Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/57246
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | PRUDÊNCIO, Ricardo Bastos Cavalcante | - |
dc.contributor.author | LIRA, Maira Farias de Andrade | - |
dc.date.accessioned | 2024-08-07T13:54:06Z | - |
dc.date.available | 2024-08-07T13:54:06Z | - |
dc.date.issued | 2024-01-25 | - |
dc.identifier.citation | LIRA, Maira Farias de Andrade. Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/57246 | - |
dc.description.abstract | Técnicas de detecção de anomalias são amplamente utilizadas para identificar instâncias com padrões distintos do comportamento geral de um conjunto de dados. O desenvolvimento de novas técnicas, como as baseadas em aprendizado profundo, e a maior disponibilidade de dados têm alavancado ainda mais o uso da detecção de anomalias em contextos como a detecção de falhas em equipamentos industriais. Comumente, uma técnica de detecção gera um score de anomalia para cada instância, que é então usado para classificá-las entre anômalas ou normais. Esta classificação é baseada em um limiar de decisão (threshold) estabelecido de forma que se o score de uma determinada instância for superior ao threshold, esta instância é considerada anômala, caso contrário é classificada como normal. Neste trabalho foi utilizado um modelo Sparse Autoencoder (SAE) para a detecção de anomalias online que vem ganhando populari- dade neste cenário e foi investigado o impacto de diferentes abordagens não supervisionadas para definição de thresholds. Para os experimentos foi utilizada uma base de dados pública referente a um problema de detecção de anomalias no metrô da cidade do Porto. A aborda- gem de cálculo do threshold impactou fortemente as métricas de avaliação da detecção. Por exemplo, a abordagem baseada em erro máximo garantiu a menor taxa de falsos positivos. Por sua vez, a abordagem baseada em intervalo interquartil obteve o maior número de verdadeiros positivos, e, consequentemente recall, enquanto que a abordagem baseada em 99-percentil garantiu o maior F1-Score. Foi avaliado ainda o uso de três tipos de filtros passa-baixa em duas abordagens distintas para a suavização do score de anomalia. De uma forma geral, a aplicação de filtros diretamente sobre o score de anomalia maximizou verdadeiros positivos, enquanto sua aplicação após uma classificação prévia das instâncias minimizou os falsos posi- tivos. Além disso, foi verificado que a utilização do filtro foi essencial para detectar sequências de anomalias. Desta forma, a seleção de abordagens de definição de thresholds e de aplicação de filtros deve ser definida em função dos objetivos específicos do modelo. | pt_BR |
dc.description.sponsorship | CAPES | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência computacional | pt_BR |
dc.subject | Detecção de anomalias | pt_BR |
dc.subject | Sparse Autoencoder | pt_BR |
dc.subject | Threshold | pt_BR |
dc.subject | Filtro passa-baixa | pt_BR |
dc.title | Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/9281776749365231 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/2984888073123287 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Anomaly detection techniques are widely used to identify instances with patterns differing from the general behavior of a data set. The development of new techniques, such as those based on deep learning, and the higher availability of data have increased anomaly detection use in contexts such as failure detection in industrial equipment. Frequently, a detection technique generates an anomaly score for each instance, later used to classify it as anomalous or normal. This classification is based on an established detection threshold such that if a given instance’s score is higher than the established limit, it is considered anomalous. Otherwise, it is normal. In this work, the impact of different unsupervised approaches to define a threshold was inves- tigated for anomaly detection by a Sparse Autoencoder (SAE) model. The experiments were based on a public database from an anomaly detection problem in Porto metro. The threshold calculation method strongly impacted detection evaluation metrics. For example, the maxi- mum error approach guaranteed the lowest false positive ratio. On the other hand, the inter quantile range approach yielded the highest true positive numbers and, consequently, higher recall, and the 99-percentile-based approach had the highest F1-Score. We also evaluated using three low-pass filters in two different approaches to smooth anomaly scores. Generally, filter applications directly on the anomaly score maximized true positives, while their application after a previous instance classification minimized false positives. Besides this, filter usage was essential to detect anomalous sequences. Thus, the selection of threshold definition techniques and filter application must be defined in function of the model-specific goals. | pt_BR |
Aparece nas coleções: | Dissertações de Mestrado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Maira Farias de Andrade Lima.pdf | 14,03 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons