Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/57246
Compartilhe esta página
Título: | Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias |
Autor(es): | LIRA, Maira Farias de Andrade |
Palavras-chave: | Inteligência computacional; Detecção de anomalias; Sparse Autoencoder; Threshold; Filtro passa-baixa |
Data do documento: | 25-Jan-2024 |
Editor: | Universidade Federal de Pernambuco |
Citação: | LIRA, Maira Farias de Andrade. Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024. |
Abstract: | Técnicas de detecção de anomalias são amplamente utilizadas para identificar instâncias com padrões distintos do comportamento geral de um conjunto de dados. O desenvolvimento de novas técnicas, como as baseadas em aprendizado profundo, e a maior disponibilidade de dados têm alavancado ainda mais o uso da detecção de anomalias em contextos como a detecção de falhas em equipamentos industriais. Comumente, uma técnica de detecção gera um score de anomalia para cada instância, que é então usado para classificá-las entre anômalas ou normais. Esta classificação é baseada em um limiar de decisão (threshold) estabelecido de forma que se o score de uma determinada instância for superior ao threshold, esta instância é considerada anômala, caso contrário é classificada como normal. Neste trabalho foi utilizado um modelo Sparse Autoencoder (SAE) para a detecção de anomalias online que vem ganhando populari- dade neste cenário e foi investigado o impacto de diferentes abordagens não supervisionadas para definição de thresholds. Para os experimentos foi utilizada uma base de dados pública referente a um problema de detecção de anomalias no metrô da cidade do Porto. A aborda- gem de cálculo do threshold impactou fortemente as métricas de avaliação da detecção. Por exemplo, a abordagem baseada em erro máximo garantiu a menor taxa de falsos positivos. Por sua vez, a abordagem baseada em intervalo interquartil obteve o maior número de verdadeiros positivos, e, consequentemente recall, enquanto que a abordagem baseada em 99-percentil garantiu o maior F1-Score. Foi avaliado ainda o uso de três tipos de filtros passa-baixa em duas abordagens distintas para a suavização do score de anomalia. De uma forma geral, a aplicação de filtros diretamente sobre o score de anomalia maximizou verdadeiros positivos, enquanto sua aplicação após uma classificação prévia das instâncias minimizou os falsos posi- tivos. Além disso, foi verificado que a utilização do filtro foi essencial para detectar sequências de anomalias. Desta forma, a seleção de abordagens de definição de thresholds e de aplicação de filtros deve ser definida em função dos objetivos específicos do modelo. |
URI: | https://repositorio.ufpe.br/handle/123456789/57246 |
Aparece nas coleções: | Dissertações de Mestrado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Maira Farias de Andrade Lima.pdf | 14,03 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons