Please use this identifier to cite or link to this item:
https://repositorio.ufpe.br/handle/123456789/49575
Share on
Title: | Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos |
Authors: | PIMENTEL, Jonatha Sousa |
Keywords: | Estatística aplicada; Dados massivos |
Issue Date: | 10-Feb-2023 |
Publisher: | Universidade Federal de Pernambuco |
Citation: | PIMENTEL, Jonatha Sousa. Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos: uma nova abordagem através da fusão de SVMs fracos e esféricos. 2023. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2023. |
Abstract: | A capacidade de geração de dados nos últimos anos, atingiu níveis nunca antes vistos. Mais dados em apenas dois anos do que em 5 mil anos de história, aumento em 50 vezes do volume gerado em um período de 10 anos, termos como Big Data, Machine Learning e Inteligência Artificial cada vez mais comumente vistos e falados. Provocado por essa mudança, é necessária a utilização de técnicas capazes de analisar tal quantidade de dados, sejam elas estatísticas ou de aprendizado de máquina, onde se destaca a interseção entre as duas áreas. Dentre as diversas técnicas existentes e de destaque, a técnica a ser aqui trabalhada são as máquinas de vetores de suporte (SVM - do inglês Support Vector Machine), introduzida por Vapnik em 1995, que busca a separação e classificação de observações através da construção de hiperplano ótimo. Apesar do grande uso, os modelos SVM sofrem para serem estimados em bases de dados massivas, sendo necessária a utilização de técnicas para enfrentar tal problema. Frente a este problema, neste trabalho serão implementadas as técnicas Sphere SVM, Speed Up SVM para a classificação, além do modelo proposto Fusion SVM, para a utilização em dados massivos. Os resultados obtidos ao comparar os modelos para diferentes bases de dados simuladas e reais, apresentam modelos que permitem a manutenção da capacidade preditiva do modelo SVM, bem como a sua estimação em um décimo do tempo do modelo completo. Além disso, para bases de dados cada vez maiores, é possível observar o melhor desempenho do modelo Fusion SVM sobre os demais. |
Description: | ARA, Anderson, também é conhecido em citações bibliográficas por: SOUZA, Anderson Luiz Ara. |
URI: | https://repositorio.ufpe.br/handle/123456789/49575 |
Appears in Collections: | Dissertações de Mestrado - Estatística |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
DISSERTAÇÃO Jonatha Sousa Pimentel.pdf | 14,4 MB | Adobe PDF | ![]() View/Open |
This item is protected by original copyright |
This item is licensed under a Creative Commons License