Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/49575
Compartilhe esta página
Título: | Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos |
Autor(es): | PIMENTEL, Jonatha Sousa |
Palavras-chave: | Estatística aplicada; Dados massivos |
Data do documento: | 10-Fev-2023 |
Editor: | Universidade Federal de Pernambuco |
Citação: | PIMENTEL, Jonatha Sousa. Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos: uma nova abordagem através da fusão de SVMs fracos e esféricos. 2023. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2023. |
Abstract: | A capacidade de geração de dados nos últimos anos, atingiu níveis nunca antes vistos. Mais dados em apenas dois anos do que em 5 mil anos de história, aumento em 50 vezes do volume gerado em um período de 10 anos, termos como Big Data, Machine Learning e Inteligência Artificial cada vez mais comumente vistos e falados. Provocado por essa mudança, é necessária a utilização de técnicas capazes de analisar tal quantidade de dados, sejam elas estatísticas ou de aprendizado de máquina, onde se destaca a interseção entre as duas áreas. Dentre as diversas técnicas existentes e de destaque, a técnica a ser aqui trabalhada são as máquinas de vetores de suporte (SVM - do inglês Support Vector Machine), introduzida por Vapnik em 1995, que busca a separação e classificação de observações através da construção de hiperplano ótimo. Apesar do grande uso, os modelos SVM sofrem para serem estimados em bases de dados massivas, sendo necessária a utilização de técnicas para enfrentar tal problema. Frente a este problema, neste trabalho serão implementadas as técnicas Sphere SVM, Speed Up SVM para a classificação, além do modelo proposto Fusion SVM, para a utilização em dados massivos. Os resultados obtidos ao comparar os modelos para diferentes bases de dados simuladas e reais, apresentam modelos que permitem a manutenção da capacidade preditiva do modelo SVM, bem como a sua estimação em um décimo do tempo do modelo completo. Além disso, para bases de dados cada vez maiores, é possível observar o melhor desempenho do modelo Fusion SVM sobre os demais. |
Descrição: | ARA, Anderson, também é conhecido em citações bibliográficas por: SOUZA, Anderson Luiz Ara. |
URI: | https://repositorio.ufpe.br/handle/123456789/49575 |
Aparece nas coleções: | Dissertações de Mestrado - Estatística |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Jonatha Sousa Pimentel.pdf | 14,4 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons