Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos

PIMENTEL, Jonatha Sousa

Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/49575

Compartilhe esta página

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	MARTÍNEZ, Raydonal Ospina	-
dc.contributor.author	PIMENTEL, Jonatha Sousa	-
dc.date.accessioned	2023-04-04T12:27:47Z	-
dc.date.available	2023-04-04T12:27:47Z	-
dc.date.issued	2023-02-10	-
dc.identifier.citation	PIMENTEL, Jonatha Sousa. Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos: uma nova abordagem através da fusão de SVMs fracos e esféricos. 2023. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2023.	pt_BR
dc.identifier.uri	https://repositorio.ufpe.br/handle/123456789/49575	-
dc.description	ARA, Anderson, também é conhecido em citações bibliográficas por: SOUZA, Anderson Luiz Ara.	pt_BR
dc.description.abstract	A capacidade de geração de dados nos últimos anos, atingiu níveis nunca antes vistos. Mais dados em apenas dois anos do que em 5 mil anos de história, aumento em 50 vezes do volume gerado em um período de 10 anos, termos como Big Data, Machine Learning e Inteligência Artificial cada vez mais comumente vistos e falados. Provocado por essa mudança, é necessária a utilização de técnicas capazes de analisar tal quantidade de dados, sejam elas estatísticas ou de aprendizado de máquina, onde se destaca a interseção entre as duas áreas. Dentre as diversas técnicas existentes e de destaque, a técnica a ser aqui trabalhada são as máquinas de vetores de suporte (SVM - do inglês Support Vector Machine), introduzida por Vapnik em 1995, que busca a separação e classificação de observações através da construção de hiperplano ótimo. Apesar do grande uso, os modelos SVM sofrem para serem estimados em bases de dados massivas, sendo necessária a utilização de técnicas para enfrentar tal problema. Frente a este problema, neste trabalho serão implementadas as técnicas Sphere SVM, Speed Up SVM para a classificação, além do modelo proposto Fusion SVM, para a utilização em dados massivos. Os resultados obtidos ao comparar os modelos para diferentes bases de dados simuladas e reais, apresentam modelos que permitem a manutenção da capacidade preditiva do modelo SVM, bem como a sua estimação em um décimo do tempo do modelo completo. Além disso, para bases de dados cada vez maiores, é possível observar o melhor desempenho do modelo Fusion SVM sobre os demais.	pt_BR
dc.description.sponsorship	CAPES	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	Universidade Federal de Pernambuco	pt_BR
dc.rights	embargoedAccess	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Estatística aplicada	pt_BR
dc.subject	Dados massivos	pt_BR
dc.title	Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos	pt_BR
dc.type	masterThesis	pt_BR
dc.contributor.advisor-co	ARA, Anderson	-
dc.contributor.authorLattes	http://lattes.cnpq.br/5906035652176254	pt_BR
dc.publisher.initials	UFPE	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.degree.level	mestrado	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/6357960802605841	pt_BR
dc.publisher.program	Programa de Pos Graduacao em Estatistica	pt_BR
dc.description.abstractx	The data generation capacity in recent years has reached levels never seen before. More data in just two years than in 5,000 years of history, a 50-fold increase in the volume generated over a 10-year period, terms like Big Data, Machine Learning and Artificial Intelligence increasingly commonly seen and spoken. Caused by this change, it is necessary to use techniques capable of analyzing such an amount of data, whether statistics or machine learning, where the intersec- tion between the two areas stands out. Among the various existing and prominent techniques, the technique to be worked on here is the support vector machines (SVM), introduced by Vapnik in 1995, which seeks to separate and classify observations through the construction of an optimal hyperplane. Despite the wide use, the SVM models suffer to be estimated in massive databases, requiring the use of techniques to face this problem. Faced with this prob- lem, this work will implement the techniques Sphere SVM, Speed Up SVM for classification, in addition to the proposed model Fusion SVM, for use in massive data. The results obtained when comparing the models for different simulated and real databases, present models that allow the maintenance of the predictive capacity of the SVM model, as well as its estimation in one tenth of the time of the complete model. In addition, for increasingly larger databases, it is possible to observe the better performance of the Fusion SVM model over the others.	pt_BR
dc.contributor.advisor-coLattes	http://lattes.cnpq.br/8916772290938469	pt_BR
Aparece nas coleções:	Dissertações de Mestrado - Estatística

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
DISSERTAÇÃO Jonatha Sousa Pimentel.pdf		14.4 MB	Adobe PDF	Visualizar/Abrir

Este arquivo é protegido por direitos autorais

Ver licença

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons