Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/49575

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorMARTÍNEZ, Raydonal Ospina-
dc.contributor.authorPIMENTEL, Jonatha Sousa-
dc.date.accessioned2023-04-04T12:27:47Z-
dc.date.available2023-04-04T12:27:47Z-
dc.date.issued2023-02-10-
dc.identifier.citationPIMENTEL, Jonatha Sousa. Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos: uma nova abordagem através da fusão de SVMs fracos e esféricos. 2023. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/49575-
dc.descriptionARA, Anderson, também é conhecido em citações bibliográficas por: SOUZA, Anderson Luiz Ara.pt_BR
dc.description.abstractA capacidade de geração de dados nos últimos anos, atingiu níveis nunca antes vistos. Mais dados em apenas dois anos do que em 5 mil anos de história, aumento em 50 vezes do volume gerado em um período de 10 anos, termos como Big Data, Machine Learning e Inteligência Artificial cada vez mais comumente vistos e falados. Provocado por essa mudança, é necessária a utilização de técnicas capazes de analisar tal quantidade de dados, sejam elas estatísticas ou de aprendizado de máquina, onde se destaca a interseção entre as duas áreas. Dentre as diversas técnicas existentes e de destaque, a técnica a ser aqui trabalhada são as máquinas de vetores de suporte (SVM - do inglês Support Vector Machine), introduzida por Vapnik em 1995, que busca a separação e classificação de observações através da construção de hiperplano ótimo. Apesar do grande uso, os modelos SVM sofrem para serem estimados em bases de dados massivas, sendo necessária a utilização de técnicas para enfrentar tal problema. Frente a este problema, neste trabalho serão implementadas as técnicas Sphere SVM, Speed Up SVM para a classificação, além do modelo proposto Fusion SVM, para a utilização em dados massivos. Os resultados obtidos ao comparar os modelos para diferentes bases de dados simuladas e reais, apresentam modelos que permitem a manutenção da capacidade preditiva do modelo SVM, bem como a sua estimação em um décimo do tempo do modelo completo. Além disso, para bases de dados cada vez maiores, é possível observar o melhor desempenho do modelo Fusion SVM sobre os demais.pt_BR
dc.description.sponsorshipCAPESpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsembargoedAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectEstatística aplicadapt_BR
dc.subjectDados massivospt_BR
dc.titleAceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricospt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coARA, Anderson-
dc.contributor.authorLatteshttp://lattes.cnpq.br/5906035652176254pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6357960802605841pt_BR
dc.publisher.programPrograma de Pos Graduacao em Estatisticapt_BR
dc.description.abstractxThe data generation capacity in recent years has reached levels never seen before. More data in just two years than in 5,000 years of history, a 50-fold increase in the volume generated over a 10-year period, terms like Big Data, Machine Learning and Artificial Intelligence increasingly commonly seen and spoken. Caused by this change, it is necessary to use techniques capable of analyzing such an amount of data, whether statistics or machine learning, where the intersec- tion between the two areas stands out. Among the various existing and prominent techniques, the technique to be worked on here is the support vector machines (SVM), introduced by Vapnik in 1995, which seeks to separate and classify observations through the construction of an optimal hyperplane. Despite the wide use, the SVM models suffer to be estimated in massive databases, requiring the use of techniques to face this problem. Faced with this prob- lem, this work will implement the techniques Sphere SVM, Speed Up SVM for classification, in addition to the proposed model Fusion SVM, for use in massive data. The results obtained when comparing the models for different simulated and real databases, present models that allow the maintenance of the predictive capacity of the SVM model, as well as its estimation in one tenth of the time of the complete model. In addition, for increasingly larger databases, it is possible to observe the better performance of the Fusion SVM model over the others.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/8916772290938469pt_BR
Aparece nas coleções:Dissertações de Mestrado - Estatística

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Jonatha Sousa Pimentel.pdf14,4 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons