Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/29996

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorCORRÊA, Renato Fernandes-
dc.contributor.authorCELERINO, Victor Galvão-
dc.date.accessioned2019-04-02T21:01:51Z-
dc.date.available2019-04-02T21:01:51Z-
dc.date.issued2018-02-26-
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/29996-
dc.description.abstractAtualmente vivenciamos um crescimento informacional extraordinário, entretanto esse crescimento é acompanhado de um grande problema: como organizar toda essa informação? No cenário da organização e recuperação da informação digital, tem se destacado a Indexação Automática através do uso dos Sintagmas Nominais. Diferente da indexação praticada através de palavras isoladas, os Sintagmas Nominais são unidades sintáticas que possuem semântica, ou seja, possuem um sentido específico. Nesse contexto, o presente trabalho tem como objetivo geral propor um método de normalização dos Sintagmas Nominais, extraídos automaticamente, em termos canônicos, para que sejam satisfatórios como descritores dos documentos. No contexto da indexação automática por sintagmas nominais, pesquisas indicaram que nem todos os Sintagmas Nominais podem ser considerados descritores. Portanto, esta pesquisa: investigou os processos ligados a indexação automática por Sintagmas Nominais; selecionou manualmente Sintagmas Nominais contendo palavras-chaves; minimizou Sintagmas Nominais extensos; alterou os Sintagmas Nominais para aproximar de termos descritores; comparou os Sintagmas Nominais normalizados com termos do TBCI; e avaliou o método proposto em um experimento de normalização dos Sintagmas Nominais. Para atingir os objetivos propostos para esta pesquisa, foram utilizados a pesquisa bibliográfica e pesquisa empírica, com a realização da proposição e avaliação de método de normalização por meio da aplicação de um experimento. Através da pesquisa bibliográfica foi possível identificar estudos realizados sobre a indexação automática através de Sintagmas Nominais, estudos esses que auxiliaram no desenvolvimento da proposta de método de normalização dos Sintagmas Nominais. O experimento foi composto de duas etapas. A primeira etapa possui 85 regras voltadas a minimizar os Sintagmas Nominais extensos, e a segunda etapa lida com critérios voltados a alterar a estrutura dos Sintagmas Nominais, aproximando-os de termos canônicos. Através desse experimento foi possível avaliar e determinar quais critérios seriam importantes para a normalização dos Sintagmas Nominais. Os resultados apresentados no experimento indicaram que as etapas 1 e 2 da proposta de normalização foram satisfatórias. Concluiu-se que a proposta de normalização conseguiu atingir seu objetivo, pois os Sintagmas Nominais foram normalizados preservando a sua estrutura e as palavras-chave.pt_BR
dc.description.sponsorshipCAPESpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectIndexação automáticapt_BR
dc.subjectSintagmas nominaispt_BR
dc.subjectRecuperação de informaçãopt_BR
dc.subjectNormalização de sintagmas nominaispt_BR
dc.titleProposta de normalização dos sintagmas nominais em termos para indexação automáticapt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/1944469937324832pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/7536537827447217pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Informacaopt_BR
dc.description.abstractxToday we are experiencing extraordinary informational growth, but this growth generates a major problem: how can we organize all this information? In the scenario of the organization and retrieval of digital information, Automatic Indexing with using of the Noun Phrases highlights. Unlike the indexation practiced with isolated words, the Noun Phrases are syntactic units that have semantics, that is, they have a specific meaning. In this context, the present work has as general objective to propose a method of normalization of the Noun Phrases extracted automatically in canonical terms, so that they are satisfactory as descriptors of the documents. In the context of automatic indexing by Noun phrases, researches indicate that not all Noun Phrases are descriptors. Therefore, this research: investigated the processes of automatic indexing by Noun Phrases; manually selected Noun Phrases containing the keywords; changed Noun Phrases to approximate descriptor terms; minimized extensive Noun Phrases; compared the normalized Noun Phrases with the TBCI terms; and evaluated the proposed method in a Noun Phrases normalization experiment. In order to reach the objectives proposed for this research, were used bibliographic research and empirical research, with the accomplishment of the proposition and evaluation of method of normalization through the application of an experiment. Through the bibliographic research, it was possible to identify studies carried out on automatic indexing through Noun Phrases, which have helped to develop the proposal of normalization of Noun Phrases. The experiment was composed of two steps. The first step has 85 rules aimed at minimizing the extended Noun Phrases, and the second step deals with criteria aimed at changing the structure of the Noun Phrases, bringing them closer to canonical terms. Through the experiment, it was possible to evaluate and determine which criteria would be important for the normalization of the Noun Phrases. The results presented in the experiment indicated that steps 1 and 2 of the normalization proposal were satisfactory. It concludes that the normalization proposal succeeded in achieving its objective, since the Noun Phrases normalized preserving their structure and the keywords.pt_BR
Aparece nas coleções:Dissertações de Mestrado - Ciência da Informação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Victor Galvão Celerino.pdf2,24 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons