Please use this identifier to cite or link to this item:
https://repositorio.ufpe.br/handle/123456789/49952
Share on
| Title: | Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa |
| Authors: | LIMA, Pedro Manoel Farias Sena de |
| Keywords: | Processamento de linguagem natural; Modelos de linguagem; BERT; Similaridade semântica; Inferência textual |
| Issue Date: | 4-May-2023 |
| Citation: | LIMA, Pedro Manoel Farias Sena de. Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa. 2023. 25 f. TCC (Graduação) - Curso de Sistemas de Informação, Centro de Informática, Universidade Federal de Pernambuco, Recife, 2023. |
| Abstract: | Os avanços na área de processamento de linguagem natural permitiram o surgimento de modelos de linguagem mais eficientes e capazes de atingir o estado da arte dentro dessa área. Porém, esses avanços representam quase que exclusivamente modelos que utilizam o inglês como sua língua principal. Em relação a outras línguas, como o português, esses avanços não seguem o mesmo ritmo. O seguinte trabalho busca realizar uma análise comparativa de métodos de modelos de linguagem capazes de utilizar a língua portuguesa, e para isso foram utilizados dois modelos, o BERT (do inglês, Bidirectional Encoder Representation from Transformers) e o BERTimbau, modelo baseado no BERT treinado para o português. A avaliação dos modelos foi feita utilizando a base de dados ASSIN 2. Os resultados mostraram que o BERTimbau atingiu uma melhor performance nas tarefas de similaridade semântica, com uma correlação de Pearson de 0,8433, e inferência textual com um F1-score de 0,886. |
| URI: | https://repositorio.ufpe.br/handle/123456789/49952 |
| Appears in Collections: | (TCC) - Sistemas da Computação |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| TCC Pedro Manoel Farias Sena de Lima.pdf | 655.43 kB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons

