Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/57554

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorRAMALHO, Geber Lisboa Ramalho-
dc.contributor.authorMELLO, Rodrigo Vitor Castro Alves de-
dc.date.accessioned2024-08-26T13:36:22Z-
dc.date.available2024-08-26T13:36:22Z-
dc.date.issued2023-09-27-
dc.identifier.citationMELLO, Rodrigo Vitor Castro Alves de. ELODIN: naming concepts in embedding spaces. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/57554-
dc.description.abstractDespite recent advancements, the field of text-to-image synthesis still suffers from the lack of fine-grained control. Using only text, it remains challenging to deal with issues such as concept coherence and concept cohesion. A method to enhance control by generating new words that can be reused throughout multiple images is proposed. Each new word, which I call “named concept”, can be mixed and matched freely with natural language, effectively expanding human vocabulary. Just as a painter combines pre-existing shades into personalized colors according to their needs, the proposed method enables combining e.g. “yellow” and “hawk” into a single word, that is, a single named concept. The new word, when present in subsequent text prompts, results in images that consistently contain the same yellow hawk. Unlike previous contributions, our method does not replicate visuals from input data. In some cases, it can generate visual concepts in a zero-shot manner, that is, without any visual input. A set of comparisons show our method to be a significant improvement over text prompts containing only natural language. Theoretical considerations on the foundations of Deep Learning are made throughout the text and Name Learning is proposed.pt_BR
dc.description.sponsorshipCNPqpt_BR
dc.language.isoengpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectDeep learningpt_BR
dc.titleELODIN : naming concepts in embedding spacespt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coCALEGÁRIO, Filipe Carlos de Albuquerque-
dc.contributor.authorLatteshttp://lattes.cnpq.br/3635922311097771pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9783292465422902pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxApesar dos avanços recentes, o campo da síntese de imagens a partir de texto ainda sofre com a falta de controle no. Usando apenas texto, continua sendo desafiador lidar com questões como coerência de conceitos e coesão de conceitos. Eu proponho um método para melhorar o controle gerando novas palavras que podem ser reutilizadas em várias gerações. Cada nova palavra, que chamamos de “conceito nomeado”, pode ser misturada e combinada livremente com linguagem natural, expandindo o vocabulário humano. Assim como um pintor combina tons pré-existentes em cores personalizadas de acordo com suas necessidades, o método proposto permite combinar, por exemplo, “amarelo” e “falcão” em uma única palavra, isto é, um único conceito nomeado. A nova palavra, quando presente em prompts de texto subsequentes, resulta em imagens que contêm, consistentemente, o mesmo falcão amarelo. Diferentemente de propostas anteriores, esse método não replica visuais presentes em dados de entrada. Em alguns casos, pode gerar conceitos visuais de forma zero-shot, sem qualquer entrada de imagem. Um conjunto de comparações mostram a melhoria significativa da proposta sobre prompts de texto contendo apenas linguagem natural. Considerações teóricas sobre os fundamentos de Deep Learning são realizadas ao longo do texto e Name Learning é proposto.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/7709859860474826pt_BR
Aparece nas coleções:Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Rodrigo Vitor Castro Alves de Mello.pdf15,34 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons