Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/49411

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorLÓSCIO, Bernadette Farias-
dc.contributor.authorMACIEL, Vitória Maria da Silva-
dc.date.accessioned2023-03-21T16:27:31Z-
dc.date.available2023-03-21T16:27:31Z-
dc.date.issued2022-03-10-
dc.identifier.citationMACIEL, Vitória Maria da Silva. Um modelo de suporte para conformidade de data lake com a LGPD. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/49411-
dc.description.abstractNa era do Big Data, um grande volume de dados estruturados, semi-estruturados, e principalmente não estruturados é gerado muito mais rápido por tecnologias digitais e sistemas de informação. Neste contexto, Data Lakes surgiram como uma alternativa aos tradicionais Data Warehouses, tornando-se uma das soluções de Big Data mais utilizadas para análise e gerenciamento distribuído de grande volumes de dados. A ideia principal do Data Lake é ingerir dados brutos e processá-los durante seu uso, caracterizando a abordagem schema on-read. Durante seu ciclo de vida em um Data Lake, um dado pode passar por inúmeras transformações, levando a questões de rastreabilidade. Com a Lei Geral de Proteção de Dados Pessoais - LGPD em vigor, as organizações precisam ter ao seu dispor, além das mudanças ocorridas nos dados, informações sobre quem modificou, onde modificou e as dependências geradas. Visando atender esse problema, alguns modelos de metadados foram propostos na literatura. No entanto, nenhum deles foca em apresentar metadados que descrevam o ciclo de vida dos dados. Sendo assim, essa dissertação propõe um Modelo de Suporte para Conformidade de Data Lake com a LGPD (Data Lake Compliance Model - DLCM), que tem como objetivo descrever os conjuntos de dados no Data Lake e os tratamentos aplicados sobre eles. Para isso, o DLCM subdivide-se em duas partes: A primeira reúne todos os elementos de metadados necessários para atendimento de uma solicitação de acesso aos dados, enquanto que a segunda parte, é composta pelo agrupamento desses metadados por categorias, onde cada categoria possui um modelo associado. Os resultados obtidos a partir da avaliação do DLCM mostraram a relevância da solução proposta no contexto de Data Lakes.pt_BR
dc.description.sponsorshipCNPqpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectBanco de dadospt_BR
dc.subjectRastreabilidadept_BR
dc.subjectMetadadospt_BR
dc.titleUm modelo de suporte para conformidade de data lake com a LGPDpt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coOLIVEIRA, Marcelo Iury de Sousa-
dc.contributor.authorLatteshttp://lattes.cnpq.br/3550115034365337pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/2512064355660153pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxIn the age of Big Data, a large volume of structured, semi-structured, and mostly unstructured data is generated much faster by digital technologies and information systems. In this context, Data Lakes emerged as an alternative to traditional Data Warehouses, becoming one of the most used Big Data solutions for distributed analysis and management of large volumes of data. The main idea of Data Lake is to ingest raw data and process it during its use, characterizing the schema on-read approach. During its life cycle in a Data Lake, data can undergo numerous transformations, leading to traceability issues. With the General Personal Data Protection Law - LGPD in place, organizations need to have at their disposal, in addition to the changes that have occurred, information about who modified the data, where they modified it and the dependencies generated. In order to address this problem, some metadata models have been proposed in the literature. However, none of them focus on presenting metadata that describes the data life cycle. Therefore, this dissertation proposes a Support Model for Data Lake Compliance with the LGPD (Data Lake Compliance Model - DLCM), which aims to describe the datasets in the Data Lake and the treatments applied to them. For this, the DLCM is subdivided into two parts: The first part gathers all the metadata elements necessary to fulfill a data access request, while the second part is composed by the grouping of these metadata by categories, where each category has an associated model. The results obtained from the DLCM evaluation showed the relevance of the proposed solution in the context of Data Lakes.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/2328386382232459pt_BR
Aparece nas coleções:Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Vitória Maria da Silva Maciel.pdf3,07 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons