Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/49411
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | LÓSCIO, Bernadette Farias | - |
dc.contributor.author | MACIEL, Vitória Maria da Silva | - |
dc.date.accessioned | 2023-03-21T16:27:31Z | - |
dc.date.available | 2023-03-21T16:27:31Z | - |
dc.date.issued | 2022-03-10 | - |
dc.identifier.citation | MACIEL, Vitória Maria da Silva. Um modelo de suporte para conformidade de data lake com a LGPD. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/49411 | - |
dc.description.abstract | Na era do Big Data, um grande volume de dados estruturados, semi-estruturados, e principalmente não estruturados é gerado muito mais rápido por tecnologias digitais e sistemas de informação. Neste contexto, Data Lakes surgiram como uma alternativa aos tradicionais Data Warehouses, tornando-se uma das soluções de Big Data mais utilizadas para análise e gerenciamento distribuído de grande volumes de dados. A ideia principal do Data Lake é ingerir dados brutos e processá-los durante seu uso, caracterizando a abordagem schema on-read. Durante seu ciclo de vida em um Data Lake, um dado pode passar por inúmeras transformações, levando a questões de rastreabilidade. Com a Lei Geral de Proteção de Dados Pessoais - LGPD em vigor, as organizações precisam ter ao seu dispor, além das mudanças ocorridas nos dados, informações sobre quem modificou, onde modificou e as dependências geradas. Visando atender esse problema, alguns modelos de metadados foram propostos na literatura. No entanto, nenhum deles foca em apresentar metadados que descrevam o ciclo de vida dos dados. Sendo assim, essa dissertação propõe um Modelo de Suporte para Conformidade de Data Lake com a LGPD (Data Lake Compliance Model - DLCM), que tem como objetivo descrever os conjuntos de dados no Data Lake e os tratamentos aplicados sobre eles. Para isso, o DLCM subdivide-se em duas partes: A primeira reúne todos os elementos de metadados necessários para atendimento de uma solicitação de acesso aos dados, enquanto que a segunda parte, é composta pelo agrupamento desses metadados por categorias, onde cada categoria possui um modelo associado. Os resultados obtidos a partir da avaliação do DLCM mostraram a relevância da solução proposta no contexto de Data Lakes. | pt_BR |
dc.description.sponsorship | CNPq | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Banco de dados | pt_BR |
dc.subject | Rastreabilidade | pt_BR |
dc.subject | Metadados | pt_BR |
dc.title | Um modelo de suporte para conformidade de data lake com a LGPD | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.advisor-co | OLIVEIRA, Marcelo Iury de Sousa | - |
dc.contributor.authorLattes | http://lattes.cnpq.br/3550115034365337 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/2512064355660153 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | In the age of Big Data, a large volume of structured, semi-structured, and mostly unstructured data is generated much faster by digital technologies and information systems. In this context, Data Lakes emerged as an alternative to traditional Data Warehouses, becoming one of the most used Big Data solutions for distributed analysis and management of large volumes of data. The main idea of Data Lake is to ingest raw data and process it during its use, characterizing the schema on-read approach. During its life cycle in a Data Lake, data can undergo numerous transformations, leading to traceability issues. With the General Personal Data Protection Law - LGPD in place, organizations need to have at their disposal, in addition to the changes that have occurred, information about who modified the data, where they modified it and the dependencies generated. In order to address this problem, some metadata models have been proposed in the literature. However, none of them focus on presenting metadata that describes the data life cycle. Therefore, this dissertation proposes a Support Model for Data Lake Compliance with the LGPD (Data Lake Compliance Model - DLCM), which aims to describe the datasets in the Data Lake and the treatments applied to them. For this, the DLCM is subdivided into two parts: The first part gathers all the metadata elements necessary to fulfill a data access request, while the second part is composed by the grouping of these metadata by categories, where each category has an associated model. The results obtained from the DLCM evaluation showed the relevance of the proposed solution in the context of Data Lakes. | pt_BR |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/2328386382232459 | pt_BR |
Aparece nas coleções: | Dissertações de Mestrado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Vitória Maria da Silva Maciel.pdf | 3,07 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons