Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar

SILVA FILHO, Rogério Luiz Cardoso

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/28008

Share on

Title:	Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
Authors:	SILVA FILHO, Rogério Luiz Cardoso
Keywords:	Mineração de dados; Desempenho escolar
Issue Date:	18-Aug-2017
Publisher:	Universidade Federal de Pernambuco
Abstract:	O Ensino Médio brasileiro vem, ao longo dos anos, passando por constantes debates acerca dos seus problemas de acesso e permanência, qualidade do ensino e ate mesmo da sua identidade. O crescimento da oferta da educação profissional integrada ao ensino médio protagonizada pelos Institutos Federais (IFs), criados em 2008, vem trazendo resultados interessantes diante dos grandes investimentos do Governo Federal. Dessa forma, novos mecanismos que subsidiem gestores no processo de tomada de decisão e na avaliação do binômio “oferta-qualidade” dessas instituições tornam-se cada vez mais necessários. Esta dissertação, considerando o papel avaliativo do Exame Nacional do Ensino Médio (ENEM), apresenta uma solução de mineração de dados em um processo de Knowledge Discovery in Databases (KDD) para predição e estimação do desempenho dos alunos do Ensino Médio dos IFs. Para a extração do conhecimento, foi utilizado o método baseado em etapas CRoss-Industry Standard Process for Data Mining (CRISP-DM) aliado as ideias do framework Domain-Driven Data Mining (D3M), visando a produção de resultados mais amigáveis aos especialistas do domínio. As bases de dados do ENEM e as do Censo escolar foram integradas para a formação de um data-mart apresentado no grao aluno. Apos a interpretação e modelagem do problema, os dados foram preparados para diferentes técnicas de Inteligência Artificial; inserindo, modificando, preenchendo e excluindo variáveis através de informações de contexto. A etapa de transformação contou ainda com um procedimento supervisionado de redução de dimensionalidade que considerou a taxa de valores ausentes, variância e a correlação entre as variáveis independentes. Na construção dos modelos, a técnica de regressão logística produziu índices de propensão de sucesso dos alunos e atingiu resultados superiores a 0,84 e 0,51 para as métricas AUC_ROC e KS2_MAX, respectivamente. Para a extração do conhecimento em linguagem natural, arvores de decisão construíram condições sequenciais e regras foram geradas por meio de indução baseada em escores. Essas técnicas foram avaliadas quanto as métricas: confiança, suporte e lift. Ao final, concluiu-se que a abordagem apresentada (Domain-Driven Data Mining) teve um ótimo resultado na modelagem e na validação de politicas publicas.
URI:	https://repositorio.ufpe.br/handle/123456789/28008
Appears in Collections:	Teses de Doutorado - Ciência da Computação

Files in This Item:

File	Description	Size	Format
TESE Rogério Luiz Cardoso Silva Filho.pdf		2.36 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show full item record Recommend this item

This item is licensed under a Creative Commons License