(Dissertação, 2017-12-12) Assis, Lucas Rocha Soares de; Ramos, Guilherme Novaes
A evasão no ensino superior é um problema que atinge diversas instituições no mundo. No Brasil, não há divulgação regular de dados sobre o assunto. Neste trabalho foram aplicadas técnicas de mineração de dados para criar um perfil de estudantes que evadem do ensino superior brasileiro. Utilizando dados do Censo da Educação Superior (CES) e Exame Nacional do Ensino Médio (ENEM), foram criados modelos de cinco algoritmos de classificação para analisar a evasão de alunos ingressantes em três diferentes níveis de evasão. Os experimentos foram conduzidos nos dados de estudantes da UnB. Entre os algoritmos testados, o CART obteve um desempenho marginalmente superior, na métrica de sensibilidade. Ele obteve desempenho de cerca de 84% para evasão a nível de curso. Nos demais testes, não houve diferença estatisticamente significativa entre os algoritmos. As principais características identificadas nos alunos que possuem propensão a evadir são: ingressar no primeiro semestre, possuir vínculos com mais de uma IES, obter notas acima da média nos exames do ENEM e já ter concluído o ensino médio no momento que realiza as provas do ENEM. Também foi desenvolvido um pacote para o R em que é possível treinar novos classificadores de evasão, que podem ser utilizados para determinar, em qualquer IES ou grupo de IES, quais alunos possuem maior tendência de evadir.