Aplicação de Técnicas de Mineração de Dados na Previsão de
Propensão à Evasão Escolar
1
Fernanda Milani , Sandro da Silva Camargo
2
1
Aluna do Curso de Especialização em Administração de Banco de Dados / Faculdades Senac
de Tecnologia – Passo Fundo / FATEC-PF
2
Professor do Curso de Especialização em Administração de Banco de Dados / Faculdades
Senac de Tecnologia – Passo Fundo / FATEC-PF
Abstract. This paper describes the application of data mining techniques in a
database from Instituto Federal Sul-Rio-Grandense, Passo Fundo Campus.
The goal is to identify factors which contribute to school evasion. It was
identified some factors which permit discovering of evasion risk groups.
Keywords: School Evasion, Data Mining.
Resumo. Este artigo descreve a aplicação de técnicas de mineração de dados
no banco de dados do Campus de Passo Fundo do Instituto Federal Sul-RioGrandense. O objetivo é a identificação de fatores que contribuem para a
evasão escolar. Foram identificados alguns fatores que permitem a descoberta
de grupos de risco para evasão.
Palavras-chave: Evasão Escolar, Mineração de Dados.
1. Introdução
A evasão é o desligamento do aluno, por sua própria responsabilidade, da instituição de
ensino a qual está matriculado (Souza, 2008). Nas Instituições Federais de Ensino a
evasão é um aspecto crítico, visto que tem influência nos repasses de recursos federais.
A predição de quais alunos têm maior propensão à evasão escolar pode permitir um
acompanhamento mais direto destes alunos de forma a diminuir a ocorrência deste
fenômeno. Além disso, a identificação de quais fatores contribuem para a evasão dos
alunos pode fornecer subsídios para a formulação de políticas que permitam atenuá-los,
reduzindo assim os níveis de evasão. A análise dos dados dos alunos através de
processos baseados em trabalho humano torna-se proibitiva, sendo necessária a
aplicação de técnicas automáticas para a análise destes dados.
2. Objetivo
Identificar os principais fatores que contribuem para evasão dos alunos do Campus de
Passo Fundo do Instituto Federal Sul-Rio-Grandense (IFSul).
3. Metodologia
Foi realizada a aplicação de técnicas de mineração de dados sobre dados dos alunos do
campus de Passo Fundo do IFSul. Para utilizar as ferramentas, houve a necessidade de
consolidar um banco de dados a partir de fontes de dados oriundas de diversos setores
do Instituto, visto que não existe um único banco de dados com toda a informação
corporativa. Devido à heterogeneidade das fontes de dados, este processo foi realizado
de forma manual e foram considerados apenas dados do curso técnico em informática,
técnico em mecânica e curso superior de sistemas para internet. Está sendo
implementada uma estrutura automática para integração de instâncias destas diversas
fontes de dados heterogêneas. Dentro do banco consolidado, 22% das instâncias
representam dados de alunos que evadiram e os outros 78% representam dados de
alunos que não evadiram. A fim de realizar a mineração de dados, foram utilizados
algoritmos de classificação implementados na ferramenta Weka (Hall et al, 2009).
4. Resultados
Foram utilizados diversos algoritmos que geram modelos “caixa-branca” com ênfase em
algoritmos de geração de regras e geração de árvores de decisão (Witten e Frank, 2005).
Levando-se em conta que a taxa média de evasão no banco de dados considerado é 22%,
foram encontradas as seguintes regras relevantes:
Em relação aos resultados obtidos que levam em consideração a idade dos
alunos, foram obtidas as seguintes regras: 1) Alunos com idade maior que 37 anos têm
um percentual crítico de evasão, em um patamar entre 40 e 50%, o que representa em
torno do dobro da média de evasão do instituto. 2) Alunos entre Alunos com idade
menor que 22 anos têm baixo percentual de evasão, inferior a 10%, o que representa
metade da média de evasão do Instituto. 3) Alunos entre 22 e 27 anos tem percentual de
evasão acima de 20%, valor que está alinhado com a média de evasão do instituto.
Em relação aos resultados obtidos que levam em consideração o curso do aluno,
foram obtidas as seguintes regras: 1) Alunos do curso técnico em mecânica têm alta
probabilidade de evasão, próxima a 30%. 2) Alunos do curso técnico em informática
têm probabilidade de evasão em torno de 20%, o que está levemente abaixo da média
geral. 3) Alunos do curso superior em tecnologia para internet têm baixa probabilidade
de evasão, em torno de 10%.
5. Conclusões
Pode-se concluir que a aplicação de técnicas de mineração de dados é eficiente na
identificação de fatores que contribuem para a evasão universitária campus de Passo
Fundo do IFSul. A utilização de algoritmos de geração de regras e de geração de árvores
de decisão permite identificar alguns dos fatores que contribuem para a evasão
universitária, sendo possível reconhecer os grupos de risco para evasão. Tais resultados
fornecem subsídios para indicar quais alunos necessitariam de um acompanhamento
mais personalizado a fim de tentar diminuir o risco de evasão.
References
Hall, M. et al. (2009) “The WEKA Data Mining Software: An Update”, SIGKDD
Explorations, Volume 11, Issue 1.
Souza, S. L. (2008) “Evasão No Ensino Superior: Um Estudo Utilizando A Mineração
De Dados Como Ferramenta De Gestão Do Conhecimento Em Um Banco de Dados
Referente À Graduação De Engenharia.” Dissertação de Mestrado. Coppe – UFRJ,
Rio de Janeiro.
Witten, I. H., Frank, E. (2005) “Data Mining: Practical machine learning tools and
techniques", Morgan Kaufmann, 2nd edition.
Download

Instruções aos Autores de Contribuições para o SIBGRAPI