Aplicação de Técnicas de Mineração de Dados na Previsão de Propensão à Evasão Escolar 1 Fernanda Milani , Sandro da Silva Camargo 2 1 Aluna do Curso de Especialização em Administração de Banco de Dados / Faculdades Senac de Tecnologia – Passo Fundo / FATEC-PF 2 Professor do Curso de Especialização em Administração de Banco de Dados / Faculdades Senac de Tecnologia – Passo Fundo / FATEC-PF Abstract. This paper describes the application of data mining techniques in a database from Instituto Federal Sul-Rio-Grandense, Passo Fundo Campus. The goal is to identify factors which contribute to school evasion. It was identified some factors which permit discovering of evasion risk groups. Keywords: School Evasion, Data Mining. Resumo. Este artigo descreve a aplicação de técnicas de mineração de dados no banco de dados do Campus de Passo Fundo do Instituto Federal Sul-RioGrandense. O objetivo é a identificação de fatores que contribuem para a evasão escolar. Foram identificados alguns fatores que permitem a descoberta de grupos de risco para evasão. Palavras-chave: Evasão Escolar, Mineração de Dados. 1. Introdução A evasão é o desligamento do aluno, por sua própria responsabilidade, da instituição de ensino a qual está matriculado (Souza, 2008). Nas Instituições Federais de Ensino a evasão é um aspecto crítico, visto que tem influência nos repasses de recursos federais. A predição de quais alunos têm maior propensão à evasão escolar pode permitir um acompanhamento mais direto destes alunos de forma a diminuir a ocorrência deste fenômeno. Além disso, a identificação de quais fatores contribuem para a evasão dos alunos pode fornecer subsídios para a formulação de políticas que permitam atenuá-los, reduzindo assim os níveis de evasão. A análise dos dados dos alunos através de processos baseados em trabalho humano torna-se proibitiva, sendo necessária a aplicação de técnicas automáticas para a análise destes dados. 2. Objetivo Identificar os principais fatores que contribuem para evasão dos alunos do Campus de Passo Fundo do Instituto Federal Sul-Rio-Grandense (IFSul). 3. Metodologia Foi realizada a aplicação de técnicas de mineração de dados sobre dados dos alunos do campus de Passo Fundo do IFSul. Para utilizar as ferramentas, houve a necessidade de consolidar um banco de dados a partir de fontes de dados oriundas de diversos setores do Instituto, visto que não existe um único banco de dados com toda a informação corporativa. Devido à heterogeneidade das fontes de dados, este processo foi realizado de forma manual e foram considerados apenas dados do curso técnico em informática, técnico em mecânica e curso superior de sistemas para internet. Está sendo implementada uma estrutura automática para integração de instâncias destas diversas fontes de dados heterogêneas. Dentro do banco consolidado, 22% das instâncias representam dados de alunos que evadiram e os outros 78% representam dados de alunos que não evadiram. A fim de realizar a mineração de dados, foram utilizados algoritmos de classificação implementados na ferramenta Weka (Hall et al, 2009). 4. Resultados Foram utilizados diversos algoritmos que geram modelos “caixa-branca” com ênfase em algoritmos de geração de regras e geração de árvores de decisão (Witten e Frank, 2005). Levando-se em conta que a taxa média de evasão no banco de dados considerado é 22%, foram encontradas as seguintes regras relevantes: Em relação aos resultados obtidos que levam em consideração a idade dos alunos, foram obtidas as seguintes regras: 1) Alunos com idade maior que 37 anos têm um percentual crítico de evasão, em um patamar entre 40 e 50%, o que representa em torno do dobro da média de evasão do instituto. 2) Alunos entre Alunos com idade menor que 22 anos têm baixo percentual de evasão, inferior a 10%, o que representa metade da média de evasão do Instituto. 3) Alunos entre 22 e 27 anos tem percentual de evasão acima de 20%, valor que está alinhado com a média de evasão do instituto. Em relação aos resultados obtidos que levam em consideração o curso do aluno, foram obtidas as seguintes regras: 1) Alunos do curso técnico em mecânica têm alta probabilidade de evasão, próxima a 30%. 2) Alunos do curso técnico em informática têm probabilidade de evasão em torno de 20%, o que está levemente abaixo da média geral. 3) Alunos do curso superior em tecnologia para internet têm baixa probabilidade de evasão, em torno de 10%. 5. Conclusões Pode-se concluir que a aplicação de técnicas de mineração de dados é eficiente na identificação de fatores que contribuem para a evasão universitária campus de Passo Fundo do IFSul. A utilização de algoritmos de geração de regras e de geração de árvores de decisão permite identificar alguns dos fatores que contribuem para a evasão universitária, sendo possível reconhecer os grupos de risco para evasão. Tais resultados fornecem subsídios para indicar quais alunos necessitariam de um acompanhamento mais personalizado a fim de tentar diminuir o risco de evasão. References Hall, M. et al. (2009) “The WEKA Data Mining Software: An Update”, SIGKDD Explorations, Volume 11, Issue 1. Souza, S. L. (2008) “Evasão No Ensino Superior: Um Estudo Utilizando A Mineração De Dados Como Ferramenta De Gestão Do Conhecimento Em Um Banco de Dados Referente À Graduação De Engenharia.” Dissertação de Mestrado. Coppe – UFRJ, Rio de Janeiro. Witten, I. H., Frank, E. (2005) “Data Mining: Practical machine learning tools and techniques", Morgan Kaufmann, 2nd edition.