Predição de Mudança Comportamental de Séries Temporais Fuzzy e Suas Aplicações Fábio J. J. Santos1,2 e Heloisa A. Camargo1 Universidade Federal de São Carlos, Brasil Instituto Federal de Educação Ciência e Tecnologia de São Paulo 1 2 {fabio_santos, heloisa}@dc.ufcar.br Resumo. Frequentemente as Séries Temporais (ST) tem sido utilizadas para auxiliar na previsão de valores. Entretanto, recentemente a identificação do padrão comportamental das ST tem atraído a atenção dos pesquisadores. Assim, este trabalho propõe o uso de técnicas de previsão e de agrupamento fuzzy para antever uma possível mudança comportamental em uma ST. Palavras-chave: série temporal fuzzy, padrão comportamental, previsão. INTRODUÇÃO Uma Série Temporal (ST) pode ser definida como uma sequência de dados reais amostrados com uma frequência temporal contínua em um determinado intervalo de tempo. O uso dos conceitos de sistemas fuzzy aplicados as Séries Temporais foi proposto inicialmente por Song e Chissom [1993]. Atualmente, a grande maioria das pesquisas envolvendo o uso de ST convencionais ou Séries Temporais Fuzzy (STF), possui foco na previsão de valores ou na identificação do padrão comportamental das séries. Considerando as amostras dos valores, as ST podem ser classificadas em monovariáveis ou multivariáveis. As séries monovariáveis consideram apenas uma variável na análise e previsão dos valores. Embora as abordagens multivariáveis considerem mais de uma variável na análise, a previsão é realizada apenas para a variável definida como principal [Chen e Tanuwijaya 2011]. Alguns trabalhos com foco na identificação do padrão comportamental das séries utilizam algoritmos de agrupamento para distinguir ST com comportamentos semelhantes das ST com comportamentos distintos [Thinh 2012]. Na sequência, são apresentadas na Seção 2 a descrição do método proposto e suas possíveis aplicações práticas e, na Seção 3, as considerações finais. PREDIÇÃO DE MUDANÇA COMPORTAMENTAL EM SÉRIES TEMPORAIS FUZZY A maior parte da literatura relacionada ao uso de ST ou STF, tem foco na previsão de valores. Dentre os trabalhos pesquisados foi identificada uma carência de métodos com o objetivo de prever uma possível mudança comportamental nestas séries. Desta forma, um dos pontos centrais deste trabalho é a aplicação da lógica fuzzy aos conceitos de ST e às técnicas de agrupamento das séries, visando antever uma possível mudança no padrão comportamental das mesmas. Entende-se por padrão comportamental de uma ST, a identificação de tendências de crescimento ou diminuição nos valores reais, ou ainda, o comportamento sazonal apresentado ao longo do tempo. Para isso, o modelo apresentado está dividido em três grandes frentes de pesquisa. A primeira delas é responsável pelo pré-processamento das ST e tem como objetivo preparar os dados para a análise. A segunda frente está relacionada à previsão de valores para todas as variáveis da ST analisada, e não somente para a variável definida como principal. Isso se faz necessário para um bom desempenho da outra grande frente de pesquisa, que é a análise comportamental da série com o objetivo de prever uma Symposium on Knowledge Discovery, Mining and Learning - KDMiLe 2013 F. J. J. Santos e H. A. Camargo mudança em seu comportamento, realizada por meio do agrupamento fuzzy das ST e das previsões dos valores para todas as variáveis envolvidas. Para atingir este objetivo, é preciso integrar as três frentes de pesquisa. O pré-processamento das ST é composto pelo processo de remoção dos outliers, pela definição da quantidade de termos linguísticos que irão representar cada variável da ST e pela definição do suporte de cada um dos conjuntos fuzzy. Após o pré-processamento das ST, é necessário realizar o agrupamento fuzzy das mesmas, de modo a organizar as ST semelhantes em um só cluster e as ST distintas em clusters diferentes. Realizado o agrupamento inicial e identificado o padrão comportamental de cada cluster, deverá ser previsto um valor para cada uma das variáveis da ST. A cada nova previsão, um novo agrupamento é realizado e os graus de pertinência das ST para cada um dos clusters é atualizado. Quando uma ST começar a diminuir seu grau de pertinência em um cluster e aumentar o grau de pertinência em outro cluster, temos o indicativo de tendência de mudança em seu padrão comportamental. Aplicações práticas Diversas são as aplicações práticas para o método apresentado. Uma das propostas iniciais é a aplicação em sistemas CRM (Customer Relationship Management) com o propósito de identificar clientes com possibilidade de deixar a empresa. Para isso, é necessário identificar o padrão comportamental do grupo de clientes inativos e também dos demais clientes da empresa. Uma vez identificado estes padrões, se uma ST de um cliente ativo indicar que está, a cada nova previsão e agrupamento, migrando para o cluster dos clientes inativos, este pode ser um indicador de que o cliente pretende deixar a empresa. Este monitoramento deverá ser realizado por meio dos graus de pertinência das ST nos respectivos clusters. Uma vez identificado este cliente, o departamento responsável poderá adotar medidas na tentativa de evitar que ele abandone a empresa. O método descrito também pode ser aplicado no mercado financeiro com o objetivo de identificar aplicações de alto risco; na área da indústria auxiliando na manutenção preventiva de máquinas, na área acadêmica com o objetivo de identificar alunos que poderão ter dificuldades de aprendizado em uma determinada disciplina a ser ofertada, ou ainda, no auxílio do controle de evasão; e em diversas outras áreas como, por exemplo, a agricultura. CONSIDERAÇÕES FINAIS Além de ser uma área com grande potencial para expansão, a ampla possibilidade de aplicações práticas também foi relevante na escolha deste tema para pesquisa. O método apresentado encontra-se em fase final de implantação da primeira frente de pesquisa, a fase do pré-processamento dos dados. Os resultados obtidos até o momento correspondem às expectativas iniciais demonstrando, portanto, que após a combinação das três frentes os resultados esperados também poderão ser alcançados. REFERÊNCIAS CHEN , S. AND TANUWIJAYA , K. Multivariate fuzzy forecasting based on fuzzy time series and automatic clustering techniques. In Expert Systems with Applications 38, pp. 10594–10605, 2011. SONG , Q. AND C HISSOM , B. S. Fuzzy Forecastin Enrollments With Fuzzy Time Series – Part I. In Fuzzy Sets and Systems 54, pp. 1–9, 1993. THINH, V. B. AND ANH, D. T. Time Series Clustering Based on I-k-Means and Multi-resolution PLA Transform. In IEEE Research, Innovation, and Vision for the Future, pp 1-4, 2012. Symposium on Knowledge Discovery, Mining and Learning - KDMiLe 2013