DESCRIÇÃO DE NEO’S CHALLANGE O concurso Neo’s Challenge centra-se na predição da satisfação dos clientes. 1. Descrição das tarefas As tarefas deste ano empregam os conjuntos de dados de treino “CLIENTES_fecha” e “SATISFACCION_fecha”. Os dados correspondem ao período de Janeiro de 2012 a Dezembro de 2014 para a categoria “CLIENTES_fecha”, e de Janeiro de 2013 a Dezembro de 2014 para a categoria “SATISFACCION_fecha”, e refletem o comportamento dos clientes durante estes período. A competição consta de duas fases, local e global: Fase local: é uma competição interna por país, onde o desafio consiste em resolver um problema, “tarefa 1” (o problema é o mesmo para todos os países). Haverá uma única equipa vencedora por país, que competirá na fase final. Fase final: As equipas vencedoras das fases locais enfrentarão um novo desafio, “tarefa 2”. Tarefa 1: Determinar os clientes ativos que passam a ser inativos Um indicador para medir a satisfação dos clientes é a atividade dos mesmos. A atividade/inatividade dos cliente constrói-se a partir das variáveis XXXX do conjunto de treino “CLIENTES_fecha” (definição de atividade mais abaixo). A tarefa consiste em determinar quais dos clientes ativos em Dezembro 2014 passam a ser inativos em 31 de Março de 2015. Para tal indicar-se-á o número de clientes que passaram a ser inativos N1, devendo a equipa participante entregar N1 id_clientes que correspondam aos N1 clientes que a equipa previu que passarão a ser clientes inativos em 31 de Março de 2015. Exemplo de cálculo de resultado: Se o número de clientes indicado que passaram de ser ativos em 31 de dezembro de 2014 a ser inativos em 31 de março de 2015 foram N1=3 clientes, um possível resultado poderia ser: 99999 11897 88854 Estes 3 números correspondem às id_clientes que a equipa participante previu que passariam a ser clientes inativos. Note-se que os clientes novos durante o 1º trimestre que são ativos e passam a ser inativos não serão considerados no conjunto de resposta. De igual modo, os clientes já inativos em 31 de dezembro também não serão considerados para o cálculo. Definição de cliente ativo para este exercício: Realizar pelo menos 3 movimentos com a conta nos últimos 90 dias (XXXX variável) e ter um volume de negócio no último mês >xxxx , dependendo do segmento (XXX variável) Tarefa 2 : Determinar o nível de satisfação dos clientes Outra forma de avaliar a satisfação dos clientes é realizar inquéritos específicos com esta finalidade. O nível de satisfação dos clientes que foram consultados durante o período de treino encontra-se recolhido no conjunto de dados “SATISFACCION_fecha” e na variável XXXX , que toma os valores 0 ou 1 (1: satisfeito e 0: resto); esta informação será proporcionada desde o início do concurso. A tarefa consiste em determinar o nível de satisfação de um conjunto de clientes que foram inquiridos durante o 1º trimestre de 2015. Para este efeito, será proporcionada antes do início da Fase Final uma lista de id_clientes que corresponderá aos clientes que foram inquiridos durante o 1º Trimestre de 2015, e o número de clientes N2 que responderam que estavam satisfeitos. As equipas participantes deverão entregar N2 id_clientes que correspondam aos N2 clientes que previram que se declarariam satisfeitos. Exemplo de saída de resultado: Se o número de clientes indicado como respondendo que estavam satisfeitos no 1º trimestre de 2015 foi de N2=4 clientes, um possível resultado poderia ser: 12399 14697 34554 67893 Estes 4 números correspondem às id_clientes que a equipa participante previu que seriam os que responderam que estão satisfeitos. Para ambas as tarefas é necessário indicar a metodologia seguida. Por favor, consulte a secção 4. Apresentação de Resultados para obter mais detalhes. 2. Seleção de equipas vencedoras. 2.1. Seleção da equipa representante de cada país para participar na final Haverá uma única equipa selecionada por país, que será a que tenha obtido a melhor classificação ao resolver o problema da Fase Local. Em caso de empate, ganhará a equipa que tenha proporcionado os resultados em primeiro lugar. Avaliação: O concurso proporcionará um número N1, que corresponde ao número de clientes que realmente passaram de ativos em 31 de dezembro de 2014 a inativos em 31 de março de 2015. Cada equipa participante deverá entregar uma lista com exatamente N1 identificadores de clientes (id_clientes), e a equipa vencedora será a que tiver acertado o maior número de id_clientes que passaram a ser inativos. Ou seja, a equipa vencedora será a que obtiver uma margem de erro menor entre as suas previsões e a resposta correta, e que obtenha um maior valor da equação: 𝑁º 𝑑𝑒 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠 𝑝𝑟𝑒𝑣𝑖𝑠𝑡𝑜𝑠 𝑞𝑢𝑒 𝑝𝑎𝑠𝑠𝑎𝑟ã𝑜 𝑎 𝑠𝑒𝑟 𝑖𝑛𝑎𝑡𝑖𝑣𝑜𝑠 𝑒 𝑞𝑢𝑒 𝑟𝑒𝑎𝑙𝑚𝑒𝑛𝑡𝑒 𝑝𝑎𝑠𝑠𝑎𝑟𝑎𝑚 𝑎 𝑠𝑒𝑟 𝑖𝑛𝑎𝑡𝑖𝑣𝑜𝑠 . 𝑁1 Após a determinação das equipas vencedoras desta Fase Local, a resposta correta estará disponível na página Web. 2.2. Seleção da equipa vencedora da Fase Final A equipa vencedora de cada país passará à fase final, que terá lugar em Espanha. Nesta fase, as equipas selecionadas na fase local deverão encontrar a solução para outro desafio, a “tarefa 2”. Avaliação da tarefa 2: O concurso proporcionará antes do início da fase final uma lista de identificadores de clientes (id_clientes), que corresponderá aos clientes inquiridos durante o 1º Trimestre de 2015, e o número de clientes N2 que responderam que estavam satisfeitos. Cada equipa participante deverá entregar uma lista com exatamente N2 id_clientes, vencendo a equipa que tiver acertado mais id_clientes satisfeitos. Ou seja, a equipa ganhadora será a que obtiver uma margem de erro menor entre as suas previsões e a resposta correta, obtendo assim um maior valor da equação: 𝑁º 𝑑𝑒 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠 𝑝𝑟𝑒𝑣𝑖𝑠𝑡𝑜𝑠 𝑞𝑢𝑒 𝑒𝑠𝑡ã𝑜 𝑠𝑎𝑡𝑖𝑠𝑓𝑒𝑖𝑡𝑜𝑠 𝑒 𝑞𝑢𝑒 𝑟𝑒𝑎𝑙𝑚𝑒𝑛𝑡𝑒 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑚 𝑞𝑢𝑒 𝑒𝑠𝑡𝑎𝑣𝑎𝑚 𝑠𝑎𝑡𝑖𝑠𝑓𝑒𝑖𝑡𝑜𝑠 . 𝑁2 Os dados de treino necessários para a resolução desta tarefa serão proporcionados no início do concurso. Avaliação final: A equipa vencedora do concurso será a que obtiver a melhor classificação no conjunto de ambas as tarefas e da metodologia empregue. A pontuação atribuir-se-á da seguinte forma: 40% para a tarefa 1, 40% para a tarefa 2, 20% para a metodologia utilizada em ambas as tarefas. No dia 1 de novembro especificar-se-á a fórmula de cálculo da classificação. 3. Obtenção dos dados para treinos, e do conjunto de resposta a prever. Os conjuntos de dados estão disponíveis para a sua descarga na página Web. A partir de 1 de novembro: Dados de treino: CLIENTES_fecha SATISFACCION_fecha O formato e descrição dos campos de cada um dos ficheiros de dados de treino encontram-se no arquivo XXX disponível na página Web. N1: Número de clientes que passaram a ser inativos. Note-se que os clientes ativos em 31 de dezembro de 2014, e sobre os quais se devem selecionar os que passarão a ser considerados inativos (os clientes com base nos quais se deve encontrar a resposta para a Tarefa 1) podem obter-se a partir dos dados de treino. Antes do início da fase final: XXX - Arquivo que contém os dados de Clientes_ID correspondentes aos clientes inquiridos durante o 1º Trimestre de 2015, e dos quais se deverão selecionar os clientes satisfeitos. N2: Número de clientes que responderam que estavam satisfeitos. 4. Apresentação de Resultados. 4.1. Apresentação de Resultados para a fase local. Cada equipa deve apresentar 1 arquivo de resultados em formato .txt (as respostas podem ser atualizadas as vezes que quiserem antes da data limite). Apenas a última atualização antes da data limite será avaliada. Em caso de empate, será tida em conta como data de entrega a data da última atualização. O ficheiro de resposta deverá ser nomeado da seguinte forma: Id-Equipo-Tarea1.TXT Onde Id-Equipo é a identificação da equipa participante que lhe foi atribuída no momento da inscrição; este ficheiro deverá conter N1 linhas, separadas por espaços, e cada linha deverá conter um identificador de cliente (id_cliente). Exemplo para o caso N1=3: 99999 11897 88854 É necessário seguir o formato do arquivo de resposta e os requisitos do nome. Os resultados apresentados com um formato diferente poderão ser rejeitados. Além do ficheiro de resultados, é necessário apresentar 1 fichero .pdf (“Id-EquipoMetodologia1.PDF”) explicando a metodologia seguida para a realização da tarefa 1. Consultar a secção 5, Anexo detalhes de metodologia 4.2. Apresentação de Resultados para a fase final. Cada equipa deverá apresentar 1 ficheiro de resultados em formato .txt na fase final, correspondente ao resultado da tarefa 2. O arquivo de resposta deverá ser nomeado da seguinte forma: Id-Equipo-Tarea2.TXT Onde Id-Equipo é a identificação da equipa participante que lhe foi atribuída no momento da inscrição; este ficheiro deverá conter N2 linhas, separadas por espaços, e cada linha deverá conter um identificador de cliente (id_cliente). Exemplo para o caso N2=4: 12399 14697 34554 67893 É necessário seguir o formato do arquivo de resposta e os requisitos do nome. Os resultados apresentados com formato diferente poderão ser recusados. Além do ficheiro de resultado, é necessário apresentar 1 ficheiro .pdf (“IdEquipa-Metodologia2.PDF”) explicando a metodologia seguida para a realização da tarefa 2. Consultar a secção 5, Anexo detalhes da metodologia 5. Anexo detalhes da metodologia. Esquema a seguir para explicar a metodologia seguida para a realização das tarefas 1 e 2: Procedimento de geração da tabela de entrada de modelização. Etapas seguidas na parte de modelização. Um possível esquema poderia ser: o Amostragem o Exploração o Modificação: Seleção de variáveis, Discretização ótima de variáveis, Criação e/ou transformação de variáveis, tratamento de omissões (missing data). o Modelização o Validação: comparação de modelos Modelo Final Procedimento de seleção dos clientes N1 e N2 Software utilizado para a resolução do problema Geração de resultados do software Num segundo plano, avaliar-se-á também a claridade e a facilidade de leitura do documento. 6. Calendário. 1 de novembro: o Início do período de inscrição o Dados de treino (CLIENTES_fecha, SATISFACCION_fecha). o Formato e descrição dos campos de cada um dos ficheiros de dados de treino o N1: Número de clientes que passaram a ser inativos em 31 de março de 2015. Aquelas equipas que se inscrevam em data posterior disporão dos dados a partir dessa data. 15 de dezembro 2015: o Fecho do período de inscrição. 31 de janeiro de 2016: o Data limite para entrega do ficheiro de resultados da tarefa 1. 3-15 de fevereiro de 2016: o Publicação das equipas vencedoras da Fase Local o Publicação da resposta correta da tarefa 1 15 de fevereiro de 2016: o Para a tarefa 2 lista de clientes inquiridos no 1º trimestre de 2015 e sobre os quais é preciso selecionar os clientes satisfeitos o N2: Número de clientes que responderam que estavam satisfeitos. 10 março de 2016: o Data limite para entrega do ficheiro de resultados da tarefa 2. 16 e 17 de março de 2016: o Realização da Fase Final