SAP PA e Clusterização: Configurando e usando algoritmo no SAP 1. Normalizando as variáveis O primeiro passo para que a clusterização seja rodada é normalizar as variáveis com as quais vamos trabalhar. Para isso, faça o seguinte procedimento: 1) Com o banco de dados com o qual pretende trabalhar aberto, vá em “Predict” e sob a aba “Data Preparation”, clique em “Normalization”. 2) Uma seta indicando verde indicando um caminho para a normalização aparecerá. Para configurar a normatização, deixe o mouse sobre o círculo que corresponde à normalização e clique em “Configure Properties”. Uma caixa de opções aparecerá na tela e você terá que escolher qual variável deseja normalizar. Na opção “Normalization Method”, escolha “Z-score”. 3) Clique em “Save and Close” logo abaixo e, para rodar a normalização, clique no ícone “Run Analysis”, indicado por um símbolo verde à sua direita. Observação: Caso você precise normalizar mais uma variável, o procedimento deverá ser feito em seqüencialmente. Para normalizar várias variáveis ao mesmo. Assim, com a base de dados selecionada, vários algoritmos de normalização podem ser selecionados de uma única vez, e em cada um deles uma variável diferente é coloca para ser normalizada, como pode ser visto pela figura abaixo. Lembre-se de configurar uma variável diferente para cada um dos blocos. 2. Rodando a clusterização K-Means 1) Após ter feito a normalização de todas as variáveis com as quais pretende trabalhar, o próximo passo é rodar a clusterização. Para isso, com vá sob a aba “Algorithms” e clique duas vezes sobre o ícone “R-K-Means”. A seguir, deixe o mouse sobre o círculo que indica o algoritmo e clique em “Configure Properties”. 2) Uma nova janela aparecerá e será pedido que você configure as propriedades para que a clusterização rode. Em “Independent Columns”, selecione as colunas que você previamente normalizou e com as quais deseja trabalhar. Em “Number of Clusters”, defina um número de clusters com o qual deseja trabalhar. Feito isso, clique em “Save and Close” e a seguir, em “Run Analysis” localizado no lado direito da tela, indicado por um símbolo verde. 3) A seguir, uma nova janela perguntando se você quer ir para os resultados aparecerá. Clique em “Sim”. Uma tabela com seus dados originais aparecerá. Para ver em quais clusters suas observações foram alocadas, vá para a última coluna. Lá aparecerá em qual cluster cada uma das observações que você teve foi alocada.