SAP PA e Clusterização:
Configurando e usando
algoritmo no SAP
1. Normalizando as variáveis
O primeiro passo para que a clusterização seja rodada é normalizar as variáveis com as
quais vamos trabalhar. Para isso, faça o seguinte procedimento:
1) Com o banco de dados com o qual pretende trabalhar aberto, vá em “Predict”
e sob a aba “Data Preparation”, clique em “Normalization”.
2) Uma seta indicando verde indicando um caminho para a normalização
aparecerá. Para configurar a normatização, deixe o mouse sobre o círculo que
corresponde à normalização e clique em “Configure Properties”. Uma caixa de
opções aparecerá na tela e você terá que escolher qual variável deseja
normalizar. Na opção “Normalization Method”, escolha “Z-score”.
3) Clique em “Save and Close” logo abaixo e, para rodar a normalização, clique no
ícone “Run Analysis”, indicado por um símbolo verde à sua direita.
Observação:
Caso você precise normalizar mais uma variável, o procedimento deverá ser feito em
seqüencialmente. Para normalizar várias variáveis ao mesmo. Assim, com a base de
dados selecionada, vários algoritmos de normalização podem ser selecionados de uma
única vez, e em cada um deles uma variável diferente é coloca para ser normalizada,
como pode ser visto pela figura abaixo. Lembre-se de configurar uma variável
diferente para cada um dos blocos.
2. Rodando a clusterização K-Means
1) Após ter feito a normalização de todas as variáveis com as quais pretende
trabalhar, o próximo passo é rodar a clusterização. Para isso, com vá sob a aba
“Algorithms” e clique duas vezes sobre o ícone “R-K-Means”. A seguir, deixe o
mouse sobre o círculo que indica o algoritmo e clique em “Configure
Properties”.
2) Uma nova janela aparecerá e será pedido que você configure as propriedades
para que a clusterização rode. Em “Independent Columns”, selecione as
colunas que você previamente normalizou e com as quais deseja trabalhar. Em
“Number of Clusters”, defina um número de clusters com o qual deseja
trabalhar. Feito isso, clique em “Save and Close” e a seguir, em “Run Analysis”
localizado no lado direito da tela, indicado por um símbolo verde.
3) A seguir, uma nova janela perguntando se você quer ir para os resultados
aparecerá. Clique em “Sim”. Uma tabela com seus dados originais aparecerá.
Para ver em quais clusters suas observações foram alocadas, vá para a última
coluna. Lá aparecerá em qual cluster cada uma das observações que você teve
foi alocada.
Download

2. SAP PA e clusterização K