SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Fator Acidentário Previdenciário - FAP Uma contribuição da análise de agrupamentos Cleverson Pereira de Almeida Curitiba, agosto de 2004 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Contextualização: Art. 10, Lei 10.666/2003 “A alíquota de contribuição de um, dois ou três por cento, destinada ao financiamento do benefício de aposentadoria especial ou daqueles concedidos em razão do grau de incidência de incapacidade laborativa decorrente dos riscos ambientais do trabalho, poderá ser reduzida, em até cinqüenta por cento, ou aumentada, em até cem por cento, conforme dispuser o regulamento, em razão do desempenho da empresa em relação à respectiva atividade econômica, apurado em conformidade com os resultados obtidos a partir dos índices de freqüência, gravidade e custo, calculados segundo metodologia aprovada pelo Conselho Nacional de Previdência Social.” (grifos nossos) SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Contextualização (cont.): no Anexo à Resolução 1236, de 28 de abril de 2004, quando ilustra o “Fluxo Básico: Modelo EstatísticoEpidemiológico”, para determinação do FAP, apresenta a fase de “processamento” assim constituída: PROCESSAMENTO • Tratamento Epidemiológico – Capítulo CID x CNAE Classe e Empresas Geração de coeficientes padronizados de Freqüência, Gravidade e Custo Determinação de clusters (grupos homogêneos) para reenquadramento por CNAE utilizando a técnica de Análise de Conglomerados, (número de Clusters a priori igual a 3) dos coeficientes padronizados tridimensionais Cálculo do (FAP) por empresa utilizando a técnica de discriminação estatística a partir dos coeficientes tridimensionais padronizados. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Problema geral que a análise de agrupamentos pretende resolver: Dada uma amostra de n objetos (ou itens, ou indivíduos, ou pontos), cada um deles medido segundo p variáveis, procurar um esquema de classificação que agrupe tais objetos / indivíduos em g grupos. Devem ser determinados também o número e as características desses grupos. (Everitt, 1993; Chatfield & Collins, 1980) SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA “Traduzindo” para a questão de atribuição das alíquotas : Dado um conjunto de 560 CNAE, cada um deles medido segundo 3 variáveis (índices / coeficientes de freqüência, gravidade e custo), deve-se agrupá-los em 3 conjuntos, aos quais serão atribuídas as alíquotas de 1%, 2% e 3%. Pré-requisito: dados fidedignos (“blindados”). SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Geometricamente: ,8 ,6 ,4 FREQ ,2 0,0 -,2 1,2 1,0 ,8 ,6 ,4 CUST ,2 0,0 -,2 -,5 0,0 ,5 2,0 1,0 1,5 GRAV 2,5 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Questões-chave para a análise de agrupamentos: Quais os critérios de similaridade (os itens devem ser similares com relação a quê)? Qual a medida de similaridade a ser adotada (como calcular)? Qual o algoritmo (método) de agrupamento? Quantos serão os grupos resultantes (ou qual o número ideal / ótimo de grupos)? SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Medida de similaridade adotada: Distância euclidiana padronizada Medida mais conhecida (comum) para indicar proximidade entre dois pontos. d ( A, B) Padronizar as variáveis implica trazê-las para uma mesma ordem de grandeza. a1 b1 2 a2 b2 2 a p bp 2 Valor padronizado = (valor original – média) / desvio padrão SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Medida de similaridade adotada – Exemplo: Padronização da variável coeficiente de freqüência Média = 20,4978 Desvio-padrão = 71,0968 Para CNAE “xywz”: coeficiente original = 30,3991 coeficiente padronizado = (30,3991 – 20,4978) / 71,0968 = 0,1393 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Medida de similaridade adotada – Exemplo (cont.): Dados dois CNAE, “abcd” e “efgh”, com as coordenadas padronizadas (0,0345; 0,8755; 0,4871) e (0,3655; 1,1942; 1,0297), respectivamente, a distância euclidiana é: d (abcd, efgh) 0,0345 0,36552 0,8755 1,19422 0,4871 1,02972 0,7110 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Métodos de agrupamento: HIERÁRQUICOS DIVISIVOS NÃO-HIERÁRQUICOS AGLOMERATIVOS WARD Foco: variabilidade interna aos grupos. Princípio: minimização do quadrado da distância euclidiana às médias (centróides) dos agrupamentos. K MÉDIAS Técnica de partição que “leva” cada item para o grupo com o centróide mais próximo. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Procedimento adotado: Agrupamento, via método de Ward (com fixação de três grupos) Determinação dos centróides (médias) de cada um dos três grupos Agrupamento, via método das k médias, partindo daqueles centróides como “sementes”. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Justificativa(s): Recomenda-se que os métodos hierárquicos e nãohierárquicos sejam usados conjugadamente, com obtenção de uma solução inicial por meio de um processo hierárquico, sendo, então, os números de aglomerados e centróides desta aglomeração usados como entradas para um método não-hierárquico. (Malhotra, 2001; Johnson & Wichern, 1998; Milligan, 1980) “Dos métodos hierárquicos, os métodos do encadeamento médio e de Ward têm-se revelado superiores aos outros métodos”. (Malhotra, 2001, p. 531; Johnson & Wichern, 1998; Milligan, 1980) O método das k médias é, muito possivelmente, o mais usual, particularmente quando há grande número de itens, e pressupõe conhecimento da quantidade de grupos. (Johnson & Wichern, 1998; Bussab, Miazaki & Andrade, 1990) SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Antes do agrupamento: Separação dos pontos considerados discrepantes (ou atípicos). Por quê? Pontos com potencial para distorcer o resultado. Como? Calculadas as médias e desvios-padrão para cada dimensão (freqüência, gravidade e custo), determinaram-se os intervalos delimitados por média + ou – 2 desvios. Os CNAE fora de pelo menos um dos intervalos foram separados. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Antes do agrupamento – Exemplo: Para variável “coeficiente de freqüência”, com média = 20,4978 e desvio-padrão = 71,0968 Média + 2 desvios = 162,6914 Média – 2 desvios = -121,6958 CNAE “jlmn”, com coeficiente = 291,6667, é considerado atípico, pois 291,6667 > 162,6914. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Resultados: 532 CNAE = 560 – 27 (atípicos) – 1 (CNAE 9500) Software SPSS, versão 12.0 Método de Ward, com fixação de 3 grupos Centróides Cluster Freqüência Gravidade Custo 1 -0,2347 -0,4908 -0,1664 2 0,1557 0,4690 0,0309 3 0,3508 1,3849 -0,0674 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Resultados (cont.): Centróides iniciais dos clusters Cluster Método das k médias, com fixação de 3 grupos 1 2 3 Freqüência -0,2347 0,1557 0,3508 Gravidade -0,4908 0,4690 1,3849 Custo -0,1664 0,0309 -0,0674 Centróides finais dos clusters Cluster 1 2 3 Freqüência -0,2603 0,0523 0,3066 Gravidade -0,5524 0,1824 1,1267 Custo -0,1640 -0,0812 0,0357 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Resultados (cont.): Número de casos em cada cluster Cluster Método das k médias, com fixação de 3 grupos 1 325 2 130 3 77 Válidos 532 Distâncias entre centróides finais dos clusters Cluster 1 2 1 2 3 3 1,7834 0,8028 0,9849 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Resultados (cont.): Alíquotas atribuídas CNAE do grupo 1 (-0,2603; -0,5524; -0,1640) 1% CNAE do grupo 2 (0,0523; 0,1824; -0,0812) 2% CNAE do grupo 3 (0,3066; 1,1267; 0,0357) e 27 CNAE atípicos 3%. Exemplos: CNAE “dcba”, (-0,2878; -0,6012; -0,1735) 1% CNAE “hgfe”, (0,4698; 1,9489; -0,0826) 3% SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Graficamente 3% 2% 1% Coeficiente Freq. Padr. Coeficiente Custo Padr. Freq. Grav. Coeficiente Grav. Padr. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA E quanto ao FAP? Dentro de cada um dos CNAE, determinam-se médias e desvios-padrão para as três dimensões e padronizam-se os dados (neste caso, das empresas pertencentes àquele CNAE). Dada a necessidade de contemplar as 3 dimensões, dado o intervalo para o FAP [0,5; 2,0] e sendo este uma variável contínua, adota-se como parâmetro a soma das coordenadas padronizadas (ou seja, quantidade de desvios-padrão). Consideram-se atípicos os dados fora do intervalo [-6 desvios; +6 desvios]. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA E quanto ao FAP? (cont.) Soma das coordenadas padronizadas 6 FAP 2 0 1 -6 0,5 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA E quanto ao FAP? (cont.) Soma das coordenadas padronizadas FAP 6 2 Si FAPi 0 1 0 1 Si FAPi -6 0,5 SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA E quanto ao FAP? (cont.) 1 – Para somas de coordenadas no intervalo ]0; 6[ Si 0 FAPi 1 Si FAPi 1 60 2 1 6 Exemplo: Empresa com soma de coordenadas igual a 3 terá FAP igual a 1,5000. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA E quanto ao FAP? (cont.) 2 – Para somas de coordenadas no intervalo ]-6; 0[ Si 6 FAPi 0,5 Si FAPi 1 0 6 1 0,5 12 Exemplo: Empresa com soma de coordenadas igual a -3 terá FAP igual a 0,7500. SEMINÁRIO INTERNACIONAL TRABALHO, SAÚDE E QUALIDADE DE VIDA Cleverson Pereira de Almeida [email protected]