INPE-16228-TDI/1547 MAPEAMENTO DO RISCO DA ESQUISTOSSOMOSE NO ESTADO DE MINAS GERAIS, USANDO DADOS AMBIENTAIS E SOCIAIS Flávia de Toledo Martins Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. Luciano Vieira Dutra e Corina da Costa Freitas, aprovada em 26 de fevereiro de 2008. Registro do documento original: <http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.07.13.17> INPE São José dos Campos 2009 PUBLICADO POR: Instituto Nacional de Pesquisas Espaciais - INPE Gabinete do Diretor (GB) Serviço de Informação e Documentação (SID) Caixa Postal 515 - CEP 12.245-970 São José dos Campos - SP - Brasil Tel.:(012) 3945-6911/6923 Fax: (012) 3945-6919 E-mail: [email protected] CONSELHO DE EDITORAÇÃO: Presidente: Dr. Gerald Jean Francis Banon - Coordenação Observação da Terra (OBT) Membros: Dra Maria do Carmo de Andrade Nono - Conselho de Pós-Graduação Dr. Haroldo Fraga de Campos Velho - Centro de Tecnologias Especiais (CTE) Dra Inez Staciarini Batista - Coordenação Ciências Espaciais e Atmosféricas (CEA) Marciana Leite Ribeiro - Serviço de Informação e Documentação (SID) Dr. Ralf Gielow - Centro de Previsão de Tempo e Estudos Climáticos (CPT) Dr. Wilson Yamaguti - Coordenação Engenharia e Tecnologia Espacial (ETE) BIBLIOTECA DIGITAL: Dr. Gerald Jean Francis Banon - Coordenação de Observação da Terra (OBT) Marciana Leite Ribeiro - Serviço de Informação e Documentação (SID) Jefferson Andrade Ancelmo - Serviço de Informação e Documentação (SID) Simone A. Del-Ducca Barbedo - Serviço de Informação e Documentação (SID) REVISÃO E NORMALIZAÇÃO DOCUMENTÁRIA: Marciana Leite Ribeiro - Serviço de Informação e Documentação (SID) Marilúcia Santos Melo Cid - Serviço de Informação e Documentação (SID) Yolanda Ribeiro da Silva Souza - Serviço de Informação e Documentação (SID) EDITORAÇÃO ELETRÔNICA: Viveca Sant´Ana Lemos - Serviço de Informação e Documentação (SID) INPE-16228-TDI/1547 MAPEAMENTO DO RISCO DA ESQUISTOSSOMOSE NO ESTADO DE MINAS GERAIS, USANDO DADOS AMBIENTAIS E SOCIAIS Flávia de Toledo Martins Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. Luciano Vieira Dutra e Corina da Costa Freitas, aprovada em 26 de fevereiro de 2008. Registro do documento original: <http://urlib.net/sid.inpe.br/mtc-m17@80/2008/02.07.13.17> INPE São José dos Campos 2009 Dados Internacionais de Catalogação na Publicação (CIP) M366m Martins, Flávia de Toledo. Mapeamento do risco da esquistossomose no Estado de Minas Gerais, usando dados ambientais e sociais / Flávia de Toledo Martins. – São José dos Campos : INPE, 2009. 144p. ; (INPE-16228-TDI/1547) Dissertação (Mestrado em Computação Aplicada) – Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 2008. Orientadores : Drs. Luciano Vieira Dutra e Corina da Costa Freitas. 1. Modelagem global. 2. Modelagem regional. 3. Regressão múltipla. 4. Classificação imprecisa. 5. Árvore de decisão. 6. Esquistossomose Mansoni. 7. Saúde pública. I.Tı́tulo. CDU 004.93’ 1:616.993.122(815.1) c 2009 do MCT/INPE. Nenhuma parte desta publicação pode ser reproduzida, armaCopyright zenada em um sistema de recuperação, ou transmitida sob qualquer forma ou por qualquer meio, eletrônico, mecânico, fotográfico, reprográfico, de microfilmagem ou outros, sem a permissão escrita da Editora, com exceção de qualquer material fornecido especificamente no propósito de ser entrado e executado num sistema computacional, para o uso exclusivo do leitor da obra. c 2009 by MCT/INPE. No part of this publication may be reproduced, stored in a Copyright retrieval system, or transmitted in any form or by any means, eletronic, mechanical, photocopying, recording, microfilming or otherwise, without written permission from the Publisher, with the exception of any material supplied specifically for the purpose of being entered and executed on a computer system, for exclusive use of the reader of the work. “Noventa por cento do sucesso se baseiam simplesmente em insistir." WOODY ALLEN A meus pais AGRADECIMENTOS Agradeço a Deus acima de tudo e a todos que contribuíram, de forma direta ou indireta, para a realização deste trabalho, em especial: À Prof. Dra. Corina, pela orientação, apoio e incentivo na realização deste trabalho e principalmente pela pessoa especial que demonstrou ser. E ao Prof. Dr. Luciano Dutra pela orientação e apoio na realização deste trabalho. Ao Instituto Nacional de Pesquisas Espaciais – INPE, pela oportunidade de estudos e utilização de suas instalações e a CAPES pelo apoio financeiro. Ao Prof. Dr. Camilo pela amizade e pela atenção dispensada a todas as minhas dúvidas. Ao Prof. Dr. Miguel, à Prof. Dra. Virginia pelas boas sugestões e a todos os professores do INPE pelo conhecimento compartilhado. Ao Omar da Fiocruz, ao Ronaldo do Ministério da Saúde e à Sandra da Secretaria de Saúde do Estado de Minas Gerais, pelos dados disponibilizados e pelas explicações sobre a esquistossomose. À Flávia Feitosa, à Helen Gurgel e à Isabela Drummond, pela boa vontade e disposição em ajudar. Ao Prof. Dr. Wolo pela amizade sincera, pelo incentivo e por fazer parte da minha vida! Aos amigos da Senzala que compartilharam todos os momentos comigo: Annete, Alessandra, Eliana, Fernanda, Graziela, Marinalva, Orlando, Thiago e Rogério. Aos companheiros de disciplina: Roberta, Egydio e Helaine pela amizade e força. Agradeço especialmente ao Eduardo Luz que foi o ombro amigo sempre presente. Se não fosse você não teria conseguido!!! Agradeço à Érica, pela amizade e companheirismo e o mais importante, por não desistir e não me deixar desistir!!! Ao meu futuro esposo, Fred pelo amor e compreensão em todas as horas. A meu pai, por sempre acreditar na importância do estudo e por sempre me apoiar e me incentivar. À minha mãe pelo amor, carinho e principalmente por compreender, mesmo sem entender, as minhas escolhas. Á minha irmã, que com certeza sempre torceu e torce por mim e ao meu querido irmão, que ainda torce por mim, mesmo lá do céu! RESUMO A esquistossomose mansoni é uma doença endêmica, transmitida por hospedeiros intermediários do gênero Biomphalaria. A esquistossomose está presente em diversos países, principalmente os subdesenvolvidos, infectando uma grande quantidade de pessoas e colocando várias outras em situação de risco. Como a doença é determinada por fatores ambientais e sociais que variam no espaço e no tempo, o uso de um sistema de informações geográficas facilita a determinação da distribuição da doença e a delimitação das possíveis áreas de risco. Nesta dissertação, foram usados os dados de prevalência da esquistossomose em 197 municípios do Estado de Minas Gerais, para estimar a prevalência da esquistossomose para os 853 municípios do Estado, juntamente com variáveis de sensoriamento remoto oriundas dos sensores MODIS e SRTM, variáveis climáticas, variáveis socioeconômicas e variáveis de caracterização de vizinhança. Com este objetivo, foram usadas várias técnicas, tais como: análise de regressão linear, classificação imprecisa, regionalização e reconhecimento de padrões, para a geração e comparação dos modelos global, regional, global impreciso, regional impreciso e de árvore de decisão. O modelo global foi desenvolvido usando um modelo de regressão linear para todo o Estado, alcançando 50,7% de exatidão global. O modelo regional contém um modelo de regressão linear para cada uma das quatro regiões propostas nesse trabalho e atingiu 66,90% de exatidão global. O modelo de árvore de decisão classificou a prevalência da doença em três faixas de risco: baixa, média e alta, alcançando 71,8% de exatidão global. A classificação imprecisa foi gerada a partir dos modelos de regressão linear usando intervalos de 55% e 60% de confiança, para o modelo global e regional, respectivamente. A classificação imprecisa atingiu 86,6% de exatidão global para o modelo global e 90,8% para o modelo regional. Finalmente a prevalência da doença foi estimada para os outros 656 municípios do Estado, onde não existem dados disponíveis, usando os cinco modelos desenvolvidos, sendo dois de regressão linear (global e regional), dois de classificações imprecisas e um de árvore de decisão. MAPPING OF THE RISK OF SCHISTOSOMIASIS IN MINAS GERAIS STATE, USING ENVIRONMENTAL AND SOCIAL DATA ABSTRACT The schistosomiasis mansoni is an endemic disease, transmitted by intermediate hosts of the genus Biomphalaria. The schistosomiasis is present in several countries, especially the underdeveloped, infecting a large number of people and putting several others in risk situation. As the disease is determined by environmental and social factors that vary in space and time, the use of a geographic information system facilitates the determination of the distribution of the disease and the delimitation of possible areas of risk. In this dissertation, were used the prevalence of schistosomiasis data in 197 municipalities in the Minas Gerais State, to estimate the prevalence of schistosomiasis for the 853 municipalities in the State, along with variables of remote sensing from the MODIS sensor and SRTM, climate variables, socioeconomic variables and variables of characterization of neighborhood. With this purpose, were used various techniques, such as linear regression analysis, imprecise classification, regionalization and pattern recognition for the generation and comparison of global, regional, imprecise global, imprecise regional and decision tree models. The global model was developed using one linear regression model for all state, reaching 50.7% of overall accuracy. The regional model contains a linear regression model for each one of the four regions proposed in this work and reached 66.90% of overall accuracy. The model of decision tree classified the disease prevalence in three ranges of risk: low, medium and high, reaching 71.8% of overall accuracy. The imprecise classification was generated from the linear regression models using intervals of 55% and 60% confidence for the global and regional models, respectively. The imprecise classification reached 86.6% of overall accuracy for the global model and 90.8% for the regional model. Finally the disease prevalence has been estimated for the other 656 municipalities in the state, where no data are available, using the five models developed, two linear regression (global and regional), two of imprecise classifications, and one decision tree. SUMÁRIO Pág. LISTA DE FIGURAS LISTA DE TABELAS LISTA DE SIGLAS E ABREVIATURAS LISTA DE SÍMBOLOS CAPÍTULO 1 ................................................................................................................ 25 INTRODUÇÃO ............................................................................................................ 25 1.1 Contextualização ...................................................................................................... 25 1.2 Justificativa e hipóteses do trabalho ......................................................................... 29 1.3 Objetivo .................................................................................................................... 30 1.3.1 Geral ...................................................................................................................... 30 1.3.2 Específicos............................................................................................................. 30 1.4 Estrutura do trabalho ................................................................................................ 31 CAPÍTULO 2 ................................................................................................................ 33 REVISÃO BIBLIOGRÁFICA .................................................................................... 33 2.1 Estudos para estimar a doença.................................................................................. 33 2.1.1 Estudos para estimar a doença no Brasil ............................................................... 36 CAPÍTULO 3 ................................................................................................................ 41 FUNDAMENTAÇÃO TEÓRICA............................................................................... 41 3.1 Variáveis de caracterização de vizinhança ............................................................... 41 3.2 Regionalização ......................................................................................................... 44 3.3 Regressão linear múltipla ......................................................................................... 45 3.4 Classificação imprecisa ............................................................................................ 48 3.5 Árvore de decisão ..................................................................................................... 49 CAPÍTULO 4 ................................................................................................................ 51 MATERIAIS ................................................................................................................. 51 4.1 Área de estudo .......................................................................................................... 51 4.2 Variáveis utilizadas................................................................................................... 52 4.2.1 Variáveis de Sensoriamento Remoto..................................................................... 53 4.2.2 Variáveis climáticas............................................................................................... 55 4.2.3 Variáveis socioeconômicas.................................................................................... 56 4.2.4 Variáveis de caracterização de vizinhança ............................................................ 59 4.3 Softwares utilizados.................................................................................................. 61 CAPÍTULO 5 ................................................................................................................ 63 METODOLOGIA......................................................................................................... 63 5.1 Variáveis de caracterização de vizinhança ............................................................... 63 5.2 Regionalização ......................................................................................................... 65 5.3 Regressão linear múltipla ......................................................................................... 66 5.4 Classificação Imprecisa ............................................................................................ 68 5.5 Comparação dos modelos global e regional ............................................................. 71 5.6 Árvore de decisão ..................................................................................................... 71 5.7 Comparação dos modelos......................................................................................... 72 CAPÍTULO 6 ................................................................................................................ 73 RESULTADOS E DISCUSSÕES ............................................................................... 73 6.1 Variáveis de caracterização de vizinhança ............................................................... 73 6.2 Regionalização ......................................................................................................... 74 6.3 Análise de Regressão Linear .................................................................................... 76 6.3.1 Modelo Global....................................................................................................... 76 6.3.1.1 Classificação imprecisa para o modelo Global................................................... 81 6.3.2 Modelo Regional ................................................................................................... 84 6.3.2.1 Classificação imprecisa para o modelo Regional ............................................... 90 6.3.3 Comparação Modelo Global e Modelo Regional .................................................. 92 6.4 Árvore de decisão ..................................................................................................... 97 6.5 Comparação das modelagens.................................................................................. 101 CAPÍTULO 7 .............................................................................................................. 105 CONCLUSÕES........................................................................................................... 105 CAPÍTULO 8 .............................................................................................................. 109 CONSIDERAÇÕES FINAIS..................................................................................... 109 REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 111 APÊNDICE A ............................................................................................................. 117 APÊNDICE B.............................................................................................................. 119 APÊNDICE C ............................................................................................................. 121 LISTA DE FIGURAS 1.1 – a) Forma cutânea b) Esplenomegalia c) Neuroesquistossomose......................... 26 3.1 – Estimador kernel gaussiano. .................................................................................. 42 4.1 – Mapa da divisão política do Estado de Minas Gerais............................................ 51 4.2 – Prevalência da Esquistossomose (1984-2005). ..................................................... 52 5.1 – Diagrama da metodologia empregada. .................................................................. 63 5.2 – Fases de uma análise de regressão......................................................................... 67 6.1 – Regionalização do Estado de Minas Gerais. ......................................................... 75 6.2 – Amostras usadas para a construção e para a validação. ........................................ 77 6.3 – R2 vs.número de variáveis. .................................................................................... 77 6.4 – Mapas temáticos (a) do risco da prevalência da esquistossomose estimada através do modelo 4, (b) do desvio padrão do modelo, e (c) dos resíduos do modelo. ...... 80 6.5– Gráfico de classificações imprecisas do modelo global para as amostras de construção (a) e para as amostras de validação (b). ............................................... 82 6.6 – Mapas temáticos do risco da prevalência da esquistossomose com 55% de confiança: (a) da classificação imprecisa; (b) da classificação mais otimista; e (c) da classificação menos otimista.............................................................................. 83 6.7 – Distribuição das amostras que possuem informação de prevalência da esquistossomose em cada região. ........................................................................... 84 6.8- Mapa temático modelo regional: a) Estimativa do risco da prevalência da esquistossomose no Estado e Minas Gerais; b) Desvio Padrão da estimativa e c) Resíduos do Modelo. .............................................................................................. 89 6.9 – Gráfico de classificações imprecisas do modelo regional. .................................... 91 6.10 – Mapas temáticos do risco da prevalência da doença com 60% de confiança: (a) da classificação imprecisa, (b) da classificação mais otimista e (c) da classificação menos otimista........................................................................................................ 92 6.11 – Representação gráfica da árvore de decisão. ....................................................... 98 6.12 – (a)Risco da prevalência da esquistossomose classificada através da árvore de decisão; (b) Erros de classificação........................................................................ 101 LISTA DE TABELAS 4.1 – Número de variáveis explicativas.......................................................................... 53 4.2 – Variáveis de Sensoriamento Remoto..................................................................... 55 4.3 – Variáveis Climáticas.............................................................................................. 56 4.4 – Variáveis socioeconômica. .................................................................................... 57 4.4 – Conclusão. ............................................................................................................. 58 4.5 – Variáveis de caracterização da influência de vizinhança. ..................................... 59 4.5 – Conclusão. ............................................................................................................. 60 5.1 – Resultados possíveis da classificação imprecisa. .................................................. 68 5.2 – Classificação imprecisa vs. classificação da prevalência observada..................... 69 6.1 – Correlação prevalência da doença com variáveis de caracterização da influência de vizinhança............................................................................................................... 74 6.2 – Validação dos modelos.......................................................................................... 79 6.3 – Coeficientes Betas normalizados e valor-p das variáveis, o coeficiente de correlação e o R2 do modelo global........................................................................ 79 6.4 – Betas e p-valor das Variáveis, o coeficiente de correlação e R2 do modelo regional. ................................................................................................................................ 85 6.5– Matriz de confusão do modelo global (modelo 4).................................................. 93 6.6 – Matriz de confusão do modelo regional. ............................................................... 93 6.7 – Amostras classificadas corretamente Modelo Global e Regional. ........................ 94 6.8 – Desvio Padrão Modelo Global e Regional. ........................................................... 95 6.9 – Resíduos Modelo Global e Regional. .................................................................... 95 6.10 – Matriz de confusão para as amostras de construção da classificação imprecisa do Modelo Global a 55% de confiança. ...................................................................... 96 6.11 – Matriz de confusão para as amostras de validação da classificação imprecisa do Modelo Global a 55% de confiança. ...................................................................... 96 6.12 – Matriz de confusão para as amostras de construção da classificação imprecisa do Modelo Regional a 60% de confiança.................................................................... 96 6.13 – Matriz de confusão para as amostras de validação da imprecisa do Modelo Regional a 60% de confiança. ................................................................................ 96 6.14 – Matriz de confusão. ........................................................................................... 100 6.15 – Porcentagem de amostras classificadas corretamente em cada modelo. ........... 102 A.1 – Correlação entre as variáveis do modelo global. ................................................ 117 A.2 – Correlação entre as variáveis do modelo para a região 1. .................................. 118 A.3 – Correlação entre as variáveis do modelo para a região 2. .................................. 118 A.4 – Correlação entre as variáveis do modelo para a região 3. .................................. 118 A.5 – Correlação entre as variáveis do modelo para a região 4. .................................. 118 B.1 – Matriz de confusão Região 1 – Conjunto de Treinamento. ................................ 119 B.2 - Matriz de confusão Região 2 – Conjunto de Treinamento.................................. 119 B.3 – Matriz de confusão Região 2 – Conjunto de Teste. ............................................ 119 B.4 – Matriz de confusão Região 3 – Conjunto de Treinamento. ................................ 119 B.5 - Matriz de confusão Região 3 – Conjunto de Teste.............................................. 120 B.6 – Matriz de confusão Região 4 – Conjunto de Treinamento. ................................ 120 B.7 – Matriz de confusão Região 4 – Conjunto de Teste. ............................................ 120 C.1 – Siglas das estimativas mostradas na Tabela C.2................................................. 121 C.2 – Estimativa do risco da prevalência pelo modelo Global, pelo Modelo Regional e pela Árvore de decisão. ........................................................................................ 121 C.2 – Continuação. ....................................................................................................... 122 C.2 – Continuação. ....................................................................................................... 123 C.2 – Continuação. ....................................................................................................... 124 C.2 – Continuação. ....................................................................................................... 125 C.2 – Continuação. ....................................................................................................... 126 C.2 – Continuação. ....................................................................................................... 127 C.2 – Continuação. ....................................................................................................... 128 C.2 – Continuação. ....................................................................................................... 129 C.2 – Continuação. ....................................................................................................... 130 C.2 – Continuação. ....................................................................................................... 131 C.2 – Continuação. ....................................................................................................... 132 C.2 – Continuação. ....................................................................................................... 133 C.2 – Continuação. ....................................................................................................... 134 C.2 – Continuação. ....................................................................................................... 135 C.2 – Continuação. ....................................................................................................... 136 C.2 – Continuação. ....................................................................................................... 137 C.2 – Continuação. ....................................................................................................... 138 C.2 – Continuação. ....................................................................................................... 139 C.2 – Continuação. ....................................................................................................... 140 C.2 – Continuação. ....................................................................................................... 141 C.2 – Continuação. ....................................................................................................... 142 C.2 – Continuação. ....................................................................................................... 143 C.2 – Conclusão............................................................................................................ 144 LISTA DE SIGLAS E ABREVIATURAS AVHRR - AdvancedVery High Resolution Radiometer FAO - United Nations Food and Agriculture Organization FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais FIOCRUZ - Fundação Oswaldo Cruz IDH - Índice de Desenvolvimento Humano MODIS - Moderate Resolution Imaging Spectroradiometer MSE - Média dos quadrados dos resíduos MSPR - Média dos quadrados dos resíduos das amostras separadas para a validação NDVI - Índice de vegetação da diferença normalizada NOAA - National Oceanic and Atmospheric Admininstration's S. japonicum - Schistossoma japonicum S. mansoni - Schistossoma mansoni SIG - Sistema de Informações Geográficas SNIU - Sistema Nacional de Indicadores Urbanos SR - Sensoriamento Remoto SRTM - Shuttle Radar Topography Mission UFMG - Universidade Federal de Minas Gerais LISTA DE SÍMBOLOS ( Lj - Intensidade populacional local ( L jm - Intensidade populacional local de um grupo populacional ( P*(m,n ) ( Q*m Índice espacial de exposição do grupo m ao grupo n Índice espacial de isolamento do grupo m R - Coeficiente de correlação R2 - Coeficiente de determinação CAPÍTULO 1 INTRODUÇÃO 1.1 Contextualização De todas as infecções parasíticas que afetam o homem, a esquistossomose é uma das mais difundidas, presente em mais de 74 países (praticamente todos subdesenvolvidos), onde mais de 200 milhões de pessoas são infectadas a cada ano, deixando de 500 a 600 milhões expostas à doença (WHO, 1993). No Brasil, ocorre a esquistossomose mansoni que tem como agente etiológico o trematódeo Schistosoma mansoni (S. mansoni). A dispersão da doença é lenta e progressiva no país, instalando-se por conta do saneamento precário ou inexistente. As pessoas se contaminam através de diversos tipos de contato (trabalho, lazer, banho) com água natural infestada por cercárias que são eliminadas na água através de hospedeiros intermediários, moluscos límnicos do gênero Biomphalaria (B. glabrata, B. tenagophila, B. straminea) (DOUMENGE et al., 1987). Provavelmente a esquistossomose foi trazida da África para o Brasil no século XVI, nos primórdios da colonização européia, em virtude do tráfico de escravos. Pelos dados do programa de controle da esquistossomose do Ministério da Saúde de 1995 a 2005, foram notificados mais de um milhão de casos positivos da doença, dos quais 27,5% dos casos positivos foram notificados no Estado de Minas Gerais. Existem também outros focos da doença disseminados pelo país, principalmente nos estados da Bahia e Espírito Santo. Estima-se que existam no país entre 10 e 12 milhões de pessoas infectadas (AMARAL ; PORTO, 1994). Os primeiros casos de esquistossomose registrados em Minas Gerais foram observados por Teixeira (1920), na cidade Belo Horizonte. Naquela oportunidade foram examinadas 9.995 pessoas “de todas as idades e condições”, sendo os ovos de S.mansoni encontrados nas fezes de 49 pacientes (0,5%). 25 A esquistossomose apresenta formas cutâneas (Figura 1.1a), agudas ou crônicas. A forma cutânea dura aproximadamente 10 dias e ocorre após a penetração das cercárias na pele humana. A forma aguda dura de 10 a 120 dias e apresenta sintomatologia variada, mas com predominância intestinal. A forma crônica depende dos órgãos atingidos, da carga parasitária (número de ovos) e da duração da doença. Por vezes, podem surgir formas graves, com extensa fibrose hepática, hipertensão porta, esplenomegalia (Figura 1.1b) e neuroesquistossomose (Figura 1.1c), podendo o indivíduo ficar paralítico. Porém, na maioria das vezes a doença é assintomática podendo o indivíduo morrer sem sequer saber que esteve infectado (DIAS, 1998). a) c) b) FIGURA 1.1 – a) Forma cutânea b) Esplenomegalia c) Neuroesquistossomose. O tratamento da esquistossomose é simples, devido à disponibilidade de drogas, como o oxamniquine (com taxa de cura de 65 - 80% ) ou o praziquantel (com taxa de cura de 78 - 90%) de ação rápida, em dose única, administradas por via oral. No entanto, a prevalência da doença permanece inalterada em regiões endêmicas e vem se expandindo principalmente na periferia dos grandes centros urbanos. Isto se deve, na maioria das vezes, ao fato da droga não conferir imunidade, levando a reinfecções de indivíduos já tratados. Estes indivíduos ficam em constante exposição ao agente infectante tornandose necessário repetir a conduta terapêutica, em intervalos de tempo variados, aumentando os efeitos tóxicos da droga (KATZ; CARVALHO, 1983; KATZ et al., 1989). O ciclo da doença é relativamente simples, mas de enorme complexidade social que depende da existência de homem eliminando ovos do parasita, de coleções hídricas habitadas por moluscos suscetíveis e das necessidades cotidianas das pessoas. Porém sabe-se que a transmissão da doença é mais dependente do comportamento do homem 26 do que do vetor, pois a infecção se dá fora de casa no contato com águas naturais contaminadas por fezes de portadores do verme. Por isso a doença, ainda hoje, pode ser considerada um caso de saúde pública devido à incidência em regiões pobres do país e, portanto, requer estudos que ajudem a relacionar a incidência da doença com variáveis sociais ou ambientais. Esta relação tem como objetivo determinar locais que potencialmente podem desenvolver a doença. Uma vez que a esquistossomose é uma doença determinada no espaço e no tempo por fatores ambientais e sociais, o Sistema de Informações Geográficas (SIG) é uma ferramenta útil que pode ser empregada para melhor conhecer a distribuição da doença. A utilização de SIG e Sensoriamento Remoto (SR) na identificação de características ambientais que permitam determinar e delimitar, respectivamente, os fatores e as áreas de risco, possibilita indicar uma melhor distribuição de recursos que permite um direcionamento mais adequado para o controle da doença (BAVIA et al., 2001; BECK et al., 2000; BECK et al., 1997; CARVALHO et al., 2005). Também seria de grande valor para o estudo considerar as relações de vizinhança, já que a doença tem caráter comportamental e social e pode ser influenciada pelo seu entorno. Por exemplo, os domicílios de um município que tenha um bom saneamento, mas que possua municípios vizinhos cujos domicílios possuam saneamento precário ou inexistente, estariam mais expostos ao possível contágio ao usar recursos hídricos naturais. A informação de vizinhança foi incorporada neste trabalho através do desenvolvimento de variáveis de caracterização de influência da vizinhança. Essas variáveis são uma adaptação do uso das medidas de segregação (índices espaciais de isolamento e exposição) descritas por Feitosa (2007). As variáveis de caracterização de influência da vizinhança medem a disparidade entre municípios vizinhos em relação às variáveis sócio-ambientais (renda, educação, saneamento esgoto, saneamento água e acumulação hídrica). Espera-se que, por considerar o arranjo espacial dos dados, as variáveis de caracterização de vizinhança possam ser úteis para estimar a prevalência da doença. 27 Outras variáveis tais como, variáveis climáticas e variáveis socioeconômicas demonstraram ser eficientes em trabalhos anteriores para estimar a prevalência da esquistossomose (FREITAS et al., 2006). As variáveis climáticas refletem as condições de sobrevivência do caramujo e das várias formas da larva do Schistosoma mansoni. As variáveis socioeconômicas refletem os fatores sociais que estão associados a esse tipo de doença, tais como: forma de acesso à água, o tipo de esgoto, a zona de residência, a escolaridade e a renda. O presente trabalho dá continuidade a um projeto da FAPEMIG (processo: 1775/03) iniciado em 2003, intitulado “Desenvolvimento de um sistema de informações para o estudo, planejamento e controle da esquistossomose no Estado de Minas Gerais” e faz parte de um novo projeto de 2006 (processo: 893/05) intitulado “Desenvolvimento de metodologias e ferramentas de geoprocessamento na análise espacial e distribuição da esquistossomose no Estado de Minas Gerais”. Este projeto é um esforço conjunto entre o Instituto Nacional de Pesquisas Espaciais (INPE), a Fundação Oswaldo Cruz (FIOCRUZ), e a Universidade Federal de Minas Gerais (UFMG). O objetivo deste trabalho é estimar o risco da prevalência da esquistossomose no Estado de Minas Gerais usando variáveis obtidas por SR, variáveis climáticas, variáveis socioeconômicas e variáveis de caracterização de vizinhança (propostas neste trabalho). Várias técnicas foram usadas para este propósito, incluindo analise de regressão linear, regionalização e reconhecimento de padrões. Utilizando análise de regressão, duas abordagens são consideradas: na primeira, um modelo de regressão linear é definido para estimar a doença em todo o Estado; a segunda abordagem consiste em determinar regiões homogêneas para o Estado e definir modelos de regressão linear diferentes para cada região do Estado. Assim, pretende-se também neste trabalho, comprovar a hipótese de que a regionalização do Estado de Minas Gerais contribui para a melhora da estimativa da doença, pelo fato de existir características sócio-ambientais diferentes relacionadas à doença em partes diferentes do Estado. 28 Técnicas de reconhecimento de padrões são também utilizadas para identificar classes de gravidade da prevalência da doença. A técnica de reconhecimento de padrões adotada nesse trabalho, árvore de decisão, é baseada em regras definidas a partir do particionamento recursivo das variáveis preditoras, no qual o conhecimento sobre o problema pode ser representado por meio de uma estrutura de regras de decisão (ARAKI, 2005; MARCELINO, 2003). Um outro diferencial abordado neste trabalho é o uso da classificação imprecisa através de cenários, mais otimista e menos otimista, da prevalência estimada dos modelos de regressão linear, calculados usando o desvio padrão da estimativa e vários níveis de confiança. O uso da classificação imprecisa é uma adaptação da classificação adotada em Drummond e Sandri (2006). O fator limitante desse trabalho se deve ao fato dos dados de prevalência da doença serem disponibilizados em nível de município, pela Secretaria de Saúde de Minas Gerais, já que a esquistossomose é uma doença de caráter pontual. Além disso, as informações das variáveis de SR são camufladas ou descaracterizadas quando se calcula a média por município. Seria de grande valia para o estudo a disponibilização de dados de localidade para geração de uma estimativa de risco mais precisa e confiável. 1.2 Justificativa e hipóteses do trabalho O presente trabalho se justifica dada a necessidade de se encontrar ferramentas para estimar o risco da prevalência da esquistossomose através de modelos que expliquem a relação das variáveis sócio-ambientais com a prevalência da doença, o que permite caracterizar regiões mais suscetíveis a sua ocorrência. Esse assunto é de suma importância para o controle da esquistossomose em território brasileiro. Desse modo, o trabalho inclui três hipóteses principais. A primeira sugere que a introdução das variáveis de caracterização de vizinhança melhora a estimativa da doença. A segunda hipótese sugere que pelo fato do Estado de Minas Gerais possuir grandes variações socioeconômicas, a separação do Estado em áreas homogêneas (regionalização) para o desenvolvimento de um modelo de regressão linear múltipla 29 para cada área, melhora a estimativa da prevalência da doença. A terceira hipótese indica que o método de classificação por árvore de decisão é adequado para classificação de risco em estudos epidemiológicos, como no caso, a prevalência da esquistossomose em Minas Gerais. Os resultados obtidos serão divulgados com a finalidade de favorecer a elaboração de plano de ação por parte do programa de controle da esquistossomose, da CoordenaçãoGeral de Doenças Transmissíveis, da Secretaria de Vigilância em Saúde. Espera-se que as metodologias empregadas colaborem para a prevenção desta e de outras doenças. 1.3 Objetivo 1.3.1 Geral O presente estudo tem como objetivo geral estimar o risco da prevalência da esquistossomose no Estado de Minas Gerais através da utilização de variáveis obtidas por sensoriamento remoto, variáveis climáticas, variáveis socioeconômicas e variáveis de caracterização de vizinhança. 1.3.2 Específicos • Propor variáveis de caracterização de vizinhança usando dados sócio-ambientais relevantes para a estimativa de prevalência de esquistossomose; • Propor uma regionalização no Estado de Minas Gerais para desenvolver um modelo estatístico para cada região; • Determinar quais as variáveis mais importantes para a predição da esquistossomose no Estado de Minas Gerais; • Desenvolver modelo de regressão múltipla linear para prever o risco da esquistossomose em áreas do Estado de Minas Gerais, para as quais não existem dados disponíveis; 30 • Realizar a classificação imprecisa através da estimativa dos modelos regional e global e do desvio padrão dos modelos, para gerar um nível de confiança dos resultados; • Desenvolver regras de classificação através de árvore de decisão para prever o risco da doença em áreas do Estado de Minas Gerais, para os quais não existem dados disponíveis; • Comparar os modelos de regressão linear com o modelo de árvore de decisão, baseado em regras de classificação; • Divulgar os resultados obtidos para favorecer a elaboração de plano de ação por parte do programa de controle da esquistossomose, da coordenação geral de doenças transmissíveis, da secretaria de vigilância em saúde. 1.4 Estrutura do trabalho Esta dissertação está organizada em sete capítulos. O capítulo 2 descreve alguns estudos abordados na literatura para estimar a esquistossomose e discute as inovações propostas neste trabalho. O capítulo 3 refere-se a fundamentação teórica, onde são apresentados os índices espaciais de isolamento e exposição descritos por Feitosa (2005) que foram usados para geração das variáveis de caracterização da vizinhança, a regionalização, a regressão linear, a classificação imprecisa e a árvore de decisão. O Capítulo 4 descreve a área de estudo, as variáveis, e os softwares utilizados nesta dissertação. No capítulo 5 é mostrada a metodologia deste trabalho. Os resultados obtidos são apresentados no capítulo 6 e são feitas algumas discussões sobre eles. Finalmente o capítulo 7 traz as considerações finais e propostas para trabalhos futuros. 31 32 CAPÍTULO 2 REVISÃO BIBLIOGRÁFICA Neste capítulo é feito um resumo sobre alguns trabalhos encontrados na literatura para estimar a esquistossomose em diversas regiões da África e da Ásia e em dois estados brasileiros, Bahia e Minas Gerais. São também apresentadas as inovações propostas neste trabalho para melhorar as estimativas de prevalência da esquistossomose. 2.1 Estudos para estimar a doença Documenta-se bem que o clima e as variáveis ambientais influenciam a distribuição da esquistossomose. Assim, as variáveis oriundas de SR e variáveis meteorológicas juntamente com SIG, possuem grande potencial em predizer a transmissão da esquistossomose (BROOKER, 2002). Por exemplo, Malone et al. (1994) investigaram a distribuição do S. mansoni no Egito usando dados do sensor AdvancedVery High Resolution Radiometer (AVHRR) a bordo do National Oceanic and Atmospheric Administration’s (NOAA) para derivar mapas da diferença de temperatura diurna (dT). Esses mapas indicam a umidade na superfície do solo e na cobertura da planta, atuando como substituto para a concentração do molusco, B. alexandrina. Eles concluíram que os valores menores de dT estão associados ao aumento da concentração do caramujo em áreas úmidas com fluxo, ambiente mais apropriado ao habitat do caramujo. Em 1997, além da diferença de temperatura diurna, Malone et al. (1997) utilizaram índice de vegetação da diferença normalizada (NDVI) como dados de requisitos naturais, juntamente com um SIG. Os resultados mostraram que a hipótese de que esses dados podem estar relacionados com a propagação e transmissão da esquistossomose no Egito, é verdadeira. 33 Gong et al. (1999) usaram o mapeamento temático de Landsat para traçar o habitat do caramujo e usaram SR juntamente a uma base de dados do SIG para delinear e modelar o espaço para o estudo da dinâmica da transmissão da esquistossomose em Sichuan, China. Yang et al. (2005a) fez uma revisão do uso do SIG e SR com aplicações na epidemiologia e no controle da esquistossomose na China. Nessa revisão alguns trabalhos de 1998 a 2005 foram relacionados. Esses trabalhos são apresentados a seguir. Em 1998, Maszle et al. avaliaram modelos hidrológicos nas áreas de transmissão afetadas severamente pela esquistossomose em Minhe e Hexing, província de Sichuan (China), utilizando SIG, juntamente com fatores ambientais (ar, água, solo, temperatura, dias de chuva, redes de irrigação e sistema natural de drenagem) e fatores epidemiológicos (incidência da doença, localização da residência do doente, informação do contato com água, densidade da população do caramujo e dados de detecção de cercárias) (MASZLE et al., 1998 citado por YANG et al., 2005a). No sul da China, em 1998, Zhou et al. utilizaram SIG, juntamente com fatores ambientais (temperatura, pancadas de chuva, evaporação) para predizer o risco de transmissão espacial da esquistossomose (ZHOU et al., 1998 citado por YANG et al., 2005a). Em 1999, na província de Jiangsu e em áreas adjacentes, Zhou et al. utilizaram SIG juntamente com a prevalência da doença e fatores ambientais (NDVI, índice de risco de clima, temperatura da superfície da terra e média da temperatura mínima em janeiro), para identificar “pontos quentes” de alta intensidade de transmissão (ZHOU et al., 1999 citado por YANG et al., 2005a). Em 2000, Zhou et al. mapearam a distribuição espacial da esquistossomose utilizando amostras de pesquisa nacional de 1989 e 1995, para toda a China (ZHOU et al., 2000 citado por YANG et al., 2005a). Já em 2001, Zhou et al. fizeram um avanço no desenvolvimento de modelos para a predição da doença usando SR, SIG e os dados do clima com base em dados históricos de prevalência, confirmando os efeitos do projeto da represa Three Gorges do rio de Yangtze nas mudanças ambientais que podem 34 impactar mudanças na distribuição espacial e temporal do S. japonicum na China, e ao sucesso de futuros programas de controle da doença (ZHOU et al., 2001). Também em 2002, Yang et al. analisaram dados de séries temporais em Anhui, Jiangsu e província Jiangxi utilizando SIG e dados de prevalência do S. japonicum de 1980 a 1998 (YANG et al., 2002a citado por YANG et al., 2005a). Em outro trabalho de 2002, Yang et al. estimaram a distribuição espacial da esquistossomose utilizando também SIG e dados da prevalência da doença de 1990 a 1998 (YANG et al., 2002b citado por YANG et al., 2005a). Em 2005, Yang et al. fizeram uma aproximação baseada numa rede Bayesiana para modelar a prevalência espaço-temporal do nível de infecção do S. japonicum na província de Jiangsu, China e concluiram que os modelos que combinam o SIG, SR e as aproximações estatísticas baseado numa rede Bayesiana facilitam estabelecer o risco da doença (YANG et al., 2005b). Em 2001, Malone et al. propuseram a criação de modelos computacionais que podem ser usados para melhorar os programas de controle da esquistossomose e outras doenças transportadas por caramujo de importância médica e veterinária. Os modelos são construídos usando métodos de SIG, modelos de dados climáticos globais, dados de satélites, dados de prevalência da doença, da distribuição dos moluscos hospedeiros, e mapas digitais dos principais fatores ambientais que afetam o desenvolvimento e propagação dos agentes da esquistossomose na Etiópia (MALONE et al., 2001a). Também em 2001, na Etiópia, Malone et al. utilizaram mapas do NDVI e da temperatura da superfície da terra (Tmax), obtidos pelo satélite NOAA e SIG para o desenvolvimento de um modelo de risco da esquistossomose. A área endêmica do modelo predito era similar àquela de um modelo prévio desenvolvido usando um conjunto de dados independentes da zona agro ecológica da United Nations Food and Agriculture Organization (FAO). O modelo desenvolvido para a Etiópia foi extrapolado para o leste da África com sucesso (MALONE et al., 2001b). 35 Brooker et al. (2001; 2002b) usaram dados do sensor AVHRR juntamente com dados de prevalência da esquistossomose em escolares para desenvolver e validar modelos de regressão logística para estimar o risco da infecção pelo S. haematobium na Tanzânia e em Camarões. Os modelos predizem se a prevalência é maior que 50%. Brooker (2002a) fez uma análise dos progressos do uso e da aplicação do SIG e do SR na epidemiologia e no controle da esquistossomose na África. Raso et al. (2006) usaram variogramas dos modelos Bayesianos para avaliar os fatores de risco e a variação espacial da co-infecção do S. mansoni e do tênia com relação às variáveis demográficas, ambientais, e socioeconômicas, incorporadas em um SIG, para o oeste da Costa do Marfim. Os modelos mostraram que a idade, o sexo, o status socioeconômico, e a elevação do terreno eram bons preditores para a distribuição espacial da co-infecção. 2.1.1 Estudos para estimar a doença no Brasil No Brasil foram realizados alguns estudos sobre esquistossomose mansoni usando ferramentas de geoprocessamento no Estado da Bahia e em Minas Gerais. Nesses estudos foram identificados fatores ambientais que influenciam a distribuição da esquistossomose usando mapas com características ambientais e dados de prevalência da doença (BAVIA et al., 1999; BAVIA et al., 2001; FREITAS et al., 2006; GUIMARÃES et al., 2006). Na Bahia, Bavia et al. (1999), observaram que a densidade da população e a duração do período de chuva anual são de grande importância para determinar a prevalência da esquistossomose em áreas selecionadas para o estudo. Bavia et al. (2001) confirmaram que uso do NDVI, da diferença média da temperatura diurna, da duração do período seco e da densidade populacional humana como fatores de risco ambiental no modelo estimado de regressão linear múltipla que obteve o coeficiente de correlação de 0,40. 36 Dutra et al. (2005a) desenvolveram dois índices hidrológicos, usando o SRTM1 (Shuttle Radar Topography Mission), o Índice de Molhamento (IM) e o Índice de Empoçamento (IE), os quais supõem-se depender de fatores topográficos (declividade local e mapa de acumulação hídrica) e da precipitação acumulada. A suposição básica para uso desses índices é que quanto maiores são esses índices, maior é o potencial de existência de uma ambiente hídrico propício para a vida do molusco transmissor. Porém a correlação do IM com a prevalência da esquistossomose foi considerada desprezível. O IE demonstrou maior correlação com os valores de prevalência quando comparados ao IM. Dutra et al. (2005b) usaram imagens SRTM para mapear a rede de drenagem e para estudar a rugosidade do terreno em Minas Gerais. O estudo relacionou a variação do limiar de rugosidade do terreno com a distribuição da prevalência da esquistossomose, que indicou que as regiões mais rugosas favorecem a retenção de água na forma de poças, gerando ambiente propício para o molusco. Guimarães et al. (2005b) utilizaram o modelo linear de mistura espectral de imagens do MODIS2 (Moderate Resolution Imaging Spectroradiometer) e SRTM para determinar as imagens-fração vegetação, solo e sombra de janeiro e julho/2002 e verificar a existência de correlação com a prevalência da esquistossomose e com a presença ou não de Biomphalaria glabatra em Minas Gerais. Foram utilizadas as médias das frações em 96 municípios com prevalência maior que zero e presença de Biomphalaria. Guimarães et al. (2006) fizeram uma análise da distribuição da esquistossomose utilizando SIG, além da estimativa da prevalência da doença para o Estado de Minas Gerais usando regressão múltipla com variáveis socioeconômicas (índice de desenvolvimento humano (IDH), renda, longevidade, e educação), variáveis climáticas (precipitação acumulada, temperatura máxima e mínima), além de variáveis qualitativas 1 O SRTM consistiu em um sistema de radar que voou a bordo do ônibus espacial Endeavour e obteve dados de elevação em uma escala global para gerar um banco de dados de modelo topográfico digitais da Terra com resolução espacial de 90 metros. Fonte:< http://www2.jpl.nasa.gov/srtm/mission.htm > 2 MODIS é um instrumento a bordo dos satélites Terra (EOS AM) e Aqua (EOS PM). A órbita do satélite Terra em torno da Terra atravessa o equador de Norte a Sul pela manhã, enquanto o satélite Aqua atravessa o equador de Sul a Norte pela tarde. Os produtos MODIS podem ser obtidos através do site: < http://modis.gsfc.nasa.gov/> 37 (caatinga, cerrado ou floresta). O modelo selecionado com R2 de 0,36 contém uma variável climática (temperatura mínima no verão), uma variável social (IDH) e a variável qualitativa do tipo de vegetação. Freitas et al. (2006) usaram a prevalência da esquistossomose no Estado de Minas Gerais para estabelecer uma relação entre vinte variáveis oriundas de SR derivados dos sensores MODIS e SRTM através de regressão múltipla, chegando a um modelo com R2 de 0,32 contendo as variáveis DEM (Modelo digital do terreno do SRTM) e NDVI_I (no inverno). Guimarães et al. (2007) uniram as variáveis derivadas dos sensores MODIS e SRTM e as variáveis socioeconômicas usadas por Freitas et al. (2006) com as variáveis climáticas e geraram um modelo com o coeficiente de determinação de 0,31, no qual as variáveis selecionadas foram DEM, Tmin_V e NDVI_I. Para a construção deste modelo, não foram usadas as variáveis qualitativas que foram usadas por Guimarães et al (2006). Fonseca et al. (2007b) utilizaram recursos de geoprocessamento para promover a integração de um conjunto de dados provenientes de SR com ferramentas de análise espacial, para desenvolver um índice hidrológico para aplicação em estudos de distribuição da prevalência de esquistossomose, caracterizando a distribuição da doença em quatorze municípios do Estado de Minas Gerais. Fonseca et al. (2007a) desenvolveram dois modelos de regressão múltipla para estimar a prevalência da esquistossomose no Estado de Minas Gerais, através de dados provenientes de SR, sócio-econômicos, espaciais (equivalentes aos valores de prevalência dos cinco municípios mais próximos ao município em questão) e dados históricos de prevalência da doença. O primeiro modelo contém as variáveis DEM, NIR_I (infravermelho próximo no inverno), Somb_I (Modelo linear de mistura espectral – Sombra no inverno), Esp1 (prevalência do primeiro vizinho mais próximo, dividida pela raiz quadrada da distância) e Esp2 (prevalência do segundo vizinho mais próximo, dividida pela raiz quadrada da distância) com R2 de 0,43. O segundo modelo 38 obteve 0,34 de R2 e contém as variáveis DEM, NIR_I, Somb_I e AguaPoçNasc (porcentagem de domicílios com acesso a água através de poço ou nascente). Martins et al. (2007) aplicaram uma técnica de reconhecimento de padrões, árvore de decisão, para classificar a prevalência da esquistossomose, com quatro classes de risco para a doença, no Estado de Minas Gerais através de variáveis derivadas de SR, climáticas e sócio-econômicas utilizando ferramentas de SIG. A árvore selecionada alcançou 65% de amostras classificadas corretamente. As variáveis selecionadas para estimar a prevalência da doença foram: DEM, Blue_V (Banda azul do MODIS), EVI_V (Índice de vegetação melhorada no verão), Somb_V, Veg_I (Modelo linear de mistura espectral – Vegetação no inverno), Tmin_V, Tmax_I (Temperatura máxima no inverno), IDHL_00 (Índice de desenvolvimento humano – longevidade de 2000), SAN6 (Porcentagem de domicílios com banheiro ligados a outro tipo de esgotamento). Tendo em vista os resultados encontrados na literatura, esta dissertação visa melhorar a estimativa do modelo de regressão linear da prevalência da esquistossomose para o Estado de Minas Gerais. Para isto é proposto a utilização de variáveis de caracterização de vizinhança e de outras variáveis socioeconômicas, tais como: tipo de esgotamento dos domicílios, forma de acesso à água dos domicílios, grau de instrução do responsável pelo domicilio, renda do chefe de família. Também são abordadas neste trabalho as melhoras nas estimativas obtidas através da regionalização do Estado e a construção de um modelo de regressão linear para cada região. Assim como em Martins et al. (2007), neste trabalho também é utilizada a técnica de árvore de decisão, para estabelecer três classes de risco da prevalência da esquistossomose no Estado. A utilização da classificação imprecisa obtida através da regressão linear é também uma novidade deste trabalho. 39 40 CAPÍTULO 3 FUNDAMENTAÇÃO TEÓRICA Neste capitulo é apresentada a fundamentação teórica para o melhor entendimento da metodologia usada neste trabalho. São apresentadas: as definições dos índices espaciais de isolamento e exposição que foram adaptados para gerar as variáveis de caracterização da vizinhança; o conceito de regionalização e como ela é feita; o conceito e os testes necessários para construção de um modelo de regressão linear; o conceito de classificação imprecisa que foi adaptado para a aplicação nos modelos de regressão linear; e a definição da árvore de decisão com os passos necessários para a sua construção. 3.1 Variáveis de caracterização de vizinhança As variáveis de caracterização de vizinhança são baseadas em um conjunto de indicadores que mostram para cada variável sócio-ambiental escolhida, a disparidade entre municípios, usando dois níveis de corte (por exemplo: baixo e alto poder aquisitivo) estabelecidos. Estes cortes se situam nos extremos dos valores dessas variáveis. O objetivo é estabelecer uma medida que traga informações do quanto que a diferença sócio-ambiental dos municípios vizinhos influencia no município de referência. Os indicadores adotados neste trabalho são obtidos através dos índices espaciais de isolamento e exposição propostos por Feitosa (2005). Estes índices foram obtidos por Feitosa (2005) a partir da extensão de índices não-espaciais baseada na abordagem proposta por Wong (1998citado por FEITOSA, 2005). As dimensões exposição e isolamento dizem respeito à capacidade de encontro entre membros de diferentes grupos (ou do mesmo grupo no caso do isolamento) (REARDON E O’SULLIVAN, 2004). Feitosa (2005) aplicou estes índices ao estudo de segregação residencial de São José dos Campos usando como unidade de área setores censitária do município. Cada unidade de 41 área considerada na análise foi associada a uma localidade cujas características populacionais são expressas por sua “intensidade populacional local”. A intensidade populacional local da unidade de área j considera tanto a população de j quanto a das unidades vizinhas à j e, na prática, representa a soma da população de todas as áreas, ponderada por sua proximidade à área j (FEITOSA, 2005). O cômputo da intensidade populacional local é realizado através do uso de um estimador kernel, que é posicionado no centróide da localidade j e computa a média ponderada dos dados populacionais da área de estudo (Figura 3.1) (SILVERMAN, 1986 citado por FEITOSA, 2005). Os pesos utilizados neste cômputo dependem dos parâmetros do estimador kernel escolhido pelo pesquisador (FEITOSA, 2005). FIGURA 3.1 – Estimador kernel gaussiano. Fonte: Feitosa (2005). Para toda localidade j cujo valor será estimado, o estimador (k) de intensidade será computado a partir dos valores das amostras i contidos numa largura de banda bw, e da distância euclidiana dij entre a localidade j de coordenada (xj, yj) e cada uma das localidades com coordenada (xi, yi) contida na amostra, como mostra a equação abaixo (DRUCK et al., 2004): k (i, j , bw) = ⎛ d 2 ⎞ 1 exp ⎜ − ij 2 ⎟ ⎜ 2bw ⎟ 2π bw ⎝ ⎠ (3.1) onde, i = 1,...,J e j = 1,...,J e J é o número total de unidades de área na área de estudo. Assim, intensidade populacional local de j será mais influenciada pela população localizada em unidades de área próximas do que por aquelas localizadas em unidades 42 mais distantes. Em termos formais, a intensidade populacional local de uma unidade de ( área j ( L j ) é definida como (FEITOSA, 2005): J ( L j = ∑ N i k (i, j , bw) , (3.2) i =1 onde Ni é a população total na unidade de área i. A intensidade populacional local de um “grupo populacional” m na unidade de área j ( ( L jm ) é calculada através da substituição da população total na unidade de área i (Ni) pela população do grupo m na unidade de área i (Nim) na Equação 3.2 (FEITOSA, 2005). J ( L jm = ∑ Nim k (i, j, bw) (3.3) i =1 ( O índice espacial de exposição do grupo m ao grupo n ( P*(m,n ) ) expressa o contato potencial entre os dois grupos populacionais e varia de 0 (exposição mínima) a 1 (exposição máxima). Dados dois grupos, o índice mede o contato potencial entre os membros de um grupo em relação aos membros de outro grupo (FEITOSA, 2005). ( 1 P*(m ,n ) = Nm ( ⎛ L jn N jm ⎜ ( ∑ ⎜L j =1 ⎝ j J ⎞ ⎟⎟ ⎠ (3.4) onde Nm é a população do grupo m na área de estudo. ( O índice espacial de isolamento do grupo m ( Q*m ) é um caso particular do índice ( espacial de exposição. O índice Q*m mede a exposição do grupo m a ele próprio e também varia entre 0 (mínimo isolamento) e 1 (máximo isolamento) (FEITOSA, 2005). ( 1 Q*m = Nm ( ⎛ L jm ⎞ N jm ⎜ ( ⎟ ∑ ⎜ L ⎟ j =1 ⎝ j ⎠ J (3.5) 43 Os índices de exposição e isolamento dependem da composição populacional do município como um todo, ou seja, as proporções de cada grupo são relevantes. Por exemplo, o índice de exposição do grupo m ao n tende a apresentar valores mais altos se a proporção do grupo n em toda a área de estudo for elevada, dado que a interação entre os indivíduos do grupo n e os demais grupos se torna mais provável. Em virtude desta ( característica, o índice de exposição é considerado assimétrico, ou seja, P*(m,n ) não é ( igual P*(n ,m ) , exceto se os grupos m e n apresentarem a mesma proporção populacional (FEITOSA, 2005). 3.2 Regionalização A regionalização é um método de agrupamento de áreas, em regiões homogêneas e contínuas no espaço. Considerando o grau de similaridade, o procedimento de regionalização busca dividir o espaço em sub-regiões, delineando novas áreas com características mais semelhantes. Este processo auxilia na descoberta de estruturas existentes em um conjunto complexo de dados, reduzindo o grande volume de dados em grupos, de forma a simplificar a análise (ASSUNÇÃO et al., 2006). Existem três abordagens, descritas por Neves et al (2002) e Assunção et al (2006), para a condução da regionalização. Na primeira abordagem, o processo é realizado em dois estágios independentes podendo identificar entre os dois estágios, se objetos similares estão, ou não, espalhados pela área de estudo. No primeiro estágio é executado um procedimento de classificação convencional usando atributos não-espaciais. No segundo estagio os objetos classificados na fase inicial, são separados formando regiões distintas. Esta abordagem pode ser usada como uma rápida avaliação da dependência espacial entre os objetos (ASSUNÇÃO et al., 2006; NEVES, 2003). Na segunda abordagem utilizada em procedimentos de regionalização, a similaridade entre os objetos é avaliada considerando simultaneamente a posição geográfica dos objetos e seus atributos não-espaciais. As coordenadas do centróide da área são utilizadas para representar a localização dos objetos e são consideradas como atributos adicionais ao problema de classificação (ASSUNÇÃO et al., 2006; NEVES, 2003). 44 Na terceira abordagem utilizada para o procedimento de regionalização, o relacionamento de vizinhança entre os objetos é explicitado por meio de dispositivos auxiliares, como: uma matriz, um grafo ou uma lista de objetos vizinhos. No caso do uso de uma matriz, ela é chamada de matriz de conectividade (C), onde cada elemento, cij, indica se os objetos i e j são vizinhos, ou não. Assim, cij = 0 para objetos não vizinhos e cij = 1 para objetos vizinhos. De forma equivalente, quando é usado um grafo, cada objeto é representado por um vértice. Quando os objetos são vizinhos, existe uma aresta ligando os dois vértices correspondentes no grafo (ASSUNÇÃO et al., 2006; NEVES, 2003). A regionalização abordada neste trabalho usa a terceira abordagem, ou seja, utiliza um grafo de conectividade para capturar as relações de adjacência entre objetos. Desta maneira, a estratégia é transformar um problema de regionalização em um problema de divisão de grafos, reduzindo um mapa de objetos espaciais a um grafo onde cada nó representa um objeto e objetos adjacentes são ligados por uma aresta (NEVES, 2003). A partir do grafo de conectividade é gerada uma árvore geradora mínima. Esta árvore é escolhida de forma a garantir que a soma dos custos associados às arestas seja o menor possível, sendo os custos das arestas inversamente proporcionais às similaridades entre os objetos. A árvore geradora mínima é baseada no algoritmo Prim descrito por Jungnikel, (1999 citado por ASSUNÇÃO et al., 2006). Após a criação da árvore geradora mínima, é necessário dividi-la para obter as regiões espaciais. O critério utilizado para seccionar a árvore geradora mínima consiste em remover as arestas que minimizam a soma dos desvios quadrados de dentro das regiões espaciais. O desvio quadrado de dentro das regiões é uma medida de dispersão de valores do atributo para os objetos em uma região. As regiões homogêneas têm valores pequenos da soma dos desvios quadrados. Assim, quanto menor esse valor, melhor a divisão (ASSUNÇÃO et al., 2006; NEVES, 2003). 3.3 Regressão linear múltipla Os modelos de regressão, lineares e não lineares, são utilizados em todas as áreas do conhecimento, como, por exemplo, computação, engenharias, biologia, medicina, 45 agronomia, administração, sociologia, etc. Esta teoria pode ser encontrada em Neter et al. (1996); Draper e Smith (1981), entre outros. Através da regressão linear múltipla é possível determinar as relações entre uma variável dependente (Y) e um conjunto de variáveis independentes (X1, X2, ..., Xn) (NETER et al., 1996). Em um modelo de regressão linear as amostras não são correlacionadas, e, consequentemente, os resíduos do modelo também são independentes, tem variância constante, e apresentam distribuição normal com média zero (DRUCK et al., 2004). O objetivo da regressão linear múltipla é encontrar um bom ajuste entre os valores preditos pelo modelo e os valores observados da variável dependente e descobrir quais das variáveis explicativas contribuem de forma significativa para este relacionamento linear (DRUCK et al., 2004). O apelo dos modelos de regressão é explicar uma ou várias variáveis de interesse em função de outras variáveis (explicativas). Para a geração de um modelo de regressão linear é mais adequado que se divida o conjunto de dados em dois conjuntos, para a construção e para a validação do modelo. Usando o conjunto de construção pode ser feita a seleção de variáveis independentes. Estas variáveis devem ser selecionadas por possuir alta correlação com a variável dependente e pouca correlação entre elas. O número de modelos possíveis é dado por 2a (onde a é o número de variáveis selecionadas). O modelo escolhido deve possuir todas as variáveis significativas, ou seja, o P-valor de cada variável deve ser significativo. O melhor modelo de regressão linear pode ser escolhido usando do procedimento best subset através dos critérios R2, R2 ajustado e Mallows’Cp (NETER et al., 1996). Após a escolha do melhor modelo deve ser realizado um teste para verificar se a introdução de interações entre as variáveis melhoram o modelo. O número de interações é a combinação simples do número de variáveis tomados 2 a 2: C ( p, 2 ) = p! ( p − 2 )!2! (3.6) onde p é o número de variáveis no modelo escolhido. 46 No teste, o valor de F tabelado é comparado com F* (equação 3.7). Se o valor do F tabelado for superior ao valor calculado (F*), as interações não melhoram o modelo, podendo ser descartadas todas de uma só vez. Caso contrário, as interações podem melhorar o modelo, e não devem ser descartadas todas de uma vez. SQR − SQRMod Completo F* = gl − glMod Completo SQRMod Completo − glModelo Completo (3.7) onde, SQR é a soma dos quadrados dos resíduos do modelo sem as variáveis relativas às interações, SQRMod Completo (modelo com as interações) é a soma dos quadrados dos resíduos do modelo completo, gl é grau de liberdade dado pela equação 3.8 e glMod Completo é grau de liberdade do modelo completo. gl = n − ( p + 1) (3.8) onde n = número de amostras e p é o número de variáveis do modelo. A adequação do modelo é feita através da análise dos resíduos, em que são testadas as hipóteses de homocedasticidade, normalidade, e independência dos erros, assim como a identificação de outliers. Neste trabalho utilizou-se o teste Levene (1960) para homocedasticidade dos erros. Caso a hipótese seja rejeitada, os parâmetros do modelo de regressão são estimados através do método dos mínimos quadrados ponderados (DALMOLIN, 2004). Para testar a normalidade dos resíduos foi utilizado o teste de Shapiro e Wilk (1965). A identificação de outliers foi efetuada utilizando-se o procedimento descrito em Neter et al (1996), através dos Leverages, DFFITS e distância de Cook. Após todas essas análises, o modelo deve ser validado. Um dos métodos para a validação dos modelos consiste na comparação do valor do MSE (média dos quadrados dos resíduos) do modelo proposto com o valor do MSPR (média dos quadrados dos resíduos das amostras separadas para a validação) que é calculado utilizando os parâmetros do modelo proposto com as amostras de validação. Os valores devem ser 47 muito próximos um do outro para que o modelo seja considerado válido (NETER et al., 1996). O modelo construído, depois de validado, pode ser usado para realizar predições e calcular probabilidades (NETER et al., 1996). 3.4 Classificação imprecisa A classificação da prevalência da doença de forma incorreta pode causar prejuízos às tomadas de decisão dos gestores, tanto por indicar como alta prevalência um município que possui prevalência baixa, como indicar como baixa prevalência um município com prevalência alta. No primeiro caso, os gestores estarão alocando recursos para um município sem grandes necessidades e no segundo caso a doença pode aumentar no município pelo não controle da doença. Neste caso e em diversas aplicações reais a obtenção de uma resposta completamente imprecisa ao invés de um resultado preciso, porém incorreto, é preferível, já que uma classificação incorreta pode causar prejuízos. Porém a incerteza e/ou a imprecisão podem ser considerada um problema em outras aplicações quando se quer tomar uma decisão. Num tratamento médico, por exemplo, a incerteza pode impedir que um tratamento seja ministrado a um paciente ou contribuir para que a terapia médica seja indicada (DRUMMOND, 2007). Neste estudo, a imprecisão pode contribuir significativamente para a conduta dos gestores em saúde. Numa classificação convencional, o número de amostras classificadas incorretamente é geralmente grande. No caso da classificação imprecisa, uma parte, ou até mesmo todas as amostras classificadas incorretamente na classificação convencional poderão ser classificadas em classes compostas e se tornarem corretas, porém imprecisas. A classificação imprecisa é um tipo particular da classificação nebulosa, difusa ou fuzzy auxilia a tomada de decisão onde há incerteza. Conforme os princípios básicos da classificação imprecisa, uma amostra não pertenceria mais a uma classe apenas, mas 48 pertenceria em maior ou menor grau a várias classes, daí o significado de classificação nebulosa ou difusa (ZADEH, 1965). Para auxiliar na tomada de decisão, Drummond (2007) definiu indicadores de qualidade de uma classificação imprecisa para eleger uma boa classificação, avaliando precisão e acurácia de uma família parametrizada de classificadores. Uma família parametrizada de classificadores é obtida variando o parâmetro α (de zero a um) de uma distribuição de possibilidade. O parâmetro α cria uma série de classificadores imprecisos que variam do classificador mais correto e impreciso ao mais preciso, porém com maior taxa de erro (DRUMMOND, 2007). 3.5 Árvore de decisão A árvore de decisão é uma técnica de reconhecimento de padrões e um modelo prático usado em inferência indutiva. Estas árvores são construídas de acordo com um conjunto de amostras previamente classificadas e, posteriormente, outras amostras são classificadas de acordo com essa mesma árvore. Para a construção destas árvores são usados algoritmos como o ID3, ASSISTANT e C4.5 (QUINLAN, 1993). O C4.5 não depende de suposições sobre a distribuição dos valores das variáveis ou da independência destas variáveis entre si. Isto é importante quando se utiliza dados de SIG juntamente com dados de imagem (ARAKI, 2005). A filosofia de funcionamento de qualquer algoritmo baseado em árvores de decisão se constitui na sucessiva divisão do problema em vários subproblemas de menores dimensões, até que uma solução para cada um dos problemas mais simples possa ser encontrada. Fundamentados neste princípio, os classificadores baseados em árvores de decisão procuram encontrar formas de dividir sucessivamente o universo em vários subconjuntos (criando para tal nós contendo os testes respectivos) até que cada um deles contemple apenas uma classe ou até que uma das classes demonstre uma clara maioria não justificando posteriores divisões (gerando nessa situação uma folha, contendo a classe majoritária). Como é evidente, a classificação consiste apenas em seguir o 49 caminho ditado pelos sucessivos testes colocados ao longo da árvore até que seja encontrada uma folha que conterá a classificação correspondente (FONSECA, 1994). Um dos parâmetros de entrada para a determinação da árvore de decisão é o número mínimo de amostras que a folha deve conter no final da classificação. Quanto menor o número de amostras em cada folha, maior será o número de regras de decisão. O objetivo é encontrar uma árvore que classifique corretamente o maior número de amostras e que a sua regra de decisão seja simples. A árvore de decisão pode ser analisada pelo especialista e, se necessário, pode ser modificada, para então ser convertida em regras que formam a base de conhecimento de um sistema. Cada caminho da raiz até a folha corresponde a uma regra de decisão ou classificação. 50 CAPÍTULO 4 MATERIAIS 4.1 Área de estudo O Estado de Minas Gerais localiza-se na região Sudeste do Brasil (Figura 4.1) e é dividido politicamente entre 853 municípios numa área de aproximadamente 590.000 km2, com população aproximada 18 milhões de habitantes que vivem sob clima tropical (IBGE, 2006). A Figura 4.1 mostra área de estudo, que corresponde a todos os municípios do Estado de Minas Gerais. FIGURA 4.1 – Mapa da divisão política do Estado de Minas Gerais. Em Minas Gerais a distribuição da esquistossomose mansoni não é regular, intercalando-se em áreas de maior prevalência com outras onde a transmissão é baixa ou nula. A doença é endêmica nas regiões norte (compreendendo as zonas do Médio São Francisco e Itacambira), oriental e centro (zonas do Alto Jequitinhonha, Metalúrgica, Oeste e Alto São Francisco). Os maiores índices de infecção são encontrados nas regiões nordeste e leste do Estado que compreendem as zonas do Mucuri, Rio Doce e da Mata (CARVALHO et al., 2005; CARVALHO et al., 1987; PELLON E TEIXEIRA, 1950). 51 4.2 Variáveis utilizadas Os dados correspondentes à prevalência da esquistossomose foram cedidos pela Secretaria de Estado de Saúde de Minas Gerais e são utilizados como sendo variável dependente para a construção do modelo de regressão e para o desenvolvimento das regras de classificação da árvore de decisão. A Figura 4.2 apresenta distribuição espacial da prevalência da doença no Estado de Minas Gerais. FIGURA 4.2 – Prevalência da Esquistossomose (1984-2005). Fonte: Secretaria da Saúde de Minas Gerais. Segundo a Secretaria de Estado de Saúde de Minas Gerais, existem 197 municípios com informação positiva de prevalência da esquistossomose. Estes municípios estão em verde, amarelo e vermelho na Figura 4.2. Nesta Figura também são apresentados os 304 municípios indenes, em azul claro, que foram cedidos quando os modelos de risco já estavam prontos e por este motivo esses municípios foram usados, neste trabalho, apenas para a validação dos modelos. Nos estudos que visam determinar a prevalência de uma doença em uma população específica, o coeficiente de prevalência (Equação 4.1) corresponde à quantidade de pessoas afetadas pela doença no momento da investigação (ou coleta de dados), em relação à população total no momento considerado (ROZENFELD, 2000). Prev C = quantidade de pessoas afetadas pela doença no momento população total no momento considerado 52 (4.1) É importante ressaltar que os dados de prevalência utilizados neste trabalho são coletados ao longo dos anos de 1984 a 2005. Os dados são uma média dos casos positivos da doença em relação à quantidade de exames realizados, sendo que os exames são feitos em no mínimo 80% da população do município (DRUMMOND, 2006). Desse modo, a prevalência da esquistossomose admitida neste trabalho é: Prev = quantidade de casos da doença população examinada (4.2) Na revisão bibliográfica, verificou-se a produção de estudos semelhantes ao proposto neste trabalho na China, na Etiópia, e no Brasil (Bahia e Minas Gerais), e todos eles elegem como variáveis significativas as variáveis de SR (vegetação, variação de temperatura, entre outras) e utilizam um SIG. Portanto, para explicar a prevalência da doença, a análise conterá variáveis extraídas de SR (obtidas pelos sensores MODIS e SRTM), variáveis climáticas e variáveis socioeconômicas, além das variáveis de caracterização da vizinhança. A Tabela 4.1 mostra o número de variáveis de cada tipo. TABELA 4.1 – Número de variáveis explicativas. Variáveis explicativas Numero de Variáveis SR 22 Climáticas 6 Socioeconômicas 34 Vizinhança 24 Total 86 4.2.1 Variáveis de Sensoriamento Remoto Para determinar as variáveis de SR, oriundas do sensor MODIS, foram usadas quatro imagens (h14v10, h14v11, h13v10 e h13v11) de duas datas, uma no verão e outra no inverno (17/01/2002 e 28/07/2002). As oito imagens foram reprojetadas através do software MODIS Reprojection Tool. Todos os demais processamentos foram realizados 53 nos softwares SPRING3, ENVI e ArcGis, em ambiente Windows (GUIMARÃES et al., 2005a). Para cada data foram usadas as variáveis da banda azul (Blue), vermelho (Red), infravermelho próximo (NIR), e infravermelho médio (MIR), os índices de vegetação melhorado (EVI), índice de vegetação da diferença normalizada (NDVI), e os índices derivados do modelo linear de mistura espectral, vegetação (Veg), solo (Solo) e sombra (Somb). Maiores informações sobre os cômputos envolvidos para o cálculo desses índices podem ser obtidos em Guimarães et. al. (2005a; 2005b). As variáveis advindas do SRTM foram obtidas durante uma missão de 11 dias em fevereiro de 2000, que reuniu dados topográficos (elevação) da superfície da Terra usando técnicas de interferometria. Nessa técnica, duas imagens da mesma área são obtidas de pontos diferentes, a diferença entre as duas imagens permite determinar a elevação do terreno (NASA, 2006). Foram usadas quatro variáveis derivadas do SRTM: Modelo digital de elevação (DEM); declividade (Dec), derivada do DEM e outras duas com informações hidrográficas, obtida através do mapa de acumulação hídrica (que mede em cada ponto de uma bacia hidrográfica, os caminhos possíveis que a água pode transcorrer ao atingir esse determinado ponto) gerado a partir do DEM (MOURA et al., 2005), a média de acumulação hídrica (AH1), e a mediana da acumulação hídrica (AH2). As dezoito variáveis derivadas do MODIS e as variáveis DEM, Dec e o mapa de acumulação hídrica, derivadas do sensor SRTM foram obtidas no projeto de 2003 apoiado pela FAPEMIG (processo: 1775/03). A Tabela 4.2 indica as variáveis de Sensoriamento Remoto, suas descrições e os sensores. 3 SPRING é um SIG no estado-da-arte com funções de processamento de imagens, análise espacial, modelagem numérica de terreno e consulta a bancos de dados espaciais. Fonte: http://www.dpi.inpe.br/spring/portugues/index.html 54 Variável TABELA 4.2 – Variáveis de Sensoriamento Remoto. Descrição Sensor Blue_V Banda azul no Verão MODIS Blue_I Banda azul no Inverno MODIS Red_V Banda vermelho no Verão MODIS Red_I Banda vermelho no Inverno MODIS NIR-V Banda infravermelho próximo no Verão MODIS NIR-I Banda infravermelho próximo no Inverno MODIS MIR-V Banda infravermelho médio no Verão MODIS MIR-I Banda infravermelho médio no Inverno MODIS EVI-V Índice de vegetação melhorado no Verão MODIS EVI-I Índice de vegetação melhorado no Inverno MODIS NDVI-V Índice de vegetação da diferença normalizada no Verão MODIS NDVI-I Índice de vegetação da diferença normalizada no Inverno MODIS Veg-V Vegetação no Verão, derivada do Modelo de Linear de Mistura Espectral MODIS Veg-I Vegetação no Inverno, derivada do Modelo de Linear de Mistura Espectral MODIS Solo-V Solo no Verão, derivada do Modelo de Linear de Mistura Espectral MODIS Solo-I Solo no Inverno, derivada do Modelo de Linear de Mistura Espectral MODIS Somb-V Sombra no Verão, derivada do Modelo de Linear de Mistura Espectral MODIS Somb-I Sombra no Inverno, derivada do Modelo de Linear de Mistura Espectral MODIS DEM Modelo digital de elevação do SRTM SRTM Dec Declividade do terreno do SRTM SRTM AH1 Média da quantidade de água que pode existir no município – calcula a partir do DEM SRTM AH2 Mediana da quantidade de água que pode existir no município – calculada a partir do DEM SRTM 4.2.2 Variáveis climáticas As variáveis climáticas usadas foram: média da precipitação acumulada (Prec), média da temperatura mínima (Tmin) e média da temperatura máxima (Tmax), das épocas do verão (período de 17/01 a 01/02/2002) e do inverno (período de 28/07 a 12/08/2002). 55 Esses dados foram coletados através das plataformas de coletas de dados (PCD), obtidas do CPTEC/INPE, e estão interpolados em formato binário na resolução de 28 x 28 km e para a sua utilização, (GUIMARÃES, 2005) usou o software GRADs4. As seis variáveis climáticas foram determinadas durante o projeto de 2003 e são utilizadas nesse trabalho. A Tabela 4.3 descreve as variáveis climáticas e suas fontes. Variável TABELA 4.3 – Variáveis Climáticas. Descrição Fonte Prec-V Precipitação acumulada média do verão CPTEC/INPE Prec-I Precipitação acumulada média do inverno CPTEC/INPE Tmin-V Temperatura mínima média do verão CPTEC/INPE Tmin-I Temperatura mínima média do inverno CPTEC/INPE Tmax-V Temperatura máxima média do verão CPTEC/INPE Tmax-I Temperatura máxima média do inverno CPTEC/INPE 4.2.3 Variáveis socioeconômicas As variáveis socioeconômicas foram obtidas do Sistema Nacional de Indicadores Urbanos (SNIU). Os índices de desenvolvimento humano (IDH), educação (IDHE), longevidade (IDHL), renda (IDHR) são dos anos de 1991 e 2000. Os dados referentes à característica da família, saneamento-esgoto, saneamento-água e situação por domicílio são do ano 2000. Os dados sobre a renda dos chefes de família, característica da família, são: porcentagem de chefes de família: sem rendimentos (SemRen); com renda inferior a um salário mínimo (RenInfsm); com renda entre um e cinco salários mínimos (Ren1e5sm); com renda entre cinco e dez salários mínimos (Ren5e10sm); com renda entre dez e quinze salários mínimos (Ren10e15sm); com renda superior a quinze salários mínimos (RenSup15sm). Os dados sobre os anos de estudo do responsável pelo domicilio, característica da família, referem-se à porcentagem de pessoas responsáveis por domicílios: sem ou com 4 O GRADs é utilizado para a visualização e manipulação dos dados metereológicos e também gera arquivos no formato ASCII. 56 menos de um ano de estudo (Est1); com um a três anos de estudo (Est1e3); com quatro a sete anos de estudo (Est4e7); com oito a dez anos de estudo (Est8e10); com onze a quinze anos de estudo (Est11e15); com mais de quinze anos de estudo (EstSup15); com estudo não determinado (EstNãoDet). Os dados de saneamento-esgoto referem-se à porcentagem de domicílios com banheiro ligados a: rio ou lago (SanRioLago); vala (SanVala); fossa rudimentar (SanFossaR); fossa séptica (SanFossaS); rede geral (SanRede); outro tipo de esgotamento (SanOutro); e porcentagem de domicílios com banheiro (ComSan) e sem banheiro (SemSan). Os dados de saneamento-água, forma de acesso a água dos domicílios, referem-se à porcentagem de domicílios: com acesso a água através da rede geral de abastecimento (AguaRede); com acesso a água através de poço ou nascente (AguaPoçNasc); com outra forma de acesso a água (AguaOutro). Os dados da situação por domicílio se referem a porcentagem de domicílios que estão na zona rural (ZRural) e na zona urbana (ZUrb). Os IDHs foram também utilizados no projeto da FAPEMIG em 2003. A Tabela 4.4 indica as siglas usadas neste trabalho para as variáveis socioeconômicas, suas descrições e suas fontes. Variável TABELA 4.4 – Variáveis socioeconômica. Descrição Fonte IDH_91 Índice de desenvolvimento humano do ano de 1991 (SNIU, 2005) IDH_00 Índice de desenvolvimento humano do ano de 2000 (SNIU, 2005) IDHR_91 Índice de desenvolvimento humano de Renda do ano de 1991 (SNIU, 2005) IDHR_00 Índice de desenvolvimento humano de Renda do ano de 2000 (SNIU, 2005) IDHL_91 Índice de desenvolvimento humano de Longevidade do ano de 1991 (SNIU, 2005) IDHL_00 Índice de desenvolvimento humano de Longevidade do ano de 2000 (SNIU, 2005) IDHE_91 Índice de desenvolvimento humano de Educação do ano de 1991 (SNIU, 2005) IDHE_00 Índice de desenvolvimento humano de Educação do ano de 2000 (SNIU, 2005) SemRen Porcentagem de chefe de família sem rendimentos (SNIU, 2005) RenInfsm Porcentagem de chefe de família com renda inferior a um salário mínimo (SNIU, 2005) (Continua) 57 TABELA 4.4 – Conclusão. Variável Descrição Fonte Ren1e5sm Porcentagem de chefe de família com renda entre um e cinco salários mínimos (SNIU, 2005) Ren5e10sm Porcentagem de chefe de família com renda entre cinco e dez salários mínimos (SNIU, 2005) Ren10e25sm Porcentagem de chefe de família com renda entre dez e quinze salários mínimos (SNIU, 2005) RenSup15sm Porcentagem de chefe de família com renda superior a quinze salários mínimos (SNIU, 2005) Est1 Porcentagem de pessoas responsáveis por domicílios sem ou com menos de um ano de estudo (SNIU, 2005) Est1e3 Porcentagem de pessoas responsáveis por domicílios com um a três anos de estudo (SNIU, 2005) Est4e7 Porcentagem de pessoas responsáveis por domicílios com quatro a sete anos de estudo (SNIU, 2005) Est8e10 Porcentagem de pessoas responsáveis por domicílios com oito a dez anos de estudo (SNIU, 2005) Est11e15 Porcentagem de pessoas responsáveis por domicílios com onze a quinze anos de estudo (SNIU, 2005) EstSup15 Porcentagem de pessoas responsáveis por domicílios com mais de quinze anos de estudo (SNIU, 2005) EstNãoDet Porcentagem de pessoas responsáveis por domicílios com estudo não determinado (SNIU, 2005) SanRioLago Porcentagem de domicílios com banheiro ligados a rio ou lago (SNIU, 2005) SanVala Porcentagem de domicílios com banheiro ligados a vala (SNIU, 2005) SanFossaR Porcentagem de domicílios com banheiro ligados a fossa rudimentar (SNIU, 2005) SanFossaS Porcentagem de domicílios com banheiro ligados a fossa séptica (SNIU, 2005) SanRede Porcentagem de domicílios com banheiro ligados a rede geral (SNIU, 2005) SanOutro Porcentagem de domicílios com banheiro ligados a outro tipo de esgotamento (SNIU, 2005) ComSan Porcentagem de domicílios com banheiro (SNIU, 2005) SemSan Porcentagem de domicílios sem banheiro (SNIU, 2005) AguaRede Porcentagem de domicílios com acesso a água através da rede geral de abastecimento (SNIU, 2005) AguaPoçNasc Porcentagem de domicílios com acesso a água através de poço ou nascente (SNIU, 2005) AguaOutra Porcentagem de domicílios com outra forma de acesso a água (SNIU, 2005) ZRural Porcentagem de domicílios da zona rural (SNIU, 2005) ZUrb Porcentagem de domicílios da zona urbana (SNIU, 2005) 58 4.2.4 Variáveis de caracterização de vizinhança A Tabela 4.5 apresenta a descrição das variáveis de caracterização da influência de vizinhança desenvolvidas. Essas variáveis foram determinadas usando alguns dados do ano de 2000 obtidos, como visto anteriormente, do SNIU juntamente com os dados de acumulação hídrica. A metodologia para o uso dos dados do SNIU e da acumulação hídrica está descrita na seção 5.1, do capítulo 5, juntamente com a metodologia para a obtenção das variáveis de caracterização da influência de vizinhança. TABELA 4.5 – Variáveis de caracterização da influência de vizinhança. Descrição Variável Variáveis de caracterização da influência de vizinhança quanto ao acesso à água HomoRede Índice que mede a homogeneidade de condições, entre municípios vizinhos, de domicílios quanto ao acesso de água através da rede geral de abastecimento HomoOutro Índice que mede a homogeneidade de condições, entre municípios vizinhos, de domicílios quanto ao acesso de água através de outro tipo de abastecimento (ex. poço, nascente, entre outros) DispRede Índice que mede a disparidade de condições entre os domicílios do município de referência que têm acesso à água através da rede geral de abastecimento, e os domicílios de municípios vizinhos que têm acesso à água através de outro tipo de abastecimento DispOutro Índice que mede a disparidade de condições entre os domicílios do município de referência que têm outro tipo de acesso, e os domicílios de municípios vizinhos que têm acesso à água através da rede geral de abastecimento Variáveis de caracterização da influência de vizinhança quanto à existência ou não de banheiro HomoCBan Índice que mede a homogeneidade de condições, entre municípios vizinhos, de domicílios quanto à existência de banheiro HomoSBan Índice que mede a homogeneidade de condições, entre municípios vizinhos, de domicílios quanto a não existência de banheiro DispCBan Índice que mede a disparidade de condições entre os domicílios do município de referência que possuem banheiro, e os domicílios de municípios vizinhos que não possuem banheiro DispSBan Índice que mede a disparidade de condições entre os domicílios do município de referência que não possuem banheiro, e os domicílios de municípios vizinhos que possuem banheiro Variáveis de caracterização da influência de vizinhança quanto à zona de residência HomoRural Índice que mede a homogeneidade de zona de residência, entre municípios vizinhos, de domicílios que estão na zona rural HomoUrb Índice que mede a homogeneidade de zona de residência, entre municípios vizinhos, de domicílios que estão na zona urbana (Continua) 59 TABELA 4.5 – Conclusão. Descrição Variável DispRural Índice que mede a disparidade entre os domicílios do município de referência que estão na zona rural, e os domicílios de municípios vizinhos que estão na zona urbana DispUrb Índice que mede a disparidade entre os domicílios do município de referência, que estão na zona urbana e os domicílios de municípios vizinhos, que estão na zona rural Variáveis de caracterização da influência de vizinhança quanto ao nível de instrução HomoSEst Índice que mede a homogeneidade de instrução do responsável pelo domicílio, entre municípios vizinhos, que não possui instrução ou com menos de três anos de estudo HomoCEst Índice que mede a homogeneidade de instrução do responsável pelo domicílio, entre municípios vizinhos ,que possui acima de oito anos de estudo DispSEst Índice que mede a disparidade entre os domicílios do município de referência, cujos responsáveis não possuem instrução ou possuem até três anos de estudo e os domicílios de municípios vizinhos, cujos responsáveis possuem acima de oito anos de instrução DispCEst Índice que mede a disparidade entre os domicílios do município de referência, cujos responsáveis possuem acima de oito anos de instrução e os domicílios de municípios vizinhos, cujos responsáveis não possuem instrução ou possuem até três anos de estudo Variáveis de caracterização da influência de vizinhança quanto à renda HomoBRen Índice que mede a homogeneidade de renda do chefe de família, entre municípios vizinhos, que não possui renda ou que possua rendimentos até 1 salário mínimo HomoARen Índice que mede a homogeneidade de renda do chefe de família, entre municípios vizinhos, que possui renda acima de 15 salários mínimos DispBRen Índice que mede a disparidade entre os domicílios do município de referência, cujos chefes de família não possuem renda ou possuem até um salário mínimo de rendimentos e os domicílios de municípios vizinhos, cujos chefes de família possuem acima de 15 salários mínimos DispARen Índice que mede a disparidade entre os domicílios do município de referência, cujos chefes de família possuem renda acima de 15 salários mínimos e os domicílios de municípios vizinhos, cujos chefes de família não possuem renda ou possuem até um salário mínimo de rendimentos Variáveis de caracterização da influência de vizinhança quanto a potencial existência de água HomoMenorAH Índice que mede a homogeneidade de áreas, entre municípios vizinhos, que possuem menor área de acumulação hídrica. HomoMaiorAH Índice que mede a homogeneidade de áreas, entre municípios vizinhos, que possuem maior área de acumulação hídrica. DispMenorAH Índice que mede a disparidade entre a menor área de acumulação hídrica do município de referência, e a maior área de acumulação hídrica dos municípios vizinhos DispMaiorAH Índice que mede a disparidade entre a maior área de acumulação hídrica do município de referência, e a menor área de acumulação hídrica dos municípios vizinhos 60 4.3 Softwares utilizados Para a determinação das variáveis de caracterização de vizinhança, foram utilizados os softwares: SPRING 4.3, Excel 2003, Segreg 5.0 e Terra View 3.1.3. O software Terra View 3.1.3 também foi usado para gerar as regiões do Estado de Minas Gerias e os mapas temáticos. Os modelos de regressão linear foram desenvolvidos nos softwares Statistica 6.0 e Excel 2003. A árvore de decisão foi construída usando o software Waikato Environment for Knowledge Analysis (Weka) e Excel 2003. 61 62 CAPÍTULO 5 METODOLOGIA Neste capítulo é apresentada a metodologia utilizada neste trabalho que se baseia no diagrama mostrado na Figura 5.1. FIGURA 5.1 – Diagrama da metodologia empregada. A área de estudo e as variáveis (de SR, climáticas, socioeconômicas e de caracterização de vizinhança) foram definidas no capítulo anterior. Cada uma das etapas seguintes é descrita em detalhes a seguir, começando pela metodologia para determinação das variáveis de caracterização de vizinhança. 5.1 Variáveis de caracterização de vizinhança As variáveis de caracterização de vizinhança consideram o arranjo espacial da população e aponta disparidades sócio-ambietais ao longo do Estado. Nesse trabalho a unidade de área utilizada são os municípios do Estado de Minas Gerais. Cada um dos 853 municípios, considerados na análise foi associado a uma área com características 63 específicas, que foram expressas por sua “intensidade populacional local”. A intensidade populacional local de cada município e a intensidade populacional local de cada grupo populacional pode ser calculada utilizando o software Segreg 5. A seleção das variáveis consideradas para a composição dos grupos populacionais utilizados nos cálculos dos índices de exposição e isolamento é fruto do diálogo com especialistas da área de saúde e constituem-se variáveis: • de acesso de água dos domicílios, pela rede geral ou outro tipo de acesso, tais como: nascente, poço, rio, entre outros; • de existência ou não de banheiro nos domicílios; • de domicílio da zona rural e da zona urbana; • do nível de instrução do responsável pelo domicilio, com até três anos de estudo ou com acima de oito anos de estudo; • de renda dos chefes de família, com rendimentos abaixo de um salário mínimo ou com rendimentos acima de 15 salários mínimos; • e a potencial existência de água, menor área de acumulação hídrica e maior área de acumulação hídrica. Esses fatores sócio-ambientais têm relação direta ou indireta com a contaminação dos corpos d’água pelas fezes do homem infectado e com a exposição do homem ao possível contágio. E assim como outras doenças parasíticas, para a transmissão da esquistossomose não só é importante que todos os domicílios do município possuam infra-estrutura adequada. Da mesma forma, é essencial que os municípios vizinhos possuam o mínimo de condições de infra-estrutura, para que a doença não ocorra num dado município. Deste modo os dados usados para a geração das variáveis de caracterização de vizinhança são justificados. Porém é importante salientar que para usar os dados de 64 acumulação hídrica, foi feito um pré-processamento no SPRING, dos dados da grade acumulação hídrica, cujos valores variam entre 0,2719 e 11,30, no qual foi gerado um mapa temático com duas classes. Com esse mapa e o mapa que representa a divisão política do Estado de Minas Gerais, foi possível gerar uma tabela, onde a área total de cada município pôde ser dividida em duas classes. A área do município correspondente à classe do intervalo entre 0,27 e 6,15 foi considerada como menor área de acumulação hídrica e a área correspondente à classe de 6,15 até 11,30, como maior área de acumulação hídrica. Estes são os dois grupos de áreas. Cabe também ressaltar que a unidade de medida usada por (FEITOSA, 2005) era a população (número de pessoas). Para determinar as variáveis de caracterização de vizinhança quanto ao acesso a água, a existência de banheiro e a zona de residência, propõe-se estender o uso dos índices de agregação para variáveis cuja unidade de medida é domicílios (número de domicílios), abstraindo o sentido original dos índices espaciais, passando a interpretar “grupos populacionais” como “grupos de domicílios”. O mesmo ocorre para as variáveis de caracterização de vizinhança quanto à potencial existência de água, cuja unidade de medida é área (em km2), interpretando “grupos populacionais” como “grupos de áreas”. As variáveis de caracterização de vizinhança foram calculadas através do cálculo dos índices espaciais de exposição e isolamento que foram determinados usando o plugin desenvolvido por Thomas Koschitzki e Marcelino P. S. Silva exposure index e isolation index (spatial segregation), para o ArcView 3.1. Para verificar a relação das variáveis de caracterização de vizinhança com a prevalência da esquistossomose através da correlação, foram usados os 197 municípios com informação sobre a doença. 5.2 Regionalização Como a extensão do Estado de Minas Gerais não é pequena e pelo fato do Estado possuir municípios com características diferentes, pode não ser coerente generalizar um modelo a fim de predizer a esquistossomose para todo o Estado. Dessa forma, é viável 65 utilizar um método para dividir o Estado em regiões espaciais estabelecendo áreas mais homogêneas em relação à variância de algumas das variáveis. O algoritmo Skater, implementado no software TerraView 3.1.3, foi adotado para particionar o Estado de Minas Gerais em regiões espaciais usando os 853 polígonos que representam a divisão política do Estado de Minas Gerais, juntamente com quatorze variáveis selecionadas por demonstrarem maior variação na distribuição espacial. Dessas variáveis, três são referentes ao tipo de abastecimento de água (porcentagem de domicílios com abastecimento de água através de poço ou nascente, da rede geral ou outra forma), quatro são referentes ao tipo de saneamento (porcentagem de domicílios sem banheiro, com esgoto ligado a rio ou lago, com esgoto ligado a fossa rudimentar e com esgoto ligado a rede geral), quatro são sobre a renda de chefe de família (porcentagem de chefe de família sem rendimentos, com renda inferior a um salário mínimo, com renda entre um e cinco salários mínimos e com renda entre cinco e dez salários mínimos) e três são sobre o nível de escolaridade do responsável pelo domicílio (% de responsável pelo domicílio sem ou com menos de um ano de estudo, com quatro a sete anos de estudo e com oito a 10 anos de estudo). 5.3 Regressão linear múltipla Para geração do modelo de regressão, adotou-se um guia de procedimentos especificado na Figura 5.2 que prevê seis fases. A primeira fase prevê a junção dos dados em uma forma matricial e preparação das variáveis independentes e da variável dependente. Foram utilizadas 86 variáveis independentes (22 de SR, 6 climáticas, 34 socioeconômicas e 24 de caracterização da vizinhança) com 197 amostras. A variável dependente usada foi a prevalência da doença que sofreu uma transformação logarítmica para obter uma melhora, no caso, significativa da sua correlação com as variáveis independentes. Nesta fase as amostras foram divididas em dois conjuntos, para a construção e para a validação do modelo. 66 FIGURA 5.2 – Fases de uma análise de regressão. Fonte: Neter et al. (1996). Na segunda fase, foi feita a determinação das variáveis independentes. Usando o conjunto de amostras de construção foi feita a redução do número de variáveis independentes. Esse procedimento foi realizado no software Statistica 6.0. As variáveis independentes pouco correlacionadas com a prevalência da doença foram descartadas, assim como as variáveis independentes que possuam correlação entre si superior a 0,8. A terceira fase é a geração dos possíveis modelos de regressão. Para a escolha do melhor modelo foi efetuado o procedimento best subset e através do critérios R2 foi definido o número e o melhor conjunto de variáveis (NETER et al., 1996). Este procedimento foi realizado no Statistica 6.0. Após a escolha do melhor modelo partiu-se para a quarta etapa, em que foram realizados vários testes especificados no item 3.3 para verificar: se as interações entre as variáveis melhoram o modelo, se os resíduos do modelo são homocedásticos e se eles possuem distribuição normal, e se existem outliers que influenciam o modelo. 67 A quinta fase é a validação do modelo, que consiste em avaliar os resultados obtidos perante amostras que não foram utilizadas na geração do modelo. Para tanto, são comparados valores relativos aos modelos de regressão propostos com os valores dos modelos concebidos com amostras que não foram utilizadas no primeiro procedimento. Para testar a robustez da estimativa do modelo global e regional além da utilização das amostras de validação, foram usados 304 municípios indenes, em que não ocorreu a doença. Usando os modelos, estes municípios indenes deveriam ser classificados como de prevalência baixa (valores abaixo de 5%), comprovando que os modelos são robustos, para as prevalências baixas. Por fim, a ultima fase prevê a análise do modelo, através da exatidão, da análise da distribuição dos resíduos e desvio padrão do modelo. 5.4 Classificação Imprecisa Usando a prevalência estimada do modelo construído e validado e o desvio padrão do modelo foram gerados cenários otimistas e pessimistas através do limite inferior e superior de intervalos de confiança para diferentes níveis de significância. Os níveis de significância são usados neste trabalho, como uma adaptação do parâmetro α, utilizado por Drummond (2007). TABELA 5.1 – Resultados possíveis da classificação imprecisa. Limite Inferior Limite Superior Classificação Baixa Baixa Baixa Baixa Média Baixa/Média Baixa Alta Baixa/Alta Média Média Média Média Alta Média/Alta Alta Alta Alta Para cada nível de confiança os limites inferior e superior foram classificados como prevalência baixa (0,001 a 5%), média (>5 a 15%) ou alta (>15%), resultando em duas classificações, uma para limite inferior e uma para limite superior. Usando estas duas classificações, foram geradas as classificações imprecisas para cada um dos 19 níveis de 68 confiança, de 5% a 95% em intervalos de 5%. Conforme o valor do nível de confiança diminui, a classificação imprecisa varia de mais correta e imprecisa à mais precisa com maior taxa de erro. As 19 classificações imprecisas foram geradas de acordo com a Tabela 5.1. Todas as classificações imprecisas foram comparadas com a classificação da prevalência observada, gerando acertos precisos e imprecisos, assim como erros precisos e imprecisos conforme Tabela 5.2. TABELA 5.2 – Classificação imprecisa vs. classificação da prevalência observada. Acertos Erros Classificação Totalmente Impreciso Classe obs. Preciso Impreciso Preciso Impreciso Baixa Baixa Média Média Baixa/Média ou Média/Alta Baixa ou Alta Alta Alta Baixa/Média Média ou Alta Média/Alta Baixa ou Média Média/Alta Baixa/Alta - Baixa/Alta Média/Alta Baixa/Alta A segunda coluna da Tabela 5.2 representa o número de amostras que são classificadas perfeitamente, ou seja, o numero de amostras classificadas de maneira correta e precisa. Quando as amostras são classificadas corretamente em classes compostas (na segunda coluna) significa que elas são classificadas com incerteza, portanto as classificações são corretas e imprecisas. Os erros de classificação podem ser precisos ou imprecisos: serão precisos se as amostras forem classificadas incorretamente numa classe única (ou baixa, ou média ou alta) e serão imprecisos se as amostras forem classificadas em classe composta (média/alta). A classificação será totalmente imprecisa quando as amostras forem classificadas como baixa/alta, não trazendo nenhuma informação ao usuário. Para eleger uma boa classificação imprecisa foi avaliada a precisão e a confiança da classificação a cada nível de confiança. Com esta finalidade, foram gerados dois gráficos, um para as amostras de construção e um para as amostras de validação, com os acertos e erros, precisos e imprecisos. Através destes gráficos foi possível verificar o comportamento das classificações imprecisas e eleger o nível de confiança, e ao mesmo tempo verificar uma classificação imprecisa, que apresente o grau de imprecisão e confiança mais adequado. 69 Neste trabalho, definiu-se como melhor nível de confiança, aquele que contiver o maior número de amostras classificadas corretamente, com um número pequeno de amostras classificadas incorretamente e que possua no máximo 5% de amostras classificadas como totalmente imprecisa. Após a escolha do melhor nível de confiança foram gerados os mapas de risco com o limite inferior e superior para os modelos global e regional. Desta foram, os gestores podem passar a contar com três mapas de risco (com a classificação do limite inferior, com a classificação da estimava da doença, e com a classificação do limite superior) para o auxílio na tomada de decisão. Estes cenários podem ajudar no controle da doença, pois os municípios que estiverem classificados como prevalência alta (acima de 15%) no cenário mais otimista (limite inferior), seriam os locais que podem ser considerados mais adequados para o controle da doença. Em seguida os municípios onde supostamente deve-se alocar os recursos são os classificados como prevalência alta mostrados no mapa de risco com a estimativa da doença. E por último, os municípios que devem ser atendidos são os classificados como prevalência alta no cenário menos otimista (limite superior). Com o nível de confiança escolhido, foi definida a classificação imprecisa para os modelos global e regional, gerando mais um mapa temático para cada modelo. As classificações imprecisas também foram comparadas com a classificação da prevalência observada para verificação dos erros de cada classificação e para a comparação da classificação imprecisa do modelo global com a do modelo regional. A classificação imprecisa, além de trazer para os gestores um mapa de risco com um nível de confiança definido, mostra a classificação da doença em classes compostas, o que pode contribuir para a tomada de decisão dos gestores. No entanto este tipo de classificação também mostra os municípios onde o modelo é totalmente impreciso (classificação baixa/alta), ou seja, a classificação dos municípios pertencentes a esta faixa não traz informação aos gestores. 70 5.5 Comparação dos modelos global e regional Os modelos global e regional foram comparados através dos R2, das matrizes de confusão, da exatidão global e dos índices kappa, das amostras de construção e das amostras de validação de cada modelo. Quanto maior R2, melhor o modelo. As matrizes de confusão mostram os erros e os acertos na classificação, e também a separabilidade das classes, quanto menor erro em cada classe, melhor a classificação do modelo. A exatidão global é a porcentagem de amostras classificadas corretamente; quanto maior esse valor, melhor o modelo. O índice kappa é a medida de concordância entre o observado (classe) e o predito (classificação) e varia entre -1 e 1, sendo que, quanto mais próximo de 1, melhor a classificação. Cabe ressaltar que o modelo regional possui mais de um modelo de regressão, então foi necessário calcular o R2 total do modelo regional usando os a soma dos quadrados dos resíduos de todos os modelos que formam o modelo regional pela soma dos quadrados do valor estimado, para as 142 amostras de construção. Também foi avaliada a precisão do modelo, através do desvio padrão e o resíduo do modelo. Dos 853 municípios, o modelo que apresentou maior número de amostras com desvio padrão baixo (abaixo de 1,1%), e menor número de amostras com desvio padrão alto (acima de 1,25%) será considerado o mais preciso. Em relação ao resíduo dos modelos, das 197 amostras, o modelo que tiver o maior número de amostras com resíduo baixo, entre -4,99% e 5,00%, e menor número de amostras com resíduo alto, abaixo de -10,00% ou acima de 10,00%, será considerado o modelo mais preciso. 5.6 Árvore de decisão Para aplicar a técnica de reconhecimento de padrões foi utilizado o software de domínio público, denominado Weka, da Universidade de Waikato, Nova Zelândia. O pacote Weka consiste de uma coleção de algoritmos de aprendizado de máquina para tarefas de mineração de dados. Pode ser usado para aplicar regras de aprendizado a um conjunto de dados e analisar a saída para extrair informações a partir dos dados de entrada (WEKA, 2006). 71 O Weka usa arquivos de dados de treinamento onde devem ser explicitadas quais variáveis são permitidas para uma relação específica, bem como o tipo de dado de cada variável (isto é, nominal ou valor numérico). O Weka pode detectar padrões em dados que podem ser explorados mediante regras. Dos recursos disponíveis, foi usado o sistema de aprendizado com o algoritmo de indução de árvore de decisão C4.5 desenvolvido por Quinlan e implementado em sua versão para linguagem Java (no Weka) com o nome J4.8 (WEKA, 2006). A base de dados usada para gerar a árvore de decisão foram as 86 variáveis explicativas (as mesma utilizada para a construção do modelo de regressão) juntamente com os dados da prevalência da doença, que foi usado como variável preditiva. A matriz de dados foi dividida em arquivos de treinamento e teste. No arquivo de treinamento foram selecionadas 142 amostras para a definição das regras de decisão. Para o arquivo de teste foram separadas 55 amostras que foram escolhidas aleatoriamente. Para a utilização do conjunto de dados foi necessário um pré-processamento a fim de torná-los compatíveis com o formato da ferramenta utilizada. Além disso, o algoritmo de classificação requer que a variável a ser explicada seja uma variável nominal; dessa forma, foi necessário discretizar os dados de prevalência para transformá-los em variável nominal. Para isso, foi utilizada uma regra simples no Excel, que classificou os dados de prevalência da doença em três categorias: baixa (0 a 5%); média (>5 a 15%); e alta (>15%). Essas faixas de classificação podem ser observadas na Figura 4.2. Para testar a robustez da árvore de decisão para a classificação de prevalência baixa, foram usados 304 municípios indenes. Usando as regras de classificação da árvore, estes municípios devem ser classificados como prevalência baixa, comprovando que os modelos são robustos para esta classificação. 5.7 Comparação dos modelos Os modelos global e regional foram comparados com a classificação da árvore de decisão através das matrizes de confusão, da exatidão global e dos índices kappa das amostras de construção e das amostras de validação de cada modelo. 72 CAPÍTULO 6 RESULTADOS E DISCUSSÕES Neste capitulo além do resultado das variáveis de caracterização de vizinhança, da correlação destas variáveis com a prevalência da doença e do resultado da regionalização, são apresentados os resultados e as discussões das classificações utilizando regressão linear (global e regional), das classificações imprecisas e da árvore de decisão, assim como a comparação destes resultados. 6.1 Variáveis de caracterização de vizinhança Usando os softwares Segreg 5 e o ArcView 3.1 foram geradas as variáveis de caracterização de vizinhança quanto ao acesso à água, à existência ou não de banheiro, à zona de residência, ao nível de instrução, à renda e à potencial existência de água, descritas na Tabela 4.5. De todas as variáveis de caracterização de vizinhança, somente a variável HomoOutro (Índice que mede a homogeneidade de condições, entre municípios vizinhos, de domicílios quanto ao acesso de água através de outro tipo de abastecimento) possui correlação significativa com a doença a 5% de significância. A 8% de significância, além da variável HomoOutro, todas as variáveis de caracterização de vizinhança quanto à potencial existência de água e a variável HomoARen (Índice que mede a homogeneidade de renda do chefe de família, entre municípios vizinhos, que possui renda acima de 15 salários mínimos), passam a ser significativas. As correlações das variáveis com a doença são mostradas na Tabela 6.1. Para as variáveis de caracterização da influência de vizinhança quanto à água, HomoRede e HomoOutro, era esperado correlação negativa e positiva, respectivamente, em relação à prevalência da esquistossomose, o que é confirmado de acordo com a Tabela 6.1. Também era esperado que a segunda fosse mais correlacionada com a prevalência da doença do que a primeira. Os coeficientes de correlação dessas variáveis 73 com a doença são estatisticamente diferentes (p= 0,0047). Portanto as duas hipóteses foram confirmadas. TABELA 6.1 – Correlação prevalência da doença com variáveis de caracterização da influência de vizinhança. Ln(Prev+1) Ln(Prev+1) Ln(Prev+1) HomoRede -0,1193 HomoCBan -0,1078 HomoRural 0,0380 HomoOutro 0,1437 HomoSBan 0,0066 HomoURb -0,1068 DispRede -0,1185 DispCBan -0,0681 DispRural 0,0055 DispOutro 0,0422 DispSBan 0,0461 DispUrb -0,0981 Ln(Prev+1) Ln(Prev+1) Ln(Prev+1) HomoSEst -0,0568 HomoBRen 0,0046 HomoMenorAH -0,1290 HomoCEst -0,0847 HomoARen -0,1283 HomoMaiorAH -0,1358 DispSEst -0,0427 DispBRen -0,0617 DispMenorAH -0,1312 DispCEst -0,0971 DispARen -0,0635 DispMaiorAH -0,1341 6.2 Regionalização Como dito anteriormente, o estado de Minas Gerais é bastante heterogêneo, com diversos tipos de relevo, com temperatura variando de leste a oeste, ou seja, características bem definidas em cada região. As características do norte de Minas, por exemplo, são semelhantes ao Nordeste brasileiro, já o sul é mais densamente habitado e possui maior número de municípios menores comparada com o norte de Minas. O oeste e uma parte da região central de Minas são mais ricos e possum IDH mais alto comparado com o leste de Minas, que além de possuir um IDH mais baixo, apresenta um saneamento básico mais precário. Assim a regionalização foi realizada usando a ferramenta Skater do Terra View 3.1.3, a partir das quatorze variáveis socioeconômicas descritas na seção 5.2 do capítulo anterior. Foram testadas regionalizações com diferentes números de regiões e optou-se pela regionalização com quatro regiões, apresentadas na Figura 6.1. Essa escolha foi feita devido ao fato das informações da prevalência da esquistossomose estarem distribuídas 74 mais ao leste e norte do Estado (Figura 4.2). Na regionalização com 3 regiões, as regiões 1 e 2 (Figura 6.1) pertencem à mesma região e como sabe-se que o leste e o oeste de Minas Gerais possuem características diferentes, descartou-se essa regionalização. Com 5 regiões, é gerada mais uma região entre a região 2 e 3 (Figura 6.1) com um pequeno número de municípios pertencentes a ela, o que acarretaria a construção de um modelo não confiável e portanto essa regionalização, com cinco regiões, também foi descartada. FIGURA 6.1 – Regionalização do Estado de Minas Gerais. Na Figura 6.1, a região 1 (em vermelho) contém 370 municípios, sendo que somente 16 deles possuem informações sobre a doença, a região 2 (em rosa), possui 86 municípios com informações, de um total de 265 municípios, a região 3 (em verde), contém 133 municípios, sendo 58 com informações da doença, já a região 4 (em azul) possui 37 municípios com informações da doença, de um total de 85 municípios. A Serra do Espinhaço praticamente divide a região 1 e 4 das regiões 2 e 3. A região 2 começa praticamente na bacia do Rio Paraíba e vai até a bacia do Rio Doce. A região 3 abrange o Vale do Jequitinhonha e Vale do Mucuri até a Serra do Espinhaço. A região 4 inclui praticamente toda a bacia do São Francisco na região Norte do Estado. A Região 1 é constituída das mesorregiões do Alto Paranaíba, do Noroeste de Minas, do Triângulo Mineiro, do Sul e Sudoeste de Minas. O relevo desta região inclui planaltos, serras e chapadas, possuindo trechos aplainados, ondulados e depressões. O triângulo mineiro é uma das mesorregiões mais desenvolvidas do Estado e a economia do restante 75 das mesorregiões é principalmente agrícola, com produção de café, soja, mandioca, feijão e milho, além da criação de gado. A região 2 é basicamente constituída pelas mesorregiões da Zona da Mata e do Vale do Rio Doce. O relevo desta região é rugoso com altos morros e é nesta região que localiza-se o ponto culminante do Estado, o Pico da Bandeira. A região tem como atividades econômicas a indústria, o comércio, a agricultura e a pecuária. Originalmente a cobertura vegetal desta região era a mata atlântica. A região 3 é constituída principalmente pelas mesorregiões do Vale do Mucuri e Vale do Jequitinhonha. Esta região é caracterizada pelo baixo desenvolvimento humano, sendo extremamente carente. A região 4 é essencialmente constituída pela mesorregião do Norte de Minas Gerais. Possui características similares às da região nordeste do Estado brasileiro, sendo a segunda região mais pobre de Minas Gerais (atrás apenas do Vale do Jequitinhonha) o clima é quente, beirando o semi-árido, formada por planalto atlântico. A economia desta região é baseada na pecuária e no extrativismo vegetal. 6.3 Análise de Regressão Linear Através da regressão linear múltipla foram geradas duas modelagens para fazer a predição da esquistossomose no Estado de Minas Gerais. Para a primeira, denominada modelo global, um único modelo de regressão é gerado com todas as amostras de treinamento e este modelo é utilizado para gerar as estimativas para todo o Estado. A segunda modelagem, denominada modelo regional, é composta por quatro modelos de regressão, um modelo para cada região do Estado conforme Figura 6.1. 6.3.1 Modelo Global Para determinar o modelo global foram separadas 142 amostras para a construção e 55 para a validação do modelo. Na Figura 6.2 observa-se as amostras para a construção (municípios em preto) e as amostras para a validação (municípios em rosa). 76 FIGURA 6.2 – Amostras usadas para a construção e para a validação. O melhor modelo foi escolhido após a realização do procedimento best subset usando o critério R2, conforme Figura 6.3. FIGURA 6.3 – R2 vs.número de variáveis. Através da Figura 6.3 percebe-se a diferença do R2 dos modelos com mais de cinco variáveis é pequena. Assim, foi selecionado para a análise o modelo com cinco variáveis: ŷ1 = e(-1,76109+0,01051*SanRioLago-0,08096*Dec+0,03447*Veg_I+0,33865*Tmin_V-2.52650*AH2)-1 (1) Este modelo gerou R2 de 0,394 (R=0,628) e contém as variáveis: SanRioLago, relacionada com o tipo de esgotamento dos domicílios (esgoto ligado a rio ou lago); Dec, relacionada com inclinação do terreno; Veg_I, ligada à vegetação, e a variável Tmin_V, relacionada à temperatura; e a variável AH2, relacionada à quantidade de água 77 que pode existir no município. No modelo, as variáveis Dec e AH2 possuem relação indireta com a esquistossomose (ou seja, quanto menor o valor destas variáveis, maior a prevalência da doença), enquanto o restante das variáveis possui relação direta com doença (ou seja, quanto maior o valor destas variáveis, maior a prevalência). No entanto, através da Tabela A.1 (Anexa) observa-se que com exceção da variável AH2, todas as variáveis do modelo possuem correlação positiva com a esquistossomose, ou seja, a variável Dec, que possui correlação positiva com a doença, é influenciada, no modelo, pela alta correlação com as outras vaiáveis. Através desse modelo, foram definidos mais três modelos usando a interação entre as variáveis: ŷ2 =e(-2,70745+0,05576*SanRioLago-0,07976*Dec+0,04605*Veg_I+0,34071*Tmin_V-2,15363*AH2-0,00117*SanRioLago*Veg_I)-1 (2) ŷ2 =e(5,55566+0,01094* SanRioLago -0,10177*Dec-0,17821*Veg_I+0,35225*Tmin_V-8,27139*AH2+0,16718*Veg_I*AH2)-1 (3) ŷ3 =e(-3,19730+0,01212* SanRioLago +0.07003*Veg_I+0,36304*Tmin_V-2,54189*AH2-0.00299*Dec*Veg_I) -1 (4) As mesmas relações podem ser encontradas no modelo 2 com R2=0,414 (R= 0,644), no modelo 3 com R2=0,425 (R= 0,652) e no modelo 4 com R2=0,424 (R= 0,651). Todos os modelos foram testados quanto à variância dos resíduos e quanto à presença de outliers e foi aceita a hipótese de que a variância dos resíduos é constante a 5% de significância, para todos os modelos e que não existe outliers que influenciassem os modelos. Os quatro modelos atendem aos requisitos de validação como pode ser visto na Tabela 6.2, pois os valores de MSE e MSPR são próximos e possuem a mesma ordem de grandeza. Portanto os quatro modelos são estatisticamente aceitáveis para estimar o risco da prevalência da esquistossomose no Estado de Minas Gerais. Foi também efetuado o teste de normalidade dos resíduos para os quatro modelos através do teste de Shapiro e Wilk (1965). Verificou-se que ao nível de significância de 5%, o modelo 1 não possui resíduos normalmente distribuídos. Já nos modelos 2, 3 e 4 os resíduos são normalmente distribuídos, destacando-se o modelo 4, como o melhor 78 modelo por apresentar o nível de significância de 2%. Sendo assim, o modelo 4 descrito na equação 4 pode ser considerado o mais adequado dos quatro modelos, sendo escolhido como modelo global. TABELA 6.2 – Validação dos modelos. Modelos MSE MSPR 1 0,558 0,780 2 0,544 0,773 3 0,534 0,800 4 0,531 0,825 A Tabela 6.3 mostra os coeficientes betas normalizados5, e o valor-p das variáveis selecionadas para o modelo global, o coeficiente de correlação (R) e o R2. A Tabela 6.3 apresenta as variáveis e seus coeficientes por ordem de importância. TABELA 6.3 – Coeficientes Betas normalizados e valor-p das variáveis, o coeficiente de correlação e o R2 do modelo global. Variáveis Coeficientes Beta Valor-p R R2 VEG_I 0,8041 0,000002 Dec*VEG_I -0,7311 0,000286 Tmin_V 0,4170 0,000000 AH2 -0,3521 0,000218 SanRioLago 0,2196 0,012452 0,651 0,424 Através da Tabela 6.3, pode-se perceber que a variável mais importante para o modelo global é a variável Veg_I e a menos importante é a variável SanRioLago, o que pode demonstrar que a nível municipal, a vegetação é mais importante do que a existência de domicílios que têm esgoto ligado ao rio ou lago. Embora as condições de saneamento seja um fator determinante para a existência da doença, o fato dela ser menos importante no modelo talvez possa ser justificado, pela modelagem ser feita a nível municipal, e a informação de saneamento mostra características mais locais. 5 Os coeficientes betas normalizados são usados para facilitar a comparação dos coeficientes de regressão, visto que as variáveis do modelo possuem unidades diferentes de medida (Neter et. al, 1996). Os maiores valores de coeficiente Beta indicam as variáveis mais importantes no modelo. 79 A Figura 6.4 mostra os mapas temáticos: da estimativa do risco da prevalência da esquistossomose através do modelo global (a); do desvio padrão do modelo (b); e do resíduo do modelo (c). a) b) c) FIGURA 6.4 – Mapas temáticos (a) do risco da prevalência da esquistossomose estimada através do modelo 4, (b) do desvio padrão do modelo, e (c) dos resíduos do modelo. Na Figura 6.4a os municípios em verde, referentes aos valores estimados de prevalência entre 0 e 5%, são classificados com prevalência baixa, os municípios em amarelo, referente aos valores estimados de prevalência entre 5 e 15%, são classificados com prevalência média e os municípios em vermelho, referente aos valores estimados de prevalência superior a 15%, são classificados com prevalência alta. Essa classificação é feita conforme registros da Secretaria de Saúde de Minas Gerais. Conforme esta classificação, das 197 amostras com informação sobre a doença, 47,21% foi classificada corretamente. A classificação da prevalência baixa através do modelo global teve como resultado 67,65% de amostras (23 amostras) classificadas corretamente, em relação à classe 80 observada de prevalência baixa (34 amostras). Classificando o conjunto de amostras indenes, das 304 amostras, 67,11% (204 amostras) foram classificadas corretamente. Das amostras classificadas erroneamente, aproximadamente 5% (15 amostras) podem ser justificadas pelo fato que nesses municípios existe informação positiva sobre a existência de caramujo, ou seja, nesses municípios foram encontrados caramujos que são suscetíveis ao verme. Como a existência da doença está ligada a existência do caramujo e o modelo reflete o habitat do caramujo, este pode ser o motivo pelo qual estes 5% de amostras foram classificadas erroneamente. Com esse resultado, pode-se concluir que o modelo global é aceitável para a classificação de prevalência baixa. No mapa do desvio padrão mostrado na Figura 6.4b pode-se observar que os municípios em lilás, cujos valores do desvio padrão estão na faixa entre 1 e 1,1%, são onde os modelos são mais precisos. Na Figura 6.4c pode ser observado em rosa os municípios onde o modelo é mais exato; nos municípios em laranja, claro e escuro, os valores preditos são superestimados; já nos municípios em azul, claro e escuro, os valores preditos são subestimados. 6.3.1.1 Classificação imprecisa para o modelo Global A estimativa do risco da prevalência da doença e o desvio padrão do modelo global foram usados para gerar as classificações imprecisas para os 19 níveis de confiança. Através das classificações imprecisas foram gerados os gráficos para as 142 amostras de construção e para as 55 amostras de validação. Os gráficos estão apresentados na Figura 6.5. Nos gráficos mostrados na Figura 6.5, percebe-se comportamentos semelhantes das classificações para as amostras de construção e de validação. Observa-se também que ao nível de confiança de 5%, aproximadamente 50% das amostras de construção são classificadas perfeitamente (curva em rosa) e a medida que o nível de confiança aumenta, a classificação precisa e correta diminui, chegando a nenhuma amostra com 95% de confiança. O erro preciso segue o mesmo comportamento do acerto preciso. 81 FIGURA 6.5– Gráfico de classificações imprecisas do modelo global para as amostras de construção (a) e para as amostras de validação (b). Também a Figura 6.5 a mostra que aproximadamente 80% das amostras de construção são classificadas corretamente, mas com incerteza, a 55% de confiança. Com o nível de confiança inferior ou superior a 55% o número de amostras classificadas como corretas e imprecisas diminui. Em relação à classificação totalmente imprecisa, após o nível de confiança de 55%, o número de amostras de construção aumenta e o nível de confiança passa de 0% para aproximadamente 90%, a 95% de confiança. Como visto na seção 5.4 do capítulo 5, a classificação imprecisa com grau de imprecisão e confiança mais adequado foi definida como aquela que contiver o maior número de amostras classificadas corretamente, precisas ou imprecisas (curvas em rosa e em amarelo da Figura 6.5) com um número pequeno de amostras classificadas incorretamente, precisas ou imprecisas (curvas em azul e roxo da Figura 6.5) e que possua no máximo 5% de amostras classificadas como totalmente imprecisa (curva em marrom da Figura 6.5). Assim, a classificação mais adequada pode ser encontrada com o nível de confiança entre 25% e 55%. Com 25% de confiança aproximadamente 76% das amostras classificadas corretamente, precisas (38%) e imprecisas (38%), porém 22% das amostras classificadas com erro preciso e 2% das amostras classificadas com erro impreciso. Já com 55% de confiança, aproximadamente 80% das amostras são classificadas corretamente com incerteza e 8% das amostras são classificadas 82 perfeitamente, porém 8% de amostras classificadas incorretamente com imprecisão e 4% das amostras são classificadas como totalmente imprecisas. Como a diferença dos acertos e dos erros das classificações não é muito grande e é mais desejável o maior nível de confiança possível, foi escolhida a classificação imprecisa com o nível de confiança de 55%. A classificação imprecisa do risco da prevalência da doença ao nível de confiança de 55% é mostrada na Figura 6.6a. A Figura 6.6 também mostra as classificações a 55% de confiança do risco da doença: no cenário mais otimista (limite inferior) (b); e no cenário menos otimista (limite superior) (c). a) b) c) FIGURA 6.6 – Mapas temáticos do risco da prevalência da esquistossomose com 55% de confiança: (a) da classificação imprecisa; (b) da classificação mais otimista; e (c) da classificação menos otimista. A Figura 6.6a mostra as classificações em prevalência baixa (verde escuro), baixa/média (verde claro), média/alta (laranja), alta (vermelho) e baixa/alta (marrom). Com essa classificação o número de amostras classificadas corretamente passa de 83 47,21% (classificação do modelo global) para 83,76% (classificação imprecisa do modelo global) em relação às 197 amostras com informação da doença. No cenário de risco mais otimista mostrado na Figura 6.6b percebe-se que são poucos os municípios classificados como prevalência alta, ou seja, como discutido no capitulo anterior, são poucos os municípios (21) que os gestores poderiam dar maior prioridade. No entanto, como é mostrado na Figura 6.6c o número de municípios que devem ser atendidos é relativamente grande, concentrando-se principalmente ao leste do Estado. 6.3.2 Modelo Regional Utilizando a regionalização descrita na seção 6.2 foram construídos quatro modelos pra cada uma das quatro regiões. A Figura 6.7 apresenta a distribuição das amostras com informação da doença em cada uma das regiões e a proporção das amostras com informação da região pelo total de amostras da região. 37/85 58/133 16/370 86/265 FIGURA 6.7 – Distribuição das amostras que possuem informação de prevalência da esquistossomose em cada região. Foi desenvolvido um modelo de regressão linear para cada uma das regiões. Para a região 1 o modelo foi construído com as 16 amostras (Equação 5) que possuíam informação da prevalência da doença. Pelo fato desta possuir um número reduzido de amostras, não foram separadas amostras para a validação deste modelo. Para a região 2 o modelo foi construído usando 59 amostras (Equação 6) e 27 amostras foram usadas para a validação do modelo. Para a região 3, foram usadas 44 amostras para a 84 construção do modelo (Equação 7) e para a validação foram usadas 14 amostras. Para a região 4 utilizou-se 28 e 9 amostras para a construção (Equação 8) e para a validação do modelo respectivamente. yˆ reg1 = e(-0,610 -293,109*HomoUrb+26,590*MIR_V)-1 (5) yˆ reg 2 = e(28,18 -1704,49*HomoCEst -0,03*Est1 -7,93*IDH_00 -0,002*Dem +0,15*Dec)-1 (6) yˆ reg 3 =e(13,46 +786,93*HomoOutro +0,012*SanRede -5,055*IDHL_00 -6,37*AH2)-1 (7) yˆ reg 4 = e(7,26+109,06*DispSBan-170,51*Blue_I +0,092*Prec_I)-1 (8) Nos testes realizados verificou-se que não houve necessidade de inserir interações para melhorar os modelos. A Tabela 6.4 mostra os coeficientes betas normalizados, os valores-p para cada uma das variáveis selecionadas para os modelos de cada região, o coeficiente de correlação (R) e o R2 de cada modelo. As variáveis e seus coeficientes estão apresentados na Tabela 6.4 por ordem de importância. TABELA 6.4 – Betas e p-valor das Variáveis, o coeficiente de correlação e R2 do modelo regional. Modelos Variáveis Coeficientes Beta Valor-p R R2 MIR_V 0,542 0,012317 HomoUrb -0,457 0,029278 Dem -0,645 0,000000 Dec 0,501 0,000014 HomoCEst -0,386 0,001699 IDH_00 -0,372 0,014255 Est1 -0,324 0,022422 AH2 -0,601 0,000000 HomoOutro 0,335 0,000916 IDHL_00 -0,253 0,011744 SanRede 0,211 0,029547 Blue_I -0,625 0,000019 DispSBan 0,298 0,021768 Prec_I 0,296 0,022083 Região 1 Região 2 Região 3 Região 4 85 0,743 0,552 0,735 0,539 0,826 0,681 0,820 0,672 O modelo descrito na Equação 5 mostra que a homogeneidade dos domicílios do município, e municípios vizinhos, que estão na zona urbana e o vigor da vegetação são os fatores determinantes para a esquistossomose na região 1. Também pode-se perceber que a variável HomoUrb possui correlação negativa com a doença, o que significa que quanto maior a porcentagem de domicílios da zona urbana que tenha municípios vizinhos com domicílios também na zona urbana, menor a prevalência da doença. Já a variável MIR_V possui correlação positiva com a doença, ou seja, quanto maior o vigor da vegetação, maior a prevalência da doença e de acordo com a Tabela 6.4 esta variável é a mais importante do modelo. As correlações entre as variáveis pode ser vista na Tabela A.2 (Apêndice A). Na Equação 6 pode-se ver que as variáveis HomoCEst (Homogeneidade de instrução do responsável pelo domicílio, entre municípios vizinhos, que possui acima de oito anos de estudo) e Est1 (porcentagem de responsável pelo domicilio sem estudo ou com menos de um ano de instrução) relacionada com o estudo do responsável pelo domicílio juntamente com a variáveis Idh_00, relacionada com o índice de desenvolvimento humano, Dem, ligada a elevação do terreno e Dec, ligada a inclinação do terreno, demonstram as características ambientais e socioeconômicas, selecionadas pelo modelo, para a prevalência da esquistossomose na região 2. E de acordo com a Tabela 6.4 a variável mais importante para o modelo é a variável Dem e a menos importante é a variável Est1, o que pode demonstrar que as características do terreno são mais importante para a prevalência da doença na região 2 do que o baixo nível escolar da população. Através da equação 6 percebe-se que as variáveis HomoCEst e Est1, possuem relação inversa com a doença, ou seja, quanto maior a porcentagem de responsáveis por domicílios com acima de oito anos de estudos de um município, que tenha municípios vizinhos com responsáveis por domicílio com o mesmo grau de instrução e quanto maior a porcentagem de responsáveis por domicilio sem ou com menos de um ano de instrução, menor a prevalência da doença. A mesma relação se tem para as variáveis Idh_00 e Dem, quanto maior o índice de desenvolvimento humano e maior a elevação do terreno, menor a porcentagem da doença. A variável Dec possui relação direta com a 86 doença, mostrando que quanto mais inclinação tiver o terreno do município, maior a prevalência da doença. Com exceção das variáveis Est1 e Dec todas as variáveis do modelo para a região 2 possuem correlação positiva com a doença de acordo com a Tabela A3 (Apêndice A). Cabe ressaltar que apesar da correlação negativa que a variável Est1 possui com a prevalência da doença, dentro do modelo da região 2, ela tem um comportamento contrário, ou seja, à medida que o número de pessoas com menos de um ano de instrução aumenta, aumenta o valor da prevalência da doença. Isso ocorre devido à alta correlação com as variáveis HomoCEst, IDH_00 e Dem. Para a região 3, a Equação 7 mostra que os fatores determinantes para a existência da doença são: HomoOutro, ligada a forma de acesso a água pelos domicílios (homogeneidade de condições, entre municípios vizinhos, de domicílios que não possuem acesso a água através da rede geral de abastecimento); SanRede, ligada ao tipo de esgoto (rede geral) dos domicílios; IdhL_00, relacionada a longevidade do ano de 2000; e AH2, ligada a quantidade de água que pode existir no município. Dessas variáveis a mais significativa é a variável AH2, e a menos significativa é a variável SanRede (Tabela 6.4). Isto quer dizer que para a região 3 a possível quantidade de água que pode existir no município é mais importante do que o número de domicílios que possuem esgoto ligado à rede geral. A Equação 7 mostra também que as variáveis HomoOutro e SanRede possuem correlação positiva com a doença, mostrando que quanto maior a área de possível acumulação hídrica em relação à maior área de municípios vizinhos de possível acumulação hídrica e quanto maior a porcentagem de domicílios com esgoto ligado a rede geral, maior a prevalência da doença (Tabela A4, Apêndice A). Já as variáveis IdhL_00 e AH2, possuem correlação negativa com a doença, o que significa que quanto maior o índice de desenvolvimento humano de longevidade e quanto maior a área de acumulação hídrica, menor a prevalência da doença. Já para a região 4, as características ambientais e socioeconômicas que levam a prevalência da doença descrita no modelo de regressão da Equação 8 são: DispSBan, 87 ligada a relação entre os domicílios que possuem banheiro (disparidade de condições entre os domicílios do município de referência, que não possuem banheiro e os domicílios de municípios vizinhos, que possuem banheiro) e os que não possuem banheiro; Prec_I, ligada à quantidade de chuva no inverno; e Blue_I, ligada à existência de água no inverno. Como visto na Tabela 6.4, das variáveis selecionadas para esta região, a variável Blue_I é a que mais se destaca em relação às outras e a variável Prec_I é a que demonstrou ter menos influência neste modelo de regressão. Na Equação 8 também pode-se perceber que as variáveis DispSBan e Prec_I possuem correlação direta com a doença, isto significa que quanto maior a porcentagem de domicílios do municípios que não possuam banheiro em relação aos domicílios dos municípios vizinhos que possuem banheiro e quanto maior a média de precipitação acumulada no inverno, maior será a prevalência da doença (Tabela A5, Apêndice A). Já a variável Blue_I possui correlação negativa com a doença, mostrando que quanto maior existência de água, menor a prevalência da doença. É importante ressaltar que a variável Est1 selecionada no modelo para a região 2 e a variável SanRede selecionada para o modelo da região 3, foram usadas para definir as regiões e supostamente em todas as regiões elas deveriam ser homogêneas não sendo significativas no modelo de regressão. Porém elas foram selecionadas por possuirem informações significativas, o que pode ser perfeitamente explicado já que quando se usa cinco regiões é criada mais uma região, como dito anteriormente, justamente entre as regiões 2 e 3, mostrando que essas regiões não são perfeitamente homogêneas (Figura 6.7. Foram realizados todos os testes para os quatro modelos e em todos eles a variância dos resíduos é constante, os resíduos são normalmente distribuídos e nenhum deles possui outliers que influencie os modelos. Em relação à validação dos modelos, como dito anteriormente o modelo para a região 1 não foi validado, já os modelos para a regia 2, 3 e 4 passaram no teste e foram validados e todos possuem resíduos normalmente distribuídos. 88 Usando os modelos das regiões 1, 2 3 e 4, foi feita a estimativa do risco da prevalência da esquistossomose para todo o Estado e foi calculado os desvios padrão do modelos. A Figura 6.8 mostra os mapas temáticos (a) do risco estimado da prevalência da doença, (b) do desvio padrão da estimativa e (c) dos resíduos dos modelos para as 197 amostras. a) b) c) FIGURA 6.8- Mapa temático modelo regional: a) Estimativa do risco da prevalência da esquistossomose no Estado e Minas Gerais; b) Desvio Padrão da estimativa e c) Resíduos do Modelo. Na Figura 6.8a, os municípios em verde, amarelo e vermelho são os municípios classificados com prevalência baixa, média e alta, respectivamente. Conforme esta classificação, das 197 amostras com informação da doença, 62,44% foi classificada corretamente. A classificação da prevalência baixa através do modelo regional teve como resultado 79,41% de amostras classificadas corretamente, em relação à classe observada de prevalência baixa. Classificando o conjunto de amostras indenes, 50,33% das amostras foram classificadas corretamente, sendo que aproximadamente 10,86% das amostras 89 que foram classificadas erroneamente podem ser explicadas, já que há dados sobre a existência do caramujo no município. Além disso, verificou-se que 46,38% (141 amostras) das amostras que foram classificadas erroneamente, foram classificadas como prevalência média, e destas 34,75% (49 amostras) das amostras possui prevalência estimada até 6%, ou seja, se aumentasse 1% na faixa de prevalência baixa, 66,44% das amostras seriam classificadas corretamente e 10,85% teriam erros explicáveis. O que demonstra que o modelo regional pode ser considerado robusto. A Figura 6.8b mostra o desvio padrão dos modelos e pode-se observar que os municípios em lilás, cujos valores do desvio padrão estão abaixo de 1,100, são onde o modelo é mais preciso. Na Figura 6.8c pode-se observar que os municípios em rosa são os locais onde os modelos são mais exatos, nos municípios em laranja, claro e escuro, os valores preditos são superestimados, já nos municípios em azul, claro e escuro, os valores preditos são subestimados. 6.3.2.1 Classificação imprecisa para o modelo Regional As classificações imprecisas para os 19 níveis de confiança foram geradas através da estimativa e do desvio padrão do modelo regional. A partir das classificações imprecisas, foram gerados dois gráficos, um para o conjunto de construção e outro para o conjunto de validação, que são apresentados na Figura 6.9. Os gráficos para as amostras de construção e para as amostras de validação, mostrados na Figura 6.9, possuem comportamentos semelhantes. Observando o gráfico para as amostras de construção, percebe-se que conforme o nível de confiança aumenta, diminui o número de amostras classificadas perfeitamente. Este mesmo comportamento é observado nas classificações incorretas precisas. A Figura 6.9 também mostra que com 35% de confiança 80% das amostras são classificadas corretamente, sendo 40% precisas (curva em rosa) e 40% imprecisas (curva em amarelo) e não há amostras classificadas como totalmente imprecisas (curva em marrom). A partir de 35% de confiança o número de amostras classificadas corretamente permanece em torno de 80% até o nível de confiança de 75%, onde o 90 número de amostras classificadas corretamente e imprecisa começa a diminuir. Em relação à classificação totalmente imprecisa (curva em marrom), até o nível de confiança de 55%, não há amostras com essa classificação, após esse limiar, o número de amostras aumenta gradativamente chegando a 50% de amostras ao nível de confiança de 95%. FIGURA 6.9 – Gráfico de classificações imprecisas do modelo regional. Como diferença de acertos e erros de classificação entre níveis de confiança de 35% e 75% não é grande e foi definido que no máximo 5% de amostras poderiam ser classificadas como totalmente imprecisas, o nível de confiança que atende todos os requisitos possui é em 60% de confiança. Sendo assim, através desta classificação imprecisa com 60% de confiança, foi gerado o mapa temático de risco da prevalência da esquistossomose, mostrado na Figura 6.10a, onde os municípios em marrom são onde a classificação é totalmente imprecisa. A Figura 6.10 também mostra os mapas de rico das classificações a 60% de confiança no cenário mais otimista (limite inferior) (b) e no cenário menos otimista (limite superior) (c). Através da classificação imprecisa do risco da prevalência da doença mostrada na Figura 6.10a o número de municípios classificados corretamente (em relação aos 197 que possuem informação da doença) pelo modelo regional passa de 63,44% 91 (classificação da estimativa do modelo) para 91,88% (classificação imprecisa do modelo). a) b) c) FIGURA 6.10 – Mapas temáticos do risco da prevalência da doença com 60% de confiança: (a) da classificação imprecisa, (b) da classificação mais otimista e (c) da classificação menos otimista. No cenário de risco mais otimista mostrado na Figura 6.10b percebe-se que são poucos os municípios (18) classificados como prevalência alta. No entanto, como é mostrado na Figura 6.10c o número de municípios que devem ser atendidos é relativamente grande, concentrando-se principalmente ao leste do Estado. 6.3.3 Comparação Modelo Global e Modelo Regional O modelo global obtebe 0,424 de R2, enquanto modelo regional obteve 0,717 de R2 total. Usando a estimativa do modelo global e regional, as amostras foram classificadas conforme faixa estipulada pela Secretária de Saúde do Estado de Minas Gerais gerando a matriz de confusão para o conjunto de construção e para o conjunto de validação, com 92 o objetivo de verificar qual dos modelos seria o mais adequado. As Tabelas 6.5 e 6.6 mostram as matrizes de confusão com a classificação dos modelos para as amostras de construção e para as amostras de validação. Nas matrizes de confusão os valores em negrito são o número e a porcentagem de amostras classificadas corretamente. As matrizes de confusão de construção e validação demonstram que a maior dificuldade encontrada pelos modelos global e regional, está na separabilidade entre as classes de prevalência média e alta, sendo que, o maior erro de classificação está na classe de prevalência alta classificada como média. Porém, tanto na matriz com as amostras de construção quanto na matriz com as amostras de validação, o modelo regional obteve menor erro na classificação de prevalência alta classificada como média. Enquanto o modelo regional classificou erroneamente 41,7% das amostras de construção e 50% das amostras de validação, o modelo global classificou erroneamente 60% das amostras de construção e 66,7% das amostras de validação como média, sendo alta. Além disso, o modelo regional, comparado com o global, possui a classificação mais exata da prevalência da doença em todas as classes. TABELA 6.5– Matriz de confusão do modelo global (modelo 4). Construção k=0,253 Validação k=-0,013 Classificação Classe Baixa Média Alta Classificação Classe Baixa Média Alta Baixa (34) 10 1 23 Baixa (12) (67,6%) (29,4%) (2,9%) 8 1 3 (25,0%) (66,7%) (8,3%) Média (48) 5 16 27 Média (25) (10,4%) (56,3%) (33,3%) 3 9 13 (12,0%) (52,0%) (36,0%) Alta (60) 2 36 22 Alta (18) (3,3%) (60,0%) (36,7%) 1 12 5 (5,6%) (66,7%) (27,8%) TABELA 6.6 – Matriz de confusão do modelo regional. Construção k= 0,494 Validação k= 0,234 Classificação Classe Baixa Média Alta Classificação Classe Baixa Média Alta Baixa (34) 7 0 27 Baixa (12) (79,4%) (20,6%) (0,0%) 4 0 8 (66,7%) (33,3%) (0,0%) Média (48) 2 13 33 Média (25) (4,2%) (68,8%) (27,1%) 4 9 12 (16,0%) (48,0%) (36,0%) Alta (60) 0 25 35 Alta (18) (0,0%) (41,7%) (58,3%) 1 9 8 (5,6%) (50,0%) (44,4%) 93 O modelo global (Tabela 6.5) classifica corretamente 50,7% (72) das amostras das 142 amostras usadas para a construção do modelo e 38,2% (21) das 55 amostras usadas para a validação do modelo. O modelo regional (Tabela 6.6) classifica corretamente 66,90% (95) das amostras de construção e 50,9% (28) das amostras de validação. Desse modo, o modelo regional apresentou a maior exatidão global em relação ao modelo global tanto para o conjunto de construção, como para o conjunto de validação. As Tabelas 6.5 e 6.6 também apresentam os índices kappa das matrizes de confusão. Por este critério, o modelo regional também demonstrou possuir a melhor classificação por possui os maiores índices kappa. O comportamento da classificação dos modelos em cada região pode ser analisado na Tabela 6.7, que mostra o número de amostras de cada região e o número de amostras classificadas corretamente em cada região, para todas as 197 amostras. TABELA 6.7 – Amostras classificadas corretamente Modelo Global e Regional. Amostras classificadas corretamente Número de Regiões amostras Modelo Global Modelo Regional 1 16 2 86 3 58 4 37 Total 197 8 (50,0%) 35 (40,7%) 28 (48,3%) 22 (59,5%) 93 (47,2%) 9 (56,25%) 44 (51,16%) 42 (72,41%) 28 (75,68%) 123 (62,44%) Na Tabela 6.7, pode-se observar que o modelo regional possui o maior número de amostras classificadas corretamente em todas as regiões, como era esperado, podendose concluir que o modelo regional é mais exato que o modelo global. Com relação à precisão dos modelos percebe-se que o regional (Figura 6.8b) foi mais preciso que o global (Figura 6.4b) em relação ao desvio padrão baixo (abaixo de 1,1%), como pode ser visto na Tabela 6.8, pois 82,87% dos municípios possuem desvio padrão baixo no modelo regional e apenas 39,04% no global. Ao analisar o desvio padrão alto, o modelo global apresenta o menor número de amostras (1,52%) com desvio padrão 94 acima de 1,25% em relação ao número de amostras do modelo regional (4,92%). Como a diferença do número de amostras dos modelos com desvio padrão baixo é grande (43,83%) e com o desvio padrão alto é pequena (3,4%), o modelo regional pode ser considerado o modelo mais preciso. Modelos Global Regional TABELA 6.8 – Desvio Padrão Modelo Global e Regional. < 1,100 1,001 - 1,150 1,151 - 1,200 1,201 - 1,250 333 456 44 7 (39,04%) (53,46%) (5,16%) (0,82%) 741 44 12 14 (86,87%) (5,16%) (1,41%) (1,64%) > 1,250 13 (1,52%) 42 (4,92%) Para os resíduos dos modelos, como pode ser observado na Tabela 6.9, o modelo regional (Figura 6.8c) possui o maior número de amostras com resíduo baixo (entre 4,99% e 5,00%) em relação ao global (Figura 6.4c), que possui maior número de amostras com estimativa superestimada (acima de 10,00%) e com estimativa subestimada (abaixo de -10,00%). Desta maneira o modelo regional, também neste critério, é considerado o melhor modelo. Modelos Global Regional TABELA 6.9 – Resíduos Modelo Global e Regional. <-10,00 -9,99 ~ -5,00 -4,99 ~ 5,00 5,01 ~ 10,00 17 22 96 32 (8,63%) (11,17%) (48,73%) (16,24%) 14 23 111 30 (7,11%) (11,68%) (56,35%) (15,23%) > 10,00 30 (15,23%) 19 (9,64%) Assim, é possível concluir que o modelo regional é mais exato e mais preciso que o modelo global. Além disso, o modelo regional possui a melhor classificação para todas a classes e maior coeficiente kappa. Comparado as classificações imprecisas dos modelos, percebe-se também que o regional, demonstrou ser mais exato em relação a classificação do global. Das 142 amostras de construção do modelo global (Tabela 6.10), a classificação imprecisa classificou corretamente 123 amostras (86,62%), e das 55 amostras de validação (Tabela 6.11), 42 amostras (76,36%) foram classificadas corretamente. Para o modelo regional, das 142 amostras de construção (Tabela 6.12), a classificação imprecisa classificou corretamente 129 amostras (90,84%) e das 55 amostras de validação (Tabela 6.13), 52 amostras (94,54%) foram classificadas corretamente. 95 TABELA 6.10 – Matriz de confusão para as amostras de construção da classificação imprecisa do Modelo Global a 55% de confiança. Classificação Baixa Média Alta Baixa/Média Média/Alta Baixa/Alta Classe Baixa (34) 0 0 4 (11,8%) (0,0%) (0,0%) 25 (73,5%) 2 (5,9%) 3 (8,8%) Média (48) 0 0 0 (0,0%) (0,0%) (0,0%) 12 (25,0%) 33 (68,8%) 3 (6,3%) Alta (60) 0 0 3 (0,0%) (0,0%) (5,0%) 6 (10,0%) 46 (76,7%) 5 (8,3%) TABELA 6.11 – Matriz de confusão para as amostras de validação da classificação imprecisa do Modelo Global a 55% de confiança. Classificação Baixa Média Alta Baixa/Média Média/Alta Baixa/Alta Classe Baixa (12) 0 0 0 (0,0%) (0,0%) (0,0%) 6 (50,0%) 3 (25,0%) 3 (25,0%) Média (25) 0 3 0 (0,0%) (0,0%) (12,0%) 6 (24,0%) 16 (64,0%) 0 (0,0%) Alta (18) 0 0 1 (0,0%) (0,0%) (5,6%) 3 (16,7%) 13 (72,2%) 1 (5,6%) TABELA 6.12 – Matriz de confusão para as amostras de construção da classificação imprecisa do Modelo Regional a 60% de confiança. Classificação Baixa Média Alta Baixa/Média Média/Alta Baixa/Alta Classe 1 0 14 (41,2%) (2,9%) (0,0%) 17 (50,0%) 2 (5,9%) 0 (0,0%) Média (48) 0 0 3 (0,0%) (6,25%) (0,0%) 6 (12,5%) 36 (75,0%) 3 (6,25%) Alta (60) 0 3 10 (0,0%) (5,0%) (16,7%) 1 (1,7%) 43 (71,7%) 3 (5,0%) Baixa (34) TABELA 6.13 – Matriz de confusão para as amostras de validação da imprecisa do Modelo Regional a 60% de confiança. Classificação Baixa Média Alta Baixa/Média Média/Alta Baixa/Alta Classe 0 0 5 (41.7%) (0,0%) (0,0%) 6 (50,0%) 1 (8,3%) 0 (0,0%) Média (25) 1 0 2 (4.0%) (8.0%) (0,0%) 5 (20,0%) 17 (68,0%) 0 (0,0%) Alta (18) 0 0 2 (0,0%) (0,0%) (11,1%) 1 (5,6%) 15 (83,3%) 0 (0,0%) Baixa (12) 96 Nas matrizes de confusão das Tabelas 6.10, 6.11, 6.12 e 6.13 os valores em negrito são o número e a porcentagem de amostras classificadas corretamente. Comparando as matrizes de confusão da classificação imprecisa do modelo global para as amostras de construção (Tabela 6.10) com a matriz para as amostras de validação (Tabela 6.11) é possível perceber que em todas as classes os erros do conjunto de validação são maiores que os erros do conjunto de construção. Contudo, o maior erro está na classificação do conjunto de validação para a classe de prevalência baixa, pois era esperado pela classificação do conjunto de construção que 14,7% das amostras fossem classificadas erroneamente e no conjunto de validação 50% das amostras foram classificadas erroneamente. Já no modelo regional, os erros do conjunto de validação (Tabela 6.13) para cada classe foram menores que os erros do conjunto de construção (Tabela 6.12), mostrando que a classificação imprecisa do modelo regional é mais robusta que a classificação imprecisa do modelo global. Este resultado mostra mais uma vez que o modelo regional traz resultados melhores que o modelo global. 6.4 Árvore de decisão Para a geração da árvore de decisão, foram testados alguns valores para o número mínimo de amostras por folha. Com valores de 2 a 9, as árvores são mais exatas, porém suas regras são bastante complicadas. Com valor igual a 10 e 11 a mesma árvore é gerada e com valor superior a 12, são geradas árvores muito pequenas com pouquíssimas regras. Como o objetivo é encontrar uma árvore que tenha regras simples e que consiga mostrar os principais fatores que expliquem a doença, foi escolhida para a análise a árvore com 10 ou 11 amostras mínimas por folha. A Figura 6.11 mostra a representação gráfica da árvore de decisão selecionada. Na Figura 6.11 para cada regra de classificação, tem-se dentro dos parênteses o número de amostras classificadas na folha / e o número de amostras classificadas incorretamente nessa folha. As variáveis apresentadas na Figura 6.11 foram selecionadas pelo Weka por conterem maior quantidade de informação. A variável colocada na raiz da árvore foi EVI_I, 97 correspondendo à divisão em dois grupos: para valores desta variável menor ou igual a 0,24522 as amostras já são classificadas como de baixa prevalência e acima deste valor tem-se outras regras para a classificação, que serão descritas a seguir, as quais usam outras variáveis tais como, variáveis de SR (NDVI_I, AH1), climática (Tmin_V), e socioeconômicas (IDH_00, SanRioLago). Algumas dessas variáveis foram selecionadas por Freitas et al. (2006) e Guimarães et al (2006), imprimindo mais confiabilidade e demonstrando que a técnica pode ser considerada eficiente para explicar a prevalência da esquistossomose. FIGURA 6.11 – Representação gráfica da árvore de decisão. A divisão seguinte da árvore foi em função da variável Tmin_V. As amostras nesse ramo terão duas possibilidades: menor ou igual a 18,78º C e maior que este valor. Se a primeira possibilidade for verdadeira, as amostras serão classificadas como prevalência baixa. Caso contrário, as amostras serão classificadas como prevalência média ou alta. Isso demonstra o que já era esperado, quando existe vegetação e a temperatura no verão for menor, dificilmente serão encontradas prevalências muito altas. Segundo Standen (1951) a temperatura ambiental tem forte influência na eclosão do miracídio (forma da larva após a eclosão do ovo do Schistosoma mansoni na água) e na penetração dele no 98 caramujo, pois a eclosão do ovo não ocorreria em temperaturas inferiores a 10ºC. Dessa forma a árvore de decisão reflete esta particularidade, classificando as amostras como prevalência média ou alta se a temperatura for alta, e como prevalência baixa se a temperatura for baixa. A próxima divisão das amostras é relativa à variável AH1, a qual está relacionada à existência de água. Quando esta variável tiver valor menor ou igual 1,987701 as amostras serão classificadas como prevalência média. Caso contrário, quando o valor de AH1 for maior, haverá a divisão da variável NDVI_I, a qual está relacionada à vegetação. Quando o valor da variável NDVI_I for maior que 0,6385, as amostras serão classificadas como prevalência alta. O mesmo ocorre se o valor for menor que este, e se a variável IDH_00 for menor ou igual a 0,695. Contudo, se IDH_00 for maior, haverá outra divisão utilizando a variável EVI_I. Quando o valor da variável EVI_I for menor ou igual a 0,27337, a prevalência será classificada como alta. Porém, se o valor da variável EVI_I for maior e o valor da variável SanRioLago for menor ou igual a 33,419244, as amostras serão classificadas como prevalência média. Se o valor da variável SanRioLago for maior que 33,419, as amostras serão classificadas como prevalência alta. Na literatura também é relatado por Dias (1998) que a doença instala-se por conta do saneamento precário ou inexistente. Sendo assim, a árvore de decisão também é coerente, quanto ao saneamento esgoto, pois quando a quantidade de domicílios que possuem esgoto ligado a rio ou lago é maior, as amostras são classificadas como prevalência alta e quando a quantidade de domicílios que possuem esgoto deste tipo de é menor, as amostras são classificadas como prevalência média. Esta árvore alcançou 71,8% de amostras classificadas corretamente, gerando um índice Kappa de 0,565. A Tabela 6.14 mostra a matriz de confusão da árvore gerada através do algoritmo J4.8 do Weka. Na matriz de confusão os valores em negrito são o número e a porcentagem de amostras classificadas corretamente. 99 TABELA 6.14 – Matriz de confusão. Construção k=0,565 Validação k=-0,024 Classificação Classe Baixa Classificação Média Alta Classe Baixa Média Alta Baixa (34) 5 1 28 Baixa (12) (82,4%) (14,7%) (2,9%) 3 5 4 (33,3%) (25,0%) (41,7%) Média (48) 13 17 18 Média (25) (27,7%) (37,5%) (35,4%) 4 14 7 (16,0%) (28,0%) (56,0%) Alta (60) 2 2 56 Alta (18) (3,3%) (3,3%) (93,3%) 4 7 7 (22,2%) (38,9%) (38,9%) Analisando as matrizes de confusão pode-se detectar os problemas na classificação e também a separabilidade entre as classes. Observa-se maior confusão na classe de prevalência média, classificada como baixa e alta. Na matriz de confusão das amostras de construção, das 142 amostras, 102 são classificadas corretamente. Para as 34 amostras da classe de prevalência baixa 82,4% das amostras foram classificadas corretamente e apenas uma amostra (2,9%) foi classificada como prevalência alta. Para as 60 amostras da classe de prevalência alta, 93,3% das amostras foram classificadas corretamente e somente duas amostras (3,3%) foram classificada como prevalência baixa. O resultado da classificação pode ser considerado coerente em relação à realidade: a temperatura, o habitat ideal para o caramujo e condições de vida das pessoas são fatores importantes para a existência da doença. Porém em alguns ramos a classificação parece ser subestimada e em outros superestimada. Esse fato pode ser observado na Figura 6.12 (b). A Figura 6.12 mostra o mapa temático da classificação do risco da doença pela árvore de decisão e os erros da classificação. Na Figura 6.12 (b) os municípios representados em laranja e amarelo a classificação é subestimada em relação a 2 e 1 classe observada, respectivamente (por exemplo, os dois municípios em laranja, foram classificados como prevalência baixa, porém pertenciam à classe de prevalência alta). Já nos municípios representados em azul escuro e claro a classificação é superestimada em 2 e em 1 classe, respectivamente. Os municípios classificados corretamente estão representados em rosa. 100 a) b) FIGURA 6.12 – (a)Risco da prevalência da esquistossomose classificada através da árvore de decisão; (b) Erros de classificação. A classificação do risco da prevalência baixa através da árvore de decisão teve como resultado 82,35% de amostras classificadas corretamente, em relação à classe observada de prevalência baixa, conforme Tabela 6.14. Classificando o conjunto de amostras indenes, 87,17% das amostras foram classificadas corretamente. Com esse resultado, pode-se concluir que a classificação é aceitável. 6.5 Comparação das modelagens A árvore de decisão traz resultados melhores em relação aos modelos de regressão Global e Regional, por apresentar maior exatidão. Das 142 amostras utilizadas para a seleção da árvore de decisão e para construção dos modelos de regressão, a árvore de decisão classifica corretamente 71,8% das amostras, enquanto os modelos de regressão Global e Regional classificam corretamente 50,7% e 57,7% das amostras, respectivamente. Para as 55 amostras separadas para a avaliação da árvore de decisão e para a validação dos modelos de regressão, a árvore de decisão classifica corretamente 43,6% das amostras, enquanto os modelos de regressão Global e Regional classificam corretamente 38,2% e 43,6% das amostras, respectivamente. Por outro lado, através do modelo de regressão é possível estimar a precisão da estimativa para todos os municípios do Estado, o que não ocorre com árvore de decisão. No entanto, quando se é verificada a classificação levando em consideração a melhor classificação para cada classe, apesar do modelo regional não conter o maior número de 101 amostras classificadas corretamente no conjunto de treinamento para as classes baixa e alta, o modelo regional é o modelo que tem o maior poder de generalização. O modelo regional contém 79,4% de amostras classificadas corretamente como prevalência baixa e 58,3% de amostras classificadas corretamente como prevalência alta (Tabela 6.6), enquanto o modelo de árvore de decisão classifica corretamente 82,4% e 93,3% como prevalência baixa e alta (Tabela 6.14), respectivamente para as amostras de treinamento. Entretanto, para as amostras de teste o modelo regional classifica corretamente 66,7% de amostras como prevalência baixa e 44,4% de amostras como prevalência alta (Tabela 6.6), enquanto o modelo de árvore de decisão classifica 33,3% e 38,9% como prevalência baixa e alta (Tabela 6.14), respectivamente. Para a classificação de prevalência média o modelo regional é o mais preciso e acurado que os outros modelos com 68,8% de amostras classificadas corretamente para o conjunto de treinamento e 48,0% de amostras classificadas corretamente para o conjunto de teste. Assim a melhor classificação por classe pode ser considerada a classificação do modelo regional. É interessante observar na Tabela 6.15 que ao fazer a divisão das classificações dos três modelos por regiões, a classificação por árvore de decisão também chegou a maior exatidão global no conjunto de treinamento em todas as regiões. Porém, na região 2 a classificação pelo modelo global tem o maior poder de generalização e nas regiões 3 e 4 a classificação que possui o maior poder de generalização é a do modelo regional. TABELA 6.15 – Porcentagem de amostras classificadas corretamente em cada modelo. Regiões 1 2 3 4 Conjuntos Treinamento Treinamento Teste Treinamento Teste Treinamento Teste Global Regional Árvore 50,00% 56,25% 62,50% 42,37% 37,04% 54,55% 28,57% 57,14% 77,78% 54,24% 29,63% 59,09% 42,86% 60,71% 100,00% 64,41% 29,63% 77,27% 35,71% 78,57% 44,44% A Tabela 6.15 foi gerada a partir das matrizes de confusão para cada região que estão no apêndice B. Através das matrizes do Apêndice B notam-se que em geral a árvore de decisão classifica melhor na maioria das regiões a classe de prevalência baixa, média e 102 alta. Esse resultado pode ser um indicativo de que a geração de uma árvore de decisão para cada uma das regiões pode chegar a um resultado melhor. 103 104 CAPÍTULO 7 CONCLUSÕES Apesar do conhecimento da dificuldade em se estabelecer relações ambientais e sociais de uma doença de veiculação hídrica a nível municipal, em geral, os resultados apresentados são satisfatórios, já que os dados de prevalência da esquistossomose a nível local não são disponibilizados. Os resultados apresentados pelos modelos demonstraram validade da modelagem computacional como ferramenta que auxilia o processo de decisão dos gestores, uma vez que se pode identificar os municípios que se tem maior risco de prevalência. Dentre os modelos apresentados (modelo de regressão global e regional e a árvore de decisão), a árvore de decisão demonstrou ser o método mais eficaz, por conseguir a melhor exatidão global. A desvantagem deste método em relação aos modelos de regressão é o fato de que não é possível estimar a precisão dos resultados. Os resultados mostram a dificuldade na separabilidade entre as classificações de prevalência média e alta em todos os modelos. No entanto, a classificação de prevalência baixa possui alta porcentagem de acerto para todos os modelos analisados. Isto é um fator importante uma vez que os recursos públicos para o combate e controle da doença são escassos e com esta classificação esses recursos dificilmente serão alocados para áreas com menor prevalência. No entanto, cabe ressaltar que não se deve deixar de lado os municípios classificados como tendo baixo risco de prevalência, pois esses municípios podem funcionar como geradores da doença. A sugestão é dar maior prioridade aos municípios classificados como tendo risco de prevalência alta. Os coeficientes de determinação (R2) são maiores para o modelo regional do que para o modelo global, o que comprova a hipótese de que a regionalização contribui para a melhora da estimativa da doença no Estado de Minas Gerais. 105 Para o modelo global, o tipo de esgoto, a vegetação no inverno, a temperatura mínima no verão, a quantidade de água que pode existir no terreno e a inclinação do terreno são fatores relacionados com risco da doença. Neste modelo não foram selecionadas variáveis de caracterização da vizinhança, devido à baixa correlação deste tipo de variável com a prevalência da doença. A não seleção de variáveis de caracterizança da vizinhança deve-se provavelmente pelo fato da informação de vizinhança ser atenuada quando se faz o modelo para todo o Estado. Duas das variáveis do modelo global, a quantidade de água que pode existir no terreno e a inclinação do terreno, também foram selecionadas no modelo regional. A primeira, foi selecionada no modelo da região 3 e a segunda no modelo da região 2. No entanto, no modelo regional, variáveis diferentes foram selecionadas em cada uma das regiões. Isto é mais um indicativo de que realmente um modelo não deveria ser generalizado para todo o Estado, dada a diferença na seleção de variáveis que possuem maior relação com a doença em cada região. Os domicílios que estão na zona urbana do município e possuem municípios vizinhos na zona urbana e o vigor da vegetação são os fatores relacionados com o risco da doença na região 1. Na região 2, as variáveis relacionadas com a doença em ordem de importância risco são: a elevação do terreno; e a inclinação do terreno; os responsáveis por domicílios que possuem acima de oito anos de instrução e possuem municípios vizinhos com responsáveis por domicílios com a mesma instrução; a porcentagem de chefes de família sem ou com menos de um ano de instrução; e o índice de desenvolvimento humano. Portanto, pode-se dizer que para esta região os fatores de risco estão relacionados aos fatores topográficos e socioeconômicos. Os fatores de risco para a região 3 são: a quantidade de água que pode existir no terreno; os domicílios com acesso a água através de poço ou nascente e possuem municípios vizinhos com a mesma foram de abastecimento de água; a porcentagem de domicílios com esgoto ligado a rede geral; e o índice de desenvolvimento humano de longevidade. 106 Estes fatores de risco estão relacionados à topografia, ao baixo saneamento básico e desenvolvimento humano. Já para a região 4, os fatores de risco são: a existência de corpos d’água; os domicílios que não possuem banheiro com municípios vizinhos que possuem banheiro; e a média da precipitação no inverno. Portanto os fatores de risco para esta região estão relacionados à existência de recursos hídricos, ao baixo saneamento básico e à pluviometria. É interessante observar que as variáveis selecionadas para cada região são razoavelmente condizentes com as condições sócio-ambientais de cada uma delas. A região 1, por ser em geral a mais desenvolvida é a menos influenciada por fatores socioeconômicos. O saneamento básico é um fator importante para as regiões 3 e 4 que são as regiões mais pobres e menos desenvolvidas. Os fatores topográficos se tornam importantes nas regiões 2 e 3, onde ocorrem as maiores diferenças em altimetria. Com as classificações imprecisas dos modelos estimados, além da porcentagem da informação sobre o nível de confiança dos resultados, tem-se também o aumento da exatidão, e consequentemente, a diminuição dos erros de classificação. Algumas das variáveis selecionadas nos modelos de regressão como vegetação, temperatura, declividade, índice de desenvolvimento humano e precipitação, já foram selecionadas em trabalhos anteriores por Bavia et al. (1999; 2001), Guimarães et al. (2006; 2007), Freitas et al. (2006), Fonseca et al. (2007a) e Malone et al. (1997; 2001b), conferindo mais confiabilidade ao modelo. Em relação às variáveis selecionadas pela árvore de decisão, de um modo geral, elas refletem fatores importantes para a existência da esquistossomose (o habitat ideal para o veículo transmissor e as condições de vida da população) e algumas delas como o índice de desenvolvimento humano, a temperatura e índices de vegetação, já foram usadas em outros trabalhos já citados para a predição da doença. Isso imprime mais confiabilidade e demonstra que a técnica pode ser considerada eficiente para explicar a prevalência da esquistossomose. Além disso, nesse tipo de classificação, os resultados são 107 normalmente bastante compreensíveis podendo compreendidos pelos especialistas da área de saúde. 108 ser facilmente utilizados e CAPÍTULO 8 CONSIDERAÇÕES FINAIS Os resultados alcançados podem ser melhorados se forem disponibilizados os dados a nível local. Para essa mudança de escala também seria de grande valor para o estudo melhor a qualidade da coleta dos dados usando GPS e adicionando algumas questões nos inquéritos epidemiológicos usados para o controle da doença. Num inquérito em escolares, por exemplo, descobrir onde a criança mora é tão importante, quanto descobrir se a criança tem contato com corpos d’água e onde ocorre o contato (se é no caminho para escola, no lazer, nas brincadeiras...). Para melhorar a modelagem sugere-se que se passe a usar series temporais da doença ao invés de usar dados históricos, para avaliar se existem fatores que aumentam ou diminuem a doença a cada mês ou ano. Sugere-se recalcular as variáveis de caracterização da influência da vizinhança quanto à existência ou não de banheiro usando a informação de banheiro ligado a rede geral de esgoto e banheiro com outro tipo de esgotamento. Essa mudança deve-se ao fato de ser mais importante para o estudo distinguir os domicílios que tem banheiro ligado a rede de esgoto dos municípios que tem outro tipo de esgotamento. Na variável atual, a informação da existência de banheiro engloba banheiros com vários tipos de esgotamento (ligado ao rio ou lago, ligado a rede geral de esgoto, ligado à fossa rudimentar, ligado à fossa séptica, entre outros) o que acaba não retornando uma informação significativa para a estimativa do risco da esquistossomose. Sugere-se também a utilização de outras variáveis, tais como: de programas de controle da doença, que pode ser usada para fazer um paralelo entre os municípios que são atendidos e os que não são; de tipos de solo, pois em estudos realizados na Bahia por Bavia (1999) foi verificado que altas prevalência da doença acontece em áreas de latossolo e de vegetação em transição; e a criação de um índice de infra-estrutura de 109 saúde também seria de grande importância para o estudo, já que a infra-estrutura em saúde é bastante precária nos dias de hoje. Como visto, a árvore de decisão demonstrou ser mais exata que as outras modelagens e a como a análise regional chegou a melhores resultados em relação a análise global, sugere-se que seja gerada uma árvore de decisão para cada região proposta nesta dissertação. Outra sugestão é usar outro tipo de regiões, como por exemplo, os municípios que estão próximos a bacias hidrográficas como, por exemplo, a bacia do Rio Doce, a bacia do Rio Paraíba, a bacia do São Francisco, o Vale do Jequitinhonha e o Vale do Mucuri entre outros. 110 REFERÊNCIAS BIBLIOGRÁFICAS AMARAL, R. S.; PORTO, M. A. S. Evolução e situação atual do controle da esquistossomose no Brasil. Revista da Sociedade Brasileira de Medicina Tropical, v. 27, p. 73-90, 1994. ARAKI, H. Fusão de informações espectrais, altimétricas e de dados auxiliares na classificação de imagens de alta resolução espacial. 136 p. Tese (Doutorado em Ciências Geodésicas ) – Universidade Federal do Paraná (UFPR), Curitiba, 2005. ASSUNÇÃO, R. M.; NEVES, M. C.; CÂMARA, G.; FREITAS, C. C. Efficient regionalization techniques for socio-economic geographical units using minimum spanning trees. International Journal of Geographical Information Science, v. 20, p. 797-811, 2006. BAVIA, M. E.; HALE, L.; MALONE, J. B.; BRAUD, D. H.; SHANE, S. M. Geographic information systems and the enviromental risk of Schistosomiasis in Bahia, Brazil. American Journal of Tropical Medical and Hygiene, v. 60, n. 4, p. 566-572, 1999. BAVIA, M. E.; MALONE, J. B.; HALE, L.; DANTAS, A.; MARRONI, L.; REIS, R. Use of thermal and vegetation index data from earth observing satellites to evaluate the risk of schistosomiasis in Bahia, Brazil. Acta Tropica, v. 79, n. 1, p. 79-85, 2001. BECK, L. R.; LOBITZ, B. M.; WOOD, B. L. Remote sensing and human health: new sensors and new opportunities. Emerging Infectious Diseases 2000, v. 6, n. 3, p. 217227, 2000. BECK, L. R.; RODRIGUEZ, M. H.; DISTER, S. W.; RODRIGUEZ, A. D.; WASHINO, R. K.; ROBERTS, D. R.; SPANNER, M. A. Assessment of a remote sensing based model for predicting malaria transmission risk in villages of Chiapas, Mexico. American Journal of Tropical Medical and Hygiene, v. 56, n. 1, p. 99-106, 1997. BROOKER, S. Schistosomes, snails and satellites. Acta Tropica, v. 82, n. 2, p. 207214, 2002. BROOKER, S.; BEASLEY, M.; NDINAROMTAN, M.; MADJIOUROUM, E. M.; BABOGUEL, M.; DJENGUINABE, E.; HAY, S. I.; BUNDY, D. A. P. Use of remote sensing and a geographic information system in a national helminth control programme in Chad. Bulletin of the World Health Organization, v. 80, p. 783-789, 2002a. BROOKER, S.; HAY, S. I.; ISSAE, W.; HALL, A.; KIHAMIA, C. M.; LWAMBO, N. J.; WINT, W.; ROGERS, D. J.; BUNDY, D. A. Predicting the distribution of urinary schistosomiasis in Tanzania using satellite sensor data. Tropical Medicine and International Health, v. 6, n. 12, p. 998-1007, 2001. BROOKER, S.; HAY, S. I.; TCHUEM TCHUENTÉ, L. A.; RATARD, R. Using NOAA AVHRR data to model human helminth distribuitions in planning disease control in Cameroon. Photogrammetric Engineering & Remote Sensing, v. 68, n. 2, p. 175-179, 2002b. 111 CARVALHO, O. S.; DUTRA, L. V.; MOURA, A. C. M.; FREITAS, C. C.; AMARAL, R. S.; DRUMMOND, S. C.; FREITAS, C. R.; SCHOLTE, R. G. C.; GUIMARÃES, R. J. P. S.; MELO, G. R.; CORREIA, V. R. M.; GUERRA, M. Desenvolvimento de um sistema de informações para o estudo, planejamento e controle da esquistossomose no Estado de Minas Gerais. In: Simpósio Brasileiro de Sensoriamento Remoto, n. XII, 2005, Goiânia. Anais... São José dos Campos: INPE, 2005. p. 2083-2086. ISBN 85-1700018-8. CD-ROM. CARVALHO, O. S.; ROCHA, R. S.; MASSARA, C. L.; KATZ, N. Expansão da esquistossomose mansoni em Minas Gerais. Memórias do Instituto Oswaldo Cruz, v. 82, p. 295-298, 1987. DALMOLIN, Q. Ajustamento por mínimos quadrados. 2. Curitiba: Editora da UFPR, 2004. 176 p. ISBSN 8588783029. DIAS, J. C. P. Problemas e possibilidades de participação comunitária no controle das grandes endemias no Brasil. Cadernos de Saúde Pública, v. 14, p. 19-37, 1998. DOUMENGE, J. P.; MOTT, K. E.; CHEUNG, C.; VILLENAVE, D.; CAPUI, O.; PERRIN, M. F. Atlas of the global distribution of schistosomiasis. Talence, Geneva: WHO-CEGET-CNRS, Presses Universitaires de Bordeaux, 1987. DRAPER, N. R.; SMITH, H. Applied regression analysis. 2. New York: John Wiley & Sons, 1981. 709 p. ISBSN 0-471-02995-5. DRUCK, S.; CARVALHO, M. S.; CÂMARA, G.; MONTEIRO, A. M. V. Análise espacial de dados geográficos. Brasília: EMBRAPA, 2004. 209 p. ISBSN 85-7383260-6. Disponível em: <http://www.dpi.inpe.br/gilberto/livro/analise/>. Acesso em: sep, 2006. DRUMMOND, I. N. Classificaçao imprecisa de dados baseada em lógica difusa e teoria de possibilidades. 2007-. (INPE--T/). 157 p. Tese (Doutorado em Computação Aplicada) – Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 2007. Disponível em: <http://urlib.net/sid.inpe.br/mtc-m17@80/2007/12.07.10.59>. Acesso em: 15 nov. 2007. DRUMMOND, I. N.; SANDRI, S. A. Parameterized Imprecise Classification: Elicitation and Assessment. Lecture Notes in Computer Science, v. 4140, p. 319-328, 2006. DRUMMOND, S. C. Dados de prevalencia da esquistossomose em Minas Gerais. Secretaria do Estado da Saúde de Minas Gerais. 2006 (Comunicação Pessoal). DUTRA, L. V.; FREITAS, C. R.; MOURA, A. C. M.; FREITAS, C. C.; GUIMARÃES, R. J. P. S.; AMARAL, R. S.; DRUMMOND, S. C.; SCHOLTE, R. G. C.; MELO, G. R.; GUERRA, M.; CARVALHO, O. S. Desenvolvimento de Índices Hidrológicos para aplicação em Sistema de Modelagem Ambiental de Risco de Esquistossomose em Minas Gerais. In: Simpósio Internacional sobre esquistossomose, n. 10., 2005a, Belo Horizonte. Anais... Rio de Janeiro: Fiocruz, 2005a. p. 133. 112 DUTRA, L. V.; MOURA, A. C. M.; FREITAS, C. R.; FREITAS, C. C.; AMARAL, R. S.; DRUMMOND, S. C.; GUIMARÃES, R. J. P. S.; SCHOLTE, R. G. C.; CARVALHO, O. S. Uso das imagens SRTM no mapeamento da rede de drenagem e no estudo da rugosidade do terreno em Minas Gerais e suas relações com a ocorrência da esquistossomose. In: Simpósio Nacional de Geografia da Saúde, n. 2., 2005b, Rio de Janeiro. Anais... Rio de Janeiro: Fiocruz, 2005b. CD-ROM. FEITOSA, F. F. Índices Epaciais para mensurar a segregação residensial: o caso de São José dos Campos (SP). 169 p. Dissertação (Mestrado em Sensoriamento Remoto) – Instituto Nacional de Pesquisas Espaciais (INPE), São José dos Campos, 2005. FEITOSA, F. F.; CÂMARA, G.; MONTEIRO, A. M. V.; KOSCHITZI, T.; SILVA, M. P. S. Global and local spatial indices of urban segregation. International Journal of Geographical Information Science, v. 21, n. 3, p. 299-323, 2007. FONSECA, F. R.; FREITAS, C. C.; DUTRA, L. V.; MARTINS, F. T.; GUIMARÃES, R. J. P. S.; SCHOLTE, R. G. C.; AMARAL, R. S.; DRUMMOND, S. C.; M., M. A. C.; ROCHA, L.; CARVALHO, O. S. Desenvolvimento de um modelo de regressão linear para a prediçãoo da prevalência de esquistossomose no Estado de Minas Gerais. In: Simpósio Brasileiro de Sensoriamento Remoto, n. 13., 2007a, Florianópolis. Anais... São José dos Campos: INPE, 2007a. p. 2573-2580. FONSECA, F. R.; SARAIVA, T. S.; FREITAS, C. C.; DUTRA, L. V.; MONTEIRO, A. M. V.; RENNÓ, C. D.; MARTINS, F. T.; GUIMARĆES, R. J. P. S.; M., M. A. C.; SCHOLTE, R. G. C.; AMARAL, R. S.; DRUMMOND, S. C.; CARVALHO, O. S. Desenvolvimento de um índice hidrológico para aplicações em estudos de distribuição da prevalência da esquistossomose em Minas Gerais. In: Simpósio Brasileiro de Sensoriamento Remoto, n. 13., 2007b, Florianópolis. Anais... São José dos Campos: INPE, 2007b. p. 2589-2595. FONSECA, J. M. M. R. D. Indução de árvores de decisão. 151 p. Dissertação (Mestrado em Departamento de Informática) – Universidade Nova de Lisboa, Lisboa, 1994. FREITAS, C. C.; GUIMARÃES, R. J. D. P. S.; DUTRA, L. V.; MARTINS, F. D. T.; GOUVÊA, É. J. C.; SANTOS, R. A. T.; MOURA, A. C. D. M.; DRUMMOND, S. C.; AMARAL, R. S.; CARVALHO, O. D. S. Remote Sensing and Geographic Information Systems for the Study of Schistosomiasis in the State of Minas Gerais, Brazil. IEEE International Geoscience And Remote Sensing Symposium, p. 2436-2439, jul./ago. 2006. Spacial issue on the 2006 International Geoscience and Remote Sensing Symposium (IGARSS'06). GONG, P.; SPEAR, R.; SETO, E.; ZHOU, Y.; XU , B.; MAXZLE, D.; LIANG, S.; DAVIS, G.; GU, X. Remote sensing and GIS for schistosomiasis control in Sichuan, China, an overview. In: GEOINFORMATICS'99 CONFERENCE, 1999, Ann Arbor, MI. Proceedings… Ann Arbor, MI:.The Association of Chinese Professionals in GIS Abroad, 1999. p. 1-9. GUIMARÃES, R. J. D. P. S. Variáveis climáticas e variáveis de sensoriamento remoto. (Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 2005) Comunicação Pessoal. 113 GUIMARÃES, R. J. D. P. S.; FREITAS, C. C.; DUTRA, L. V.; MOURA, A. C. D. M.; AMARAL, R. S.; DRUMMOND, S. C.; SCHOLTE, R. G. C.; FREITAS, C. R.; CARVALHO, O. D. S. Analysis and estimative of schistosomiasis prevalence for Minas Gerais state, Brazil, using multiple regression with social and environmental spatial data. Mem Inst Oswaldo Cruz, v. 101, p. 91-96, 2006. GUIMARÃES, R. J. D. P. S. E.; FREITAS, C. D. C.; DUTRA, L. V.; MOURA, A. C. D. M.; AMARAL, R. S. D.; DRUMMOND, S. C.; SCHOLTE, R. G. C.; CARVALHO, O. D. S. Schistosomiasis Risk Estimation in Minas Gerais State, Brazil, using Environmental Data and GIS techniques. Acta Tropica, 2007. Submetido. GUIMARÃES, R. J. P. S.; FREITAS, C. C.; DUTRA, L. V.; SHIMABUKURO, Y. E.; CARVALHO, O. S.; MOURA, A. C. M.; AMARAL, R. S.; DRUMMOND, S. C.; SCHOLTE, R. G. C.; FREITAS, C. R.; MELO, G. R. Comparação do modelo de mistura com os índices de vegetação NDVI e EVI oriundos das imagens MODIS para o Estado de Minas Gerais. In: Simpósio Brasileiro de Sensoriamento Remoto, n. 12., 2005a, Goiânia. Anais... São José dos Campos: INPE, 2005a. p. 2665-2672. GUIMARÃES, R. J. P. S.; FREITAS, C. C.; DUTRA, L. V.; SHIMABUKURO, Y. E.; MOURA, A. C. M.; AMARAL, R. S.; DRUMMOND, S. C.; SCHOLTE, R. G. C.; FREITAS, C. R.; CARVALHO, O. S. Avaliação do modelo de mistura oriundos das imagens MODIS como uma variável para determinar a prevalência da esquistossomose no Estado de Minas Gerais. In: Simpósio Nacional de Geografia da Saúde, n. 2., 2005b, Rio de Janeiro. Anais... Rio de Janeiro: Fiocruz, 2005b. CD-ROM. INSTITUTO BRASILEIRO DE GEOGRÁFIA E ESTATISTICA (IBGE). População e domicílios - censo 2000 - resultados da amostra. Disponível em: <http://www.ibge.gov.br/estadosat/perfil.php?sigla=mg>. Acesso em: apr. 2006. KATZ, N.; CARVALHO, O. S. Introdução recente da esquistossomose mansoni no sul do estado de Minas Gerais, Brasil. Memórias do Instituto Oswaldo Cruz, v. 78, p. 281-284, 1983. KATZ, N.; DIAS, E. P.; SOUZA, C. P.; BRUCE, J. I.; COLES, G. C. Rate of action of schistosomicides in mice infected with Schistosoma mansoni. Revista da Sociedade Brasileira de Medicina Tropical, v. 22, n. 4, p. 183-186, 1989. LEVENE, H. In contributions to probability and statistics: essays in honor of harold hotelling. I. Olkin et al. Stanford University Press, 1960. 278-292 p. MALONE, J. B.; ABDEL-RAHMAN, M. S.; EL BAHY, M. M.; HUH, O. K.; SHAFIK, M.; BAVIA, M. Geographic information systems and the distribution of Schistosoma mansoni in the Nile delta. Parasitology Today, v. 13, n. 3, p. 112-119, 1997. MALONE, J. B.; BERGQUIST, N. R.; HUH, O. K.; BAVIA, M. E.; BERNARDI, M.; EL BAHY, M. M.; FUENTES, M. V.; KRISTENSEN, T. K.; MCCARROLL, J. C.; YILMA, J. M.; ZHOU, X. N. A global network for the control of snail-borne disease using satellite surveillance and geographic information systems. Acta Tropica, v. 79, n. 1, p. 7-12, 2001a. 114 MALONE, J. B.; HUH, O. K.; FEHLER, D. P.; WILSON, P. A.; WILENSKY, D. E.; HOLMES, R. A.; ELMAGDOUB, A. L. Temperature data from satellite imagery and distribution of schistosomiasis in Egypt. American Journal of Tropical Medical and Hygiene, v. 51, n. 3, p. 714-722, 1994. MALONE, J. B.; YILMA, J. M.; MCCARROLL, J. C.; ERKO, B.; MUKARATIRWA, S.; ZHOU, X. Satellite climatology and the environmental risk of Schistosoma mansoni in Ethiopia and east Africa. Acta Tropica, v. 79, n. 1, p. 59-72, 2001b. MARCELINO, I. P. O. Análise de episódios de tornados em Santa Catarina: caracterização sinótica e mineração de dados. 2003-06-10. 222 p. (INPE-12145TDI/969). Dissertação (Mestrado em Sensoriamento Remoto) – Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 2003. Disponível em: <http://urlib.net/sid.inpe.br/jeferson/2003/08.19.09.24>. Acesso em: 17 jan. 2006. MARTINS, F. T.; DUTRA, L. V.; FREITAS, C. C.; FONSECA, F. R.; GUIMARÃES, R. J. P. S.; SCHOLTE, R. G. C.; AMARAL, R. S.; DRUMMOND, S. C.; FREITAS, C. R.; CARVALHO, O. S. Uso de árvore de decisão para predição da prevalência de esquistossomose no Estado de Minas Gerais, Brazil. In: Simpósio Brasileiro de Sensoriamento Remoto, n. 13., 2007, Florianópolis. Anais... São José dos Campos: INPE, 2007. p. 2841-2848. MOURA, A. C. M.; FREITAS, C. R.; DUTRA, L. V.; MELO, G. R.; CARVALHO, O. S.; FREITAS, C. C.; AMARAL, R. S.; SCHOLTE, R. G. C.; DRUMMOND, S. C.; GUIMARÃES, R. J. P. S. Atualização de mapa de drenagem como subsídio para montagem de SIG para a análise da distribuição da esquistossomose em Minas Gerais. In: Simpósio Brasileiro de Sensoriamento Remoto, n. 12., 2005, Goiânia. Anais... São José dos Campos: INPE, 2005. p. 3551-3558. NASA. Shuttle Radar Topography Mission. 2006. Disponível em: <http://www2.jpl.nasa.gov/srtm/mission.htm>. Acesso em: 08 de março de 2006. NETER, J.; KUTNER, M. H.; NACHTSSHEIM, C. J.; WASSERMAN, W. Applied linear statistical models. 4. Boston: WCB/McGraw-Hill, 1996. NEVES, M. C. Procedimentos eficientes para regionalização de unidades socioeconômicas em bancos de dados geográficos. 129 p. Tese (Doutorado em Sensoriamento Remoto) – Instituto Naciol de Pesquisas Espaciais (INPE), São José dos Campos, 2003. NEVES, M. C.; CAMARA, G.; ASSUNÇÃO, R. M.; FREITAS, C. C. Procedimentos automáticos e semi-automáticos de regionalização por árvore geradora mínima. In: SIMPÓSIO BRASILEIRO DE GEOINFORMÁTICA, 4., 2002, Caxambu. Anais... [S.l.]: SBC/INPE/Prodabel, 2002. p. 109-116. PELLON, A. B.; TEIXEIRA, I. Distribuição da esquistossomose mansônica no Brasil. In: CONGRESSO BRASILEIRO DE HIGIÊNE, 8., 1950, Recife. Anais… Recife: [s.n.], 1950. p. 117. QUINLAN, J. R. C4.5: programs for machine learning. San Francisco, CA, USA: Morgan Kaufmann Publishers, 1993. 115 RASO, G.; VOUNATSOU, P.; SINGER, B. H.; N'GORAN, E. K.; TANNER, M.; UTZINGER, J. An integrated approach for risk profiling and spatial prediction of Schistosoma mansoni–hookworm coinfection. PNAS - Proceedings of the National Academy of Sciences of the United States of America v. 103, p. 6934–6939, 2006. REARDON, S. F.; O’SULLIVAN, D. Measures of spatial segregation. University Park: Pennsylvania State University, 2004. 47 p. ROZENFELD, S. Fundamentos da vigilância sanitária. Rio de Janeiro: Fiocruz, 2000. 304 p. SHAPIRO, S. S.; WILK, M. B. An analysis of variance test for normality (complete samples). Biometrika, v. 52, p. 591-611, 1965. Sistema Nacional de Indicadores Urbanos (SNIU). 2005. Disponível em: <http://www.cidades.gov.br/index.php?option=content&task=section&id=49>. Acesso em: nov. 2005. STANDEN, O. D. The effect of temperature, light and salinity upon the hatching of the ova of Schistosoma mansoni. Transactions of the Royal Society of Tropical Medicine and Hygiene, v. 45, p. 225-241, 1951. TEIXEIRA, M. J. A schistosomose mansônica na infância em Belo Horizonte. 107 p. Tese (Concurso à Cadeira em Pediatria da Universidade Federal de Minas Gerais) – Imprensa Oficial, Belo Horizonte, 1920. WEKA. Data mning software in java the university of Waikato. 2006. Disponível em: <http://www.cs.waikato.ac.nz/ml/weka/>. Acesso em: jun, 2006. WHO. The control of schistosomiasis. Geneva: World Health Organization, 1993. 94 p. WONG, D. W. S. Measuring multiethnic spatial segregation. Urban Geography, v. 19, p. 77-87, 1998. YANG, G.-J.; VOUNATSOU, P.; XIAO-NONG, Z.; UTZINGER, J.; TANNER, M. A review of geographic information system and remote sensing with applications to the epidemiology and control of schistosomiasis in China. Acta Tropica, v. 96, n. 2-3, p. 117-129, 2005a. YANG, G.-J.; VOUNATSOU, P.; ZHOU, X.-N.; TANNER, M.; UTZINGER, J. A Bayesian-based approach for spatio-temporal modeling of county level prevalence of Schistosoma japonicum infection in Jiangsu province, China. International Journal for Parasitology, v. 35, n. 2, p. 155-162, 2005b. ZADEH, L. A. Fuzzy Sets, Information and Control. In: Yuan, G. J. K. e. B. (Ed.). Fuzzy sets., v. 8. World Scientific, 1965, p. 338-353. ZHOU, X. N.; MALONE, J. B.; KRISTENSEN, T. K.; BERGQUIST, N. R. Application of geographic information systems and remote sensing to schistosomiasis control in China. Acta Tropica, v. 79, n. 1, p. 97-106, 2001. 116 APÊNDICE A TABELA A.1 – Correlação entre as variáveis do modelo global. 117 Ln(Prev) SanRioLago Dec Veg_I Tmin_V AH2 SanRioLago *Veg_I SanRioLago *AH2 Dec*Veg_I Ln(Prev) 1,00 0,26 0,39 0,47 0,41 -0,39 0,28 0,25 0,44 SanRioLago 0,26 1,00 0,62 0,23 0,00 -0,55 0,98 1,00 0,46 Dec 0,39 0,62 1,00 0,64 0,28 -0,74 0,66 0,63 0,91 Veg_I 0,47 0,23 0,64 1,00 0,26 -0,44 0,35 0,23 0,88 Tmin_V 0,41 0,00 0,28 0,26 1,00 -0,05 0,04 0,02 0,32 AH2 -0,39 -0,55 -0,74 -0,44 -0,05 1,00 -0,54 -0,53 -0,63 SanRioLago*Veg_I 0,28 0,98 0,66 0,35 0,04 -0,54 1,00 0,98 0,57 SanRioLago*AH2 0,25 1,00 0,63 0,23 0,02 -0,53 0,98 1,00 0,47 Dec*Veg_I 0,44 0,46 0,91 0,88 0,32 -0,63 0,57 0,47 1,00 Os valores em negrito da Tabela A.1 são referentes às variáveis que possuem correlação significativa a 5% de significância. Assim como na Tabela A.1, os valores em negrito das Tabelas A.2, A.3, A.4 e A.5 são referentes às variáveis que possuem correlação significativa a 5% de significância. TABELA A.2 – Correlação entre as variáveis do modelo para a região 1. Ln(Prev) HomoUrb MIR_V Ln(Prev) 1,00 -0,51 0,59 HomoUrb -0,51 1,00 -0,10 MIR_V 0,59 -0,10 1,00 TABELA A.3 – Correlação entre as variáveis do modelo para a região 2. Ln(Prev) HomoCEst Est1 IDH_00 DEM Dec Ln(Prev) 1,00 -0,40 0,27 -0,31 -0,33 0,29 HomoCEst -0,40 1,00 -0,37 0,59 -0,17 -0,05 Est1 0,27 -0,37 1,00 -0,62 -0,19 0,19 IDH_00 -0,31 0,59 -0,62 1,00 -0,14 0,01 DEM -0,33 -0,17 -0,19 -0,14 1,00 0,26 Dec 0,29 -0,05 0,19 0,01 0,26 1,00 TABELA A.4 – Correlação entre as variáveis do modelo para a região 3. Ln(Prev) HomoOutro SanRede IDHL_00 AH2 Ln(Prev) 1,00 0,31 0,33 -0,41 -0,67 HomoOutro 0,31 1,00 0,22 0,07 0,09 SanRede 0,33 0,22 1,00 0,04 -0,09 IDHL_00 -0,41 0,07 0,04 1,00 0,32 AH2 -0,67 0,09 -0,09 0,32 1,00 TABELA A.5 – Correlação entre as variáveis do modelo para a região 4. Ln(Prev) DispSBan BLUE_I PREC_I Ln(Prev) 1,00 0,45 -0,67 0,40 DispSBan 0,45 1,00 -0,12 0,25 BLUE_I -0,67 -0,12 1,00 -0,04 PREC_I 0,40 0,25 -0,04 1,00 118 APÊNDICE B Nas Tabelas B1, B2, B4 e B6 são apresentadas as matrizes de confusão da estimativa global, regional e da classificação pela árvore de decisão para cada uma das regiões usando o conjunto de treinamento. As Tabelas B3, B5 e B6 apresentam as matrizes de confusão para as regiões 2, 3 e 4 respectivamente da estimativa global, regional e da classificação por árvore de decisão usando o conjunto de validação. TABELA B.1- Matriz de confusão Região 1 – Conjunto de Treinamento. Estimativa Global Estimativa Regional Classificação Árvore Baixa Média Alta Baixa Média Alta Baixa Média Alta 3 0 2 0 1 1 5 6 6 Baixa (8) 62,50 37,50 0,00 75,00 25,00 0,00 75,00 12,50 12,50 1 1 3 0 2 0 3 2 3 Média (5) 20,00 60,00 20,00 60,00 40,00 0,00 40,00 60,00 0,00 1 2 0 2 1 1 0 1 1 Alta (3) 33,33 66,67 0,00 0,00 66,67 33,33 33,33 33,33 33,33 TABELA B.2 - Matriz de confusão Região 2 – Conjunto de Treinamento. Estimativa Global Estimativa Regional Classificação Árvore Baixa Média Alta Baixa Média Alta Baixa Média Alta 2 1 4 0 1 1 2 1 3 Baixa (5) 40,00 40,00 20,00 20,00 80,00 0,00 60,00 20,00 20,00 1 10 0 6 6 11 16 21 10 Média (27) 3,70 77,78 22,22 22,22 37,04 40,74 59,26 37,04 0,00 0 20 0 17 0 2 7 10 25 Alta (27) 0,00 74,07 25,93 0,00 0,00 7,41 62,96 37,04 92,59 TABELA B.3 – Matriz de confusão Região 2 – Conjunto de Teste. Estimativa Global Estimativa Regional Classificação Árvore Baixa Média Alta Baixa Média Alta Baixa Média Alta 3 1 4 0 1 2 0 0 1 Baixa (4) 75,00 25,00 0,00 100,00 0,00 0,00 25,00 25,00 50,00 1 5 1 7 2 8 7 5 3 Média (13) 7,69 38,46 53,85 15,38 23,08 61,54 53,85 38,46 7,69 0 7 0 7 1 5 3 3 4 Alta (10) 0,00 70,00 30,00 0,00 30,00 10,00 50,00 40,00 70,00 TABELA B.4 – Matriz de confusão Região 3 – Conjunto de Treinamento. Estimativa Global Estimativa Regional Classificação Árvore Baixa Média Alta Baixa Média Alta Baixa Média Alta 4 0 5 2 3 0 5 2 6 Baixa (9) 0,00 22,22 55,56 22,22 66,67 33,33 0,00 55,56 44,44 2 6 0 11 3 4 4 1 5 Média (12) 16,67 33,33 50,00 8,33 91,67 25,00 41,67 33,33 0,00 0 8 0 0 0 0 15 23 23 Alta (23) 0,00 34,78 65,22 0,00 0,00 100,00 0,00 100,00 0,00 119 Baixa (2) Média (6) Alta (6) TABELA B.5 - Matriz de confusão Região 3 – Conjunto de Teste. Estimativa Global Estimativa Regional Classificação Árvore Baixa Média Alta Baixa Média Alta Baixa Média Alta 2 0 2 0 2 0 0 0 0 100,00 0,00 0,00 100,00 100,00 0,00 0,00 0,00 0,00 1 3 0 6 1 3 2 0 2 16,67 50,00 0,00 100,00 16,67 50,00 33,33 0,00 33,33 1 3 0 0 2 1 2 6 3 16,67 50,00 0,00 100,00 33,33 16,67 33,33 0,00 50,00 TABELA B.6 – Matriz de confusão Região 4 – Conjunto de Treinamento. Estimativa Global Estimativa Regional Classificação Árvore Baixa Média Alta Baixa Média Alta Baixa Média Alta 2 0 0 0 0 0 11 13 13 Baixa (13) 0,00 0,00 0,00 84,62 15,38 0,00 100,00 0,00 100,00 2 0 3 0 3 2 5 4 2 Média (7) 28,57 71,43 0,00 57,14 0,00 42,86 42,86 28,57 28,57 1 7 1 7 1 0 0 0 7 Alta (8) 12,50 87,50 0,00 12,50 12,50 0,00 87,50 0,00 87,50 Baixa (5) Média (3) Alta (1) TABELA B.7 – Matriz de confusão Região 4 – Conjunto de Teste. Estimativa Global Estimativa Regional Classificação Árvore Baixa Média Alta Baixa Média Alta Baixa Média Alta 2 0 0 0 0 1 3 5 4 40,00 0,00 100,00 0,00 0,00 20,00 60,00 0,00 80,00 0 0 0 0 0 3 3 3 0 0,00 0,00 100,00 0,00 0,00 100,00 100,00 0,00 0,00 0 0 0 0 1 0 1 1 0 0,00 0,00 0,00 100,00 100,00 0,00 100,00 0,00 0,00 120 APÊNDICE C A Tabela C.2 apresenta os 853 municípios do Estado de Minas Gerais com as regiões definidas nesta dissertação (seção 6.2) e os resultados das estimativas de risco da prevalência da esquistossomose para o modelo global e regional, além da classificação obtida através da árvore de decisão. A seguir são apresentadas as siglas das estimativas mostradas na Tabela C.2. TABELA C.1 – Siglas das estimativas mostradas na Tabela C.2 121 EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR LimInfR LimSupR ClassImprecisaR Árvore Estimativa do modelo de regressão linear global (Figura 6.4a) Limite inferior do modelo global (Figura 6.6b) Limite superior do modelo global (Figura 6.6c) Classificação imprecisa do modelo global a 55% de confiança (Figura 6.6a) Estimativa do modelo de regressão linear regional (Figura 6.8a) Limite inferior do modelo regional (Figura 6.10b) Limite superior do modelo regional (Figura 6.10c) Classificação imprecisa do modelo regional a 60% de confiança (Figura 6.10a) Classificação pela árvore de decisão (Figura 6.12a) TABELA C.2 – Estimativa do risco da prevalência pelo modelo Global, pelo Modelo Regional e pela Árvore de decisão. COD 3100104 3100203 3100302 3100401 3100500 3100609 3100708 3100807 3100906 3101003 3101102 3101201 3101300 MUNICIPIO ABADIA DOS DOURADOS ABAETE ABRE-CAMPO ACAIACA ACUCENA AGUA BOA AGUA COMPRIDA AGUANIL AGUAS FORMOSAS AGUAS VERMELHAS AIMORES AIURUOCA ALAGOA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR LimInfR LimSupR ClassImprecisaR Árvore 1 6,656 3,387 12,361 Baixa/Média 19,409 8,468 35,241 Média/Alta Baixa 1 0,011 -0,470 0,932 Baixa 10,035 4,444 17,475 Baixa/Alta Baixa 2 11,939 6,385 21,672 Média/Alta 12,433 7,744 17,504 Média/Alta Média 2 7,141 3,632 13,310 Baixa/Média 14,025 9,338 20,414 Média/Alta Baixa 3 12,512 6,694 22,728 Média/Alta 38,066 7,650 22,720 Média/Alta Alta 3 16,988 9,342 30,289 Média/Alta 66,184 16,031 48,352 Alta Média 1 1,047 0,154 2,631 Baixa 3,289 1,254 6,787 Baixa/Média Baixa 1 2,364 0,921 4,890 Baixa 4,532 1,819 8,466 Baixa/Média Baixa 3 26,032 14,390 46,481 Média/Alta 30,754 18,355 55,751 Alta Alta 4 7,447 3,705 14,163 Baixa/Média 10,176 7,912 29,534 Média/Alta Alta 2 18,633 10,184 33,466 Média/Alta 12,040 7,898 17,773 Média/Alta Alta 1 7,669 3,965 14,136 Baixa/Média 5,047 1,884 8,609 Baixa/Média Alta 1 2,934 1,177 6,109 Baixa/Média 6,349 2,730 11,414 Baixa/Média Alta (Continua) TABELA C.2 – Continuação. 122 COD 3101409 3101508 3101607 3101631 3101706 3101805 3101904 3102001 3102050 3102100 3102209 3102308 3102407 3102506 3102605 3102704 3102803 3102852 3102902 3103009 3103108 3103207 3103306 3103405 3103504 3103603 3103702 3103751 3103801 3103900 3104007 3104106 3104205 3104304 3104403 3104452 3104502 3104601 3104700 MUNICIPIO ALBERTINA ALEM PARAIBA ALFENAS ALFREDO VASCONCELOS ALMENARA ALPERCATA ALPINOPOLIS ALTEROSA ALTO CAPARAO ALTO RIO DOCE ALVARENGA ALVINOPOLIS ALVORADA DE MINAS AMPARO DA SERRA ANDRADAS CACHOEIRA DE PAJEU ANDRELANDIA ANGELANDIA ANTONIO CARLOS ANTONIO DIAS ANTONIO PRADO DE MINAS ARACAI ARACITABA ARACUAI ARAGUARI ARANTINA ARAPONGA ARAPORA ARAPUA ARAUJOS ARAXA ARCEBURGO ARCOS AREADO ARGIRITA ARICANDUVA ARINOS ASTOLFO DUTRA ATALEIA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 2,759 1,119 5,668 Baixa/Média 6,250 2 6,762 3,453 12,529 Baixa/Média 4,515 1 2,073 0,745 4,412 Baixa 3,422 2 9,115 4,687 16,990 Baixa/Alta 4,905 3 12,229 6,498 22,339 Média/Alta 15,823 2 12,222 6,559 22,130 Média/Alta 11,979 1 5,289 2,600 9,986 Baixa/Média 6,000 1 3,504 1,560 6,922 Baixa/Média 3,625 2 10,436 5,388 19,472 Média/Alta 9,718 2 8,849 4,562 16,439 Baixa/Alta 8,845 2 8,068 4,138 15,003 Baixa/Alta 20,967 2 11,430 6,120 20,700 Média/Alta 8,063 3 10,625 5,624 19,400 Média/Alta 27,637 2 15,321 8,265 27,749 Média/Alta 11,568 1 2,456 0,961 5,089 Baixa/Média 3,955 3 15,671 8,538 28,139 Média/Alta 40,857 2 3,625 1,636 7,115 Baixa/Média 3,874 3 20,822 11,452 37,241 Média/Alta 16,818 2 7,996 4,048 15,031 Baixa/Alta 4,736 2 12,322 6,559 22,480 Média/Alta 14,648 2 15,300 8,253 27,712 Média/Alta 22,137 3 2,896 1,229 5,812 Baixa/Média 4,830 2 2,312 0,860 4,897 Baixa 12,250 3 6,713 3,402 12,512 Baixa/Média 27,877 1 5,283 2,601 9,964 Baixa/Média 1,686 2 6,031 3,007 11,337 Baixa/Média 5,304 2 11,381 5,993 20,921 Média/Alta 11,962 1 2,887 1,197 5,877 Baixa/Média 2,328 1 4,697 2,264 8,943 Baixa/Média 5,846 1 5,243 2,575 9,902 Baixa/Média 3,675 1 6,134 3,074 11,491 Baixa/Média 4,992 1 4,642 2,227 8,865 Baixa/Média 2,153 1 5,001 2,440 9,469 Baixa/Média 8,507 1 2,962 1,249 5,979 Baixa/Média 4,909 2 6,762 3,455 12,526 Baixa/Média 16,564 3 19,797 10,873 35,429 Média/Alta 39,687 4 8,832 4,594 16,282 Baixa/Alta 9,492 2 2,736 1,129 5,554 Baixa/Média 12,085 3 16,739 9,141 30,028 Média/Alta 42,498 LimInfR LimSupR ClassImprecisaR Árvore 2,807 11,657 Baixa/Média Baixa 3,541 9,540 Baixa/Média Média 1,623 8,403 Baixa/Média Baixa 0,471 2,508 Baixa Baixa 11,464 35,256 Média/Alta Alta 7,064 16,284 Média/Alta Baixa 2,442 10,298 Baixa/Média Baixa 1,152 6,266 Baixa/Média Baixa 1,688 5,774 Baixa/Média Alta 4,014 9,537 Baixa/Média Baixa 15,179 34,239 Alta Alta 4,215 10,142 Baixa/Média Média 3,456 11,662 Baixa/Média Baixa 6,386 14,355 Média Baixa 1,073 5,849 Baixa/Média Baixa 6,006 18,590 Média/Alta Alta 0,261 2,018 Baixa Baixa 5,676 17,486 Média/Alta Alta 0,506 2,560 Baixa Baixa 11,134 25,024 Média/Alta Alta 18,903 42,499 Alta Alta 0,472 3,276 Baixa Baixa 8,836 19,808 Média/Alta Baixa 5,547 18,895 Média/Alta Baixa 0,877 7,867 Baixa/Média Baixa 0,423 2,455 Baixa Baixa 4,602 11,646 Baixa/Média Média 0,758 5,288 Baixa/Média Baixa 2,608 10,997 Baixa/Média Baixa 1,457 7,324 Baixa/Média Alta 3,766 18,881 Baixa/Alta Baixa 0,590 4,735 Baixa Baixa 4,068 16,224 Baixa/Alta Alta 2,033 9,016 Baixa/Média Baixa 10,278 23,197 Média/Alta Média 7,013 20,956 Média/Alta Média 6,640 29,522 Média/Alta Baixa 6,736 16,558 Média/Alta Alta 13,449 38,852 Média/Alta Alta (Continua) TABELA C.2 – Continuação. 123 COD 3104809 3104908 3105004 3105103 3105202 3105301 3105400 3105509 3105608 3105707 3105905 3106002 3106101 3106200 3106309 3106408 3106507 3106606 3106655 3106705 3106804 3106903 3107000 3107109 3107208 3107307 3107406 3107505 3107604 3107703 3107802 3107901 3108008 3108107 3108206 3108255 3108305 3108404 MUNICIPIO AUGUSTO DE LIMA BAEPENDI BALDIM BAMBUI BANDEIRA BANDEIRA DO SUL BARAO DE COCAIS BARAO DO MONTE ALTO BARBACENA BARRA LONGA BARROSO BELA VISTA DE MINAS BELMIRO BRAGA BELO HORIZONTE BELO ORIENTE BELO VALE BERILO BERTOPOLIS BERIZAL BETIM BIAS FORTES BICAS BIQUINHAS BOA ESPERANCA BOCAINA DE MINAS BOCAIUVA BOM DESPACHO BOM JARDIM DE MINAS BOM JESUS DA PENHA BOM JESUS DO AMPARO BOM JESUS DO GALHO BOM REPOUSO BOM SUCESSO BONFIM BONFINOPOLIS DE MINAS BONITO DE MINAS BORDA DA MATA BOTELHOS Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR LimInfR LimSupR ClassImprecisaR Árvore 4 1,159 0,224 2,806 Baixa 2,110 1,095 5,824 Baixa/Média Baixa 1 4,513 2,157 8,630 Baixa/Média 6,326 2,311 9,884 Baixa/Média Média 1 6,083 3,049 11,390 Baixa/Média 20,230 8,528 35,918 Média/Alta Alta 1 5,720 2,851 10,729 Baixa/Média 5,415 2,177 9,414 Baixa/Média Baixa 3 7,842 3,940 14,824 Baixa/Média 32,039 9,939 29,637 Média/Alta Alta 1 2,369 0,909 4,944 Baixa 7,737 3,681 14,583 Baixa/Média Baixa 1 10,121 5,365 18,431 Média/Alta 2,638 1,071 6,056 Baixa/Média Alta 2 20,426 11,269 36,416 Média/Alta 15,384 12,350 26,922 Média/Alta Média 2 4,598 2,154 8,938 Baixa/Média -0,926 -0,967 -0,914 Baixa Baixa 2 8,207 4,249 15,147 Baixa/Alta 15,079 14,320 31,697 Média/Alta Baixa 2 2,629 1,053 5,417 Baixa/Média 2,842 0,323 2,126 Baixa Baixa 1 8,428 4,388 15,495 Baixa/Alta 3,433 1,431 7,226 Baixa/Média Alta 2 5,289 2,559 10,112 Baixa/Média 13,842 7,293 16,747 Média/Alta Baixa 1 1,861 0,608 4,090 Baixa -1,000 3,541 4,826 Baixa Baixa 2 37,304 20,631 66,829 Alta 9,743 7,135 16,098 Média/Alta Alta 1 3,146 1,362 6,278 Baixa/Média 6,333 2,378 10,194 Baixa/Média Baixa 3 7,359 3,790 13,587 Baixa/Média 24,575 2,797 9,681 Baixa/Média Alta 3 24,630 13,629 43,905 Média/Alta 28,875 10,921 33,498 Média/Alta Alta 4 5,639 2,776 10,674 Baixa/Média 8,774 5,566 21,674 Média/Alta Alta 1 5,911 2,948 11,097 Baixa/Média 0,212 -0,051 49,379 Baixa/Alta Baixa 2 4,266 1,958 8,374 Baixa/Média 10,073 3,880 9,435 Baixa/Média Baixa 2 3,162 1,367 6,317 Baixa/Média 6,940 2,252 6,860 Baixa/Média Baixa 1 -0,082 -0,518 0,750 Baixa 9,610 4,492 17,615 Baixa/Alta Baixa 1 1,787 0,587 3,894 Baixa 4,015 1,275 6,560 Baixa/Média Baixa 1 8,161 4,123 15,384 Baixa/Alta 3,767 1,302 6,836 Baixa/Média Alta 3 2,079 0,757 4,396 Baixa 3,411 0,423 3,328 Baixa Baixa 1 4,295 2,030 8,252 Baixa/Média 5,683 2,812 11,855 Baixa/Média Alta 2 4,879 2,355 9,303 Baixa/Média 6,354 0,823 3,397 Baixa Baixa 1 5,901 2,939 11,092 Baixa/Média 6,380 2,863 11,828 Baixa/Média Baixa 1 17,700 9,647 31,843 Média/Alta 3,681 1,264 6,715 Baixa/Média Média 2 13,567 7,380 24,325 Média/Alta 11,642 9,513 21,074 Média/Alta Alta 1 2,507 0,972 5,239 Baixa/Média 3,026 0,733 5,007 Baixa/Média Baixa 1 5,485 2,671 10,454 Baixa/Média 7,553 3,225 12,962 Baixa/Média Baixa 1 3,041 1,299 6,102 Baixa/Média 4,949 1,723 8,078 Baixa/Média Baixa 1 6,932 3,524 12,907 Baixa/Média 23,541 10,144 43,816 Média/Alta Baixa 4 9,749 5,066 18,046 Média/Alta 8,404 6,617 24,615 Média/Alta Alta 1 1,832 0,590 4,041 Baixa 4,141 1,562 7,523 Baixa/Média Baixa 1 3,166 1,369 6,329 Baixa/Média 4,647 1,633 7,710 Baixa/Média Baixa (Continua) TABELA C.2 – Continuação. 124 COD 3108503 3108552 3108602 3108701 3108800 3108909 3109006 3109105 3109204 3109253 3109303 3109402 3109451 3109501 3109600 3109709 3109808 3109907 3110004 3110103 3110202 3110301 3110400 3110509 3110608 3110707 3110806 3110905 3111002 3111101 3111150 3111200 3111309 3111408 3111507 3111606 3111705 3111804 MUNICIPIO BOTUMIRIM BRASILANDIA DE MINAS BRASILIA DE MINAS BRAS PIRES BRAUNAS BRASOPOLIS BRUMADINHO BUENO BRANDAO BUENOPOLIS BUGRE BURITIS BURITIZEIRO CABECEIRA GRANDE CABO VERDE CACHOEIRA DA PRATA CACHOEIRA DE MINAS CACHOEIRA DOURADA CAETANOPOLIS CAETE CAIANA CAJURI CALDAS CAMACHO CAMANDUCAIA CAMBUI CAMBUQUIRA CAMPANARIO CAMPANHA CAMPESTRE CAMPINA VERDE CAMPO AZUL CAMPO BELO CAMPO DO MEIO CAMPO FLORIDO CAMPOS ALTOS CAMPOS GERAIS CANAA CANAPOLIS Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR LimInfR LimSupR ClassImprecisaR Árvore 3 5,526 2,746 10,368 Baixa/Média 9,866 0,296 2,791 Baixa Média 4 7,723 3,982 14,274 Baixa/Média 1,888 0,782 5,358 Baixa/Média Baixa 4 12,317 6,588 22,371 Média/Alta 7,466 8,908 31,269 Média/Alta Alta 2 6,091 3,017 11,517 Baixa/Média 10,715 6,384 14,631 Média Baixa 3 11,726 6,211 21,459 Média/Alta 28,815 5,304 16,404 Média/Alta Alta 1 1,039 0,121 2,707 Baixa 3,231 0,729 4,890 Baixa Baixa 1 4,242 1,995 8,175 Baixa/Média 3,404 1,050 5,813 Baixa/Média Baixa 1 2,662 1,070 5,478 Baixa/Média 3,048 0,716 4,936 Baixa Baixa 4 1,602 0,480 3,572 Baixa 3,102 2,053 8,889 Baixa/Média Baixa 2 36,864 19,891 67,629 Alta 15,447 10,086 22,451 Média/Alta Alta 4 4,503 2,129 8,678 Baixa/Média 0,546 0,052 2,679 Baixa Baixa 4 10,089 5,334 18,414 Média/Alta 1,790 1,345 6,696 Baixa/Média Baixa 1 4,041 1,881 7,821 Baixa/Média 31,729 13,815 64,305 Média/Alta Baixa 1 3,649 1,649 7,159 Baixa/Média 4,462 1,224 6,409 Baixa/Média Baixa 1 5,559 2,762 10,436 Baixa/Média 8,795 4,403 17,138 Baixa/Alta Baixa 1 1,454 0,367 3,403 Baixa 3,355 0,968 5,714 Baixa/Média Baixa 1 1,397 0,339 3,292 Baixa 3,984 1,684 8,095 Baixa/Média Baixa 1 3,160 1,382 6,267 Baixa/Média 20,485 9,740 40,830 Média/Alta Baixa 1 11,972 6,401 21,735 Média/Alta 2,831 1,122 6,212 Baixa/Média Alta 2 23,755 13,171 42,245 Média/Alta 10,923 4,485 10,650 Baixa/Média Média 2 15,474 8,244 28,358 Média/Alta 9,566 4,397 10,360 Baixa/Média Baixa 1 1,404 0,353 3,272 Baixa 7,332 2,699 11,259 Baixa/Média Baixa 1 6,422 3,241 11,989 Baixa/Média 13,027 5,784 22,916 Média/Alta Baixa 1 1,315 0,283 3,177 Baixa 1,860 0,193 3,335 Baixa Baixa 1 0,661 -0,080 1,999 Baixa 2,116 0,448 4,105 Baixa Baixa 1 3,961 1,837 7,676 Baixa/Média 3,506 1,298 6,749 Baixa/Média Baixa 2 20,146 11,128 35,868 Média/Alta 15,175 12,360 26,845 Média/Alta Alta 1 4,102 1,904 7,966 Baixa/Média 6,546 2,978 12,088 Baixa/Média Baixa 1 2,894 1,208 5,865 Baixa/Média 8,250 2,352 10,162 Baixa/Média Baixa 1 8,297 4,301 15,307 Baixa/Alta 7,177 2,680 11,137 Baixa/Média Baixa 4 10,809 5,747 19,667 Média/Alta 3,464 1,999 9,115 Baixa/Média Baixa 1 5,269 2,553 10,062 Baixa/Média 6,730 3,256 13,735 Baixa/Média Baixa 1 1,391 0,359 3,203 Baixa 3,496 1,353 6,961 Baixa/Média Baixa 1 5,058 2,463 9,597 Baixa/Média 4,375 1,715 8,104 Baixa/Média Baixa 1 7,296 3,760 13,461 Baixa/Média 9,769 4,741 18,367 Baixa/Alta Média 1 2,604 1,053 5,328 Baixa/Média 3,415 0,705 4,730 Baixa Baixa 2 13,488 7,218 24,541 Média/Alta 11,868 8,893 19,984 Média/Alta Média 1 4,898 2,352 9,379 Baixa/Média 3,651 1,419 7,148 Baixa/Média Baixa (Continua) TABELA C.2 – Continuação. 125 COD 3111903 3112000 3112059 3112109 3112208 3112307 3112406 3112505 3112604 3112653 3112703 3112802 3112901 3113008 3113107 3113206 3113305 3113404 3113503 3113602 3113701 3113800 3113909 3114006 3114105 3114204 3114303 3114402 3114501 3114550 3114600 3114709 3114808 3114907 3115003 3115102 3115201 3115300 MUNICIPIO CANA VERDE CANDEIAS CANTAGALO CAPARAO CAPELA NOVA CAPELINHA CAPETINGA CAPIM BRANCO CAPINOPOLIS CAPITAO ANDRADE CAPITAO ENEIAS CAPITOLIO CAPUTIRA CARAI CARANAIBA CARANDAI CARANGOLA CARATINGA CARBONITA CAREACU CARLOS CHAGAS CARMESIA CARMO DA CACHOEIRA CARMO DA MATA CARMO DE MINAS CARMO DO CAJURU CARMO DO PARANAIBA CARMO DO RIO CLARO CARMOPOLIS DE MINAS CARNEIRINHO CARRANCAS CARVALHOPOLIS CARVALHOS CASA GRANDE CASCALHO RICO CASSIA CONCEICAO DA BARRA DE MINAS CATAGUASES Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR LimInfR LimSupR ClassImprecisaR Árvore 1 9,553 4,861 18,003 Baixa/Alta 7,633 3,271 13,224 Baixa/Média Baixa 1 4,981 2,411 9,487 Baixa/Média 11,152 4,310 17,223 Baixa/Alta Baixa 3 20,050 11,044 35,792 Média/Alta 48,914 10,305 30,595 Média/Alta Média 2 15,198 8,204 27,507 Média/Alta 12,062 4,426 10,933 Baixa/Média Alta 2 11,047 5,763 20,459 Média/Alta 7,735 2,940 7,518 Baixa/Média Baixa 3 15,446 8,419 27,718 Média/Alta 27,658 10,605 31,673 Média/Alta Alta 1 5,893 2,951 11,027 Baixa/Média 3,102 1,096 6,226 Baixa/Média Alta 1 5,047 2,466 9,550 Baixa/Média 7,185 3,501 13,877 Baixa/Média Baixa 1 2,535 0,992 5,275 Baixa/Média 3,389 1,376 7,004 Baixa/Média Baixa 2 10,492 5,574 19,089 Média/Alta 16,525 14,323 31,085 Média/Alta Baixa 4 2,565 1,033 5,252 Baixa/Média 2,416 1,565 7,290 Baixa/Média Baixa 1 2,718 1,124 5,509 Baixa/Média 6,996 3,089 12,539 Baixa/Média Baixa 2 17,872 9,763 32,090 Média/Alta 11,529 7,141 15,993 Média/Alta Média 3 24,035 13,305 42,813 Média/Alta 90,714 19,046 56,617 Alta Alta 2 8,016 4,103 14,932 Baixa/Média 8,558 3,068 7,730 Baixa/Média Baixa 2 6,801 3,408 12,807 Baixa/Média 2,978 -0,038 1,398 Baixa Baixa 2 11,503 6,143 20,882 Média/Alta 6,706 2,427 7,045 Baixa/Média Média 2 13,211 7,174 23,707 Média/Alta 1,523 0,792 2,863 Baixa Média 3 4,917 2,381 9,355 Baixa/Média 3,740 0,686 4,011 Baixa Média 1 1,802 0,583 3,960 Baixa 2,808 0,939 5,779 Baixa/Média Baixa 3 26,874 14,887 47,905 Média/Alta 27,393 13,776 40,208 Média/Alta Média 2 9,617 5,049 17,633 Média/Alta 14,811 9,193 20,478 Média/Alta Alta 1 5,826 2,896 10,959 Baixa/Média 5,154 1,906 8,603 Baixa/Média Baixa 1 4,900 2,369 9,334 Baixa/Média 4,971 1,997 8,912 Baixa/Média Baixa 1 6,216 3,132 11,603 Baixa/Média 3,576 1,075 6,014 Baixa/Média Baixa 1 3,992 1,856 7,726 Baixa/Média 6,201 2,703 11,149 Baixa/Média Baixa 1 4,968 2,427 9,393 Baixa/Média 14,115 5,810 23,671 Média/Alta Baixa 1 1,274 0,291 3,004 Baixa 5,345 1,785 8,147 Baixa/Média Baixa 1 3,695 1,677 7,235 Baixa/Média 7,892 2,990 12,239 Baixa/Média Baixa 1 7,478 3,810 13,945 Baixa/Média 7,925 3,287 13,281 Baixa/Média Baixa 1 3,245 1,424 6,433 Baixa/Média 5,854 2,532 10,735 Baixa/Média Baixa 1 2,289 0,858 4,822 Baixa 7,487 3,502 14,006 Baixa/Média Baixa 1 9,150 4,778 16,831 Baixa/Alta 4,018 1,492 7,433 Baixa/Média Média 2 4,806 2,291 9,243 Baixa/Média 5,256 1,260 4,188 Baixa Baixa 1 6,243 3,156 11,622 Baixa/Média 5,423 2,338 10,123 Baixa/Média Baixa 1 4,439 2,121 8,480 Baixa/Média 2,819 0,850 5,358 Baixa/Média Baixa 1 3,037 1,290 6,118 Baixa/Média 4,633 1,921 8,782 Baixa/Média Baixa 2 8,826 4,645 16,106 Baixa/Alta 0,939 0,540 2,674 Baixa Média (Continua) TABELA C.2 – Continuação. 126 COD 3115359 3115409 3115458 3115474 3115508 3115607 3115706 3115805 3115904 3116001 3116100 3116159 3116209 3116308 3116407 3116506 3116605 3116704 3116803 3116902 3117009 3117108 3117207 3117306 3117405 3117504 3117603 3117702 3117801 3117836 3117876 3117900 3118007 3118106 3118205 3118304 3118403 3118502 MUNICIPIO CATAS ALTAS CATAS ALTAS DA NORUEGA CATUJI CATUTI CAXAMBU CEDRO DO ABAETE CENTRAL DE MINAS CENTRALINA CHACARA CHALE CHAPADA DO NORTE CHAPADA GAUCHA CHIADOR CIPOTANEA CLARAVAL CLARO DOS POCOES CLAUDIO COIMBRA COLUNA COMENDADOR GOMES COMERCINHO CONCEICAO DA APARECIDA CONCEICAO DAS PEDRAS CONCEICAO DAS ALAGOAS CONCEICAO DE IPANEMA CONCEICAO DO MATO DENTRO CONCEICAO DO PARA CONCEICAO DO RIO VERDE CONCEICAO DOS OUROS CONEGO MARINHO CONFINS CONGONHAL CONGONHAS CONGONHAS DO NORTE CONQUISTA CONSELHEIRO LAFAIETE CONSELHEIRO PENA CONSOLACAO Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 6,369 3,206 11,913 Baixa/Média 4,311 2 13,539 7,194 24,795 Média/Alta 9,180 3 25,096 13,770 45,104 Média/Alta 43,467 4 3,570 1,610 7,004 Baixa/Média -0,599 1 4,918 2,382 9,357 Baixa/Média 2,216 1 5,411 2,679 10,172 Baixa/Média 5,172 2 12,787 6,862 23,178 Média/Alta 16,860 1 4,452 2,089 8,624 Baixa/Média 4,070 2 3,231 1,385 6,506 Baixa/Média 9,599 2 24,969 13,627 45,107 Média/Alta 17,308 3 11,628 6,252 20,987 Média/Alta 36,589 4 11,738 6,261 21,346 Média/Alta 9,098 2 4,070 1,900 7,863 Baixa/Média 16,308 2 6,123 3,032 11,585 Baixa/Média 10,646 1 3.933 1.830 7.599 Baixa/Média 9,072 4 2,543 1,026 5,196 Baixa/Média 2,698 1 5,655 2,798 10,662 Baixa/Média 5,265 2 7,704 3,942 14,327 Baixa/Média 8,272 3 12,526 6,708 22,733 Média/Alta 37,991 1 8,178 4,242 15,071 Baixa/Alta 5,832 3 4,867 2,346 9,290 Baixa/Média 40,264 1 4,600 2,196 8,812 Baixa/Média 3,932 1 4,458 2,069 8,709 Baixa/Média 5,572 1 1,159 0,213 2,843 Baixa 3,552 2 18,078 9,895 32,409 Média/Alta 18,121 2 6,056 3,045 11,307 Baixa/Média 6,545 1 7,498 3,856 13,872 Baixa/Média 3,191 1 4,149 1,949 7,992 Baixa/Média 2,568 1 1,135 0,180 2,866 Baixa 3,071 4 9,965 5,180 18,454 Média/Alta 12,280 1 3,517 1,583 6,899 Baixa/Média 7,475 1 1,542 0,422 3,542 Baixa 5,807 1 3,460 1,540 6,830 Baixa/Média 4,378 3 3,391 1,511 6,681 Baixa/Média 14,866 1 2,114 0,774 4,465 Baixa 2,480 1 4,414 2,065 8,564 Baixa/Média 3,533 2 10,104 5,338 18,454 Média/Alta 12,848 1 1,602 0,433 3,723 Baixa 4,401 LimInfR LimSupR ClassImprecisaR Árvore 1,784 8,348 Baixa/Média Baixa 4,611 10,867 Baixa/Média Baixa 10,021 29,151 Média/Alta Alta -0,771 -0,108 Baixa Baixa 0,910 5,654 Baixa/Média Baixa 2,361 10,229 Baixa/Média Alta 10,304 22,721 Média/Alta Alta 1,761 8,208 Baixa/Média Baixa 3,608 8,927 Baixa/Média Baixa 10,191 22,794 Média/Alta Alta 5,278 16,650 Média/Alta Média 4,438 25,611 Baixa/Alta Alta 10,633 23,518 Média/Alta Baixa 8,245 18,972 Média/Alta Baixa 4,004 15,869 Baixa/Alta Alta 1,809 8,062 Baixa/Média Baixa 1,933 8,616 Baixa/Média Baixa 2,398 6,687 Baixa/Média Baixa 10,596 30,784 Média/Alta Alta 2,504 10,665 Baixa/Média Baixa 7,121 22,060 Média/Alta Baixa 1,306 6,770 Baixa/Média Baixa 2,370 10,231 Baixa/Média Baixa 1,375 6,938 Baixa/Média Baixa 9,514 21,338 Média/Alta Alta 1,696 5,269 Baixa/Média Baixa 0,992 5,892 Baixa/Média Alta 0,835 5,412 Baixa/Média Baixa 1,012 5,936 Baixa/Média Baixa 8,887 32,523 Média/Alta Média 3,424 13,724 Baixa/Média Alta 2,425 10,318 Baixa/Média Baixa 2,446 10,710 Baixa/Média Baixa 2,410 8,476 Baixa/Média Baixa 0,779 5,307 Baixa/Média Baixa 2,651 16,476 Baixa/Alta Baixa 7,119 16,366 Média/Alta Média 1,839 8,576 Baixa/Média Baixa (Continua) TABELA C.2 – Continuação. 127 COD 3118601 3118700 3118809 3118908 3119005 3119104 3119203 3119302 3119401 3119500 3119609 3119708 3119807 3119906 3119955 3120003 3120102 3120151 3120201 3120300 3120409 3120508 3120607 3120706 3120805 3120839 3120870 3120904 3121001 3121100 3121209 3121258 3121308 3121407 3121506 3121605 3121704 3121803 MUNICIPIO CONTAGEM COQUEIRAL CORACAO DE JESUS CORDISBURGO CORDISLANDIA CORINTO COROACI COROMANDEL CORONEL FABRICIANO CORONEL MURTA CORONEL PACHECO CORONEL XAVIER CHAVES CORREGO DANTA CORREGO DO BOM JESUS CORREGO FUNDO CORREGO NOVO COUTO DE MAGALHAES DE MINAS CRISOLITA CRISTAIS CRISTALIA CRISTIANO OTONI CRISTINA CRUCILANDIA CRUZEIRO DA FORTALEZA CRUZILIA CUPARAQUE CURRAL DE DENTRO CURVELO DATAS DELFIM MOREIRA DELFINOPOLIS DELTA DESCOBERTO DESTERRO DE ENTRE-RIOS DESTERRO DO MELO DIAMANTINA DIOGO DE VASCONCELOS DIONISIO Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 4,753 2,281 9,090 Baixa/Média -0,866 1 5,591 2,753 10,575 Baixa/Média 3,341 4 9,056 4,747 16,596 Baixa/Alta 5,149 3 3,975 1,845 7,698 Baixa/Média 8,371 1 1,757 0,564 3,860 Baixa 5,560 1 3,133 1,367 6,219 Baixa/Média 11,931 3 19,806 10,915 35,331 Média/Alta 41,587 1 4,058 1,902 7,816 Baixa/Média 14,838 2 9,331 4,844 17,263 Baixa/Alta -0,652 3 3,700 1,678 7,251 Baixa/Média 7,194 2 2,796 1,135 5,749 Baixa/Média 12,003 2 3,753 1,702 7,360 Baixa/Média 5,604 1 9,002 4,726 16,473 Baixa/Alta 6,096 1 0,344 -0,265 1,458 Baixa 2,981 1 2,024 0,726 4,297 Baixa 6,873 2 20,381 11,197 36,482 Média/Alta 13,547 3 1,121 0,199 2,752 Baixa 2,377 3 32,707 18,209 58,147 Alta 31,246 1 2,124 0,784 4,470 Baixa 5,285 3 8,625 4,521 15,782 Baixa/Alta 9,476 2 3,792 1,717 7,452 Baixa/Média 5,807 1 3,818 1,702 7,589 Baixa/Média 13,047 1 3,061 1,312 6,133 Baixa/Média 6,166 1 6,627 3,369 12,314 Baixa/Média 5,739 2 5,096 2,481 9,676 Baixa/Média 3,419 2 16,521 9,004 29,689 Média/Alta 19,293 3 6,849 3,479 12,754 Baixa/Média 3,946 1 3,675 1,678 7,161 Baixa/Média 13,724 3 1,051 0,160 2,627 Baixa 8,802 1 4,576 2,055 9,177 Baixa/Média 5,002 1 1,628 0,492 3,628 Baixa 5,389 1 1,358 0,327 3,190 Baixa 1,936 2 3,924 1,818 7,605 Baixa/Média 13,130 1 3,171 1,358 6,380 Baixa/Média 9,773 2 6,131 3,012 11,674 Baixa/Média 10,503 3 1,785 0,584 3,896 Baixa 4,614 2 13,785 7,314 25,291 Média/Alta 12,210 2 19,611 10,797 35,009 Média/Alta 11,961 LimInfR LimSupR ClassImprecisaR Árvore -0,525 575,694 Baixa/Alta Baixa 1,047 5,993 Baixa/Média Baixa 7,415 26,734 Média/Alta Alta 1,397 5,889 Baixa/Média Baixa 2,522 10,707 Baixa/Média Baixa 5,448 21,516 Média/Alta Baixa 12,685 37,169 Média/Alta Alta 5,597 23,178 Média/Alta Baixa -0,624 -0,106 Baixa Alta 1,259 5,453 Baixa/Média Baixa 4,954 11,838 Baixa/Média Baixa 1,351 4,433 Baixa Baixa 2,667 11,179 Baixa/Média Média 0,923 5,725 Baixa/Média Baixa 3,008 12,298 Baixa/Média Baixa 10,147 22,264 Média/Alta Alta 0,453 3,464 Baixa Baixa 8,508 25,742 Média/Alta Alta 2,077 9,179 Baixa/Média Baixa 0,114 2,270 Baixa Média 1,188 4,047 Baixa Baixa 5,172 20,760 Média/Alta Baixa 2,595 10,932 Baixa/Média Baixa 2,642 11,084 Baixa/Média Baixa 0,067 1,639 Baixa Baixa 11,970 26,399 Média/Alta Média 0,470 4,098 Baixa Alta 5,340 25,341 Média/Alta Baixa 3,176 11,311 Baixa/Média Baixa 1,615 7,723 Baixa/Média Baixa 2,265 9,824 Baixa/Média Baixa 0,537 4,649 Baixa Baixa 6,882 16,178 Média/Alta Baixa 3,979 15,875 Baixa/Alta Baixa 4,445 10,542 Baixa/Média Baixa 2,681 9,791 Baixa/Média Baixa 7,688 17,134 Média/Alta Baixa 10,713 23,829 Média/Alta Alta (Continua) TABELA C.2 – Continuação. 128 COD 3121902 3122009 3122108 3122207 3122306 3122355 3122405 3122454 3122470 3122504 3122603 3122702 3122801 3122900 3123007 3123106 3123205 3123304 3123403 3123502 3123528 3123601 3123700 3123809 3123858 3123908 3124005 3124104 3124203 3124302 3124401 3124500 3124609 3124708 3124807 3124906 3125002 3125101 MUNICIPIO DIVINESIA DIVINO DIVINO DAS LARANJEIRAS DIVINOLANDIA DE MINAS DIVINOPOLIS DIVISA ALEGRE DIVISA NOVA DIVISOPOLIS DOM BOSCO DOM CAVATI DOM JOAQUIM DOM SILVERIO DOM VICOSO DONA EUSEBIA DORES DE CAMPOS DORES DE GUANHAES DORES DO INDAIA DORES DO TURVO DORESOPOLIS DOURADOQUARA DURANDE ELOI MENDES ENGENHEIRO CALDAS ENGENHEIRO NAVARRO ENTRE-FOLHAS ENTRE-RIOS DE MINAS ERVALIA ESMERALDAS ESPERA FELIZ ESPINOSA ESPIRITO SANTO DO DOURADO ESTIVA ESTRELA-D'ALVA ESTRELA DO INDAIA ESTRELA DO SUL EUGENOPOLIS EWBANK DA CAMARA EXTREMA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 2 5,863 2,901 11,074 Baixa/Média 9,373 2 11,084 5,935 20,055 Média/Alta 9,800 2 13,250 7,150 23,915 Média/Alta 16,494 3 20,468 11,314 36,424 Média/Alta 37,403 1 4,585 2,184 8,798 Baixa/Média 1,147 4 3,839 1,704 7,659 Baixa/Média 9,812 1 2,438 0,946 5,072 Baixa/Média 3,191 3 11,004 5,753 20,337 Média/Alta 9,637 1 3,862 1,758 7,571 Baixa/Média 13,524 2 8,747 4,594 15,982 Baixa/Alta 15,111 2 21,020 11,512 37,754 Média/Alta 9,415 2 8,406 4,365 15,492 Baixa/Alta 13,497 1 4,829 2,297 9,304 Baixa/Média 12,927 2 6,001 3,011 11,220 Baixa/Média 17,301 2 3,198 1,378 6,409 Baixa/Média 4,251 2 14,754 7,832 27,102 Média/Alta 15,132 1 4,676 2,246 8,926 Baixa/Média 7,087 2 8,658 4,471 16,049 Baixa/Alta 8,730 1 6,873 3,508 12,749 Baixa/Média 3,526 1 4,775 2,311 9,075 Baixa/Média 30,610 2 25,718 14,264 45,767 Média/Alta 14,446 1 2,410 0,932 5,018 Baixa/Média 4,031 2 13,071 7,080 23,504 Média/Alta 13,168 4 2,750 1,142 5,565 Baixa/Média 1,856 2 11,692 6,264 21,176 Média/Alta 14,699 2 3,719 1,669 7,345 Baixa/Média 4,112 2 7,253 3,732 13,395 Baixa/Média 9,201 1 8,083 4,182 14,921 Baixa/Média 6,232 2 17,448 9,520 31,352 Média/Alta 8,649 4 3,099 1,343 6,170 Baixa/Média 0,665 1 1,541 0,431 3,514 Baixa 8,815 1 0,977 0,097 2,562 Baixa 3,703 2 11,815 6,351 21,340 Média/Alta 15,450 1 6,243 3,141 11,671 Baixa/Média 5,322 1 7,102 3,647 13,126 Baixa/Média 8,300 2 20,310 11,182 36,280 Média/Alta 12,929 2 5,905 2,847 11,394 Baixa/Média 9,894 1 0,859 0,032 2,349 Baixa 5,277 LimInfR LimSupR ClassImprecisaR Árvore 3,566 8,841 Baixa/Média Baixa 4,555 10,734 Baixa/Média Média 8,753 19,689 Média/Alta Alta 8,524 26,582 Média/Alta Média 0,876 18,522 Baixa/Alta Baixa 5,794 22,466 Média/Alta Alta 1,159 6,448 Baixa/Média Baixa 2,185 8,708 Baixa/Média Alta 6,065 24,048 Média/Alta Baixa 9,518 21,414 Média/Alta Alta 5,685 13,334 Média Alta 8,859 20,312 Média/Alta Média 5,793 22,940 Média/Alta Baixa 13,421 30,870 Média/Alta Média 0,539 2,741 Baixa Baixa 8,527 19,228 Média/Alta Alta 3,457 13,685 Baixa/Média Baixa 3,123 7,860 Baixa/Média Baixa 1,406 7,268 Baixa/Média Média 13,786 63,453 Média/Alta Baixa 9,915 21,763 Média/Alta Média 1,382 6,889 Baixa/Média Baixa 10,643 23,473 Média/Alta Alta 1,024 5,577 Baixa/Média Baixa 8,805 19,492 Média/Alta Alta 0,581 2,717 Baixa Baixa 3,640 8,892 Baixa/Média Média 2,099 9,636 Baixa/Média Baixa 3,919 9,585 Baixa/Média Média 0,574 4,214 Baixa Baixa 3,773 15,071 Baixa/Alta Baixa 0,993 5,763 Baixa/Média Baixa 7,937 18,374 Média/Alta Média 2,374 10,223 Baixa/Média Baixa 3,825 15,122 Baixa/Alta Alta 6,672 15,481 Média/Alta Alta 5,373 12,734 Média Baixa 1,787 8,168 Baixa/Média Baixa (Continua) TABELA C.2 – Continuação. 129 COD 3125200 3125309 3125408 3125507 3125606 3125705 3125804 3125903 3125952 3126000 3126109 3126208 3126307 3126406 3126505 3126604 3126703 3126752 3126802 3126901 3126950 3127008 3127057 3127073 3127107 3127206 3127305 3127339 3127354 3127370 3127388 3127404 3127503 3127602 3127701 3127800 3127909 3128006 MUNICIPIO FAMA FARIA LEMOS FELICIO DOS SANTOS SAO GONCALO DO RIO PRETO FELISBURGO FELIXLANDIA FERNANDES TOURINHO FERROS FERVEDOURO FLORESTAL FORMIGA FORMOSO FORTALEZA DE MINAS FORTUNA DE MINAS FRANCISCO BADARO FRANCISCO DUMONT FRANCISCO SA FRANCISCOPOLIS FREI GASPAR FREI INOCENCIO FREI LAGONEGRO FRONTEIRA FRONTEIRA DOS VALES FRUTA DE LEITE FRUTAL FUNILANDIA GALILEIA GAMELEIRAS GLAUCILANDIA GOIABEIRA GOIANA GONCALVES GONZAGA GOUVEIA GOVERNADOR VALADARES GRAO-MOGOL GRUPIARA GUANHAES Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 1,578 0,460 3,551 Baixa 5,283 2 18,566 10,186 33,225 Média/Alta 14,576 3 5,086 2,457 9,715 Baixa/Média 14,318 3 1,998 0,703 4,278 Baixa 4,741 3 11,337 6,073 20,518 Média/Alta 15,020 1 -0,020 -0,490 0,883 Baixa 10,112 2 20,341 11,173 36,413 Média/Alta 13,398 2 9,985 5,216 18,412 Média/Alta 17,064 2 17,248 9,424 30,943 Média/Alta 10,172 1 6,546 3,322 12,174 Baixa/Média 3,621 1 2,956 1,265 5,910 Baixa/Média 7,281 4 7,482 3,842 13,858 Baixa/Média 2,794 1 4,942 2,405 9,368 Baixa/Média 7,050 1 5,962 2,984 11,164 Baixa/Média 8,075 3 6,039 3,002 11,380 Baixa/Média 22,603 4 1,974 0,682 4,259 Baixa 4,734 3 4,442 2,118 8,498 Baixa/Média 12,568 3 13,969 7,590 25,084 Média/Alta 27,808 3 28,731 15,949 51,155 Alta 57,922 2 11,160 5,978 20,189 Média/Alta 13,372 3 16,430 8,957 29,512 Média/Alta 67,937 1 2,380 0,899 5,015 Baixa/Média 4,709 3 21,569 11,792 38,817 Média/Alta 36,110 4 8,034 4,188 14,731 Baixa/Média 9,749 1 2,472 0,954 5,171 Baixa/Média 4,111 3 3,468 1,559 6,798 Baixa/Média 5,193 2 10,827 5,739 19,756 Média/Alta 15,544 4 3,014 1,291 6,034 Baixa/Média 0,859 3 2,385 0,924 4,956 Baixa 13,500 2 21,587 11,917 38,498 Média/Alta 17,377 2 2,782 1,142 5,678 Baixa/Média 9,652 1 0,697 -0,086 2,151 Baixa 3,103 3 9,170 4,760 16,956 Baixa/Alta 33,492 3 1,183 0,236 2,855 Baixa 7,260 2 13,500 7,313 24,291 Média/Alta -0,998 3 6,477 3,268 12,097 Baixa/Média 3,710 1 3,243 1,417 6,450 Baixa/Média 35,593 3 11,916 6,415 21,496 Média/Alta 28,347 LimInfR LimSupR ClassImprecisaR Árvore 2,330 10,107 Baixa/Média Baixa 8,562 19,155 Média/Alta Média 1,378 5,804 Baixa/Média Baixa 1,372 6,620 Baixa/Média Baixa 4,540 14,762 Baixa/Média Alta 4,321 17,023 Baixa/Alta Baixa 9,794 21,805 Média/Alta Média 11,920 26,749 Média/Alta Alta 4,463 10,615 Baixa/Média Alta 1,397 7,130 Baixa/Média Baixa 3,071 13,907 Baixa/Média Baixa 1,395 7,655 Baixa/Média Baixa 3,244 13,107 Baixa/Média Baixa 3,789 15,024 Baixa/Alta Baixa 2,425 8,663 Baixa/Média Baixa 3,073 12,455 Baixa/Média Alta 1,353 5,661 Baixa/Média Baixa 4,354 13,921 Baixa/Média Alta 15,517 44,961 Alta Alta 6,803 15,639 Média/Alta Alta 12,594 38,169 Média/Alta Alta 1,954 8,806 Baixa/Média Baixa 6,090 18,496 Média/Alta Alta 7,673 28,678 Média/Alta Média 1,443 7,194 Baixa/Média Baixa 1,236 5,389 Baixa/Média Baixa 10,992 24,047 Média/Alta Baixa 0,411 3,619 Baixa Baixa 1,282 5,580 Baixa/Média Baixa 14,170 30,820 Média/Alta Alta 3,990 9,999 Baixa/Média Baixa 0,932 5,727 Baixa/Média Baixa 6,593 19,847 Média/Alta Média 2,008 7,727 Baixa/Média Baixa -0,993 -0,984 Baixa Média -0,023 1,928 Baixa Média 16,055 77,256 Alta Baixa 11,604 33,886 Média/Alta Média (Continua) TABELA C.2 – Continuação. 130 COD 3128105 3128204 3128253 3128303 3128402 3128501 3128600 3128709 3128808 3128907 3129004 3129103 3129202 3129301 3129400 3129509 3129608 3129657 3129707 3129806 3129905 3130002 3130051 3130101 3130200 3130309 3130408 3130507 3130556 3130606 3130655 3130705 3130804 3130903 3131000 3131109 3131158 3131208 MUNICIPIO GUAPE GUARACIABA GUARACIAMA GUARANESIA GUARANI GUARARA GUARDA-MOR GUAXUPE GUIDOVAL GUIMARANIA GUIRICEMA GURINHATA HELIODORA IAPU IBERTIOGA IBIA IBIAI IBIRACATU IBIRACI IBIRITE IBITIURA DE MINAS IBITURUNA ICARAI DE MINAS IGARAPE IGARATINGA IGUATAMA IJACI ILICINEA IMBE DE MINAS INCONFIDENTES INDAIABIRA INDIANOPOLIS INGAI INHAPIM INHAUMA INIMUTABA IPABA IPANEMA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR LimInfR LimSupR ClassImprecisaR Árvore 1 1,169 0,228 2,831 Baixa 6,421 2,009 8,939 Baixa/Média Baixa 2 11,743 6,228 21,465 Média/Alta 11,829 7,290 16,250 Média/Alta Baixa 3 2,815 1,180 5,675 Baixa/Média 3,255 -0,325 1,038 Baixa Baixa 1 5,258 2,572 9,961 Baixa/Média 5,331 2,245 9,645 Baixa/Média Baixa 2 4,509 2,150 8,635 Baixa/Média 9,859 3,976 10,157 Baixa/Média Baixa 2 7,033 3,579 13,090 Baixa/Média 11,898 5,528 13,285 Média Baixa 1 2,282 0,872 4,751 Baixa 9,634 4,100 16,275 Baixa/Alta Baixa 1 5,079 2,468 9,655 Baixa/Média 4,268 2,003 9,143 Baixa/Média Baixa 2 4,669 2,241 8,914 Baixa/Média 13,928 8,179 18,641 Média/Alta Baixa 1 6,542 3,328 12,143 Baixa/Média 16,146 7,589 30,502 Média/Alta Alta 2 4,810 2,311 9,197 Baixa/Média 12,424 6,003 13,976 Média Baixa 1 5,727 2,835 10,802 Baixa/Média 6,922 2,685 11,240 Baixa/Média Baixa 1 2,827 1,172 5,742 Baixa/Média 3,005 1,048 6,108 Baixa/Média Baixa 2 16,383 8,986 29,259 Média/Alta 13,444 9,115 20,027 Média/Alta Média 2 3,542 1,563 7,046 Baixa/Média 4,745 0,327 2,215 Baixa Baixa 1 6,067 3,053 11,325 Baixa/Média 8,545 3,799 15,050 Baixa/Alta Alta 4 9,115 4,786 16,686 Baixa/Alta 2,483 1,304 6,600 Baixa/Média Alta 4 7,174 3,682 13,270 Baixa/Média 2,867 1,861 8,224 Baixa/Média Baixa 1 4,082 1,915 7,858 Baixa/Média 5,894 2,335 10,006 Baixa/Média Alta 1 4,227 1,987 8,145 Baixa/Média 4,692 2,870 27,436 Baixa/Alta Baixa 1 1,755 0,556 3,878 Baixa 6,007 2,663 11,174 Baixa/Média Baixa 1 5,875 2,900 11,121 Baixa/Média 9,393 4,494 17,576 Baixa/Alta Baixa 4 6,475 3,276 12,067 Baixa/Média 10,464 6,836 30,126 Média/Alta Baixa 1 4,685 2,255 8,929 Baixa/Média 4,995 2,400 10,193 Baixa/Média Baixa 1 4,358 2,055 8,395 Baixa/Média 2,421 0,698 5,033 Baixa/Média Baixa 1 3,805 1,755 7,380 Baixa/Média 5,281 2,333 10,015 Baixa/Média Baixa 1 4,645 2,195 8,974 Baixa/Média 14,734 7,037 27,910 Média/Alta Baixa 1 3,707 1,690 7,235 Baixa/Média 7,187 3,034 12,339 Baixa/Média Baixa 2 17,343 9,432 31,250 Média/Alta 12,343 8,433 18,655 Média/Alta Alta 1 2,598 1,026 5,387 Baixa/Média 3,182 0,970 5,807 Baixa/Média Baixa 4 7,142 3,644 13,276 Baixa/Média 8,180 5,633 21,483 Média/Alta Alta 1 3,551 1,592 6,988 Baixa/Média 7,351 3,224 13,041 Baixa/Média Baixa 1 3,231 1,417 6,409 Baixa/Média 8,180 3,816 15,133 Baixa/Alta Baixa 2 11,471 6,132 20,806 Média/Alta 12,296 8,276 18,375 Média/Alta Alta 1 4,326 2,053 8,293 Baixa/Média 9,958 4,594 17,992 Baixa/Alta Baixa 1 3,756 1,716 7,329 Baixa/Média 22,460 9,866 42,146 Média/Alta Baixa 2 21,162 11,653 37,818 Média/Alta 11,338 8,521 19,054 Média/Alta Média 2 11,661 6,270 21,049 Média/Alta 14,343 9,489 21,145 Média/Alta Média (Continua) TABELA C.2 – Continuação. 131 COD 3131307 3131406 3131505 3131604 3131703 3131802 3131901 3132008 3132107 3132206 3132305 3132404 3132503 3132602 3132701 3132800 3132909 3133006 3133105 3133204 3133303 3133402 3133501 3133600 3133709 3133758 3133808 3133907 3134004 3134103 3134202 3134301 3134400 3134509 3134608 3134707 3134806 3134905 MUNICIPIO IPATINGA IPIACU IPUIUNA IRAI DE MINAS ITABIRA ITABIRINHA DE MANTENA ITABIRITO ITACAMBIRA ITACARAMBI ITAGUARA ITAIPE ITAJUBA ITAMARANDIBA ITAMARATI DE MINAS ITAMBACURI ITAMBE DO MATO DENTRO ITAMOJI ITAMONTE ITANHANDU ITANHOMI ITAOBIM ITAPAJIPE ITAPECERICA ITAPEVA ITATIAIUCU ITAU DE MINAS ITAUNA ITAVERAVA ITINGA ITUETA ITUIUTABA ITUMIRIM ITURAMA ITUTINGA JABUTICATUBAS JACINTO JACUI JACUTINGA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 2 8,697 4,544 15,961 Baixa/Alta -0,999 1 1,223 0,237 2,995 Baixa 4,382 1 2,478 0,960 5,170 Baixa/Média 9,893 1 1,515 0,426 3,438 Baixa 6,341 1 7,138 3,670 13,183 Baixa/Média 2,650 2 13,385 7,186 24,277 Média/Alta 19,949 1 3,454 1,540 6,810 Baixa/Média 3,329 3 2,915 1,241 5,839 Baixa/Média 9,093 4 4,150 1,935 8,037 Baixa/Média 2,562 1 4,533 2,161 8,685 Baixa/Média 9,439 3 34,438 19,000 61,790 Alta 43,287 1 0,548 -0,154 1,834 Baixa 1,433 3 11,600 6,141 21,230 Média/Alta 19,117 2 7,292 3,758 13,450 Baixa/Média 16,664 3 19,771 10,912 35,218 Média/Alta 28,913 1 5,061 2,473 9,576 Baixa/Média 4,408 1 4,055 1,895 7,829 Baixa/Média 6,201 1 3,474 1,471 7,100 Baixa/Média 3,662 1 3,604 1,618 7,096 Baixa/Média 5,529 2 10,428 5,548 18,946 Média/Alta 14,493 3 3,774 1,721 7,378 Baixa/Média 4,030 1 3,264 1,403 6,566 Baixa/Média 4,694 1 7,613 3,918 14,083 Baixa/Média 7,319 1 1,524 0,415 3,504 Baixa 4,512 1 3,525 1,578 6,944 Baixa/Média 5,016 1 6,861 3,499 12,735 Baixa/Média 3,317 1 4,494 2,135 8,627 Baixa/Média 2,366 2 12,568 6,633 23,118 Média/Alta 8,208 3 4,699 2,258 8,970 Baixa/Média 15,236 2 18,353 10,018 32,994 Média/Alta 18,635 1 4,038 1,863 7,868 Baixa/Média 2,851 1 3,245 1,423 6,436 Baixa/Média 8,335 1 5,986 2,959 11,330 Baixa/Média 5,585 1 2,597 1,049 5,314 Baixa/Média 7,206 1 4,394 2,093 8,409 Baixa/Média 14,285 3 12,696 6,835 22,940 Média/Alta 18,545 1 6,293 3,166 11,769 Baixa/Média 4,621 1 2,604 1,046 5,348 Baixa/Média 5,725 LimInfR LimSupR ClassImprecisaR Árvore -0,997 -0,992 Baixa Média 1,907 8,747 Baixa/Média Baixa 4,421 17,356 Baixa/Alta Baixa 2,871 11,805 Baixa/Média Baixa 1,042 8,152 Baixa/Média Média 14,334 31,917 Média/Alta Média 1,685 8,094 Baixa/Média Baixa 0,232 2,563 Baixa Baixa 1,502 7,114 Baixa/Média Baixa 4,025 15,923 Baixa/Alta Baixa 10,234 29,896 Média/Alta Alta 0,651 5,333 Baixa/Média Baixa 4,999 16,834 Baixa/Alta Alta 9,516 22,051 Média/Alta Média 9,051 27,689 Média/Alta Alta 1,717 8,160 Baixa/Média Média 2,493 10,518 Baixa/Média Baixa 1,056 5,944 Baixa/Média Alta 2,452 10,357 Baixa/Média Média 9,290 20,416 Média/Alta Alta -0,075 1,765 Baixa Baixa 1,615 7,681 Baixa/Média Baixa 2,900 11,875 Baixa/Média Baixa 1,602 7,714 Baixa/Média Baixa 1,882 8,557 Baixa/Média Baixa 1,453 7,277 Baixa/Média Baixa 1,240 8,001 Baixa/Média Baixa 2,983 7,545 Baixa/Média Baixa 1,989 7,479 Baixa/Média Baixa 15,182 33,052 Alta Alta 1,342 8,843 Baixa/Média Baixa 3,812 15,076 Baixa/Alta Baixa 2,768 11,398 Baixa/Média Baixa 3,272 13,209 Baixa/Média Baixa 5,273 21,481 Média/Alta Baixa 4,744 14,868 Baixa/Média Alta 1,673 7,930 Baixa/Média Baixa 2,249 9,662 Baixa/Média Baixa (Continua) TABELA C.2 – Continuação. 132 COD 3135001 3135050 3135076 3135100 3135209 3135308 3135357 3135407 3135456 3135506 3135605 3135704 3135803 3135902 3136009 3136108 3136207 3136306 3136405 3136504 3136520 3136553 3136579 3136603 3136652 3136702 3136801 3136900 3136959 3137007 3137106 3137205 3137304 3137403 3137502 3137536 3137601 3137700 MUNICIPIO JAGUARACU JAIBA JAMPRUCA JANAUBA JANUARIA JAPARAIBA JANPOVAR JECEABA JENIPAPO DE MINAS JEQUERI JEQUITAI JEQUITIBA JEQUITINHONHA JESUANIA JOAIMA JOANESIA JOAO MONLEVADE JOAO PINHEIRO JOAQUIM FELICIO JORDANIA JOSE GONCALVES DE MINAS JOSE RAYDAN JOSENOPOLIS NOVA UNIAO JUATUBA JUIZ DE FORA JURAMENTO JURUAIA JUVENILIA LADAINHA LAGAMAR LAGOA DA PRATA LAGOA DOS PATOS LAGOA DOURADA LAGOA FORMOSA LAGOA GRANDE LAGOA SANTA LAJINHA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 2 6,861 3,454 12,875 Baixa/Média 20,956 4 3,356 1,481 6,647 Baixa/Média 0,760 2 19,114 10,529 34,089 Média/Alta 15,608 4 3,112 1,347 6,204 Baixa/Média 0,758 4 7,557 3,854 14,086 Baixa/Média 7,707 1 3,170 1,389 6,281 Baixa/Média 6,035 4 6,019 3,029 11,231 Baixa/Média 3,876 1 3,382 1,497 6,688 Baixa/Média 9,732 3 10,416 5,539 18,930 Média/Alta 17,112 2 10,788 5,732 19,642 Média/Alta 13,541 4 3,563 1,598 7,016 Baixa/Média 1,774 3 4,527 2,164 8,657 Baixa/Média 11,109 3 8,410 4,362 15,515 Baixa/Alta 2,935 1 4,589 2,197 8,774 Baixa/Média 2,687 3 12,093 6,503 21,848 Média/Alta 14,950 3 8,423 4,408 15,418 Baixa/Alta 33,505 1 5,039 2,451 9,568 Baixa/Média 3,082 1 8,789 4,601 16,108 Baixa/Alta 14,077 4 2,963 1,268 5,924 Baixa/Média 4,013 3 51,100 26,970 96,049 Alta 25,720 3 12,112 6,459 22,048 Média/Alta 3,994 3 20,684 11,431 36,825 Média/Alta 51,711 4 16,271 8,819 29,380 Média/Alta 14,568 1 7,577 3,927 13,931 Baixa/Média 7,783 1 4,570 2,190 8,725 Baixa/Média 2,097 2 2,450 0,932 5,161 Baixa/Média -1,000 3 3,535 1,600 6,909 Baixa/Média 5,490 1 4,602 2,198 8,812 Baixa/Média 6,354 4 3,750 1,713 7,316 Baixa/Média -0,013 3 32,214 17,781 57,736 Alta 170,905 1 4,295 2,037 8,230 Baixa/Média 15,405 1 2,953 1,262 5,908 Baixa/Média 6,213 4 5,337 2,631 10,059 Baixa/Média 1,370 2 4,447 2,075 8,649 Baixa/Média 4,629 1 4,091 1,919 7,879 Baixa/Média 13,934 1 5,407 2,652 10,239 Baixa/Média 9,900 1 5,505 2,730 10,346 Baixa/Média 5,995 2 22,310 12,272 39,940 Média/Alta 13,322 LimInfR LimSupR ClassImprecisaR Árvore 13,567 31,300 Média/Alta Média 0,435 3,708 Baixa Baixa 13,106 31,385 Média/Alta Alta 0,411 3,643 Baixa Baixa 25,968 119,101 Alta Alta 2,616 11,016 Baixa/Média Baixa 3,633 13,774 Baixa/Média Baixa 4,056 16,125 Baixa/Alta Baixa 2,919 10,116 Baixa/Média Alta 8,059 26,595 Média/Alta Média 1,106 5,802 Baixa/Média Baixa 3,310 10,951 Baixa/Média Baixa 0,110 2,274 Baixa Alta 0,802 5,370 Baixa/Média Baixa 6,411 20,150 Média/Alta Alta 9,191 26,965 Média/Alta Média 1,984 10,384 Baixa/Média Média 5,084 21,623 Média/Alta Baixa 2,373 10,118 Baixa/Média Baixa 12,197 37,536 Média/Alta Alta 0,413 3,181 Baixa Alta 13,779 41,017 Média/Alta Alta 11,268 43,243 Média/Alta Média 3,066 12,588 Baixa/Média Alta 0,647 4,892 Baixa Baixa -1,000 -1,000 Baixa Baixa 0,469 3,239 Baixa Baixa 2,358 10,137 Baixa/Média Baixa -0,292 1,436 Baixa Baixa 23,696 73,238 Alta Alta 6,659 26,788 Média/Alta Baixa 3,334 13,646 Baixa/Média Baixa 0,620 4,293 Baixa Baixa 0,692 2,967 Baixa Baixa 5,431 21,920 Média/Alta Baixa 4,469 17,530 Baixa/Alta Alta 3,207 13,326 Baixa/Média Alta 8,967 20,013 Média/Alta Alta (Continua) TABELA C.2 – Continuação. 133 COD 3137809 3137908 3138005 3138104 3138203 3138302 3138351 3138401 3138500 3138609 3138625 3138658 3138674 3138682 3138708 3138807 3138906 3139003 3139102 3139201 3139250 3139300 3139409 3139508 3139607 3139706 3139805 3139904 3140001 3140100 3140159 3140209 3140308 3140407 3140506 3140530 3140555 3140605 MUNICIPIO LAMBARI LAMIM LARANJAL LASSANCE LAVRAS LEANDRO FERREIRA LEME DO PRADO LEOPOLDINA LIBERDADE LIMA DUARTE LIMEIRA DO OESTE LONTRA LUISBURGO LUISLANDIA LUMINARIAS LUZ MAXACALIS MACHADO MADRE DE DEUS DE MINAS MALACACHETA MAMONAS MANGA MANHUACU MANHUMIRIM MANTENA MARAVILHAS MAR DE ESPANHA MARIA DA FE MARIANA MARILAC MARIO CAMPOS MARIPA DE MINAS MARLIERIA MARMELOPOLIS MARTINHO CAMPOS MARTINS SOARES MATA VERDE MATERLANDIA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 3,393 1,499 6,725 Baixa/Média 4,882 2 8,637 4,455 16,025 Baixa/Alta 10,030 2 15,060 8,223 26,965 Média/Alta 14,418 4 6,196 3,119 11,572 Baixa/Média 3,236 1 7,443 3,747 14,018 Baixa/Média 5,865 1 6,786 3,462 12,587 Baixa/Média 4,786 3 11,103 5,782 20,599 Média/Alta 0,824 2 13,733 7,442 24,713 Média/Alta 2,711 2 7,471 3,845 13,812 Baixa/Média 5,976 2 3,781 1,711 7,431 Baixa/Média 6,421 1 8,996 4,688 16,567 Baixa/Alta 6,712 4 7,868 4,079 14,483 Baixa/Média 3,382 2 10,343 5,375 19,183 Média/Alta 12,382 4 12,539 6,705 22,791 Média/Alta 7,803 1 3,384 1,506 6,668 Baixa/Média 5,440 1 3,531 1,595 6,912 Baixa/Média 7,669 3 32,046 17,727 57,314 Alta 24,193 1 2,784 1,145 5,676 Baixa/Média 7,178 2 2,343 0,893 4,905 Baixa 4,131 3 18,415 10,104 32,947 Média/Alta 47,210 4 3,534 1,588 6,943 Baixa/Média 0,963 4 3,079 1,325 6,154 Baixa/Média 0,826 2 10,423 5,543 18,943 Média/Alta 3,425 2 12,956 6,953 23,493 Média/Alta 11,132 2 12,261 6,522 22,379 Média/Alta 16,160 1 5,714 2,848 10,714 Baixa/Média 8,244 2 4,630 2,218 8,851 Baixa/Média 10,706 1 2,146 0,755 4,641 Baixa 14,968 1 9,105 4,747 16,767 Baixa/Alta 3,532 3 15,314 8,356 27,447 Média/Alta 22,701 1 4,830 2,328 9,212 Baixa/Média 4,771 2 10,509 5,501 19,374 Média/Alta 11,963 2 45,291 24,917 81,681 Alta 12,206 1 4,034 1,792 8,076 Baixa/Média 20,154 1 4,222 1,990 8,120 Baixa/Média 10,742 2 26,612 14,683 47,614 Média/Alta 13,136 3 9,158 4,661 17,228 Baixa/Alta 22,394 3 13,810 7,426 25,032 Média/Alta 59,311 LimInfR LimSupR ClassImprecisaR Árvore 1,877 8,457 Baixa/Média Baixa 5,010 11,606 Média Baixa 6,946 17,079 Média/Alta Média 2,154 9,163 Baixa/Média Alta 3,509 17,084 Baixa/Alta Baixa 2,012 9,077 Baixa/Média Alta -0,240 1,489 Baixa Alta 1,751 5,339 Baixa/Média Média 0,244 2,169 Baixa Baixa 1,723 5,081 Baixa/Média Baixa 2,842 11,745 Baixa/Média Baixa 2,269 9,516 Baixa/Média Baixa 4,554 11,225 Baixa/Média Alta 5,521 20,670 Média/Alta Alta 2,314 9,999 Baixa/Média Baixa 3,531 13,986 Baixa/Média Baixa 12,215 37,523 Média/Alta Alta 2,577 10,862 Baixa/Média Baixa 0,486 2,586 Baixa Baixa 15,706 45,539 Alta Alta 0,327 3,363 Baixa Baixa 0,608 4,266 Baixa Baixa 0,939 3,513 Baixa Média 5,851 13,955 Média Média 11,791 26,684 Média/Alta Média 3,671 14,597 Baixa/Média Alta 6,786 15,924 Média/Alta Baixa 5,379 22,039 Média/Alta Baixa 1,255 6,540 Baixa/Média Baixa 5,948 18,230 Média/Alta Alta 1,947 8,766 Baixa/Média Baixa 5,643 13,533 Média Baixa 6,126 14,330 Média Alta 8,967 37,484 Média/Alta Baixa 4,826 18,897 Baixa/Alta Baixa 6,147 14,122 Média Média 13,876 43,034 Média/Alta Alta 11,397 33,464 Média/Alta Alta (Continua) TABELA C.2 – Continuação. 134 COD 3140704 3140803 3140852 3140902 3141009 3141108 3141207 3141306 3141405 3141504 3141603 3141702 3141801 3141900 3142007 3142106 3142205 3142254 3142304 3142403 3142502 3142601 3142700 3142809 3142908 3143005 3143104 3143153 3143203 3143302 3143401 3143450 3143500 3143609 3143708 3143807 3143906 3144003 MUNICIPIO MATEUS LEME MATIAS BARBOSA MATIAS CARDOSO MATIPO MATO VERDE MATOZINHOS MATUTINA MEDEIROS MEDINA MENDES PIMENTEL MERCES MESQUITA MINAS NOVAS MINDURI MIRABELA MIRADOURO MIRAI MIRAVANIA MOEDA MOEMA MONJOLOS MONSENHOR PAULO MONTALVANIA MONTE ALEGRE DE MINAS MONTE AZUL MONTE BELO MONTE CARMELO MONTE FORMOSO MONTE SANTO DE MINAS MONTES CLAROS MONTE SIAO MONTEZUMA MORADA NOVA DE MINAS MORRO DA GARCA MORRO DO PILAR MUNHOZ MURIAE MUTUM Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 4,549 2,177 8,690 Baixa/Média 2,115 2 4,303 1,999 8,375 Baixa/Média 8,763 4 2,865 1,199 5,791 Baixa/Média 1,131 2 14,120 7,653 25,422 Média/Alta 9,914 4 4,919 2,389 9,337 Baixa/Média -0,285 1 3,310 1,470 6,522 Baixa/Média 5,517 1 8,234 4,299 15,090 Baixa/Alta 6,895 1 5,615 2,780 10,576 Baixa/Média 8,111 3 6,248 3,152 11,652 Baixa/Média 29,176 2 13,998 7,572 25,240 Média/Alta 16,978 2 4,437 2,077 8,605 Baixa/Média 10,755 3 11,761 6,309 21,280 Média/Alta 20,970 3 13,533 7,304 24,434 Média/Alta 29,639 2 6,088 3,052 11,399 Baixa/Média 5,069 4 8,252 4,301 15,149 Baixa/Alta 6,063 2 12,548 6,782 22,584 Média/Alta 12,140 2 5,989 3,005 11,196 Baixa/Média 12,840 4 7,828 4,057 14,409 Baixa/Média 5,977 1 1,627 0,482 3,656 Baixa 7,450 1 2,660 1,094 5,398 Baixa/Média 5,671 4 1,127 0,205 2,754 Baixa 3,878 1 3,124 1,345 6,253 Baixa/Média 7,274 4 5,401 2,664 10,183 Baixa/Média 0,902 1 4,304 2,021 8,309 Baixa/Média 7,825 4 3,697 1,687 7,210 Baixa/Média 0,158 1 3,183 1,379 6,356 Baixa/Média 4,594 1 5,645 2,812 10,582 Baixa/Média 22,097 3 23,801 13,176 42,390 Média/Alta 45,571 1 6,383 3,220 11,916 Baixa/Média 7,148 3 3,625 1,653 7,063 Baixa/Média 5,070 1 1,979 0,688 4,259 Baixa 5,434 4 5,533 2,697 10,545 Baixa/Média 7,566 1 -0,675 -0,847 -0,309 Baixa 11,322 1 5,222 2,540 9,939 Baixa/Média 10,047 2 5,761 2,871 10,811 Baixa/Média 9,567 1 2,390 0,915 5,001 Baixa/Média 2,945 2 13,408 7,275 24,086 Média/Alta 0,398 2 19,868 10,940 35,473 Média/Alta 14,101 LimInfR LimSupR ClassImprecisaR Árvore 0,582 4,559 Baixa Baixa 3,498 9,455 Baixa/Média Baixa 0,663 4,409 Baixa Baixa 5,361 12,249 Média Média -0,494 0,812 Baixa Baixa 2,870 11,707 Baixa/Média Baixa 3,163 12,817 Baixa/Média Alta 3,698 14,731 Baixa/Média Baixa 10,501 31,796 Média/Alta Alta 12,471 27,392 Média/Alta Alta 4,248 10,191 Baixa/Média Baixa 8,356 24,799 Média/Alta Alta 4,063 14,644 Baixa/Média Média 0,363 2,357 Baixa Baixa 4,437 16,729 Baixa/Alta Alta 5,819 13,337 Média Média 8,272 18,704 Média/Alta Média 3,898 15,079 Baixa/Alta Baixa 3,117 12,729 Baixa/Média Baixa 2,626 10,979 Baixa/Média Baixa 2,181 9,449 Baixa/Média Baixa 3,202 12,937 Baixa/Média Baixa 0,564 4,182 Baixa Baixa 3,088 12,560 Baixa/Média Baixa -0,082 2,114 Baixa Baixa 1,508 7,330 Baixa/Média Baixa 9,249 43,125 Média/Alta Baixa 9,986 30,594 Média/Alta Média 2,737 11,325 Baixa/Média Baixa 2,916 11,222 Baixa/Média Baixa 1,943 8,672 Baixa/Média Baixa 5,796 21,737 Média/Alta Alta 5,186 20,287 Média/Alta Baixa 4,658 18,261 Baixa/Alta Alta 3,895 9,374 Baixa/Média Alta 0,852 5,460 Baixa/Média Baixa 0,176 1,662 Baixa Média 8,076 18,103 Média/Alta Média (Continua) TABELA C.2 – Continuação. 135 COD 3144102 3144201 3144300 3144359 3144375 3144409 3144508 3144607 3144656 3144672 3144706 3144805 3144904 3145000 3145059 3145109 3145208 3145307 3145356 3145372 3145406 3145455 3145505 3145604 3145703 3145802 3145851 3145877 3145901 3146008 3146107 3146206 3146255 3146305 3146404 3146503 3146552 3146602 MUNICIPIO MUZAMBINHO NACIP RAYDAN NANUQUE NAQUE NATALANDIA NATERCIA NAZARENO NEPOMUCENO NINHEIRA NOVA BELEM NOVA ERA NOVA LIMA NOVA MODICA NOVA PONTE NOVA PORTEIRINHA NOVA RESENDE NOVA SERRANA NOVO CRUZEIRO NOVO ORIENTE DE MINAS NOVORIZONTE OLARIA OLHOS-D'AGUA OLIMPIO NORONHA OLIVEIRA OLIVEIRA FORTES ONCA DE PITANGUI ORATORIOS ORIZANIA OURO BRANCO OURO FINO OURO PRETO OURO VERDE DE MINAS PADRE CARVALHO PADRE PARAISO PAINEIRAS PAINS PAI PEDRO PAIVA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 3,171 1,374 6,328 Baixa/Média 4,273 3 11,377 6,096 20,590 Média/Alta 23,899 3 31,236 17,186 56,140 Alta 8,416 2 27,719 15,357 49,424 Alta 12,588 1 5,278 2,577 10,019 Baixa/Média 10,997 1 2,917 1,206 5,957 Baixa/Média 3,989 1 3,701 1,669 7,281 Baixa/Média 6,991 1 6,043 3,018 11,346 Baixa/Média 6,703 4 3,199 1,353 6,492 Baixa/Média 9,565 3 27,249 15,106 48,548 Alta 38,423 1 8,004 4,140 14,771 Baixa/Média 3,475 1 2,715 1,117 5,519 Baixa/Média 2,612 2 15,204 8,265 27,343 Média/Alta 14,803 1 1,400 0,360 3,234 Baixa 6,102 4 45,337 23,591 86,313 Alta 1,498 1 5,749 2,850 10,829 Baixa/Média 6,562 1 6,252 3,142 11,697 Baixa/Média 4,795 3 24,152 13,381 42,989 Média/Alta 100,284 3 23,934 13,154 42,925 Média/Alta 43,378 4 8,027 4,184 14,720 Baixa/Média 8,840 2 2,913 1,191 5,991 Baixa/Média 11,405 4 2,231 0,836 4,685 Baixa 8,327 1 3,918 1,801 7,636 Baixa/Média 2,906 1 3,848 1,762 7,509 Baixa/Média 10,075 2 4,579 2,118 8,981 Baixa/Média 11,059 1 6,226 3,147 11,589 Baixa/Média 6,995 2 9,603 5,038 17,620 Média/Alta 12,078 2 6,853 3,464 12,813 Baixa/Média 12,349 1 3,868 1,767 7,562 Baixa/Média 4,721 1 3,164 1,358 6,355 Baixa/Média 3,680 1 4,607 2,195 8,841 Baixa/Média 2,887 3 12,817 6,791 23,503 Média/Alta 28,302 4 10,762 5,670 19,740 Média/Alta 12,953 3 21,956 12,136 39,119 Média/Alta 53,499 1 -0,514 -0,766 0,009 Baixa 6,597 1 3,099 1,347 6,159 Baixa/Média 4,626 4 3,070 1,322 6,134 Baixa/Média -0,274 2 5,854 2,832 11,256 Baixa/Média 13,601 LimInfR LimSupR ClassImprecisaR Árvore 1,376 6,849 Baixa/Média Baixa 14,352 45,220 Média/Alta Alta 9,485 30,035 Média/Alta Alta 8,151 18,401 Média/Alta Média 5,230 20,412 Média/Alta Baixa 1,542 7,594 Baixa/Média Baixa 3,186 12,855 Baixa/Média Baixa 2,322 9,918 Baixa/Média Baixa 8,656 31,826 Média/Alta Alta 13,299 38,803 Média/Alta Alta 1,372 6,940 Baixa/Média Alta 2,012 10,568 Baixa/Média Baixa 7,242 17,115 Média/Alta Alta 2,780 11,451 Baixa/Média Baixa 0,677 4,484 Baixa Média 2,139 9,362 Baixa/Média Baixa 2,321 10,139 Baixa/Média Baixa 30,379 107,838 Alta Alta 13,163 38,542 Média/Alta Alta 5,690 21,991 Média/Alta Alta 5,525 13,017 Média Baixa 5,710 21,857 Média/Alta Baixa 1,045 6,172 Baixa/Média Baixa 4,372 17,737 Baixa/Alta Baixa 4,316 10,352 Baixa/Média Baixa 3,016 12,381 Baixa/Média Média 9,498 21,091 Média/Alta Baixa 8,218 19,000 Média/Alta Alta 2,454 10,404 Baixa/Média Baixa 0,940 5,435 Baixa/Média Baixa 0,978 6,204 Baixa/Média Baixa 12,975 39,330 Média/Alta Alta 9,278 35,666 Média/Alta Média 13,764 40,158 Média/Alta Alta 2,929 12,029 Baixa/Média Baixa 1,860 8,523 Baixa/Média Baixa -0,506 0,761 Baixa Baixa 9,632 21,649 Média/Alta Baixa (Continua) TABELA C.2 – Continuação. 136 COD 3146701 3146750 3146909 3147006 3147105 3147204 3147303 3147402 3147501 3147600 3147709 3147808 3147907 3147956 3148004 3148103 3148202 3148301 3148400 3148509 3148608 3148707 3148756 3148806 3148905 3149002 3149101 3149150 3149200 3149309 3149408 3149507 3149606 3149705 3149804 3149903 3149952 3150000 MUNICIPIO PALMA PALMOPOLIS PAPAGAIOS PARACATU PARA DE MINAS PARAGUACU PARAISOPOLIS PARAOPEBA PASSABEM PASSA-QUATRO PASSA-TEMPO PASSA-VINTE PASSOS PATIS PATOS DE MINAS PATROCINIO PATROCINIO DO MURIAE PAULA CANDIDO PAULISTAS PAVAO PECANHA PEDRA AZUL PEDRA BONITA PEDRA DO ANTA PEDRA DO INDAIA PEDRA DOURADA PEDRALVA PEDRAS DE MARIA DA CRUZ PEDRINOPOLIS PEDRO LEOPOLDO PEDRO TEIXEIRA PEQUERI PEQUI PERDIGAO PERDIZES PERDOES PERIQUITO PESCADOR Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR LimInfR LimSupR ClassImprecisaR Árvore 2 20,309 11,220 36,159 Média/Alta 14,395 9,692 22,425 Média/Alta Média 3 19,849 10,843 35,704 Média/Alta 40,960 6,518 19,773 Média/Alta Alta 1 2,179 0,808 4,589 Baixa 8,288 3,766 14,847 Baixa/Média Baixa 1 4,339 2,053 8,338 Baixa/Média 8,488 2,593 12,721 Baixa/Média Baixa 1 4,645 2,234 8,851 Baixa/Média 2,657 1,201 7,653 Baixa/Média Baixa 1 2,626 1,054 5,400 Baixa/Média 5,446 2,121 9,239 Baixa/Média Baixa 1 0,362 -0,257 1,495 Baixa 2,520 0,671 4,800 Baixa Baixa 1 3,275 1,446 6,471 Baixa/Média 10,210 4,775 18,753 Baixa/Alta Baixa 2 10,425 5,537 18,968 Média/Alta 12,182 8,039 18,008 Média/Alta Média 1 3,733 1,634 7,506 Baixa/Média 16,026 7,044 28,663 Média/Alta Alta 1 3,257 1,422 6,484 Baixa/Média 11,631 5,245 20,579 Média/Alta Baixa 2 5,008 2,319 9,874 Baixa/Média 12,531 3,547 9,381 Baixa/Média Alta 1 4,732 2,283 9,009 Baixa/Média 3,366 1,299 8,627 Baixa/Média Baixa 4 6,047 3,034 11,309 Baixa/Média 4,303 3,050 12,091 Baixa/Média Baixa 1 5,452 2,705 10,235 Baixa/Média 6,934 2,698 18,915 Baixa/Alta Baixa 1 4,961 2,421 9,386 Baixa/Média 8,654 3,187 15,315 Baixa/Alta Alta 2 16,136 8,820 28,903 Média/Alta 14,113 9,386 21,802 Média/Alta Média 2 9,341 4,870 17,217 Baixa/Alta 8,923 4,904 11,516 Baixa/Média Baixa 3 15,211 8,254 27,398 Média/Alta 53,591 7,344 23,276 Média/Alta Média 3 23,010 12,728 40,991 Média/Alta 30,035 7,763 24,021 Média/Alta Média 3 16,823 9,195 30,158 Média/Alta 43,538 18,075 52,978 Alta Alta 3 8,805 4,620 16,107 Baixa/Alta 11,805 4,868 16,042 Baixa/Alta Alta 2 12,276 6,598 22,199 Média/Alta 10,851 5,029 11,913 Média Média 2 7,366 3,754 13,721 Baixa/Média 12,033 8,351 18,520 Média/Alta Baixa 1 5,705 2,833 10,729 Baixa/Média 10,710 4,829 18,990 Baixa/Alta Baixa 2 16,377 8,794 29,831 Média/Alta 12,459 6,140 14,201 Média Média 1 3,932 1,776 7,764 Baixa/Média 6,340 2,078 9,180 Baixa/Média Baixa 4 4,150 1,950 7,990 Baixa/Média 1,779 0,983 5,426 Baixa/Média Baixa 1 1,196 0,239 2,894 Baixa 4,382 1,910 8,768 Baixa/Média Baixa 1 5,760 2,876 10,790 Baixa/Média 3,915 1,415 7,396 Baixa/Média Baixa 2 9,275 4,726 17,437 Baixa/Alta 10,721 5,896 13,443 Média Baixa 2 2,798 1,154 5,696 Baixa/Média 12,348 6,617 15,645 Média/Alta Baixa 1 5,077 2,484 9,602 Baixa/Média 8,419 3,957 15,607 Baixa/Alta Alta 1 4,675 2,249 8,913 Baixa/Média 5,281 2,322 10,015 Baixa/Média Baixa 1 4,038 1,889 7,785 Baixa/Média 7,912 3,010 12,331 Baixa/Média Baixa 1 10,202 5,242 19,106 Média/Alta 10,507 4,851 19,014 Baixa/Alta Baixa 2 38,682 21,388 69,334 Alta 12,175 8,947 20,424 Média/Alta Alta 2 20,607 11,328 36,868 Média/Alta 14,946 8,921 19,750 Média/Alta Média (Continua) TABELA C.2 – Continuação. 137 COD 3150109 3150158 3150208 3150307 3150406 3150505 3150539 3150570 3150604 3150703 3150802 3150901 3151008 3151107 3151206 3151305 3151404 3151503 3151602 3151701 3151800 3151909 3152006 3152105 3152131 3152170 3152204 3152303 3152402 3152501 3152600 3152709 3152808 3152907 3153004 3153103 3153202 3153301 MUNICIPIO PIAU PIEDADE DE CARATINGA PIEDADE DE PONTE NOVA PIEDADE DO RIO GRANDE PIEDADE DOS GERAIS PIMENTA PINGO-D'AGUA PINTOPOLIS PIRACEMA PIRAJUBA PIRANGA PIRANGUCU PIRANGUINHO PIRAPETINGA PIRAPORA PIRAUBA PITANGUI PIUMHI PLANURA POCO FUNDO POCOS DE CALDAS POCRANE POMPEU PONTE NOVA PONTO CHIQUE PONTO DOS VOLANTES PORTEIRINHA PORTO FIRME POTE POUSO ALEGRE POUSO ALTO PRADOS PRATA PRATAPOLIS PRATINHA PRESIDENTE BERNARDES PRESIDENTE JUSCELINO PRESIDENTE KUBITSCHEK Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 2 3,570 1,570 7,124 Baixa/Média 14,451 2 12,696 6,877 22,813 Média/Alta 10,053 2 9,757 5,122 17,901 Média/Alta 13,348 2 3,149 1,341 6,355 Baixa/Média 4,943 1 3,856 1,747 7,586 Baixa/Média 9,184 1 2,935 1,252 5,875 Baixa/Média 9,945 2 16,956 9,271 30,392 Média/Alta 12,521 4 9,670 5,082 17,720 Média/Alta 20,747 1 2,971 1,258 5,984 Baixa/Média 10,124 1 1,829 0,590 4,036 Baixa 4,865 2 13,417 7,132 24,562 Média/Alta 9,056 1 0,330 -0,289 1,486 Baixa 1,661 1 2,294 0,852 4,859 Baixa 2,032 2 13,223 7,144 23,839 Média/Alta 11,661 4 4,339 2,040 8,379 Baixa/Média 0,465 2 5,345 2,616 10,135 Baixa/Média 9,871 1 3,881 1,799 7,512 Baixa/Média 6,277 1 5,637 2,803 10,582 Baixa/Média 5,275 1 1,140 0,196 2,827 Baixa 4,166 1 2,043 0,717 4,395 Baixa 9,977 1 1,910 0,649 4,132 Baixa 1,837 2 17,932 9,847 32,042 Média/Alta 18,266 1 1,380 0,345 3,210 Baixa 10,118 2 7,607 3,889 14,151 Baixa/Média 2,018 4 7,709 3,960 14,291 Baixa/Média 2,622 3 14,576 7,900 26,259 Média/Alta 16,959 4 3,058 1,317 6,107 Baixa/Média 0,015 2 9,299 4,846 17,142 Baixa/Alta 11,213 3 27,095 15,006 48,314 Alta 44,126 1 1,666 0,489 3,773 Baixa 1,562 1 6,348 3,207 11,833 Baixa/Média 2,654 2 3,009 1,272 6,072 Baixa/Média 4,758 1 5,900 2,941 11,083 Baixa/Média 6,275 1 5,495 2,710 10,372 Baixa/Média 3,611 1 5,878 2,936 11,021 Baixa/Média 11,900 2 8,465 4,369 15,684 Baixa/Alta 11,487 3 3,196 1,396 6,348 Baixa/Média 15,427 2 2,859 1,204 5,758 Baixa/Média 4,687 LimInfR LimSupR ClassImprecisaR Árvore 8,413 19,096 Média/Alta Baixa 4,785 11,289 Baixa/Média Alta 12,186 27,111 Média/Alta Média 0,851 3,277 Baixa Baixa 3,948 15,705 Baixa/Alta Baixa 4,601 17,968 Baixa/Alta Baixa 9,293 20,739 Média/Alta Média 7,544 68,979 Média/Alta Alta 4,165 16,584 Baixa/Alta Baixa 2,157 9,550 Baixa/Média Baixa 5,726 13,201 Média Baixa 0,194 3,531 Baixa Baixa 0,437 4,246 Baixa Baixa 6,829 16,663 Média/Alta Média -0,080 2,091 Baixa Baixa 4,327 10,965 Baixa/Média Baixa 2,771 11,395 Baixa/Média Baixa 2,243 9,655 Baixa/Média Alta 1,881 8,612 Baixa/Média Baixa 3,556 14,449 Baixa/Média Baixa 1,510 12,877 Baixa/Média Baixa 13,088 28,463 Média/Alta Média 4,380 17,344 Baixa/Alta Baixa 1,123 3,735 Baixa Baixa 1,208 6,939 Baixa/Média Alta 1,837 7,434 Baixa/Média Alta 0,110 2,929 Baixa Baixa 6,347 14,248 Média Baixa 11,106 32,498 Média/Alta Alta 0,697 6,130 Baixa/Média Baixa 0,712 5,041 Baixa/Média Alta 0,980 3,605 Baixa Baixa 2,290 9,806 Baixa/Média Baixa 1,408 7,138 Baixa/Média Baixa 5,586 21,900 Média/Alta Baixa 7,169 16,157 Média/Alta Baixa 4,878 15,521 Baixa/Alta Baixa 0,441 2,505 Baixa Baixa (Continua) TABELA C.2 – Continuação. 138 COD 3153400 3153509 3153608 3153707 3153806 3153905 3154002 3154101 3154150 3154200 3154309 3154408 3154457 3154507 3154606 3154705 3154804 3154903 3155009 3155108 3155207 3155306 3155405 3155504 3155603 3155702 3155801 3155900 3156007 3156106 3156205 3156304 3156403 3156452 3156502 3156601 3156700 3156809 MUNICIPIO PRESIDENTE OLEGARIO ALTO JEQUITIBA PRUDENTE DE MORAIS QUARTEL GERAL QUELUZITO RAPOSOS RAUL SOARES RECREIO REDUTO RESENDE COSTA RESPLENDOR RESSAQUINHA RIACHINHO RIACHO DOS MACHADOS RIBEIRAO DAS NEVES RIBEIRAO VERMELHO RIO ACIMA RIO CASCA RIO DOCE RIO DO PRADO RIO ESPERA RIO MANSO RIO NOVO RIO PARANAIBA RIO PARDO DE MINAS RIO PIRACICABA RIO POMBA RIO PRETO RIO VERMELHO RITAPOLIS ROCHEDO DE MINAS RODEIRO ROMARIA ROSARIO DA LIMEIRA RUBELITA RUBIM SABARA SABINOPOLIS Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 6,744 3,440 12,508 Baixa/Média 19,462 2 13,716 7,306 25,075 Média/Alta 13,345 3 1,881 0,644 4,049 Baixa 1,605 1 4,876 2,373 9,238 Baixa/Média 5,886 2 4,414 2,083 8,510 Baixa/Média 6,025 1 4,335 2,048 8,336 Baixa/Média 4,103 2 12,939 6,975 23,363 Média/Alta 9,972 2 33,441 18,566 59,623 Alta 11,585 2 11,590 6,221 20,950 Média/Alta 14,845 1 2,955 1,244 5,972 Baixa/Média 5,158 2 22,449 12,387 40,076 Média/Alta 12,897 2 7,576 3,843 14,187 Baixa/Média 4,920 4 6,329 3,172 11,874 Baixa/Média 5,608 4 4,952 2,411 9,384 Baixa/Média 3,124 1 6,793 3,458 12,624 Baixa/Média 2,821 1 24,427 12,185 48,035 Média/Alta 10,251 1 3,439 1,536 6,773 Baixa/Média 4,830 2 10,364 5,512 18,832 Média/Alta 11,613 2 3,913 1,801 7,618 Baixa/Média 16,571 3 13,612 7,391 24,445 Média/Alta 27,558 2 10,418 5,416 19,322 Média/Alta 9,323 1 3,266 1,427 6,497 Baixa/Média 4,323 2 3,753 1,704 7,353 Baixa/Média 8,658 1 4,729 2,282 9,000 Baixa/Média 9,818 4 7,654 3,935 14,176 Baixa/Média 11,195 1 7,194 3,708 13,263 Baixa/Média 6,758 2 3,790 1,722 7,428 Baixa/Média 8,090 2 5,415 2,595 10,448 Baixa/Média 11,790 3 9,978 5,233 18,335 Média/Alta 63,587 1 3,423 1,513 6,786 Baixa/Média 8,626 2 3,340 1,479 6,597 Baixa/Média 13,991 2 3,737 1,696 7,323 Baixa/Média 13,185 1 3,072 1,296 6,221 Baixa/Média 10,274 2 11,127 5,966 20,112 Média/Alta 13,027 3 6,417 3,259 11,917 Baixa/Média 16,739 3 7,022 3,602 12,982 Baixa/Média 17,056 1 6,291 3,175 11,733 Baixa/Média 1,914 3 11,505 6,156 20,853 Média/Alta 35,565 LimInfR LimSupR ClassImprecisaR Árvore 7,066 30,038 Média/Alta Baixa 6,588 15,901 Média/Alta Alta -0,411 0,791 Baixa Baixa 2,684 11,237 Baixa/Média Baixa 1,402 4,494 Baixa Baixa 1,928 8,686 Baixa/Média Baixa 5,928 13,516 Média Média 6,578 15,727 Média/Alta Média 8,352 18,814 Média/Alta Média 2,079 9,174 Baixa/Média Baixa 7,689 17,497 Média/Alta Média 0,729 3,047 Baixa Baixa 2,864 16,524 Baixa/Alta Baixa 2,477 10,212 Baixa/Média Baixa 1,201 61,236 Baixa/Alta Baixa 5,103 19,798 Média/Alta Baixa 2,137 9,392 Baixa/Média Baixa 8,630 19,269 Média/Alta Alta 11,566 25,218 Média/Alta Alta 9,404 27,989 Média/Alta Alta 5,277 12,229 Média Baixa 1,700 8,071 Baixa/Média Baixa 3,200 8,591 Baixa/Média Baixa 3,714 14,952 Baixa/Média Alta 12,770 46,026 Média/Alta Média 2,857 11,694 Baixa/Média Média 3,224 8,590 Baixa/Média Baixa 4,463 11,198 Baixa/Média Baixa 16,176 48,868 Alta Baixa 3,865 15,309 Baixa/Alta Baixa 8,182 19,193 Média/Alta Baixa 8,055 18,778 Média/Alta Baixa 4,919 19,195 Baixa/Alta Alta 5,782 13,404 Média Média 1,737 6,710 Baixa/Média Alta 8,739 27,642 Média/Alta Alta 1,374 12,765 Baixa/Média Média 8,282 24,868 Média/Alta Alta (Continua) TABELA C.2 – Continuação. 139 COD 3156908 3157005 3157104 3157203 3157252 3157278 3157302 3157336 3157377 3157401 3157500 3157609 3157658 3157708 3157807 3157906 3158003 3158102 3158201 3158300 3158409 3158508 3158607 3158706 3158805 3158904 3158953 3159001 3159100 3159209 3159308 3159357 3159407 3159506 3159605 3159704 3159803 3159902 MUNICIPIO SACRAMENTO SALINAS SALTO DA DIVISA SANTA BARBARA SANTA BARBARA DO LESTE SANTA BARBARA DO MONTE VERDE SANTA BARBARA DO TUGURIO SANTA CRUZ DE MINAS SANTA CRUZ DE SALINAS SANTA CRUZ DO ESCALVADO SANTA EFIGENIA DE MINAS SANTA FE DE MINAS SANTA HELENA DE MINAS SANTA JULIANA SANTA LUZIA SANTA MARGARIDA SANTA MARIA DE ITABIRA SANTA MARIA DO SALTO SANTA MARIA DO SUACUI SANTANA DA VARGEM SANTANA DE CATAGUASES SANTANA DE PIRAPAMA SANTANA DO DESERTO SANTANA DO GARAMBEU SANTANA DO JACARE SANTANA DO MANHUACU SANTANA DO PARAISO SANTANA DO RIACHO SANTANA DOS MONTES SANTA RITA DE CALDAS SANTA RITA DO JACUTINGA SANTA RITA DE MINAS SANTA RITA DO IBITIPOCA SANTA RITA DO ITUETO SANTA RITA DO SAPUCAI SANTA ROSA DA SERRA SANTA VITORIA SANTO ANTONIO DO AMPARO Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 2,052 0,742 4,347 Baixa 5,137 3 4,924 2,391 9,347 Baixa/Média 16,863 3 36,115 19,430 66,428 Alta 11,906 1 6,821 3,458 12,723 Baixa/Média 3,116 2 15,915 8,609 28,774 Média/Alta 11,623 2 6,318 3,133 11,955 Baixa/Média 11,933 2 4,297 1,945 8,527 Baixa/Média 11,627 2 0,845 0,043 2,265 Baixa 3,695 3 7,052 3,629 13,005 Baixa/Média 16,678 2 10,503 5,545 19,218 Média/Alta 14,455 3 9,037 4,728 16,587 Baixa/Alta 26,579 4 9,590 5,036 17,578 Média/Alta 4,227 3 28,390 15,722 50,656 Alta 32,360 1 1,232 0,265 2,937 Baixa 7,296 1 7,662 3,960 14,128 Baixa/Média 1,713 2 13,826 7,493 24,884 Média/Alta 9,902 2 6,984 3,547 13,018 Baixa/Média 14,090 3 8,559 4,477 15,684 Baixa/Alta 14,671 3 13,009 7,047 23,391 Média/Alta 31,367 1 5,179 2,523 9,839 Baixa/Média 3,051 2 10,482 5,596 18,988 Média/Alta 15,752 3 2,373 0,926 4,907 Baixa 8,233 2 4,788 2,287 9,192 Baixa/Média 14,745 2 2,339 0,893 4,891 Baixa 5,110 1 16,506 8,385 31,654 Média/Alta 12,514 2 14,051 7,604 25,328 Média/Alta 15,013 2 30,845 17,128 54,941 Alta 9,751 3 2,082 0,755 4,411 Baixa 5,898 2 7,693 3,921 14,355 Baixa/Média 9,224 1 1,726 0,535 3,839 Baixa 8,661 2 4,765 2,235 9,272 Baixa/Média 13,337 2 9,282 4,913 16,882 Baixa/Alta 11,329 2 3,444 1,520 6,840 Baixa/Média 6,028 2 16,004 8,645 28,980 Média/Alta 21,601 1 1,757 0,547 3,913 Baixa 2,561 1 15,291 8,254 27,679 Média/Alta 5,263 1 2,650 1,054 5,485 Baixa/Média 5,831 1 5,926 2,925 11,219 Baixa/Média 12,117 LimInfR LimSupR ClassImprecisaR Árvore 1,947 8,661 Baixa/Média Baixa 4,740 15,247 Baixa/Alta Baixa 5,959 18,987 Média/Alta Alta 1,236 6,516 Baixa/Média Alta 5,458 12,804 Média Alta 6,068 13,811 Média Baixa 7,334 16,578 Média/Alta Baixa 0,281 2,219 Baixa Baixa 3,220 11,751 Baixa/Média Alta 12,475 27,267 Média/Alta Alta 5,226 16,356 Média/Alta Média 1,982 11,752 Baixa/Média Baixa 8,124 24,601 Média/Alta Alta 3,403 13,576 Baixa/Média Baixa 1,382 29,968 Baixa/Alta Média 5,648 13,146 Média Média 8,344 18,783 Média/Alta Alta 7,592 24,341 Média/Alta Alta 14,952 43,606 Média/Alta Alta 0,956 5,765 Baixa/Média Baixa 8,853 20,300 Média/Alta Média 2,058 7,548 Baixa/Média Baixa 8,420 19,413 Média/Alta Baixa 0,761 3,118 Baixa Baixa 6,223 24,237 Média/Alta Baixa 10,639 23,347 Média/Alta Alta 6,903 15,592 Média/Alta Alta 1,038 4,904 Baixa Baixa 4,291 10,175 Baixa/Média Baixa 3,561 14,284 Baixa/Média Baixa 6,482 15,378 Média/Alta Baixa 6,726 15,208 Média/Alta Alta 1,005 3,620 Baixa Baixa 16,343 35,786 Alta Alta 0,756 4,978 Baixa Baixa 2,264 9,880 Baixa/Média Média 2,313 9,873 Baixa/Média Baixa 5,627 22,001 Média/Alta Baixa (Continua) TABELA C.2 – Continuação. 140 COD 3160009 3160108 3160207 3160306 3160405 3160454 3160504 3160603 3160702 3160801 3160900 3160959 3161007 3161056 3161106 3161205 3161304 3161403 3161502 3161601 3161650 3161700 3161809 3161908 3162005 3162104 3162203 3162252 3162302 3162401 3162450 3162500 3162559 3162575 3162609 3162658 3162708 3162807 MUNICIPIO SANTO ANTONIO DO AVENTUREIRO SANTO ANTONIO DO GRAMA SANTO ANTONIO DO ITAMBE SANTO ANTONIO DO JACINTO SANTO ANTONIO DO MONTE SANTO ANTONIO DO RETIRO SANTO ANTONIO DO RIO ABAIXO SANTO HIPOLITO SANTOS DUMONT SAO BENTO ABADE SAO BRAS DO SUACUI SAO DOMINGOS DAS DORES SAO DOMINGOS DO PRATA SAO FELIX DE MINAS SAO FRANCISCO SAO FRANCISCO DE PAULA SAO FRANCISCO DE SALES SAO FRANCISCO DO GLORIA SAO GERALDO SAO GERALDO DA PIEDADE SAO GERALDO DO BAIXIO SAO GONCALO DO ABAETE SAO GONCALO DO PARA SAO GONCALO DO RIO ABAIXO SAO GONCALO DO SAPUCAI SAO GOTARDO SAO JOAO BATISTA DO GLORIA SAO JOAO DA LAGOA SAO JOAO DA MATA SAO JOAO DA PONTE SAO JOAO DAS MISSOES SAO JOAO DEL-REI SAO JOAO DO MANHUACU SAO JOAO DO MANTENINHA SAO JOAO DO ORIENTE SAO JOAO DO PACUI SAO JOAO DO PARAISO SAO JOAO EVANGELISTA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 2 10,394 5,522 18,907 Média/Alta 14,634 2 8,917 4,656 16,388 Baixa/Alta 14,393 3 9,724 5,096 17,863 Média/Alta 37,673 3 14,209 7,737 25,476 Média/Alta 47,876 1 5,105 2,497 9,658 Baixa/Média 6,702 4 5,981 3,010 11,154 Baixa/Média 9,101 2 14,139 7,617 25,596 Média/Alta 12,354 4 1,540 0,447 3,460 Baixa 1,609 2 4,004 1,812 7,906 Baixa/Média 1,124 1 5,598 2,761 10,576 Baixa/Média 4,463 1 2,803 1,142 5,751 Baixa/Média 10,897 2 20,206 11,074 36,244 Média/Alta 10,908 2 13,146 7,106 23,686 Média/Alta 9,248 2 21,458 11,751 38,553 Média/Alta 16,706 4 7,025 3,590 13,031 Baixa/Média 8,200 1 5,657 2,800 10,662 Baixa/Média 10,655 1 3,490 1,533 6,959 Baixa/Média 6,423 2 16,965 9,306 30,316 Média/Alta 12,069 2 3,352 1,482 6,632 Baixa/Média 10,895 3 10,244 5,419 18,696 Média/Alta 25,647 2 9,689 5,095 17,745 Média/Alta 19,079 1 3,957 1,839 7,657 Baixa/Média 15,049 1 4,898 2,362 9,348 Baixa/Média 6,216 1 17,841 9,729 32,084 Média/Alta 4,848 1 2,591 1,036 5,335 Baixa/Média 5,099 1 7,524 3,895 13,842 Baixa/Média 5,430 1 1,775 0,581 3,870 Baixa 7,307 4 6,269 3,165 11,688 Baixa/Média 4,985 1 2,165 0,785 4,611 Baixa 6,065 4 3,910 1,812 7,574 Baixa/Média 3,050 4 5,064 2,474 9,585 Baixa/Média 3,677 2 3,312 1,431 6,647 Baixa/Média -0,734 2 11,709 6,258 21,252 Média/Alta 9,518 2 13,166 7,068 23,873 Média/Alta 20,713 2 13,735 7,478 24,609 Média/Alta 14,929 4 8,942 4,684 16,389 Baixa/Alta 3,533 4 4,026 1,850 7,865 Baixa/Média 4,305 3 14,641 7,960 26,305 Média/Alta 59,906 LimInfR LimSupR ClassImprecisaR Árvore 10,305 22,860 Média/Alta Alta 9,291 20,297 Média/Alta Alta 4,910 15,471 Baixa/Alta Baixa 12,786 37,350 Média/Alta Alta 2,788 11,471 Baixa/Média Alta 7,643 28,124 Média/Alta Alta 7,091 15,811 Média/Alta Alta 0,730 4,648 Baixa Baixa 0,149 1,610 Baixa Baixa 1,964 8,937 Baixa/Média Baixa 5,344 20,780 Média/Alta Baixa 4,768 11,274 Baixa/Média Média 4,108 10,181 Baixa/Média Alta 10,184 23,610 Média/Alta Alta 10,841 45,580 Média/Alta Baixa 4,708 18,501 Baixa/Alta Baixa 2,803 11,610 Baixa/Média Baixa 6,603 14,844 Média Alta 5,175 12,176 Média Baixa 6,554 19,840 Média/Alta Alta 12,880 28,026 Média/Alta Baixa 6,962 27,753 Média/Alta Baixa 2,760 11,406 Baixa/Média Baixa 1,642 7,795 Baixa/Média Alta 2,044 8,982 Baixa/Média Baixa 2,483 10,449 Baixa/Média Média 3,330 13,366 Baixa/Média Baixa 3,287 13,007 Baixa/Média Alta 2,699 11,302 Baixa/Média Baixa 4,511 17,349 Baixa/Alta Baixa 3,148 12,280 Baixa/Média Baixa -0,921 -0,779 Baixa Baixa 4,276 10,229 Baixa/Média Alta 17,751 38,652 Alta Alta 12,840 27,928 Média/Alta Alta 2,058 9,015 Baixa/Média Baixa 4,831 18,029 Baixa/Alta Alta 14,740 43,014 Média/Alta Média (Continua) TABELA C.2 – Continuação. 141 COD 3162906 3162922 3162948 3162955 3163003 3163102 3163201 3163300 3163409 3163508 3163607 3163706 3163805 3163904 3164001 3164100 3164209 3164308 3164407 3164431 3164472 3164506 3164605 3164704 3164803 3164902 3165008 3165107 3165206 3165305 3165404 3165503 3165537 3165552 3165560 3165578 3165602 3165701 MUNICIPIO Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR SAO JOAO NEPOMUCENO 2 3,345 1,479 6,614 Baixa/Média 6,316 SAO JOAQUIM DE BICAS 1 5,742 2,851 10,802 Baixa/Média 4,442 SAO JOSE DA BARRA 1 2,123 0,783 4,469 Baixa 5,552 SAO JOSE DA LAPA 1 6,963 3,565 12,890 Baixa/Média 6,673 SAO JOSE DA SAFIRA 3 20,852 11,544 37,066 Média/Alta 25,849 SAO JOSE DA VARGINHA 1 5,448 2,694 10,254 Baixa/Média 8,209 SAO JOSE DO ALEGRE 1 1,987 0,687 4,290 Baixa 2,377 SAO JOSE DO DIVINO 2 12,381 6,629 22,470 Média/Alta 17,073 SAO JOSE DO GOIABAL 2 15,625 8,530 28,001 Média/Alta 12,374 SAO JOSE DO JACURI 3 16,679 9,121 29,881 Média/Alta 59,671 SAO JOSE DO MANTIMENTO 2 14,049 7,594 25,353 Média/Alta 20,273 SAO LOURENCO 1 4,008 1,858 7,776 Baixa/Média 2,004 SAO MIGUEL DO ANTA 2 8,777 4,569 16,164 Baixa/Alta 10,505 SAO PEDRO DA UNIAO 1 5,606 2,777 10,553 Baixa/Média 5,925 SAO PEDRO DOS FERROS 2 13,500 7,306 24,312 Média/Alta 10,738 SAO PEDRO DO SUACUI 3 19,612 10,814 34,964 Média/Alta 54,717 SAO ROMAO 4 10,346 5,435 19,003 Média/Alta 13,285 SAO ROQUE DE MINAS 1 4,126 1,937 7,946 Baixa/Média 6,633 SAO SEBASTIAO DA BELA VISTA 1 1,868 0,615 4,092 Baixa 3,013 SAO SEBASTIAO DA VARGEM ALEGRE 2 10,334 5,494 18,781 Média/Alta 12,910 SAO SEBASTIAO DO ANTA 2 13,952 7,552 25,144 Média/Alta 15,129 SAO SEBASTIAO DO MARANHAO 3 23,205 12,764 41,568 Média/Alta 114,304 SAO SEBASTIAO DO OESTE 1 6,288 3,159 11,771 Baixa/Média 7,008 SAO SEBASTIAO DO PARAISO 1 5,005 2,441 9,479 Baixa/Média 3,217 SAO SEBASTIAO DO RIO PRETO 2 13,594 7,220 24,913 Média/Alta 12,987 SAO SEBASTIAO DO RIO VERDE 1 9,766 5,160 17,815 Média/Alta 3,514 SAO TIAGO 1 3,595 1,597 7,131 Baixa/Média 13,730 SAO TOMAS DE AQUINO 1 5,104 2,496 9,656 Baixa/Média 2,145 SAO TOME DAS LETRAS 1 3,680 1,679 7,175 Baixa/Média 4,140 SAO VICENTE DE MINAS 2 6,061 3,004 11,451 Baixa/Média 4,172 SAPUCAI-MIRIM 1 0,991 0,076 2,687 Baixa 2,189 SARDOA 3 14,981 8,134 26,962 Média/Alta 41,604 SARZEDO 1 5,830 2,909 10,933 Baixa/Média 5,352 SETUBINHA 3 21,506 11,821 38,507 Média/Alta 40,222 SEM-PEIXE 2 11,883 6,170 22,147 Média/Alta 14,378 SENADOR AMARAL 1 2,260 0,836 4,790 Baixa 3,908 SENADOR CORTES 2 8,033 4,173 14,772 Baixa/Média 13,476 SENADOR FIRMINO 2 7,555 3,847 14,099 Baixa/Média 9,371 LimInfR LimSupR ClassImprecisaR Árvore 4,041 10,396 Baixa/Média Baixa 1,643 7,710 Baixa/Média Baixa 2,397 10,259 Baixa/Média Baixa 2,522 10,620 Baixa/Média Baixa 12,923 40,279 Média/Alta Alta 3,710 14,777 Baixa/Média Baixa 0,704 5,122 Baixa/Média Baixa 10,146 22,719 Média/Alta Alta 9,661 21,408 Média/Alta Alta 12,960 38,185 Média/Alta Alta 14,568 31,878 Média/Alta Média 1,049 6,148 Baixa/Média Alta 5,092 11,876 Média Baixa 2,376 10,207 Baixa/Média Baixa 6,922 15,844 Média/Alta Alta 12,634 36,900 Média/Alta Alta 5,158 38,242 Média/Alta Alta 2,773 11,506 Baixa/Média Baixa 0,992 5,938 Baixa/Média Baixa 7,502 16,894 Média/Alta Média 10,837 23,929 Média/Alta Alta 24,870 74,209 Alta Alta 2,853 11,823 Baixa/Média Baixa 1,147 6,509 Baixa/Média Baixa 7,449 16,615 Média/Alta Alta 1,346 7,062 Baixa/Média Alta 6,073 24,106 Média/Alta Baixa 0,536 4,566 Baixa Alta 1,492 7,391 Baixa/Média Baixa 0,081 1,780 Baixa Baixa 0,498 4,439 Baixa Baixa 7,638 23,607 Média/Alta Média 2,442 10,281 Baixa/Média Baixa 8,269 26,320 Média/Alta Alta 8,997 19,702 Média/Alta Média 1,436 7,258 Baixa/Média Baixa 7,414 16,988 Média/Alta Baixa 3,633 8,988 Baixa/Média Baixa (Continua) TABELA C.2 – Continuação. 142 COD 3165800 3165909 3166006 3166105 3166204 3166303 3166402 3166501 3166600 3166709 3166808 3166907 3166956 3167004 3167103 3167202 3167301 3167400 3167509 3167608 3167707 3167806 3167905 3168002 3168051 3168101 3168200 3168309 3168408 3168507 3168606 3168705 3168804 3168903 3169000 3169059 3169109 3169208 MUNICIPIO SENADOR JOSE BENTO SENADOR MODESTINO GONCALVES SENHORA DE OLIVEIRA SENHORA DO PORTO SENHORA DOS REMEDIOS SERICITA SERITINGA SERRA AZUL DE MINAS SERRA DA SAUDADE SERRA DOS AIMORES SERRA DO SALITRE SERRANIA SERRANOPOLIS DE MINAS SERRANOS SERRO SETE LAGOAS SILVEIRANIA SILVIANOPOLIS SIMAO PEREIRA SIMONESIA SOBRALIA SOLEDADE DE MINAS TABULEIRO TAIOBEIRAS TAPARUBA TAPIRA TAPIRAI TAQUARACU DE MINAS TARUMIRIM TEIXEIRAS TEOFILO OTONI TIMOTEO TIRADENTES TIROS TOCANTINS TOCOS DO MOJI TOLEDO TOMBOS Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 1,575 0,434 3,623 Baixa 5,479 3 6,155 3,065 11,594 Baixa/Média 8,840 2 8,475 4,367 15,729 Baixa/Alta 9,921 2 10,050 5,285 18,430 Média/Alta 15,067 2 7,698 3,916 14,389 Baixa/Média 8,145 2 8,603 4,467 15,870 Baixa/Alta 13,102 2 7,094 3,618 13,184 Baixa/Média 6,189 3 9,614 5,030 17,683 Média/Alta 24,934 1 6,149 3,087 11,505 Baixa/Média 5,216 3 42,974 23,531 77,830 Alta 11,314 1 5,854 2,934 10,941 Baixa/Média 7,875 1 2,381 0,913 4,975 Baixa 4,237 4 4,948 2,397 9,415 Baixa/Média 1,139 2 7,967 4,118 14,711 Baixa/Média 5,614 3 4,513 2,147 8,655 Baixa/Média 22,390 1 2,584 1,048 5,271 Baixa/Média 1,889 2 4,318 2,011 8,391 Baixa/Média 12,528 1 2,102 0,751 4,496 Baixa 5,563 2 4,014 1,848 7,828 Baixa/Média 13,901 2 13,495 7,288 24,351 Média/Alta 11,833 2 13,233 7,182 23,757 Média/Alta 14,531 1 5,808 2,904 10,871 Baixa/Média 2,981 2 3,888 1,767 7,637 Baixa/Média 12,639 4 6,153 3,067 11,579 Baixa/Média 5,680 2 14,597 7,957 26,159 Média/Alta 16,371 1 4,544 2,172 8,692 Baixa/Média 5,974 1 10,667 5,676 19,389 Média/Alta 5,881 1 6,401 3,250 11,888 Baixa/Média 11,360 2 11,631 6,245 21,022 Média/Alta 14,719 2 14,152 7,583 25,748 Média/Alta 8,529 3 21,690 11,968 38,701 Média/Alta 102,780 2 11,836 6,369 21,359 Média/Alta -0,572 2 2,646 1,072 5,418 Baixa/Média 4,939 1 6,052 3,027 11,349 Baixa/Média 17,530 2 5,280 2,595 9,970 Baixa/Média 9,106 1 2,710 1,074 5,635 Baixa/Média 3,479 1 2,150 0,781 4,572 Baixa 3,124 2 18,189 9,961 32,592 Média/Alta 14,130 LimInfR LimSupR ClassImprecisaR Árvore 2,331 10,112 Baixa/Média Baixa 2,904 10,606 Baixa/Média Baixa 7,945 18,560 Média/Alta Baixa 11,330 25,588 Média/Alta Média 2,816 7,206 Baixa/Média Baixa 7,552 17,515 Média/Alta Média 0,908 3,473 Baixa Média 5,796 17,720 Média/Alta Baixa 2,352 10,207 Baixa/Média Baixa 3,310 11,645 Baixa/Média Alta 3,394 13,601 Baixa/Média Baixa 1,751 8,211 Baixa/Média Baixa 0,484 3,852 Baixa Baixa 1,286 4,179 Baixa Baixa 6,805 20,506 Média/Alta Baixa 1,720 33,191 Baixa/Alta Baixa 6,591 15,064 Média/Alta Baixa 2,223 9,704 Baixa/Média Baixa 6,306 15,215 Média/Alta Baixa 7,486 17,003 Média/Alta Alta 8,344 18,778 Média/Alta Alta 0,998 5,951 Baixa/Média Baixa 6,331 14,505 Média Baixa 3,638 14,347 Baixa/Média Alta 9,970 21,922 Média/Alta Média 2,675 11,205 Baixa/Média Baixa 2,655 11,166 Baixa/Média Média 5,092 20,052 Média/Alta Média 10,698 23,264 Média/Alta Alta 4,423 10,483 Baixa/Média Baixa 44,539 157,253 Alta Média -0,641 -0,074 Baixa Média 0,564 2,856 Baixa Baixa 7,589 31,038 Média/Alta Baixa 4,120 10,484 Baixa/Média Baixa 1,118 6,289 Baixa/Média Baixa 0,918 5,667 Baixa/Média Baixa 7,416 17,531 Média/Alta Média (Continua) TABELA C.2 – Continuação. 143 COD 3169307 3169356 3169406 3169505 3169604 3169703 3169802 3169901 3170008 3170057 3170107 3170206 3170305 3170404 3170438 3170479 3170503 3170529 3170578 3170602 3170651 3170701 3170750 3170800 3170909 3171006 3171030 3171071 3171105 3171154 3171204 3171303 3171402 3171501 3171600 3171709 3171808 3171907 MUNICIPIO TRES CORACOES TRES MARIAS TRES PONTAS TUMIRITINGA TUPACIGUARA TURMALINA TURVOLANDIA UBA UBAI UBAPORANGA UBERABA UBERLANDIA UMBURATIBA UNAI UNIAO DE MINAS URUANA DE MINAS URUCANIA URUCUIA VARGEM ALEGRE VARGEM BONITA VARGEM GRANDE DO RIO PARDO VARGINHA VARJAO DE MINAS VARZEA DA PALMA VARZELANDIA VAZANTE VERDELANDIA VEREDINHA VERISSIMO VERMELHO NOVO VESPASIANO VICOSA VIEIRAS MATIAS LOBATO VIRGEM DA LAPA VIRGINIA VIRGINOPOLIS VIRGOLANDIA Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR 1 4,230 1,980 8,179 Baixa/Média 2,888 1 3,363 1,485 6,660 Baixa/Média 11,567 1 3,770 1,723 7,356 Baixa/Média 3,798 2 12,175 6,468 22,246 Média/Alta 14,532 1 2,594 1,036 5,344 Baixa/Média 5,341 3 8,601 4,467 15,862 Baixa/Alta 4,625 1 2,314 0,872 4,866 Baixa 7,111 2 4,877 2,346 9,323 Baixa/Média 0,096 4 10,154 5,368 18,537 Média/Alta 5,348 2 14,010 7,610 25,167 Média/Alta 10,797 1 2,540 1,021 5,199 Baixa/Média -0,468 1 3,257 1,429 6,461 Baixa/Média -0,969 3 31,998 17,750 57,071 Alta 20,614 1 4,911 2,374 9,357 Baixa/Média 21,958 1 10,196 5,377 18,657 Média/Alta 8,140 4 6,492 3,274 12,130 Baixa/Média 1,929 2 10,281 5,418 18,830 Média/Alta 12,634 4 10,321 5,447 18,882 Média/Alta 8,126 2 4,472 2,116 8,612 Baixa/Média 17,824 1 5,824 2,916 10,890 Baixa/Média 3,732 4 5,194 2,541 9,834 Baixa/Média 4,088 1 3,576 1,603 7,043 Baixa/Média 2,077 1 10,316 5,457 18,829 Média/Alta 18,951 4 3,644 1,646 7,151 Baixa/Média 0,741 4 3,581 1,621 7,005 Baixa/Média 3,459 1 4,189 1,972 8,060 Baixa/Média 8,626 4 3,074 1,325 6,137 Baixa/Média 0,737 3 11,022 5,865 20,055 Média/Alta 6,642 1 5,221 2,571 9,838 Baixa/Média 5,379 2 17,934 9,768 32,292 Média/Alta 12,145 1 5,249 2,585 9,891 Baixa/Média 6,316 2 7,683 3,924 14,312 Baixa/Média 0,185 2 12,620 6,807 22,760 Média/Alta 14,215 2 14,156 7,678 25,470 Média/Alta 13,271 3 5,050 2,440 9,642 Baixa/Média 21,375 1 4,167 1,937 8,088 Baixa/Média 9,207 3 15,265 8,332 27,348 Média/Alta 22,678 3 11,349 6,100 20,477 Média/Alta 28,117 LimInfR LimSupR ClassImprecisaR Árvore 1,115 6,574 Baixa/Média Baixa 6,093 23,840 Média/Alta Baixa 0,982 5,695 Baixa/Média Baixa 9,787 21,708 Média/Alta Baixa 2,522 10,562 Baixa/Média Baixa 0,520 3,458 Baixa Alta 3,079 12,572 Baixa/Média Baixa -0,156 0,929 Baixa Baixa 3,989 16,206 Baixa/Alta Alta 5,524 12,596 Média Alta -0,164 19,016 Baixa/Alta Baixa -0,794 114,253 Baixa/Alta Baixa 14,199 44,854 Média/Alta Alta 5,898 30,141 Média/Alta Baixa 3,527 14,149 Baixa/Média Baixa 0,854 5,447 Baixa/Média Baixa 9,814 21,646 Média/Alta Média 3,391 29,823 Baixa/Alta Alta 12,975 28,223 Média/Alta Alta 1,458 7,394 Baixa/Média Média 2,457 10,358 Baixa/Média Alta 1,422 10,238 Baixa/Média Baixa 8,759 36,054 Média/Alta Alta 0,435 3,705 Baixa Baixa 3,251 12,715 Baixa/Média Baixa 3,778 14,995 Baixa/Média Alta 0,341 3,401 Baixa Baixa 0,889 4,436 Baixa Média 2,315 10,053 Baixa/Média Baixa 8,403 18,734 Média/Alta Média 4,563 20,442 Baixa/Alta Alta -0,446 0,376 Baixa Baixa 8,766 19,494 Média/Alta Média 7,914 17,906 Média/Alta Alta 5,451 16,693 Média/Alta Baixa 3,441 13,988 Baixa/Média Média 7,795 23,196 Média/Alta Alta 9,074 27,155 Média/Alta Média (Continua) TABELA C.2 – Conclusão. COD MUNICIPIO 3172004 VISCONDE DO RIO BRANCO 3172103 VOLTA GRANDE 3172202 VENCESLAU BRAS Regiões EstimadoG LimInfG LimSupG ClassImprecisaG EstimadoR LimInfR LimSupR ClassImprecisaR Árvore 2 3,933 1,795 7,705 Baixa/Média 5,310 2,820 7,446 Baixa/Média Baixa 2 11,034 5,887 20,028 Média/Alta 15,316 11,003 24,899 Média/Alta Alta 1 0,559 -0,165 1,909 Baixa 1,928 0,435 4,338 Baixa Baixa 144 145