Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2015 Apresentação da Disciplina Camilo Daleles Rennó [email protected] http://www.dpi.inpe.br/~camilo/estatistica/ Estatística Definição: é a ciência que investiga os processos de obtenção, organização e análise de dados sobre uma população população, e os métodos de tirar conclusões ou fazer predições com base nesses dados. população = universo = espaço amostral (é conjunto de todos os resultados possíveis de um experimento, representado por U ou S) Estatística Descritiva X Estatística Inferencial 2 Estatística Estatística Descritiva X Estatística Inferencial S 3 Estatística Estatística Descritiva X Estatística Inferencial 100 90 80 20 15 70 10 60 5 50 + + 0 classe 1 S Classes 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 100 - 110 110 - 120 120 - 130 F.A. 2 4 6 12 10 25 12 19 7 5 3 1 106 F.R. 0,02 0,04 0,06 0,11 0,09 0,24 0,11 0,18 0,07 0,05 0,03 0,01 classe 2 • média • moda • mediana • desvio médio • desvio padrão • assimetria • curtose • coeficiente de variação 4 Estatística Estatística Descritiva X Estatística Inferencial 0,35 0,30 0,25 f ( x; , , ) 0,20 0,15 0,10 0,05 0,00 S 5 Estatística Estatística Descritiva X Estatística Inferencial intervalos de confiança testes de hipóteses 0,35 0,30 0,25 f ( x; , , ) 0,20 0,15 0,10 0,05 0,00 ˆ ˆ ˆ S 6 Para que Estatística em SR? • caracterizar um fenômeno ex: Qual o retroespalhamento de áreas florestais em dados JERS? Fonte: Santos et al. Savanna and tropical rainforest biomass estimation and spatialization using JERS-1 data. Int. J. Remote Sensing, 23(7):1217-1229. 2002 7 Para que Estatística em SR? • comparar fenômenos ex: é possível distinguir diferentes níveis de degradação em florestas tropicais em imagens Landsat/TM? Fonte: http://www.obt.inpe.br/degrad/ 8 Para que Estatística em SR? • encontrar padrões ex: qual o comportamento espectral padrão da cana-de-açúcar? Fonte: http://www.a-a-r-s.org/aars/proceeding/ACRS2004/Papers/HSS04-1.htm 9 Para que Estatística em SR? • selecionar fatores mais importantes para explicar um fenômeno ex: quais as bandas Landsat/TM e/ou índices de vegetação que melhor explicam a variação da área basal da caatinga? Fonte: http://www.scielo.br/pdf/pab/v49n4/0100-204X-pab-49-04-0306.pdf 10 Para que Estatística em SR? • encontrar relações matemáticas entre fenômenos ex: qual modelo matemático que melhor estima a concentração de sólidos em suspensão de corpos d´água na Amazônia a partir da reflectância de superfície em dados do Landsat/TM? Fonte: http://mtc-m19.sid.inpe.br/col/sid.inpe.br/mtc-m19/2013/02.26.19.52/doc/publicacao.pdf 11 Para que Estatística em SR? • avaliar classificações/mapeamentos/modelos ex: qual método de classificação resulta no melhor mapeamento de uma área urbana? Classificação MAXVER Imagem IKONOS fusionada Classificação orientada a objetos Fonte: http://marte.sid.inpe.br/col/ltid.inpe.br/sbsr/2004/11.19.17.58/doc/4217.pdf 12 Para que Estatística em SR? • especificar tamanho de amostra ex: quantas observações uma amostra deve ter para garantir que a exatidão de mapeamento estimada esteja dentro de certos limites aceitáveis? Fonte: http://marte.sid.inpe.br/col/ltid.inpe.br/sbsr/2004/11.19.17.58/doc/4217.pdf 13 Estatística em SR (imagens) Uma imagem é uma grade ou matriz, onde cada número representa o valor de uma grandeza (radiância, reflectância, retroespalhamento, etc) de um elemento de resolução (pixel ou célula). A visualização é feita associando-se a cada número um nível de cinza (ou uma cor). 14 Estatística em SR (imagens) Numa imagem classificada, cada elemento de resolução está associado a uma classe de acordo com um conjunto de regras. fatiamento 100 > 100 15 Estatística em SR (imagens) 139 142 Sorteio aleatório de 1 ponto... 174 142 155 18 23 139 28 163 7 174 99 102 137 187 152 16 99 9 149 162 148 175 156 16 32 142 174 142 155 18 23 139 28 163 7 174 99 102 137 187 152 16 99 9 149 162 148 175 156 16 32 16 Dinâmica do curso Revisão sobre probabilidades (opcional) Variáveis Aleatórias e Distribuições Inferência Estatística Intervalo de Confiança Teste de Hipótese Análise de Variância e Regressão Componentes Principais Análise de Agrupamento Teoria de Amostragem Técnicas de Reamostragem Estatísticas Não-Paramétricas Avaliação de Classificação Simulação Estocástica 17 Dinâmica do curso Avaliações: • Exercícios individuais disponibilizados ao término de cada aula entregues por e-mail até às 17h do dia seguinte notas: 0 – não entregue, 5 incompleta e 10 completo (mesmo se errado) discutido no início da aula seguinte (sem identificação) • Exercícios em grupo • Provas 18