Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Estatística para dados direccionais Susana Barbosa Mestrado em Ciências Geofísicas 2012-2013 Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Dados direccionais observações de direcções no plano ou no espaço 2-D (plano): dados circulares 3-D (espaço): dados esféricos Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Estatística circular Estatística circular métodos estatísticos para análise de dados circulares “A curious byway of statistics. . . somewhere between the analysis of linear and the analysis of spherical data” (Fisher 1993) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Dados circulares I direcção representada por um ângulo medido em relação a uma direcção “zero” arbitrária I não há uma ordenação natural das observações I 0 = 2π (o início e o fim coincidem) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Dados circulares em geofísica Medidas I vento I ondulação I ... Aplicações I produção de energia renovável I riscos, protecção costeira I ... Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Direcção tomada por 76 tartarugas após serem libertadas (Stephens, 1969) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Direcção tomada por 76 tartarugas após serem libertadas (Stephens, 1969) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Direcção tomada por 76 tartarugas após serem libertadas (Stephens, 1969) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Direcção do eixo maior de 164 formas de feldspato em basalto (Fisher, 1993) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Representação de dados circulares (x = r cos α, y = r sin α) ⇐⇒ (r , α) r = 1 (na estatística circular o interesse é apenas na direcção) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Direcção média A direcção média (direcção preferencial) não deve ser calculada a partir da média dos ângulos! Exemplo: (45 + 90 + 135)/3 = 90 (0 + 45 + 315)/3 = 120 Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Direcção média O valor da média angular depende I origem (arbitrária) I sentido (horario, anti-horario) =⇒ é necessária uma medida alternativa da média para dados direccionais =⇒ como a variância depende da média, é também necessária uma medida alternativa de dispersão para dados direccionais Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Direcção média n observações (xi , yi ) ⇔ (cos αi , sin αi ), i = 1, ..., n P P Vector resultante: R = ( ni=1 cos αi , ni=1 sin αi ) ≡ (C, S) A média circular ᾱ0 é definida como ᾱ0 = arctg(S/C)) Nota: quando R = 0 não existe uma direcção média (observações distribuídas uniformemente sobre o círculo, não há uma direcção preferencial) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Dispersão circular A variância circular é definida como S =1− 1 n Pn i=1 cos(αi − ᾱ0 ) = 1 − ||R||/n P P onde R é o vector resultante R = ( ni=1 cos αi , ni=1 sin αi ) N: 0 < S < 1 S ∼ 0 observações com a mesma direcção S ∼ 1 observações dispersas pela circunferência unitária Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Distribuição de probabilidade circular Distribuição circular: distribuição de probabilidade para variáveis angulares em que toda a probabilidade está concentrada na circunferência do ciclo unitário A função densidade de probabilidade circular f (θ) verifica f (θ) ≥ 0 ´ 2π 0 f (θ)dθ = 1 f (θ) = f (θ + k 2π) ∀k Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Distribuição uniforme A função densidade de probabilidade da distribuição circular uniforme é f (θ) = 1 2π , θ ∈ [0, 2π) (todas as direcções têm igual probabilidade) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Distribuição de von Mises A fdp da distribuição de von Mises é f (θ) = 1 2πI0 (k ) exp[kcos(θ − µ)], θ ∈ [0, 2π), k > 0 onde I0 (k ) é uma função de Bessel modificada de ordem 0, ´ 2π 1 I0 (k ) = 2π 0 exp[k cosθdθ] (“distribuição normal circular” - distribuição mais comum para dados circulares simétricos e unimodais) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Distribuição de von Mises µ- direcção média a distribuição de von Mises tem o valor máximo para θ = µ a distribuição é simétrica em torno de µ k - parâmetro de dispersão k → 0 distribuição von Mises → distribuição uniforme k → ∞ distribuição concentrada na direcção de µ Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Testes de hipótese para dados circulares I Testes de Uniformidade I Testes de Homogeneidade Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Testes de uniformidade Distribuição uniforme f (θ) = 1 2π , θ ∈ [0, 2π) (todas as direcções têm igual probabilidade) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Teste de Rayleigh Assumindo que a distribuição dos dados é de Von Mises com parâmetro de dispersão k H0 : k = 0 H1 : k > 0 (distribuição unimodal com direcção média desconhecida) H 1 : k > 0 & µ = µ0 (distribuição unimodal com direcção média µ0 ) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo H0 : k = 0 H1 : k > 0 P-value: 0.15 H0 : k = 0 H1 : k > 0 & µ = π P-value: Susana Barbosa: Análise de dados em Geociências 0.96 Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo H0 : k = 0 H1 : k > 0 P-value: 0 H0 : k = 0 H1 : k > 0 & µ = π P-value: Susana Barbosa: Análise de dados em Geociências 0 Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Teste de Kuiper Teste não-paramétrico de uniformidade H0 : a distribuição dos dados é uniforme (todas as direcções têm igual probabilidade) P-value > 0.15 Susana Barbosa: Análise de dados em Geociências P-value:< 0.01 Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Outros testes de uniformidade não-paramétricos I Teste de Watson I Teste de espaçamento de Rao I Teste de Ajne I ... Vantagens dos testes não-paramétricos - amostras pequenas - dados não-unimodais Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Testes de homogeneidade Para duas amostras de dados circulares I a direcção média (direcção preferencial) das duas populações é a mesma? I a variância circular (dispersão) é igual? Em ambos os casos assume-se que os dados são amostras de populações com distribuição de von Mises Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Teste de Watson H 0 : µ1 = µ2 P-value Susana Barbosa: Análise de dados em Geociências < 0.05 Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Teste de Watson H 0 : µ1 = µ2 P-value Susana Barbosa: Análise de dados em Geociências < 0.05 Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Teste de Rao H 0 : k1 = k2 P-value Susana Barbosa: Análise de dados em Geociências > 0.1 Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Teste de Rao H 0 : k1 = k2 P-value Susana Barbosa: Análise de dados em Geociências < 0.01 Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Intervalos de confiança - exemplo Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Intervalos de confiança - exemplo mle.vonmises(x) mu: 2.974 ( 0.1080 ) kappa: 2.308 ( 0.3966 ) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Intervalos de confiança - exemplo Bootstrap Confidence Intervals Confidence Level: 95 % Mean Direction: Low = 2.7 High = 3.2 Concentration Parameter: Low = 1.8 High = 3.1 Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Correlação circular O coeficiente de correlação circular para dois conjuntos de dados circulares (αi , βi ), i = 1, ..., n com direcção média µ e ν (em relação à mesma direcção inicial e com o mesmo sentido de rotação) é dado por ρc = E[cos(α − β − µ + ν) − cos(α + β − µ − ν)] p 2 E[sin2 (α − µ)]E[sin2 (β − ν)] Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Correlação circular Propriedades do coeficiente de correlação circular I ρc (α, β) = ρc (β, α) I |ρc (α, β)| ≤ 1 I ρc = 0 se α e β são independentes (o inverso não é verdadeiro) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Correlação circular O coeficiente de correlação circular amostral para duas amostras (αi , βi ), i = 1, ..., n com direcção média ᾱ e β̄ é dado por Pn sin(αi − ᾱ)sin(βi − β̄) rc = qPi=1 n 2 2 i=1 sin (αi − ᾱ)sin (βi − β̄) Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo rc = 0.90 P-value < 0.01 Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Exemplo rc = 0.21 P-value = 0.07 Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013 Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Referências Batschelet, E. (1981). Circular Statistics in Biology, Academic Press Jammalamadaka, S.R. & Sengupta, A. (2001). Topics in Circular Statistics. World Scientific, River Edge, N.J. Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013