A REPRESENTATIVIDADE DO VALOR MÉDIO EM AMOSTRAS COM GRANDES AMPLITUDES
Francisco de Assis Salviano de Sousa, DCA/CCT/UFPb, e-mail: [email protected]
Josiclêda Domiciano Galvíncio, CPGM/CCT/UFPb, e-mail: [email protected]
ABSTRACT
In this study the law of basic probability and the arithmetic mean of ten time series of total monthly precipitation
(TMP) at stations selected from five regions in Paraíba State are used to calculate the probablity of occurrence of
TMP above or below the mean value.In three of the five regions studied the arithmetic mean is a good indicator of
the distribution of TMP’s in all the years. In the “Sertão” the mean value is not a good measure during the period
August—October. In the “Cariri” region the mean is not a representative measure of TMP’s during the dry months:
September, October and November. The results of the study suggest that such mean values should be used with
caution in models of climate forecasting.
RESUMO
Neste trabalho utiliza-se a lei de probabilidade básica, o valor numérico da média aritmética de dez séries
temporais — totais mensais precipitados (TMP’s) — de postos situados em cinco diferentes regiões do Estado da
Paraíba, com diferentes tamanhos amostrais (N), para calcular a probabilidade de ocorrer TMP’s abaixo ou acima
desse valor numérico e evidenciar a representatividade do valor médio amostral.
Em três das cinco regiões estudadas, a média flutua em torno de 60 por cento dos TMP’s. Isso evidencia
uma ótima representatividade dessa estatística e uma boa distribuição dos TMP’s em todos os anos. Na região do
Sertão a média não é representativa para os meses secos: agosto, setembro e outubro. Neles, aproximadamente, 80
por cento dos TMP’s estão abaixo do valor numérico da média e na região do Cariri a média não é representativa
para os meses secos: setembro, outubro e novembro. A não representatividade da média nesses meses evidencia má
distribuição dos TMP’s. Portanto, recomenda-se cautela quando se fizer uso dessas médias em modelos de previsão
climática, principalmente se elas forem um dos parâmetros desses modelos.
INTRODUÇÃO
A importância da representatividade do valor numérico da média aritmética ou momento de ordem um
pode ser ressaltada nos modelos estatísticos de previsão como, por exemplo, Thomas-Fiering, Autoregressivos
(AR), Médias Móveis (MA), Análise Harmônica, dentre outros que utilizam a média aritmética como origem dos
desvios (anomalias) dos valores observados.
A representatividade do valor médio pode ser evidenciada também no ajuste dos dados a qualquer função
distribuição de probabilidade paramétrica ou modelo probabilístico. Dessas funções, as mais utilizadas na
meteorologia e climatologia são: Normal, Log-Normal, Gumbel, Weibull, Gamma, Beta, Bernoulli, Poisson e
Exponencial. Essa representatividade tem igual importância nos momentos de ordem dois (variância), três e quatro,
visto que esses momentos compõem os coeficientes de assimetria, curtose e de variação, responsáveis pelas
principais características de uma amostra.
Na meteorologia, até o momento, pouco se sabe, quantitativamente, à respeito do processo gerador da
precipitação. Muitas vezes o conhecimento adquirido: o qualitativo, é isolado da influência das inter-relações das
variáveis meteorológicas. Nesse contexto a incerteza quanto a representatividade do valor numérico da média
aritmética é mais um complicador nos resultados da previsão climática elaborada por modelos estatísticos ou
dinâmicos.
Os primeiros relacionam as previsões, quanto ao ano ou mês ser seco, normal ou chuvoso, com base nos
valores das médias aritméticas climatológicas e utilizam esses valores como parâmetros, portanto, na prática, é um
valor limitador nesses modelos. Já nos modelos dinâmicos, o valor da média pode não ser um parâmetro, mas os
resultados das previsões têm como referência esse valor, que também limita as previsões.
Toda essa teoria acerca da representatividade do valor numérico da média aritmética, considera os dados
observados não-agrupados. Caso se agrupe, a falta de representatividade poderá aumentar, principalmente se os
dados apresentarem grande dispersão. Esse é um caso típico de uma amostra de totais mensais precipitados no
546
Semi-Árido nordestino, visto que pode-se dispor em uma mesma amostra valores extremos, observados em
períodos secos e chuvosos.
A média aritmética é comumente utilizada, por exemplo, em meteorologia e climatologia para representar
o a valor central ou esperado de uma variável qualquer em um ponto fixo no espaço e no tempo. Quando os valores
observados de séries anuais longas tendem para um valor central, diz-se que esse último valor é “real” e é
denominado “normal climatológico”. Por existir vários tipos de médias, doravante, neste trabalho, a palavra média
terá o significado de média aritmética. Em geral, segundo BROOKS; CARRUTHERS (1978), a média aritmética
oferece maiores vantagens do que a mediana, são elas:
i)
ii)
iii)
a média é um padrão mais conveniente para referenciar as flutuações de uma variável, visto que no
intervalo representado pela média a soma dos desvios é igual a zero. Por esta razão apenas ela é um nível
de referência praticável, para os desvios acumulados, na exibição da tendência da série;
para uma dada série de valores observados, o valor médio é mais rapidamente calculado do que a mediana;
as médias para diferentes períodos são prontamente combinadas, enquanto as medianas não são; a média é
mais estável do que a mediana, e o erro padrão da estimativa para uma amostra de observações é menor;
Por outro lado, quando a distribuição é anormal a média geralmente não é uma estatística representativa.
Por exemplo, em climas semi-áridos a precipitação média, para um dado mês, poderá ser maior do que o quartil
superior, isto é ocorrer menos do que um mês em quatro.
A mediana tem as seguintes vantagens:
i)
ii)
é quase sempre representativa e geralmente dá uma estimativa melhor do valor esperado do que a média,
visto que metade das observações estão de um lado e a outra metade do outro lado da mediana. Exceção
ocorre quando mais da metade das observações estão em uma classe extrema, por exemplo, mais do que a
metade dos meses são secos (ou seja, sem ocorrência de chuva). Nesses casos as estatísticas média e
mediana não são representativas;
exceto para dados com distribuições aproximadamente normais, a mediana juntamente com os quartis dão
maior representatividade à distribuição desses dados do que a média e o desvio padrão.
METODOLOGIA
Para estudar a representatividade do valor numérico da média aritmética foram utilizadas dez séries
temporais, de totais mensais precipitados (TMP’s), com diferentes tamanhos amostrais (N), de postos situados em
cinco diferentes regiões do Estado da Paraíba. No Litoral, João Pessoa e Alhandra; no Brejo, Areia e Bananeiras;
no Agreste, Campina Grande; no Cariri, Bodocongó, Soledade e Cabaceiras e no Sertão, Sousa e Patos.
Utilizando-se da lei de probabilidade básica e do valor numérico da média de cada uma das séries
supracitadas, efetuou-se o cálculo da probabilidade de ocorrer totais mensais precipitados (TMP’s) abaixo ou acima
desse valor numérico. Aqui o valor numérico de cada uma das médias é considerado como a Normal Climatológica
(NC).
RESULTADOS E DISCUSSÃO
Tabela 1 – Valores médios mensais da precipitação em milímetros (P), probabilidade de ocorrer TMP’s menor ou
igual a NC (P≤P), maior que a NC (P>P) e tamanho da amostra em anos (N)
Região: Agreste
P
P≤ P
P>P
N
jan
38,0
63,5
36,5
74
Posto: Campina Grande
fev
55,0
62,1
37,9
74
mar
97,0
55,4
44,6
74
abr
111,0
56,7
43,3
74
mai
109,0
52,7
47,3
74
jun
110,0
59,4
40,6
74
547
jul
107,0
55,4
44,6
74
ago
58,0
58,1
41,9
74
set
28,0
62,1
37,9
74
out
12,0
66,2
33,8
74
nov
13,0
61,6
38,4
74
dez
20,0
63,5
36,5
74
Tabela 2 – Valores médios mensais da precipitação em milímetros (P), probabilidade de ocorrer TMP’s menor ou
igual a NC (P≤P), maior que a NC (P>P) e tamanho da amostra em anos (N)
Região: Litoral
Posto: João Pessoa
P
P≤ P
P>P
N
jan
80,0
60,6
39,4
66
fev
101,0
62,6
37,4
67
mar
205,0
56,2
43,8
64
abr
264,0
56,2
43,8
64
mai
jun
283,0 302,0
54,8
60,3
45,2
39,7
62
63
jul
237,0
61,2
38,8
67
ago
140,0
50,7
49,3
67
set
68,0
62,1
37,9
66
P
P≤ P
P>P
N
70,0
60,7
39,3
56
108,0
53,5
46,5
56
199,0
58,9
41,1
56
226,0
56,6
43,4
53
288,0
56,1
43,9
57
273,0
59,2
40,8
49
149,0
62,2
37,8
53
75,0
63,1
36,9
57
296,0
55,5
44,5
54
out
nov
28,0
28,0
64,7
65,7
35,3
34,3
68
67
Posto: Alhandra
38,0
41,0
54,4
67,3
45,6
32,7
57
55
dez
36,0
69,7
30,3
66
50,0
64,3
35,7
56
Tabela 3 – Valores médios mensais da precipitação em milímetros (P), probabilidade de ocorrer TMP’s menor ou
igual a NC (P≤P), maior que a NC (P>P) e tamanho da amostra em anos (N)
Região: Brejo
Posto: Areia
P
P≤ P
P>P
N
jan
67,0
57,1
42,9
77
fev
94,0
54,5
45,5
77
mar
161,0
55,8
44,2
77
abr
174,0
51,3
48,7
76
mai
178,0
57,3
42,7
75
jun
204,0
59,2
40,8
76
jul
193,0
59,2
40,8
76
ago
132,0
55,2
44,8
76
set
65,0
58,6
41,4
75
out
32,0
68,9
31,1
74
P
P≤ P
P>P
N
61,0
65,3
34,7
54
88,0
58,7
41,3
55
154,0
48,1
51,9
57
171,0
57
43
54
164,0
57
43
54
168,0
59
41
63
149,0
50,6
49,4
56
100,0
57,3
42,7
53
52,0
60
40
57
19,0
60
40
56
nov
dez
31,0
42,0
67,5
61,3
32,5
38,7
74
75
Posto: Bananeiras
23,0
33,0
68
62,8
32
37,2
61
63
Tabela 4 – Valores médios mensais da precipitação em milímetros (P), probabilidade de ocorrer TMP’s menor ou
igual a NC (P≤P), maior que a NC (P>P) e tamanho da amostra em anos (N)
Região: Sertão
Posto: Patos
P
P≤ P
P>P
N
jan
66,0
62,6
37,4
73
fev
133,0
58,2
41,8
73
mar
207,0
52,2
47,8
69
abr
155,0
56,3
43,7
75
mai
60,0
60,5
39,5
75
jun
22,0
69,8
30,2
74
jul
9,0
68
32
71
ago
3,0
78,6
21,4
72
set
1,0
84
16
75
out
6,0
79,7
20,3
71
P
P≤ P
P>P
N
89,0
61,6
38,4
73
153,0
49,3
50,7
73
219,0
50,7
49,3
73
157,0
60,8
39,2
74
72,0
58,6
41,4
75
29,0
59,1
40,9
71
12,0
59,1
40,9
71
4,0
80
20
70
4,0
82,4
17,6
74
6,0
71,6
28,4
74
548
nov
dez
15,0
26,0
78,3
67,5
21,7
32,5
73
68
Posto: Sousa
13,0
33,0
77,5
68,5
22,5
31,5
71
73
Tabela 5 – Valores médios mensais da precipitação em milímetros (P), probabilidade de ocorrer TMP’s menor ou
igual a NC (P≤P), maior que a NC (P>P) e tamanho da amostra em anos (N)
Região: Cariri
Posto: Bodocongó
P
P≤ P
P>P
N
jan
16,0
63,1
36,9
57
fev
37,0
65
35
57
mar
80,0
60
40
55
abr
79,0
59
41
56
mai
53,0
62,6
37,4
56
jun
54,0
57
43
58
jul
48,0
50
50
58
ago
19,0
65
35
57
set
8,0
67,2
32,8
58
out
6,0
77,6
22,4
58
P
P≤ P
P>P
N
23,1
66,2
33,8
80
54,6
65
35
80
99,7
58,7
41,3
79
87,9
67,5
32,5
79
38,3
60,2
39,8
78
32,9
65,4
34,6
78
28,4
59,7
40,3
77
8,4
64,9
35,1
77
2,8
76
24
79
5,4
88,6
11,4
79
P
P≤ P
P>P
N
15,4
54,4
45,6
79
36,5
62,3
37,7
77
49,3
65,7
34,3
73
62,9
60,2
39,8
73
38,9
60
40
75
37,3
60
40
75
35,4
59,7
40,3
77
12,2
64,5
35,5
79
3,4
73,4
26,6
79
3,0
87,3
12,7
79
nov
dez
5,0
10,0
70,7
65,5
29,3
34,5
58
58
Posto: Soledade
3,4
10,8
82,3
74,7
17,7
25,3
79
79
Posto: Cabaceiras
3,0
6,8
72,7
77,9
27,3
22,1
77
77
Na prática é raro encontrar uma amostra de um evento meteorológico que tenha o valor numérico da média
aritmética posicionado exatamente em 50 por cento do total de casos. Comumente esse valor encontra-se entre 45 e
65 por cento do total de casos.
A Figura 1 resume os resultados das cinco regiões estudadas (Tabelas 1 a 5). Nota-se nas Figura 1(a, b, c)
que a média flutua em torno de 60 por cento dos TMP’s . Isso evidencia uma ótima representatividade dessa
estatística e uma boa distribuição dos TMP’s em todos os anos.
Na região do Sertão (Figura 1d) a média não é representativa para os meses secos: agosto, setembro e
outubro. Neles, aproximadamente, 80 por cento dos TMP’s estão abaixo do valor numérico da média e na região do
Cariri (Figura 1e) a média não é representativa para os meses secos: setembro, outubro e novembro. A não
representatividade da média nesses meses evidencia má distribuição dos TMP’s. Portanto recomenda-se cautela
quando se fizer uso dessas médias em modelos de previsão climática, principalmente se elas forem parâmetros
desses modelos.
Agreste
80
60
50
40
30
20
10
Campina Grande
Percntual
Percentual
70
Litoral
60
40
João Pessoa
Alhandra
20
0
0
jan fev mar abr mai jun jul ago set out nov dez
jan fev mar abr mai jun jul ago set out nov dez
(a)
(b)
549
100
Areia
Bananeiras
Percentual
Percentual
Sertão
Brejo
80
70
60
50
40
30
20
10
0
80
60
40
Patos
20
Sousa
0
jan fev mar abr mai jun jul ago set out nov dez
jan fev mar abr mai jun jul ago set out nov dez
(c)
(d)
Cariri
Percentual
100
80
60
40
Bodocongó
Soledade
Cabaceiras
20
0
jan fev mar abr mai jun jul ago set out nov dez
(e)
Figura 1- Probabilidade percentual para ocorrência de totais mensais precipitados – TMP’s menores ou iguais a
média aritmética
CONCLUSÃO
Para os meses mais secos das regiões tipicamente semi-áridas, cariri e sertão, a média aritmética não é uma
estatística representativa dos totais mensais precipitados—TMP’s.
REFERÊNCIAS BIBLIOGRÁFICAS
BROOKS, C.E.P. ; CARRUTHERS, N. Handbook of Statistical Methods in Meteorology. London, Her Magesty’s
Stationary Office, 412p., 1978.
550
Download

média aritmética