O Passeio Aleatório unidimensional
Michael Fowler
Atira a moeda ao ar, dá um passo
O passeio aleatório a uma dimensão constrói-se do seguinte modo:
Andas sobre um recta, cada passo com o peso comprimento.
Antes de cada passo, atiras uma moeda ao ar.
Se for caras, dás um passo em frente. Se for coroas, dás um passo atrás.
A moeda não está viciada, portanto a probabilidade de caras ou coroas é a mesma.
O problema consiste em calcular a probabilidade de estar numa dada posição ao fim de um certo número
de passos e, em particular, calcular a distância média à origem.
Mas porque é que este jogo nos interessa?
O passeio aleatório é central na Física Estatística. É essencial para prever quão rapidamente um gás se
difunde num outro, quão rápido o calor se propaga num sólido, quão grandes são as flutuações de pressão
num pequeno recipiente e muitos outros fenómenos estatísticos.
Einstein usou o passeio aleatório para calcular o tamanho dos átomos a partir do movimento Browniano.
A probabilidade de estar numa dada posição ao fim de n passos
Comecemos com um passeio de alguns passos, de comprimento unitário, e procuremos um padrão.
Definimos a função probabilidade 𝒇𝒇𝑡𝑡 (𝒏𝒏) como sendo a probabilidade de que num passeio de N
passos unitários, aleatoriamente para trás ou para a frente sobre a recta, começando em 0,
acabemos na posição n.
Dado que temos de terminar em algum sítio, a soma sobre n destas probabilidades tem de ser igual a 1.
Vamos listar apenas probabilidades não nulas.
Para um passeio de zero passos, 𝑓𝑓0 (0) = 1.
Para um passeio de um passo, 𝑓𝑓1 (βˆ’1) = 1/2, 𝑓𝑓1 (1) = 1/2.
1
1
Para um passeio de dois passos, 𝑓𝑓2 (βˆ’2) = 4 , 𝑓𝑓2 (0) = 2 , 𝑓𝑓2 (2) = 1/4.
Talvez seja útil enumerar a sequência de lançamentos da moeda que originam uma dada posição.
Para um passeio de três passos, CCC termina em 3, CCc, CcC e cCC termina em 1, e para os número
negativos é só trocar C e c. Há um total de 23 = 8 passeios de 3 passos diferentes, portanto a
probabilidade das diferentes posições finais é: 𝑓𝑓3 (βˆ’3) = 1/8 (só um passeio), 𝑓𝑓3 (βˆ’1) = 3/8 (três
3
passeios possíveis), 𝑓𝑓3 (1) = 8 , 𝑓𝑓3 (3) = 1/8.
Para um passeio de quatro passos, cada configuração de C’s e c’s tem uma probabilidade de (1/2)4 =
1/16.
Portanto 𝑓𝑓4 (4) = 1/16 dado que há apenas um passeio compatível – CCCC.
𝑓𝑓4 (2) = 1/4 porque há 4 passeios diferentes que terminam em 2 – CCCc, CCcC, CcCC, cCCC.
𝑓𝑓4 (0) = 3/8, - CCcc, CcCc, CccC, ccCC, cCCc, cCcC.
Probabilidades e o Triângulo de Pascal
Ignorando o factor (1/2)𝑁𝑁 , há um padrão nestas probabilidades:
Isto é o Triângulo de Pascal – cada entrada é a soma das duas diagonalmente acima. Estes número são de
facto os coeficientes que aparecem na expansão binomial de (π‘Žπ‘Ž + 𝑏𝑏)𝑁𝑁 .
Por exemplo, a linha de 25 𝑓𝑓5 (𝑛𝑛) tem os coeficientes binomiais:
(π‘Žπ‘Ž + 𝑏𝑏)5 = π‘Žπ‘Ž5 + 5π‘Žπ‘Ž4 𝑏𝑏 + 10π‘Žπ‘Ž3 𝑏𝑏 2 + 10π‘Žπ‘Ž2 𝑏𝑏 3 + 5π‘Žπ‘Žπ‘π‘ 4 + 𝑏𝑏 5
Para vermos como é que estes coeficientes binomiais se relacionam com o nosso passeio aleatório,
escrevemos:
(π‘Žπ‘Ž + 𝑏𝑏)5 = (π‘Žπ‘Ž + 𝑏𝑏) × (π‘Žπ‘Ž + 𝑏𝑏) × (π‘Žπ‘Ž + 𝑏𝑏) × (π‘Žπ‘Ž + 𝑏𝑏) × (π‘Žπ‘Ž + 𝑏𝑏)
e pensamos nisto como a soma de todos os produtos que se podem escrever escolhendo um termo de cada
parêntisis. Há 25 = 32 termos desses (escolhendo um dos dois de cada dos cinco parêntisis), portanto o
coeficiente de π‘Žπ‘Ž3 𝑏𝑏 2 deve ser o número de termos desses 32 que têm 3 π‘Žπ‘Žβ€™s e 2 𝑏𝑏’s.
Mas isso é o mesmo que o número de diferentes sequências que se podem escrever rearranjando CCCcc,
logo é claro que as probabilidades do passeio aleatório e os coeficientes binomiais são o mesmo conjunto
de números (excepto que as probabilidades têm de ser divididas por 32 para que a sua soma seja um).
Calcular as probabilidades usando a função Factorial
O modo mais eficiente de calcular estes coeficientes é usar a função factorial. Supõe que temos cinco
objectos
distintos,
A,B,C,D,E.
Quantas
sequências
diferentes
podemos
formar:
ABCDE,ABDCE,BDCAE,etc? Bom, o primeiro elemento da sequência pode ser qualquer um dos cinco.
O seguinte é um dos restantes quatro, etc. Portanto, o número total de sequências diferentes é 5 × 4 × 3 ×
2 × 1, que é chamado β€œcinco factorial” e escreve-se 5!.
Mas quantas sequências diferentes podemos fazer com CCCcc? Por outras palavras, se escrevêssemos
todas as 5! (120) sequências, quantas delas seriam realmente diferentes?
Uma vez que os dois c’s são iguais, não seríamos capazes de distinguir as sequências em que eles
aparecessem trocados, por isso baixamos logo de 120 para 60. Mas os três H’s também são idênticos, e se
fossem diferentes haveria 3!=6 maneiras diferentes de os arranjar. Como são iguais, essas 6 maneiras
correspondem a uma só, pelo que dividimos 60 por 6, restando apenas 10 sequências diferentes com 3 C’s
e 2 c’s.
O mesmo argumento se aplica a qualquer número de C’s e c’s. O número total de diferentes sequências de
m C’s e n c’s é (π‘šπ‘š + 𝑛𝑛)!/((π‘šπ‘š!)(𝑛𝑛!)) , onde os factoriais no denominador traduzem o facto de que trocar
os C’s ou os c’s entre si dá a mesma sequência.
Também vale a pena mencionar que no passeio de cinco passos que termina em -1, o qual tem
probabilidade 10/25 , o quarto passo teve de ser 0 ou -2. Olhando para o Triângulo de Pascal, vemos que
a probabilidade de um passeio de quatro passos terminar em 0 é 6/24 e a de terminar em -2 é 4/24 . Em
qualquer dos casos, a probabilidade do passo seguinte ser -1 é ½ , logo a probabilidade total de chegar a -1
1
6
4
em cinco passos é 2 × 24 + 1/2 × 24 . Portanto a propriedade do Triângulo de Pascal de que qualquer
entrada é a soma das duas diagonalmente acima é consistente com as nossas probabilidades.
A Distribuição de Probabilidade
Vale a pena visualizar esta distribuição de probabilidade para ganhar intuição sobre o passeio aleatório.
Para 5 passos, temos:
Consideremos agora uma passeio maior. Após 100 passos, qual é a probabilidade de terminar num inteiro
n?
Isto acontecerá se o número de passos para a frente exceder em n o número de passos para trás (n pode ser
um número negativo).
Isto é,
de onde
𝑛𝑛𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 =
𝑛𝑛𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 βˆ’ 𝑛𝑛𝑑𝑑𝑑𝑑 á𝑠𝑠 = 𝑛𝑛
𝑛𝑛𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 + 𝑛𝑛𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 = 100
1
(100 + 𝑛𝑛),
2
𝑛𝑛𝑑𝑑𝑑𝑑 á𝑠𝑠 =
1
(100 βˆ’ 𝑛𝑛)
2
Repara que, no caso geral, se o número total de passos N for par, 𝑛𝑛𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 , 𝑛𝑛𝑑𝑑𝑑𝑑 á𝑠𝑠 são ambos pares ou ambos
ímpares, logo 𝑛𝑛, a diferença entre eles, é par. Analogamente N ímpar implica 𝑛𝑛 ímpar.
O número total de caminhos que terminam no ponto 𝑛𝑛 é, pelo argumento cara/coroa anterior,
100!
�𝑛𝑛𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 !οΏ½(𝑛𝑛𝑑𝑑𝑑𝑑 á𝑠𝑠 !)
=
100!
1
1
οΏ½2 (100 + 𝑛𝑛)οΏ½ ! οΏ½ (100 βˆ’ 𝑛𝑛)οΏ½ !
2
.
Para encontrarmos a probabilidade de terminarmos em 𝑛𝑛 após 100 passos, precisamos de saber qual a
fracção de caminhos que terminam em 𝑛𝑛. (dado que o lançamento da moeda é puramente aleatório,
tomamos as probabilidades de todos os caminhos idênticas). O número total de caminhos com 100 passos
possíveis é 2100 β‰… 1.26 × 1030 .
Usámos o Excel para representar graficamente esta a razão: (número de caminhos que terminam em
𝑛𝑛)/(número total de caminhos) para caminhos de 100 passos:
A probabilidade de terminarmos na origem é cerca de 8%, tal como (aproximadamente) a probabilidade
de terminarmos 2 passos para a esquerda ou direita. A probabilidade de terminarmos a menos de 10 passos
do início é maior que 70%, e a de estarmos afastados mais do que 20 passos é bem menor que 5%.
(Nota: é fácil construíres tu próprio este gráfico no Excel. Escreve -100 em A1, depois =A1+2 em A2,
depois =(FACT(100))/(FACT(50-A1/2)*FACT(50+A1/2))*2^-100 em B1, e arrasta uma cópia desta
fórmula até à linha 101. Depois selecciona as duas colunas, clica no Assistente de Gráficos, etc.)
Também vale a pena fazer um gráfico logarítmico, para obter uma ideia mais clara do modo como as
probabilidades diminuem para valores de 𝑛𝑛 afastados da origem.
Isto parece uma parábola – e é! Bom, para ser preciso, o logaritmo da distribuição de probabilidade tende
para uma parábola quando N se torna muito grande, desde que 𝑛𝑛 seja muito menor que N, e de facto este
é o limite importante em Física Estatística.
O logaritmo natural da probabilidade de terminarmos o caminho em 𝑛𝑛 tende para ln 𝐢𝐢 βˆ’ 𝑛𝑛2 /200, onde a
constante C é a probabilidade (100!/50! 50!)/2100 de terminarmos exactamente onde começámos.
Isto significa que a probabilidade 𝑃𝑃(𝑛𝑛) é dada por:
𝑃𝑃(𝑛𝑛) =
𝑛𝑛 2
βˆ’
200
𝐢𝐢𝑒𝑒
,
𝐢𝐢 β‰… 0.08
Esta é chamada uma distribuição de probabilidade Gaussiana. O ponto importante a ter em conta é que a
probabilidade decai drasticamente quando a distância à origem é superior a 10. Diminuir um espaço
vertical é um factor de 100!
Derivação do resultado usando a Fórmula de Stirling
Para 𝑁𝑁 muito grande, a dependência exponencial em 𝑛𝑛2 pode ser derivada matematicamente usando a
Fórmula de Stirling ln 𝑛𝑛! β‰… 𝑛𝑛 ln 𝑛𝑛 βˆ’ 𝑛𝑛, que resulta de:
𝑛𝑛
ln 𝑛𝑛! = ln 1 + ln 2 + ln 3+. . + ln 𝑛𝑛 β‰… οΏ½ ln π‘₯π‘₯ 𝑑𝑑𝑑𝑑 = [π‘₯π‘₯ ln π‘₯π‘₯ βˆ’ π‘₯π‘₯]𝑛𝑛0 = 𝑛𝑛 ln 𝑛𝑛 βˆ’ 𝑛𝑛.
0
Para um passeio de N passos, o número total de caminhos que terminam em 𝑛𝑛 é
𝑁𝑁!
.
1
1
οΏ½ (𝑁𝑁+𝑛𝑛)οΏ½!οΏ½ (π‘π‘βˆ’π‘›π‘›)οΏ½!
2
2
Para acharmos a probabilidade 𝑃𝑃(𝑛𝑛) de tomarmos um destes caminhos, dividimos pelo número total de
caminhos que é 2𝑁𝑁 .
Aplicando a fórmula de Stirling
E aproximando
(usando ln(1 ± π‘₯π‘₯) β‰… ±π‘₯π‘₯ βˆ’ π‘₯π‘₯ 2 /2 para π‘₯π‘₯ pequeno) o lado direito fica simplesmente – 𝑛𝑛2 /2𝑁𝑁.
Na realidade, podemos até obter o factor multiplicativo para o limite de N elevado (𝑛𝑛 muito menor que N)
1
usando uma versão mais rigorosa da fórmula de Stirling, ln 𝑛𝑛! β‰… 𝑛𝑛 ln 𝑛𝑛 βˆ’ 𝑛𝑛 + 2 2πœ‹πœ‹πœ‹πœ‹. Isto dá-nos
𝑃𝑃(𝑛𝑛) =
2
√2πœ‹πœ‹πœ‹πœ‹
𝑛𝑛 2
𝑒𝑒 βˆ’2𝑁𝑁 .
Para N=100, vem 𝑃𝑃(0) = 0.08 mais ou menos 1%, tal como vimos com o Excel. A normalização pode
ser verificada usando o resultado conhecido para o integral Gaussiano, lembrando que 𝑃𝑃(𝑛𝑛) só é não nulo
se 𝑁𝑁 βˆ’ 𝑛𝑛 for par.
Então, a que distância esperar acabar?
Como os passos para a frente e para trás são equiprováveis em qualquer instante, a posição final média
esperada é de volta à origem. A questão interessante é quão longe da origem, em média, esperas acabar,
independentemente da direcção. Para nos livrarmos da direcção, calculamos o valor esperado do
quadrado da distância final à origem, a β€œdistância quadrática média”, e de seguida tomamos a raiz
quadrada. Esta chama-se a distância rms (β€œroot mean square”).
Por exemplo, pegando nas probabilidades para o passeio de cinco passos, e somando +5 com -5 etc, o
valor esperado de 𝑛𝑛2 é:
2βˆ™
5
10 2 160
1
βˆ™ 52 + 2 βˆ™
βˆ™ 32 + 2 βˆ™
βˆ™1 =
= 5.
32
32
32
32
Isto é, a distância rms à origem ao fim de 5 passos é √5. De facto,
A distância rms à origem após um passeio aleatório de 𝒏𝒏 passos unitários é βˆšπ’π’.
Uma boa maneira de provar este resultado para qualquer número de passos é introduzindo a ideia de
variável aleatória. Se π‘₯π‘₯1 for uma dessas variáveis, então toma o valor +1 ou -1 com igual probabilidade
da cada vez que a verificarmos. Por outras palavras, se me perguntares β€œQual é o valor de π‘₯π‘₯1 ?” eu lanço
uma moeda ao ar, e respondo β€œ+1” se sair cara ou β€œ-1” se sair coroa. Por outro lado, se me perguntares
β€œQual é o valor de π‘₯π‘₯12 ?” eu digo imediatamente β€œ1” sem me dar ao trabalho de lançar a moeda. Usaremos
parêntisis <> para denotar valores médios (isto é, valores esperados). Portanto para uma moeda não
viciada, < π‘₯π‘₯1 >= 0, < π‘₯π‘₯12 >= 1.
O ponto final de um passeio aleatório de 𝑛𝑛 passos pode ser escrito como uma soma de 𝑛𝑛 variáveis
destas:
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 = π‘₯π‘₯1 + π‘₯π‘₯2 + β‹― + π‘₯π‘₯𝑛𝑛
O valor esperado do quadrado do comprimento do caminho é então:
< (π‘₯π‘₯1 + π‘₯π‘₯2 + π‘₯π‘₯3 + β‹― + π‘₯π‘₯𝑛𝑛 )2 >
Se quadrarmos o termo lá dentro, ficamos com 𝑛𝑛2 termos. Destes, 𝑛𝑛 são do tipo < π‘₯π‘₯12 > logo iguais a 1.
Todos os outros são do tipo < π‘₯π‘₯1 π‘₯π‘₯2 >. Mas isto é o produto de dois lançamentos diferentes, e tem valor
+1 para CC e cc, e -1 para Cc e cC. Portanto a média é zero, e podemos eliminar todos estes termos. Então
< (π‘₯π‘₯1 + π‘₯π‘₯2 + π‘₯π‘₯3 + β‹― + π‘₯π‘₯𝑛𝑛 )2 >= 𝑛𝑛,
Isto é, a distância rms é βˆšπ’π’ no caso geral.
Flutuações de densidade num pequeno volume de gás
Supõe que temos uma pequena caixa contendo N moléculas de gás. Assumimos que a interacção entre as
moléculas é desprezável, e que elas ressaltam dentro da caixa independentemente.
Se num dado instante inserirmos uma divisõria exactamente a meio da caixa, esperamos encontrar em
média 50% das moléculas na metade direita da caixa.
A questão é: quão perto de 50%? Qual é o desvio que esperamos encontrar? 51% é muito improvável?
Uma vez que as N moléculas se estão a mover aleatoriamente dentro da caixa, podemos atribuir uma
variável aleatória 𝑦𝑦𝑛𝑛 a cada molécula, onde 𝑦𝑦𝑛𝑛 = 1 se a π‘›π‘›π‘‘π‘‘β„Ž molécula estiver do lado direito ou igual a
zero estiver do lado esquerdo, e os valores 0 e 1 são igualmente prováveis. O número total de moléculas
𝑁𝑁𝑅𝑅 na metade direita da caixa é então:
𝑁𝑁𝑅𝑅 = 𝑦𝑦1 + 𝑦𝑦2 + β‹― + 𝑦𝑦𝑁𝑁 .
Esta soma de 𝑁𝑁 variáveis aleatórias parece-se muito com o passeio aleatório! De facto, são equivalentes.
Define uma variável aleatória π‘₯π‘₯𝑛𝑛 por:
𝑦𝑦𝑛𝑛 =
1
(1 + π‘₯π‘₯𝑛𝑛 )
2
Dado que 𝑦𝑦𝑛𝑛 toma valor 0 ou 1 com igual probabilidade, π‘₯π‘₯𝑛𝑛 toma os valores -1 e 1 com igual
probabilidade – então π‘₯π‘₯𝑛𝑛 é idêntica à nossa variável do passo no passeio aleatório. Logo,
𝑁𝑁𝑅𝑅 = 𝑦𝑦1 + 𝑦𝑦2 + β‹― + 𝑦𝑦𝑁𝑁 =
1
𝑁𝑁 + π‘₯π‘₯1 + π‘₯π‘₯2 + β‹― + π‘₯π‘₯𝑁𝑁
2
É evidente que a soma de um passeio com N passos dá o desvio do número de moléculas em metade do
recipiente de N/2. Portanto, da nossa análise do passeio aleatório concluimos que o valor esperado deste
desvio é βˆšπ‘π‘ . Por exemplo, se o recipiente contiver 100 moléculas, esperamos um desvio de cerca de
10% em cada medição.
Mas qual o desvio esperado num recipiente suficientemente grande que se veja, cheio de moléculas de ar
à temperatura ambiente? Tomemos um cubo com 1mm de lado. Contém cerca de 1016 moléculas.
Portanto, o número de moléculas do lado direito flutua no tempo por um valor da ordem de √1016 = 108 .
Este é um número grande, mas como fracção do número total, é só uma parte em 108 !
A probabilidade de flutuações maiores é incrivelmente pequena. A probabilidade de um desvio de π‘šπ‘š do
valor médio 𝑁𝑁/2 é:
2π‘šπ‘š 2
𝑁𝑁 .
𝑃𝑃(π‘šπ‘š) = 𝐢𝐢𝑒𝑒 βˆ’
Portanto a probabilidade de uma flutuação de uma parte em 10000000, que seria 10βˆšπ‘π‘, é da ordem de
𝑒𝑒 βˆ’200 , ou cerca de 10βˆ’85 . Se verificarmos o gás a cada trilionésimo de segundo durante toda a idade do
Universo não nos levaria nem perto de vermos isto acontecer. É por isto que, à escala humana, os gases
são tão suaves e contínuos. Os efeitos cinéticos não se manifestam em flutuações de densidade e pressão
observáveis – uma das razões pela qual levou tanto tampo à teoria atómica para ser geralmente aceite.
Tradução/Adaptação Casa das Ciências 2009
Download

O Passeio AleatΓ³rio unidimensional