c
°Paulo
Rodrigues Lima Vargas Moniz
TÓPICOS DE RELATIVIDADE E
COSMOLOGIA
Apontamentos para Aulas Teóricas
(“Lecture Notes”)
Departamento de Fı́sica
Universidade da Beira Interior
Setembro de 2003
-1
NOTA
Aos (Às) aluno(a)s, a interessados, a criticos e para os que é “pouco, não
chega, não é assim”:
Esta é a versão −7 − λ, onde λ ∈ <+ e λ À 1. Falta bastante, mas
pretende-se que a assistência tenha um guia para s “lectures”. Isto é pois um
(very!!) modest and rough draft do que se wish it will become. Be patient...:
Ad interim in medias res absit omen.
0
1
A Relatividade Restrita
A teoria Newtoniana colocava o espaço e o tempo como conceitos totalmente
separados. O tempo era absoluto, igual para todos os observadores e as
distancias eram imutáveis entre observadores. A teoria da relativade restrita
de A. Einstein vem colocar estas duas entidades numa única, o espaço-tempo
quadri-dimensional.
Para se formular sumáriamente a relatividade restrita há que tomar o
conceito de referencial inercial S: um sistema de coordenadas, onde se tem as
dimensões espaciais x, y, z, mutualmente ortogonais e um sistema de relógios
(inerciais) sincronizados em repouso nesse referencial, fornecendo um tempo
coordenado t. A caracteristica essencial destes referenciais é que a descrição
do movimento é formulada nestas variáveis então a primeira lei de Newton é
válida. Daqui vem que se um S e S 0 são referenciais inerciais então S 0 movese com velocidade constante e sem rotação relativamante a S. Refira-se que
neste contexto as coordenadas (t, x, y, z) identificam pontos no espaço-tempo
e cada ponto corresponde a um evento (ou acontecimento): por exemplo, um
relâmpago súbito que em (t = T, x ± ∆x, y ± ∆y, z ± ∆z) ilumina todos
as localizações espaciais (x ± ∆x, y ± ∆y, z ± ∆z) de uma sala às escuras
imediatamente antes e depois.
A relatividade restrita é baseada em dois postulados:
• A velocidade da luz c é a mesma em todos os referenciais inerciais
• As leis da natureza são as mesmas em todos os referenciais inerciais
Assim sendo, então de
dr
dr0
= 0
(1)
dt
dt
para a velocidade de um raio de luz no vazio nos referenciais S e S 0 , extraimos
que
c2 dt2 − dx2 − dy 2 − dz 2 = c2 dt02 − dx02 − dy 02 − dz 02 = 0
(2)
c=
implicando que há uma quantidade invariante em relatividade restrita interrelacionando tempo e espaço:
ds2 ≡ c2 dt2 − dx2 − dy 2 − dz 2
1
(3)
A quantidade ds é o elemento de linha espacio-temporal. A invariância está
indicada em (2) para trajectórias luminosas e iremos ver como é noutros casos
adiante. A presença desta invariância está ligada (como em vários outras
situações semelhantes em fı́sica) à existência de determinadas simetrias no
espaço-tempo quadri-dimensional.
Em teoria da relatividade emprega-se usualmente a convenção xµ , onde
µ = 0, 1, 2, 3 para indexar coordenadas no espaço-tempo através de
x0 ≡ ct,
x1 ≡ x,
x2 ≡ y,
x3 ≡ z
(4)
empregando uma representação matricial (ou tensorial, como se especificará
em mais detalhe no capitulo 3) para o elemento de linha ou intervalo espaciotemporal
ds2 ≡ ηµν dxµ dxν = ηµν dx0µ dx0ν
(5)
onde




ηµυ = 
1
0
0
0
0
−1
0
0
0
0
−1
0
0
0
0
−1





(6)
representa a métrica do espaço-tempo (designado de Minkowski) e à qual
corresponderá uma geometria Lorentziana (como já iremos explicar). Assumimos a convenção de soma de indices de Einstein. A matriz em (6)
constitui uma representação do tensor da métrica de Minkowski. As leis da
natureza serão equações (incluindo tensores) tal como (5) que são invariantes
sob acção de uma transformação de coordenadas de S para S 0 .
Essas aplicações entre referenciais inerciais são designadas de transformações
de Lorentz. Na sua forma mais abrangente as transformações entre dois referenciais inerciais podem ser expressas na forma (admitindo uma representação
matricial)
0
x0µ = Λµ ν xν + C µ
(7)
0
onde Λµ
ν
e C µ são constantes. Diferenciando (7) e usando (5) obtemos que
ηµυ = Λρ
0
µΛ
σ0
ν ηρσ
(8)
e que caracteriza as trasformações de Lorentz. Para C µ = 0 temos as
transformações homogéneas e para C µ 6= 0 temos as as transformações nãohomogeneas, constituindo o grupo de transformações de Poincaré. No caso
homogéneo o grupod e transformações é designado de grupo de Lorentz,
2
Figura ...
Figure 1: Representação de ...
onde as origens dos referencias inerciais coicidem em t = t0 = 0. Além das
rotações no espaço Euclidiano tri-dimensional onde (x, y, z) → (x0 , y 0 , z 0 ), incluem também o caso de transformações onde (t, x) → (t0 , x0 ), designadas de
“boost”, associada a quando um dos referencias se move com velocidade relativa V constante e uniforme com respeito ao outro, como ilustrada na figura
junta. Nesse caso simples de movimento ao longo do eixo dos xx, verifica-se
que as transformações de Lorentz têm a forma
µ
0
t
=
x0 =
y0 =
z0 =
V
γ t−x 2
c
γ (x − V t)
y
z
¶
(9)
(10)
(11)
(12)
ou então na forma matricial





ct0
x0
y0
z0






=


γ
−V γ/c
−V γ/c
γ
0
0
0
0
3
0
0
1
0
0
0
0
1





ct
x
y
z





(13)
com
Ã
V2
γ ≡ 1− 2
c
!−1/2
(14)
Se fizermos tanh ψ = V /c, então também se pode escrever
ct0
x0
y0
z0
=
=
=
=
ct cosh ψ − x sinh ψ
x cosh ψ − ct sinh ψ
y
z
(15)
(16)
(17)
(18)
o que é mais parecido (formalmente) com uma rotação espacial mas não
sendo uma de forma alguma. Das transformações de Lorentz obtem (e.g.,
por diferenciação) que a lei de adição de velocidades é alterada, sendo para
o caso de dois referencias inercias S e S 0 , onde S 0 se move no eixo dos xx
com velocidade V relativamente a S e se um observador em S 0 regista um
movimento de uma particula no eixo dos xx com velocidade W , então o
observador S resgistas esse movimento no eixo dos xx com velocidade
U=
V +W
1 + V W/c2
(19)
Analisemos agora as consequências fisicas da transformação de Lorentz
em que (t, x) → (t0 , x0 ). Um facto imediato é que acontecimentos simultâneos
num referencial S já não o serão em S 0 . Seja por exemplo o acender dos faróis
de um carro em S que se tomam como simultâneos em t1 = t2 = t0 e separados
espacialmente entre
x´1 e x2 . Pela transformação de Lorentz (9) obtem-se em
³
V
0
0
S que ∆t = γ ∆x c2 : os acontecimentos em S 0 não são simultâneos, devido
à separação espacial em S.
O tempo em relatividade restrita adquire ainda um outro contexto bastante relevante. Cada referencial inercial possui o seu tempo coordenado. É
possivel introduzir um conceito de tempo invariante associado com um dado
observador cuja posição no espaço é um ponto. O seu percurso no espaçotempo é designado de linha ou percurso de existência (ou de história) 1 .
Define-se então para esse observador (que coincide com a sua origem das coordenads) o seu tempo próprio τ, cujo intervalo dτ corresponde ao progresso
1
Em lingua Inglesa usa-se a designação “world line”, que alguns preferem traduzir como
linha do universo. Propomos aqui uma designação diferente.
4
de um relógio comóvel com ele, registando para ele o tempo que progride
enquanto segue ao longo da sua linha de existência. Para outro observador
num referencial inercial S, com coordenadas t, x, y, z, regista as variações de
coordenadas relacionando-as através de
c2 dτ 2 = c2 dt2 − dr2 − dy 2 − dz 2 = ηµν dxµ dxν
ou por
Ã
V2
dτ = 1 − 2
c
(20)
!1/2
dt
(21)
onde V é a velocidade do observador com tempo próprio τ relativamente a S.
Para esse observador, o tempo próprio é o seu tempo coordenado; É o tempo
registado por um relógio que se move junto com particula ou observador ao
longo da sua linha de existência ou de história. Verifica-se então que de (21)
se tem
Ã
!1/2
V2
∆τ = 1 − 2
∆t
(22)
c
onde ∆t é o intervalo de tempo coordenado registado por relógios estacionários e sincronos em S, enquanto que ∆τ é o intervalo de tempo próprio
para esses mesmos acontecimentos mas tal como registados por relógio que se
move junto com o referencial onde esses acontecimentos ocorrem na mesma
localização espacial. Um exemplo desses acontecimentos são os batimentos
ou intervalos de progresso de um relógio em S 0 . Temos então que
∆t > ∆τ
(23)
pelo que um relógio em movimento progride mais lentamente relativamente
a um relógio idêntico em S. Este é o fenómeno da dilatação do tempo.
Também a noção de espaço ou comprimento espacial em relatividade restrita adquire um contexto importante. Suponhamos que temos uma régua
rigida movendo-se na direcção do seu comprimento (e.g., a direcção positiva
do eixo dos xx) com uma velocidade V relativamante ao referencial inercial S como na figura junta. Seja S 0 o referencial inercial onde a régua está
fixa e assim em repouso. Define-se como comprimento próprio `0 como o
comprimento dessa régua tal como medido em S 0 onde
`0 = x02 − x01
5
(24)
Figura ...
Figure 2: Representação de ...
em que x02 e x01 são as coordenadas espaciais das extremidades da régua em S 0 .
Usando as transformações de Lorentz (10) para determinar as coordenadas
espaciais das extremidades em S e tomando a diferença no mesmo instante
de tempo t em S, obtemos que (para o comprimento medido em S dado por
` = x2 − x1 )
!1/2
Ã
V2
`0
(25)
`= 1− 2
c
e assim
` < `0
(26)
ao que corresponde uma contracção no comprimento para a régua que está
em movimento e tal como registado em S. Saliente-se que se a régua se
movesse numa direcção perpendicular ao seu comprimento (e.g., estivesse
alinhada com eixo dos yy mas movimento fosse no eixo dos xx) não haveria
contracção. Daı́ que para volumes (e claro para densidades) se deve tomar a
contracção espacial como
Ã
V2
slV = 1 − 2
c
!1/2
slV0
(27)
Consideremos agora a descrição geométrica do espaço-tempo da relatividade restrita. Num espaço tempo quadri-dimensional introduz-se o conceito
6
de quadri-vector, com a notação de
o
n
n
o
λ →λµ = λ0 , λ1 , λ2 , λ3 = λ0 , ~λ
(28)
empregando a métrica ηµν para levantar e baixar indices (no capitulo 3 ficará
mais claro porquê) através de
n
λµ = ηµν λν = λ0 , −λ1 , −λ2 , −λ3
o
(29)
pelo que o produto escalar toma a forma
λ · σ = λµ σ µ = ηµν λν σ µ = λ0 σ 0 − λ1 σ 1 − λ2 σ 2 − λ3 σ 3
(30)
Um aspecto que é então pertinente de salientar é que um quadrivector pode
determinar que
ηµν λν λµ





> 0 → tipotempo
= 0 → tiponuloouluz
< 0 → tipoespaço
(31)
Esta designação tem a ver com a estrutura e representação de espaço tempo
em diagramas. Relembre-se que para um raio de luz c2 dt2 −dx2 −dy 2 −dz 2 =
0, pelo que se usa (ver figura junta) a convenção de representar o espaçotempo (ignorando uma dimensão espacial) com o eixo do tempo apontando
na vertical e dois eixos espaciais de xx e yy, por exemplo, ortogonais ao
primeiro definindo linhas e um plano horizontal.
Os raios de luz fazem ângulos de 45o entre eixos com escala ct e o de
xx (ou entre o eixo do tempo e o eixo de dimensão espacial, como yy, se
tomarmos unidadees tais que c = 1). Todas as direcções percorridas por
fotões a partir de um ponto O no espaço tempo define um cone de luz (ou
nulo) de equação c2 t2 = x2 + y 2 + z 2 . De facto, são dois desses cones, um
apontando para instantes futuros aos de O e outro para instantes passados.
Ao primeiro chamamos de cone de luz do futuro e ao segundo cone de luz do
passado. Constituem pois pontos ou acontecimentos no espaço-tempo que
estão no futuro ou no passado de O, respectivamente, sendo alcançados por
raios de luz. Todos os pontos no interior do cone de luz do futuro constituem
com esse cone acontecimentos no futuro relativamente a O, enquanto que
os no interior e no cone do passado são pontos que estão no passado causal
de O. Estas duas regiões relacionam-se causalmente com O: As no cone
de luz do passado e seu interior poderão influenciar O, enquanto que O
7
Figura ...
Figure 3: Representação de ...
pode influenciar os pontos no cone de luz e do futuro e seu interior. Tal
deve-se a que a transmissão de qualquer sinal ou informação se fará com
velocidades V ≤ c. As regiões fora destes cones contêm pontos que nunca
poderão relacionar-se causalmente com O pois teriamos uma transformação
de informação com V > c. Daı́ a designação em (31) onde um quadrivector que esteja orientado no espaço-tempo no interior do cone de luz diz-se
tipo-tempo, se no seu exterior é designado de tipo-espaço e se sobre o cone
de luz é designado de tipo-luz ou tipo-nulo. Fotões descrevem trajectórias
sempre tangentes aos cones de luz enquanto que as linhas de existência ou
de história de um corpo (pontual) com massa m descrevem trajectrias no
espaço-tempo que têm V < c e por isso estão sempre no interior dos cones de
luz definidos em cada ponto dessa trajectória, a qual é uma linha que pode
ser parametrizada pelo tempo próprio τ.
Os diagramas de Minkowski para o espaço-tempo da relatividade restrita
permitem representar também as trnasformações de Lorentz entre dois referenciais inerciais S e S 0 . Note-se (como indicado na figura junta) que o eixo
dos x0 x0 de S 0 é dado por t0 = 0, i.e., t = xV /c2 , enquanto que o eixo do tempo
t0 é dado por x0 = 0, i.e., por x = V t. Fazendo c = 1 a inclinação do eixo dos
x0 x0 relativamente a S é V enquanto que a inclinação do eixo do tempo t0 é
dada por 1/V . Assim se os eixos do espaço-tempo em S estão ortogonais,
8
Figura ...
Figure 4: Representação de ...
a representação de S 0 neste diagrama não terá os eixos correspondentes do
tempo e direcções espaciais ortogonais mas sim inclinados. Acontecimentos
simultâneos em S são representados por uma linha paralela ao eixo dos xx
enquanto que os simultâneos em S 0 constituem linhas paralelas a x0 x0 . Daı́ a
dependencia do conceito de simultaniedade no referencial usado.
Após a discussão cinemática da relatividade restrita feita atrás, podemos
agora considerar alguns aspectos acerda da dinâmica relativista.
A linha de existência ou de história de uma particula com massa m é
dada por xµ (τ ) e tem como vector tangente a essa linha o quadrivector uµ =
dxµ
. Verifica-se que ηµν uν uµ = c2 , sendo um vector tipo-tempo e estando no
dτ
interior do cone de luz em cada ponto ou acontecimento da linha referida. A
velocidade coordenada
V µ (e que não é um
é definida como
n
o
n quadri-vector)
o
dxµ
dt
µ
µ
µ
V = dt = c, V~ , tal que u = dτ V = γc, γ V~ .
O quadri-momento é dado por
pµ = muµ
(32)
onde m é a massa em repouso da particula. Também se escreve
pµ = {E/c, p~}
9
(33)
Para fotões temos
pµ = h̄k µ
onde h̄ =
h
,
2π
(34)
h sendo a constante de Planck e com o quadrivector de onda
½
µ
k =
¾
2π ~
,k =
λ
½
2π 2π
, ~n
λ λ
¾
(35)
sendo ~n um vector unitário na direcção de propagação. Tem-se que k µ kµ = 0
pelo que pµ pµ = 0 e a energia do fotão é E = hc/λ = hf.
Notar que de (32) e (33) se tem que p~ = γmV~ e E/c = p0 = γmc. Temos
então que
1
(36)
E = γmc2 ' mc2 + mV 2 + · · ·
2
Verifica-se que a parte espacial de pµ se reduz a p~ = mV~ quando V ¿ c
mas a energia total reduz-se a um termo cinético usual na descrição Newtoniana somado de mc2 que constitui a sua energia em repouso. Da in0
variancia de pµ pµ = pµ pµ0 sob acção de uma transformação de Lorentz,
usando que em S 0 (o referencial instantaneo de repouso da particula) onde
0
pµ = {mc, 0}obtemos que
E 2 = p2 c2 + m2 c4
(37)
A justificação de E = γmc2 pode ser feita do seguinte modo. Notemos que
a segunda lei de Newton escreve-se como



~
~
dp
F · V ~
fµ =
≡
,F
 c

dτ
µ
(38)
Igualmente se tem que
dp0
dp0
γ
= F~ · V~ ⇒ F~ · V~ = c
dτ
c
dt
(39)
representando a taxa a que a força F~ produz energia transferida para a particula pelo que se pode definir a energia como E = cp0 . Neste contexto tem-se
que em colisões e na ausência de forças externas se verifica a conservação de
quadri-momento, na forma
X
pµ = cons tan te
todasasparticulas
10
(40)
Figura ...
Figure 5: Representação de ...
significando que se conserva a energia total assim como as componentes espaciais do momento.
Um exemplo relevante é aquele em que um fotão colide elásticamente
com um particula estacionária (e.g., um electrão). Podemos assumir para
simplificar (ver figura junta) que o fotão inicialmente se move na direcção
positiva do eixo dos xx e após a colisão a direcção do fotão faz um ângulo θ
com o eixo dos xx e o electrão um ângulo φ. Antes da colisão temos
(
(antes) µ
pf otão
(antes) µ
pelectrão
=
)
hf hf
,
, 0, 0
c c
(41)
= {mc, 0, 0, 0}
(42)
e depois verifica-se
(
(depois) µ
pf otão
(depois) µ
pelectrão
)
hf 0 hf 0
hf 0
,
cos θ,
sin θ, 0
c
c
c
(43)
= {γmc, γmV cos φ, −γmV sin φ, 0}
(44)
=
Usando as leis de conservação (antes) pµfotão +(antes) pµelectrão =(depois) pµfotão +(depois)
pµelectrão obtemos que a frequência final f 0 do electrão se relaciona com a
11
Figura ...
Figure 6: Representação de ...
frequência inicial f como
f0 =
f
1+
hf
(1
mc2
− cos θ)
(45)
constituindo o efeito de Compton.
Outro efeito de importante aplicação é o efeito de Doppler relativista.
É inteiramente cinemático e pode ser exemplificado com recurso a outros
elementos da teoria. Vamos mostrar que com uso das transformações de
Lorentz aplicadas a k µ . O contexto fisico é o seguinte. Suponhamos que
temos uma fonte luminosa que se move relativamente a um referencial inercial
S com velocidade V na direcção positiva do eixos do xx.
Num dado instante um observador na origem O recebe um fotão que faz
um ângulo θ com a direcção positiva do eixo dos xx como indicado na figura
junta. Assumamos que à fonte se associa o referencial inercial S 0 , cujos eixos
são paralelos aos de S, estando a fonte em O0 . A relação entre o quadrivector
k expresso em coordenadas de S na forma k µ e de S 0 com k µ0 procede de
acordo com a trasformação de Lorentz
0
k µ0 = Λµ ν k ν
(46)
Usando (13) e (35) obtemos que o comprimento de onda próprio da radiação
λ0 registado no referencial inercial comóvel com a fonte S 0 onde ela está em
12
repouso se relaciona com o comprimento de onda λ registado em S como
¸
·
V
(47)
λ = λ0 γ 1 − cos θ
c
sendo por isso diferentes. Se a fonte se aproxima do observador em O ao
longo do eixo dos xx então θ = 0 e
Ã
λ = λ0
1−
1+
V
c
V
c
!1/2
(48)
tendo-se que λ < λ0 e assim um desvio no sentido do azul no espectro visivel.
Se a fonte se afasta do observador em O ao longo do eixo dos xx então θ = π
e
Ã
!1/2
1 + Vc
λ = λ0
(49)
1 − Vc
tendo-se que λ > λ0 e assim um desvio no sentido do vermelho no espectro visivel. Para uma situação transversal θ = ± π2 o efeito de Doppler corresponde
ao efeito de dilatação do tempo.
A terminar, consideremos como no formalismo da relatividade restrita se
pode apresentar o essencial do electromagnetismo: as equações de Maxwell.
Estas equações são consistentes com a relatividade geral e não com a
mecânica Newtoniana. Escrevem-se usualmente como
~ ·B
~ = 0
∇
~ ·E
~ = ρ
∇
ε0
~
~ ×E
~ = − ∂B
∇
∂t
(50)
~ = ∇
~ ×A
~
B
(54)
~
~ = −∇Φ
~ − ∂A
E
∂t
(55)
(51)
(52)
~
~ ×B
~ = µ0 J~ + µ0 ε0 ∂ E
∇
(53)
∂t
~ é o campo eléctrico, B
~ o campo magnético, ρ a densidade de carga,
onde E
J~ é a densidade de corrente com µ0 e ε0 sendo a permeabilidade e a permis~ eB
~ obtêm-se de um
sividade do vazio, em que µ0 ε0 = c−2 . Os vectores E
~
potencial vector A e de um potencial escalar Φ através
13
que satisfazem (50) e (51), sendo que os potenciais são determinados a menos
de uma transformação
~ → A
~ + ∇Ω
~
A
∂Ω
Φ → Φ−
∂t
(56)
(57)
onde Ω é uma função arbitrária, designada de transformação de padrão2 .
Escolhendo a condição de Lorentz
~ ·A
~ + µ0 ε0 ∂Φ = 0
∇
∂t
~ e Φ satisfazem
as equações (52) e (53) implicam que A
Ã
!
∂2
~ = −µ0 J~
∇ − 2 2 A
c ∂t
ρ
Φ = −
ε0
~ ≡
A
2
(58)
(59)
No formalismo da relatividade restrita tomamos o quadri-potencial
½
µ
A ≡
¾
Φ ~
,A
c
(60)
e usando a representação (em tensor) para o campo electromagnético
Fµν ≡ Aµ,ν − Aν,µ
com a convenção
como
∂
∂xµ
(61)
≡ “, µ”, as equações de Maxwell podem escrever-se
F µν,ν = µ0 J µ
Fµν,σ + Fνσ,µ + Fσµ,ν = 0
com


[Fµν ] = 


2
0
−E 1 /c −E 2 /c −E 3 /c
E 1 /c
0
B3
−B 2
2
3
E /c −B
0
B1
E 3 /c
B2
−B 1
0
Da palavra “gauge” em lingua Inglesa.
14
(62)
(63)



,

(64)
³
´
onde J µ = ρc, ~j como a quadri-densidade de corrente J µ = ρV µ = γρ0 V µ =
ρ0 uµ , sendo ρ0 a densidade de carga própria, e com as equações de Maxwell
covariantes sob acção da transformação de Lorentz.
2
O Principio da Equivalência
Porque é que a Relatividade Restrita impõe uma nova teoria da gravitação,
alterando a teoria Newtoniana? auto - impõe alteração?
A gravitação domina em várias escalas ligando matéria nas estrelas e
galáxias. A “forma” clássica dessa interacção era a seguinte
F =G
m1 m2
r2
e com muito sucesso.
No entanto, não é compativel com a Relatividade Restrita. A razão é que
esta lei não depende do tempo e actua instantaneamente . Mas, no quadro
da Relatividade Restrita nenhum sinal se propaga a uma velocidade superior
à da luz. O mesmo se aplica
à´ lei de Coulomb, mas...
³
Q1 Q2
Na Lei de Coulomb r2 , no entanto, temos o caso limite das equações
de Maxwell (as quais compatı́veis com relatividade restrita) em que as cargas
se movem com velocidade inferior à da luz.
O desejável é encontrar uma nova formulação da gravitação compativel
com a Teoria da Relatividade e em que a Teoria Newtoniana surja assim
como um limite.
Sendo que a gravitação é causada pela presença de matéria, provocando
efeitos de aceleração, vamos expor argumentos em que a descrição do espaçotempo em relatividade restrita com um referencial inércial é incompativel com
a existência de matéria e os efeitos associados de gravitação.
Recordemos então que na Relatividade Restrita:
a. O tempo não é absoluto ou simultâneo; depende do estado de movimento relativo dos referenciais inérciais.
b. Idem para os comprimentos espaciais.
c. A invariância entre observadores é implementada com
15
Figura issueA-ii
Figure 7: Representação de ...
∆s2 = c2 ∆t2 − ∆x2 − ∆y 2 − ∆z 2
d. Em um referencial inercial, constituido por uma rede infinita de réguas
e relógios inérciais em cada ponto, todos estes estão sincronizados.
e. A geometria da Relatividade Restrita é Lorentziana mas o espaço fisico
é Euclidiano.
f. As diferenças de registos espaciais e temporais são explicadas e formuladas com as transformações de Lorentzv entre referenciais inerciais.
Consideremos então, um referencial não inercial e analisemos o que um
observador nessas condições determina para o espaço e tempo. Esse referencial não inercial está acelerado e tomemos como exemplo uma placa giratória
(em torno do eixo dos zz ). Esta roda de forma uniforme com velocidade
angular ω e corresponde ao referencial S’. O referencial S’ assenta ou roda
sobre referencial inercial S.
Um ponto em S’ com coordenadas x = r e y = 0 move-se no circulo x2 +
2
y = r2 com aceleração ω 2 r. Portanto, todos os pontos em S’, exceptuando
a origem, têm uma aceleração diferente consoante o valor de r.
Seja o relógio C em S’ colocado a uma distância r da origem. Ao rodar
passa por B ( relógio em S ) instantaneamente coincidindo com ele. Ao passar
16
2-Figuras issueA-iv
Figure 8: Representação de ...
por B, C tem uma velocidade instantânea de vC = ωr. Em um infinitésimo
de tempo podemos aplicar resultados da relatividade restrita e concluir que
(no referencial de repouso instantâneo de C ) a taxa de andamento de C se
relaciona com a de B, tal que C parece progredir mais devagar em relação a
B. De facto, para unidades de tempo (tiques do relógio) em B e C, tal como
medido em B temos que
τB
τC = r
1−
³
ωr
c
´2
(65)
isto é,τB < τc . Os intervalos entre dois tiques de C, τC , são maiores que o
intervalo de tempo entre dois tiques em B , de acordo com o observador no
referencial inercial S. Assim, relógio C parece progredir mais lentamente que
o relógio B. Ao fim de uma volta, ambos os observadores concordam que B
se adiantou mais.
No entanto, os relógios A e B estão sincronizados e têm o mesmo andamento. Mas o mesmo também se aplica a A e D em S’ , que coincidem na
origem onde a aceleração é nula. Podemos então escrever que
τD = τA = τB < τC
(66)
Assim, um relógio num ponto a um raio r 6= 0 em S’ progride mais lentamente
17
Figura issueA-v
Figure 9: Representação de ...
relativamente a um relógio na origem (r = 0) no mesmo referencial.
Consideremos de novo a plataforma rotativa onde está um circulo de raio
R’. Para o obter tomamos uma régua de comprimento R’ e mantendo uma extremidade fixa na origem vamos marcando um número de pontos A’,B’,C’,...
igualmente espaçadas numa direcção perpendicular. Isto é realizado com o
uso de uma régua padrão de comprimento L, que é colocada sucessivamente
de forma perpendicular a R’. Assim podemos medir o comprimento de R’
em unidades de L, obtendo o número NR0 0 . Quanto à circunferência, usando
0
a régua L entre A’, B’,... obtemos um número NC¯
em termos das unidades
L. Tomando L tão pequeno quanto possivel calculamos o quociente
0
NC¯
2NR0 0
(67)
o qual num referencial inercial (S ) daria π mas não é assim em S’.
Observemos que o circulo de raio R’ em S’ pode ser comparado com um
circulo de raio R em S. Em particular, note-se que a direcção do movimento
em S0 é sempre perpendicular à linha unindo a origem com um ponto do
circulo. Se a régua R’ em S’ coincidir com uma régua de igual comprimento
R=R’ em S então o circulo em S’ “coincide” com um circulo em S, nesse
caso, NR0 0 = NR , onde o N é o número de pequenas réguas de comprirmento
L que completam a régua R0 em S 0 .
18
Em S, usando uma régua padrão L ao longo do cı́rculo obtemos que
= π . A geometria é Euclidiana mas o comprimento da régua padrão L
pode ser comparado instantaneamente com uma régua padrão em S 0 . Mas
as réguas padrão em S’ ao longo do circulo surgem contraidas (mais curtas)
do que as réguas padrão no circulo em S. PORQUÊ ? Porque se movem com
velocidade ωR0 com respeito a S. Isto implica que um maior número de
réguas padrão é necessário em S’ para completar o circulo e assim,
NC¯
2NR
0
NC¯
> NC¯
(68)
0
NC¯
>π
2NR0 0
(69)
e logo
Assim, a geometria espacial registada pelo observador na placa rotativa
não é Euclidiana. Em suma, temos uma distorção do espaço e do tempo
quando se emprega referenciais acelerados (não Lorentziano e não Euclidiano).
Qualquer teoria da gravitação tem que ser consistente com a relatividade
restrita. Mas a teoria Newtoniana não é. Uma nova teoria da gravitação
é necessária, em que a relatividade restritaseja um limiteE tal teoria, envolvendo aceleração, não pode ter estrutura Lorentziana, não pode usar o
espaço absoluto newtoniano nem o tempo correspondente (um limite da relatividade restrita). Igualmente importante, como a relatividade restrita é
uma estrutura geométrica, também a nova teoria da gravitação terá que o
ser.
Para determinar como terá que ser a nova teoria da gravitação, analisemos
alguns elementos intrinsecos da teoria da gravitação Newtoniana, associada
à ocorrência de aceleração. Em primeiro lugar notemos o seguinte.
A gravitação é uma força algo peculiar na mecânica Newtoniana. A
segunda lei, F~ = m~a, relaciona a força total num corpo com a sua aceleração:
F~ resulta sempre da acção exterior. A constante m é a massa inercial e
representa a capacidade do corpo resistir à aceleração. Genericamente F~
poderá depender de vários factores tais como : massa, volume, carga, etc....
assim como do elemento actuante. No caso da gravitação temos que
F~ = −
n
X
Gmmi
i=1
19
~r − ~ri
|~r − ~ri |3
(70)
P
−~
ri
onde − ni=1 Gmi |~r~r−~
“representa” a acção de um conjunto de n massas.
ri |3
Note-se, no entanto, que temos aqui “dois”
³ tipos de
´ massa gravitica. O
G
parâmetro m é uma massa gravitica passiva m ≡ mp , determinado a acção
(sua magnitude) no corpo actuado
³
´por outros. E também temos o equivalente
G
a uma massa gravitica activa ma que determina a força com que outros vão
influenciar a mG
p.
É sabido desde Galileu que o movimento sob a acção da gravidade é
independente da composição dos objectos (universalidade da queda livre).
Esta universalidade pode ser exposta do seguinte modo:
Vamos tomar dois corpos teste com massas m1 e m2 sob acção de um
planeta com massa mplaneta . Temos então que, por um lado (assumindo por
simplicidade que os três corpos estão colineares)
F1 = m1 g ≡ mG
1,p g
F2 = m2 g ≡ mG
2,p g
onde
g=−
e também
(71)
G
Gmplaneta
≡ mG
a 2
2
r
r
F1 = mI1 a1
F2 = mI2 a2
(72)
mI1 a1 = m1 g
(73)
Daqui vem que
e
mI2 a2 = µ2 g
mas da universalidade da queda livre a1 = a2 e
C = 1, temos então
mI = mG
p
(74)
mI1
m1
=
mI2
mµ2
= C e tomando
(75)
O papel dual representado por m (mI e mG
p ) implica que
n
X
~r − ~ri
→
−
a =−
Gmi
|~r − ~ri |3
i=1
(76)
isto é, a aceleração de qualquer particula é independente das sua massa.
20
Mas porque é então a gravitação tão anómala? Pode ser formulada uma
teoria para uma força gravitacional, determinando que a aceleração gravitica
de uma massa num campo gravitico é igual para todos e segue naturalmente?
Vamos agora focar outro aspecto em mecânica Newtoniana da gravitação,
relacionado com o contexto do principio da relatividade.
O principio da relatividade afirma que as leis da fisica são as mesmo em
qualquer referencial inercial. Mas Einstein não estava satisfeito com esta
aparente “preferência ” pelos referenciais inerciais. Qual seria a razão desta
“preferência”? Haveria algo na mecânica ou na relatividade restrita que
atribuisse essa diferença? Em particular, Einstein apontou que a verificação
da lei da inércia de Newton era um argumento circular (viciado). De facto,
um corpo move-se sem aceleração se nenhuma força actuar nele, mas como é
que sabemos se nenhuma força actua? Para forças de contacto é óbvio! Mas,
e quanto a forças do tipo F ∼ r12 ( forças à distância)? Dizemos que não
existem forças se o movimento for rectilineo e uniforme....
Outro aspecto importante a discutir é que a segunda lei não é válida em
todos os referenciais. De facto, em F~ = m~a, temos em F~ o efeito num corpo
tal como actuado por outros. É invariante e não depende do sistema de
coordenadas. Em m~a a aceleração do corpo actuado depende do sistema de
coordenadas. Num outo referencial F~ = m~a pode não ser válido. Considerese pois o seguinte exemplo:
Seja um observador isolado no universo junto com uma particula teste,
registando o movimento dessa particula teste. Se o observador está num
referencial não acelerado e sem rotação, vê um objecto com velocidade constante, V~ constante, com um movimento uniforme e rectilineo. Mas, se o
observador está em rotação, regista o corpo teste com o movimento de hélice
(helicoidal). Há pois referenciais onde F~ = m~a = 0 e outros onde objectos
”espontaneamente” ou sem razão aparente aceleram. As leis de newton apenas podem ser empregues em referenciais inerciais: aqueles que se movem
−
→
entre si com velocidade V constante.
No entanto, podemos perguntar a um nivel mais fundamental: Porque é
que (se de facto é assim) a natureza selecciona certos referenciais? E como?
Em particular, como identificar um referencial inercial a partir do qual outros
se podem definir? Note-se também que não é objecto da relatividade restrita
resolver este assunto.
A proposta de Newton é que existia uma identidade (estrutura): o espaço
absoluto sem qualquer relação com os corpos (massas) exteriores sendo imutável.
21
De forma mais subtil é o espaço absoluto de Newton que “actua” na matéria
e lhe confere inércia . Como pode este espaço ser entendido (“visualizado”)?
A Terra é, em aproximação, um referencial inercial mas, o Sol é melhor
como exemplo. Mas como o Sol se move tal como a via láctea chegamos
no limite à conclusão que o espaço absoluto, no quadro Newtoniano, estaria
identificado com as estrelas fixas, isto é, em mais detalhe, a distribuição de
matéria em larga escala no Universo. Assim, o espaço absoluto era quilo que
permitiria distinguir de referenciais inerciais de referenciais não inerciais.
No entanto foram levantadas algumas objecções, em particular, por Leibniz e Berkeley. Estes afirmavam que um espaço sem matéria não tinha propriedades mecânicas, sendo mais preciso, a velocidade média da matéria no
universo é que estabeleceria o padrão relativamente ao qual a inércia e aceleração se definiriam.
Num ponto de vista ainda mais radical, E. Mach propõe que a inércia
(massa inercial) de qualquer corpo é devida ao resto da matéria do universo.
Esta ideia influenciou Albert Einstein. Mais especificamente, a hipótese é que
a aceleração relativa à matéria distante é que vai determinar as propriedades
de inércia. Neste contexto é interessante rever o referencial inercial de “estrelas fixas” e os referenciais inerciais como aqueles cujo movimento não acelera
relativamente ao referencial de “estrelas fixas”.
Consideremos então a questão das forças inerciais neste contexto de referenciais inerciais e referenciais não inerciais, assim como da equivalência entre
mI e mG
p.
Seja a situação em que numa carruagem que subitamente acelera, o café
contido numa chávena transborda. Ou de um carro que subitamente faz uma
curva e somos “atirados” para as paredes. Isto é descrito nestes referenciais
(comboio e carro) como forças de inércia (por exemplo, força centrifuga).
Para outro observador num referencial inercial, o que sucede é que a chavena
avança e o café fica no mesmo local e o passageiro do carro segue em linha
recta.
Podemos assim usar referenciais não inerciais e e refernciais inerciais
transformando coordenadas entre ambos e na descrição do mesmo fenómeno,
invocar ou não forças de inercia, as quais são ilusórias.
E quanto à gravitação? Estas forças têm sido tratadas de forma diferente
tal que a aceleração de um corpo em queda livre é causada pela presença de
um campo de forças preenchendo o espaço. O que vamos ver é que como
Einstein propôs, é possivel tratar a força gravı́tica de forma similar às forças
de inércia. Isto é, como consequencia da escolha do referencial de observação.
22
3Figuras issueC-i
Figure 10: Representação de ...
Tal leva-nos ao principio da equivalência.
Albert Einstein concluiu que a equivalência entre massa inercial e massa
gravitica deveria ser justificada num contexto mais fundamental, relacionando aceleração e gravitação numa experiência hipotética. Considerou dois
tipos de observadores sem conhecimento do seu estado de movimento. Irse-à assim ver que as forças gravitacionais são como as forças expressas ou
presentes em referenciais acelerados e que constituem forças inerciais num
referencial inercial, isto é, têm uma existência relativa e podem ser removidas através de uma transformação de coordenadas. A gravitação produz pois
aceleração e vamos explorar este facto, nomeadamente a relação entre esses
dois conceitos (aceleração e gravidade).
Suponhamos que temos um observador num elevador estacionário no
campo gravitico da Terra (suspenso). O observador larga um objecto e este
cai (desloca-se verticalmente para baixo) com aceleração constante. Mas
será que esta experiência pode ser distinguida de outra, em que na ausência
de qualquer campo gravitico o elevador está numa nave espacial acelerada?
Note-se que o observador não flutua mas é “empurrado” para o solo da cabine
do elevador e se ele largar um objecto, este não está sujeito a qualquer força
e prossegue a velocidade constante (zero ou não). Só que a nave acelera na
vertical, afastando-se do objecto largado, depois eventualmente tocando-o no
solo da cabine.
Do ponto de vista do observador é o objecto que cai afastando-se dele
com aceleração constante. É semelhante ao que ocorre no caso da cabine
suspensa.
23
2Figuras issueC-ii
Figure 11: Representação de ...
Temos então dois tipos de observadores os quais largam o mesmo objecto
numa experiencia. Nenhum deles pode afirmar se está num referencial acelerado no espaço vazio ou estacionário (suspenso) num campo gravı́tico. Claro
que se toma a aceleração perto do planeta e da nave iguais.
Neste contexto analisemos o caso de um referencial em queda livre.
Seja um referencial inercial com coordenadas x, y, z, isto é, um referencial
ideal, que descreve o movimento do elevador e do objecto largado. Neste
referencial inercial a Terra está estacionária. Tomemos o elevador perto do
planeta onde o objecto é largado pelo observador e simultaneamente o cabo
que suspendia o elevador é cortado. Mantendo um sangue frio excepcional
o observador, relativamente às paredes do elevador, identifica o referencial
X, Y, Z e que o objecto largado do repouso vai continuando em repouso ainda
que no referencial x, y, z, se veja o objecto acelerar para a Terra. Tomemos
que a aceleração é g perto da superficie do planeta. No referencial inercial
as posições do objecto e de um canto do elevador são dadas pelos vactores
1
~r1 (t) = ~g t2 + V~1 (0) t + ~s1
2
(77)
1
~r2 (t) = ~g t2 + ~s2
2
(78)
e por
24
2Figuras issueC-iv
Figure 12: Representação de ...
Recorde-se a universalidade da queda livre (todos os objectos caiem com
~ , o qual é o vector posição do objecto
a mesma aceleração). Mas ~r1 − ~r2 = R
largado visto pelo observador em O ( origem das coordenadas em X, Y, Z),
isto é, o referencial acelerado. Verifica-se então que:
~ = V~1 (0) t + (~s1 − ~s2 )
R
(79)
isto é, no referencial em queda livre, qualquer objecto visto a acelerar sob
acção da gravidade no referencial inercial, move-se agora em linha recta e
velocidade constante. O referencial em queda livre comporta-se então como
um referencial inercial!
A relação entre a gravitação e aceleração pode então ser investigada e
diferenciada seguinte ponto de vista:
Tomemos não um mas dois objectos para largar simultaneamente. E
façamos isso no referencial acelerado da nave espacial ou no referencial estacionário do elevador junto à Terra. Se pudermos seguir os dois objectos numa
região do espaço e/ou num intervalo de tempo suficientemente grande, iremos verificar que no referencial estacionário, os dois objectos aceleram para
baixo mas aparentam convergir um para o outro com uma aceleração lateral.
Tal não ocorre no referencial acelerado.
Assim, é apenas localmente que a gravitação e a aceleração são equiva25
lentes. Esta definição de localidade é para as dimensões espaciais e temporais.
Uma região local do espaço e tempo é aquela em que os efeitos não uniformes
da gravitação não se fazem sentir. Neste contexto os referenciais em queda
livre são equivalentes a inerciais apenas localmente.
A definição de referencial em queda livre altera a nossa perspectiva de
como a gravitação actua. Se um objecto é visto a acelerar verticalmente
(caindo) pode ser interpretado não só como resultado da atracção gravı́tica
mas também de um referencial acelerado, i.e., um referencial não inercial.
Nos referenciais em queda livre a gravitação desaparece e o movimento sob
acção da gravitação é removido. A gravitação não é uma força qualquer e
por isso pode ser encarada numa nova perspectiva.
Todos estes aspectos levaram Einstein a formular o principio da equivalencia sobre o qual a teoria da relatividade geral assenta. O principio da
equivalencia afirma que o movimento de objectos numa região local adjacente à presença de matéria não pode ser distinguido através de qualquer
experiência do movimento de um corpo idêntico na região local onde haja
uma aceleração uniforme.
Note-se que esta é a versão “fraca” do principio da equivalencia, envolvendo apenas experências mecânicas. A versão ”forte” afirma que é para
qualquer tipo de experiências. Tomando então o principio da equivalencia, vejamos como este nos permite elucidar ainda mais como a perspectiva espacio-temporal da relatividade restrita é distorcida na presença de
gravitação, i.e., na presença de matéria.
Tomemos de novo a nave espacial como laboratório de experiências. Um
feixe luminoso é enviado através da nave a qual se encontra no espaço vazio,
fora do alcançe de qualquer interacção. O feixe sai de um ponto P0 e atinge
também perpendicularmente a parede oposta em P1 .
Mas se a nave ligar os motores e nesse instante enviar o feixe de P0 ,
como a nave acelera, o ponto de impacto do feixe já não será P1 mas sim
P2 ,um pouco mais abaixo. Isto é consequencia da velocidade finita da luz
e da aceleração da nave espacial. No entanto, de acordo com o principio
da equivalencia esta situação não pode ser distinguida do cenário onde a
nave está estacionária na presença de um campo gravitico uniforme criado
pela presença de matéria exterior (planeta). A luz é assim “curvada” pela
gravitação!
As trajectórias curvilineas da luz num campo gravitico podem ser interpretadas em termos de equivalência entre massa e energia. A massa cria o
campo gravitico e também sente a reacção (criado por outras massas). A
26
2Figuras issueC-vii
Figure 13: Representação de ...
2Figuras issueC-x
Figure 14: Representação de ...
27
2Figuras issueC-xii
Figure 15: Representação de ...
luz como energia também sentirá essa acção. Mas outra forma de relatar
este fenómeno é afirmando que a luz segue sempre o caminho mais curto
ou directo no espaço-tempo (a discutir melhor adiante). Mas já analisamos
como efeitos de aceleração, isto é, gravitação (no quadro do principio de
equivalência), distorcem o espaço-tempo, Assim, o campo gravitico “seria”
essa distorção, curvando a luz que agora segue o percurso mais directo entre
dois pontos.
O desvio da luz ou qualquer radiação electromagnética pode ser usado
para testar o principio de equivalência e a relatividade geral. Einstein calculou quanto um raio de luz é desviado ao passar junto ao Sol. Esse desvio
implicaria um ângulo de variação entre a posição aparente da estrela e a sua
posição real, tal foi e é possivel de realizar num eclipse solar.
Mas deve ser referido que utilizando o principio da equivalência apenas
se vê metade do desvio, cuja totalidade apenas é extraida no quadro da
relatividade geral.
O principio da equivalência pode também ser usado para mostrar em mais
detalhe como a gravitação altera de forma fundamental as propriedades do
espaço e do tempo.
Analisemos então como relógios idênticos em diferentes localizações num
referêncial estacionário com respeito a um agregado da matéria (campo gravItico)
28
2Figuras issueC-viii
Figure 16: Representação de ...
podem ter diferentes taxas de progressão (tiques...).
Tomemos um relógio, onde por exemplo um átomo emite luz com uma
determinada frequência.Vamos comparar a frequência da luz emitida por
relógios idênticos em diferentes pontos do campo gravItico (da Terra) empregando o principio da equivalência para obter uma expressão para essa
diferença de frequência. Como já discutimos o campo gravitico assume-se
como uniforme e apontando na direcção vertical para baixo. Um raio de
luz é emitido em H = 0 e recebido em H = H1 . Como é que a frequência
recebida f 0 é diferente da frequência f gerada por idêntico processo atómico
em H1 e em H0 ?
Usando o principio de equivalência, o que tem lugar num campo gravı́tico
uniforme também se pode descrever usando um referêncial acelerado e uniforme. Seja uma nave espacial inicialmente em repouso, quando a luz de
frequência f é emitida em A, na base da nave. Esta liga os motores e acelera uniformemente no campo gravitico. A luz percorre então uma distância
H1 até ao receptor em B com um ∆t = Hc1 . Usemos agora o referêncial instantâneo que quando a luz é emitida o átomo está instantâneamente em
repouso com esse referêncial instantâneo (que é inercial!!). Quando a luz é
emitida, a fonte está instantaneamente em repouso e poderia ter sido emitida
por uma fonte em repouso S com velocidade nula. Quando a luz atinge o
receptor , este move-se com uma velocidade instantânea de V = g∆t = gHc 1
29
com respeito a S. Esta luz também seria recebida por observador com velocidade constante V = gHc 1 : é o referencial instantâneo de repouso do receptor
R. Por outras palavras: a luz recebida no receptor, com este movendo-se a
velocidade constante durante um intervalo infinitésimal gHc 1 ,em respeito a S,
é a velocidade do referêncial instantâneo em repouso de R (o receptor).
Assim se o receptor se move afastando-se da fonte emissora com velocidade (instantânea) gHc 1 tal como registado em S, no instante de recepção
da luz, a fonte emissora também se afasta do receptor com igual velocidade
(instantânea) tal como registado em R. Neste contexto empregando os resultados do efeito de Dopph relativista temos que:
Se uma fonte de luz com frequência f se afasta de um receptor com
velocidade V , a frequência f 0 da luz observada no receptor irá ser diferente
de f através de
Ã
f0 = f
e com
³ ´2
V
C
µ
f0 ≈ f 1 −
<<
V
C
V
C
¶
⇒
1−
1+
V
C
V
C
³
!1
2
1−
V
C
´
= fµ
³ ´2 ¶ 12
1 − VC
(80)
<< 1 temos que
f0 − f
∆f
V
fV
f gH1
≡
= − ⇒ ∆f = −
=− 2
f
f
C
c
c
(81)
Em conclusão, a luz recebida no topo da nave terá uma frequência mais baixa
e por isso corresponde a um desvio para o vermelho. Se a luz for enviada na
direcção oposta para baixo a fonte estará movendo-se para o receptor e dai a
variação de ∆f é positiva (troca de sinal) e a luz sofre um desvio para o azul.
Pelo principio da equivalência estas considerações também se aplicariam no
caso de um campo gravitico correspondente.
Note-se que este efeito não é uma consequência da gravitação a afectar o
mecanismo de relógios. O argumento é baseado no principio da equivalência
que envolve regiões locais onde o campo gravitico é uniforme. O desvio espectral gravitico e a correspondente dilatação temporal são uma propriedade
do próprio espaço-tempo assim distorcido.
Seja agora a figura junta, onde temos dois observadores A e B em diferentes pontos de de magnitude de um campo gravitico. Se a frequência da
luz diminui quando esta“sobe” pelo campo gravı́tico, B verá o relógio de A
progredir mais lentamente e A verá o relógio de B progredir mais rápido.
30
Figura issueC-xiii
Figure 17: Representação de ...
Tudo isto pode ser interpretado como A e B transmitindo fotões entre si,
comparando a frequência do fotão recebido com a frequência das respectivas
fontes. Devido à sua energia, trabalho tem que ser desenvolvido para o fotão
“subir” pelo campo gravı́tico, de A para B. Tal como trabalho é realizado
pelo campo gravittico no fotão quando este “cai” de B para A. Assim, um
fotão de frequência f deixando A chega a B com uma frequência menor e
menor energia, demorará então mais tempo em B para que o correspondente
número de periodos de oscilação recebidos, passe com respeito às oscilações ou
periodo do relógio (outra fonte) existente em B. Com o relógio B se conclui
assim que um segundo demora mais em A do que no seu referêncial. Por
outras palavras o tempo passa mais devagar junto a campos gravitacionais
mais fortes ou onde é mais intenso. Um relógio no topo ganhará ou avançará
com respeito ao relógio na base.
Este é o fenómeno da dilatação temporal gravı́tico o qual não é simétrico
entre A e B.Ambos concordam com o resultado.
31
3
Elementos de Geometria (Diferencial)
Ao usarmos o principio da equivalência verificamos que os conceitos espaçotempo da relatividade restrita tinham que ser abandonados. Isto também implicou que é necessário encontrar outros métodos para descrever a mecânica
(propriedades geométricas) no e do espaço-tempo.
Mas como é que podemos fazer e onde encontrar pontos de partida?
A primeira lei de Newton afirma que um corpo sem acção e forças descreve
uma trajectória rectilinea com velocidade constante. Einstein afirmou (como
iremos discutir em detalhe aqui) que na presença de matéria um corpo “continuará” ao longo de uma linha “direita” através do espaço-tempo distorcido.
Em particular, a relatividade geral explica como um corpo se move sobre a
acção da gravitação usando técnicas geométricas para resolver problemas de
mecânica.
De certa forma, encontrar a trajectória de uma particula é um problema
que envolve geometria. Requere a parametrização de curvas, a definição do
seu comprimento em diferentes coordenadas e em diferentes espaços: planos,
superficie de uma esfera, etc. Para definir tais distâncias usar-se-à o conceito
de métrica. Assim a relatividade geral constituirá uma teoria geométrica da
gravitação: conceitos fundamentais como os geodésica (minimo e máximo de
comprimento entre dois pontos do espaço-tempo) irão ser usados devidamente
relacionados com o princı́pio da equivalência.
Uma vez que a gravitação distorce a geometria do espaço-tempo, não
podemos usar referenciais inerciais globais apenas locais (principio de equivalência).
Não há pois sistemas de coordenadas priveligiados, onde as leis da natureza
devem ser escritas. Tendo por isso que adquirir uma mesma nova forma com
respeito a coordenadas generalizadas: covariância geral. Sendo mais preciso,
na relatividade restrita as leis da natureza tomam a mesma forma em todos os
referenciais inerciais. No contexto da relatividade geral num campo gravitico
todas as leis da natureza irão tomar uma mesma forma em qualquer ponto
do espaço-tempo assim como no referencial em queda livre. Temos assim que
estudar as leis de transformação de coordenadas entre diferentes referenciais
locais, de tal forma que a generalizaçã o de transformadas de coordenadas
deve deixar manter a forma dessas leis da natureza independentemente do
sistema de coordenadas.
Na mecânica Newtoniana já temos “ingredientes” de natureza geométrica:
32
se soubermos as forças que actuam numa particula como é que essa particula
se irá mover?
A resposta é através de um conjunto de coordenadas x(t), y(t) e z(t)
obtidas de equações diferenciais, os quais determinam a posição e também a
trajectória da particula.
Mas também podemos interpretar ou atribuir um outro contexto em que
temos antes um cenário de geometria. Uma trajectória é também uma entidade geométrica. Por exemplo uma linha recta como trajectória é um
percurso mais curto entre 2 pontos. Podemos assim atribuir também uma
solução geométrica baseada nos conceitos de comprimento a qualquer problema de movimento. No caso de um plano espacial (bi-dimensional) a definição
de linha recta é a distância (Euclidiana) mais curta entre dois pontos. De
forma mais geral, a curva de comprimento espacial minimo é designada de
geodésica. Como exemplo, tomemos um objecto pequeno (esférico) movendose com velocidade constante num:
a) Plano (com qualquer orientação espacial), indo de A para B na ausência
de gravidade (ou na sua presença com outras forças)
b) Na superficie de uma esfera, na ausência de gravidade ou em (perspectiva tri-dimensional), na mesma esfera com a presença de forças.
Para determinar a trajectória podemos usar as equações/leis de Newton
em três dimensões, resolvendo-as para obter a trajectória OU usando o conceito de geodésica para os dois pontos no plano ou superficie da esfera. A
trajectória em ambas as situações será a de mais curto percurso. A linha
recta no plano ou no segmento de um grande cı́rculo na esfera. Para este
último caso temos que saber a geometria da esfera.
O exemplo anterior não pode ser extendido e aplicado a trajectórias de
particulas em três dimensões espaciais sob acção da força da gravidade. De
facto tomemos dois pontos A e B à superfı́cie da Terra (por exemplo) os
quais podem ser unidos por diferentes percursos aos quais associam diferentes ângulos e velocidades iniciais. Como escolher então nessas condições a
trajectória real entre todas as possı́veis? Não poderá ser através daquela com
comprimento mı́nimo. No entanto notemos que as trajectórias ocorrem no
espaço e no tempo e deveremos procurar a trajectória real como aquela que
é uma geodésica no espaço-tempo quadridimensional e que tem uma duração
máxima de tempo próprio. Na realidade o que observamos são linhas do universo (linhas espaço-temporais) no espaço-tempo e não somente percursos no
espaço.
Como iremos ver, a relatividade geral contém a gravitação como a man33
ifestação de um espaço tempo curvo no qual a relatividade restrita é uma
aproximação, tal como o principio da equivalência indica. Mas esta distorção do espaço-tempo (lembrar que espaço-tempo da relatividade restrita
é Lorentziana, isto é, plano) implica que a descrição de movimentos não pode
ser feita com as coordenadas que caracterizam um referencial inercial local.
Há que usar coordenadas arbitárias o que significa que não há sistemas de
coordenadas preferenciais e temos que saber relacionar diferentes aspectos da
teoria desta forma.
Neste sentido vamos considerar o conceito de “variedade espaço-temporal”.
Uma variedade M é caracterizada por um conjunto de pontos que podem ser
coordenatizados com números reais (x1 , x2 , ..., xn ), havendo uma relação injectiva e bijectiva entre a variedade M e o espaço <n . A variedade M poderá
não ter apenas um sistema de coordenadas. Vários poderão ser necessários.
A esta colecção por vezes chama-se mapa de aplicações. É um mapa de
aplicações entre M e <n . Onde os dois sistemas
n de0 ocoordenadas se sobrepõem
a
podemos usar o sistema {x } , a = 1, ..., n ou xa , a0 = 1, ..., n. Requere-se
que estas funções sejam continuas e diferenciaveis:
0
∂xa
∂xa
a
X b≡
,
X
≡
(82)
0
b
∂xb
∂xb0
existem e são continuas. A matriz Jacobiana é não-singular, o que implica
que
0
X a b0 Xcb = δca
(83)
a0
e
0
0
(84)
1 se p=q
0 se p6=q
(85)
X a b X b c0 = δca0
onde
δqp =
n
De forma a adquirir um contexto mais adequado à nossa percepção (e
limite existencial ... imediato), vamos tomar como exemplo um espaço tridimensional, o qual contém superficies bidimensional. Seja então espaço Euclidiano com o sistema de coordenadas (x, y, z) usual associado a uma base
de vectores (~i, ~j, ~k) ≡ (i, j, k). Mas devemos também usar outras quaisquer
coordenadas (u, v, w). Podemos então relacioná-las:
x = x(u, v, w); y = y(u, v, w); z = z(u, v, w)
34
(86)
ou
u = u(x, y, z); v = v(x, y, z); w = w(x, y, z).
(87)
As coordenadas de um vector ~r ≡ r podem assim ser escritas como:
~r ≡ r = x(u, v, w) i + y(u, v, w) j + z(u, v, w) k
(88)
fazendo w = wo = C com u e v livres temos
~r ≡ r = x(u, v, wo ) i + y(u, v, wo ) j + z(u, v, wo ) k
(89)
que parametrizam as coordenadas de uma superfı́cie w = wo , onde os parametros u e v são coordenadas. Fazendo agora v = vo = C e w = wo = C com u
livre temos:
~r ≡ r = x(u, vo , wo ) i + y(u, vo , wo ) j + z(u, vo , wo ) k
(90)
que parametriza uma curva correspondente à intersecção das superficies v =
vo e w = w o .
Notemos que se diferenciármos a expressão para r = r(u, vo , wo ) ou us∂
armos derivadas parciais para r = r(u, v, w), temos que a diferenciação ∂u
produz o vector tangente à curva indicada em que u é livre e v = vo e
w = wo . De forma similar se obtêm tangentes às curvas em que ve w são
os parametros respectivos. Neste contexto (u, v, w) e os vectores tangentes
assim definidos permitem igualmente coordenatizr o espaço tridimensional
Euclineano. Assim, as derivadas parciais
eu ≡ ~eu ≡
∂r
∂r
∂r
, ev− ≡ ~ev ≡
, ew ≡ ~ew ≡
∂u
∂v
∂w
(91)
fornecem uma base alternativa de vectores, os quais podem ser normalizados
de forma obvia. Um vector λ ≡~λ qualquer pode ser expresso como
λ = ai + bj + ck = αeu + βev + γew
(92)
−
→
em que (α, β, γ) são as componentes de λ ≡~λ na base {→
eu , −
ev , −
e→
w } ≡ {eu , ev , ew }.
Curiosamente há outra forma em que o sistema (u, v, w) também pode
ser usado para determinar uma base de vectores. Tomando
u = u(x, y, z); v = v(x, y, z); w = w(x, y, z)
35
(93)
vamos considerar os seguintes gradientes:
∂u
∂u
−→ ∂u
∇u =
i+
j+
k
∂x
∂y
∂z
(94)
∂v
∂v
−→ ∂v
∇v =
i+
j+
k
∂x
∂y
∂z
(95)
∂w
∂w
−−→ ∂w
∇w =
i+
j+
k
(96)
∂x
∂y
∂z
os quais são ortogonais às superficies de nivel com
coordenadas
u = uo , v = v o
n−
→ −
→ −→o
e w = wo . Temos assim, uma base alternativa ∇u , ∇v , ∇w que é dual à base
n
−→ v −
→ w −→o
u
→
→
{−
eu , −
ev , −
e→
w }. Define-se esta nova base como e ≡ ∇u , e ≡ ∇v , e ≡ ∇w
Desta forma o vector λ ≡~λ escreve-se como:
−
→
λ = λu eu + λv ev + λw ew = λu eu + λv ev + λw ew
(97)
.
Vamos clarificar a relação entre as duas bases e as respectivas componentes. Para simplificar e condensar a notação
usemos
n→
o (i = 1, 2, 3) então
−u −
→v −
→
w
i
i
−
→
−
→
−
→
u ≡ (u, v, w), {ei } ≡ { eu , ev , ew } e {e } ≡ e , e , e . Tal que
→
→
−
λ ≡~λ = λ1 −
e1 +λ2 −
e2 +λ3 →
e3 =
X
−
→ X
−
→
−
→
−
→
→
λi ei ≡ λi −
ei = λi ei =
λi ei = λ1 e1 +λ2 e2 +λ3 e3
i
i
(98)
i
Usando a definição de e e ej , podemos escrever que
→
r
∂ui ∂x
∂ui ∂y
∂ui ∂z
∂ui
−
→ ∂−
ei ej = ∇ui j =
+
+
=
= δji
∂u
∂x ∂uj
∂y ∂uj
∂z ∂uj
∂uj
e com este procedimento podemos também determinar
−
→
→
λ · e j = λi −
ei ej = λi δji = λj
(99)
e
λ · e j = λj .
(100)
−
→
Em conclusão, as componentes de λ com respeito a uma dada base são
−
→
determinadas pelo producto de λ com o elemento correspondente na outra
base. Assim,
−
→ →
−
→
−→
→
→
λµ = λ −
µ = λi −
e i µj −
ej = gij λi µj = λi ei µj ej = g ij λi µj
(101)
36
em que
→
−
gij ≡ −
ei · →
ej = ei · ej
(102)
g ij ≡ ei · ej .
(103)
→
− →
−
→−
λµ = λ →
µ = λi ei µj −
ej = λi µj δji = λi µi
(104)
→
−→
λµ = λ −
µ = gij λi µj = g ij λi µj = λj µj
(105)
g ij λi µj = λi µi ∀λi ⇒ g ij µj = µi
(106)
gij λi µj = λi µi ∀λi ⇒ gij µj = µi
(107)
e
Também podemos escrever que:
e
donde
o que mostra que gij e g ij podem ser usados para subir/baixar indices tal
que :
µi = g ij µj = g ij gjk µk ⇒ g ij gjk = δki
(108)
As componentes λi de λque correspondem ao uso da base {ei } são designadas de componentes contravariantes enquanto, que as componentes λi
associadas à base {ei } são ditas de covariantes.
Sejamos agora mais precisos acerca das coordenadas e bases genéricas
{ei } e {ei } cuja relevância ocorre em sistemas coordenadoas genéricas, isto
é, vamos ver como uma se relaciona com a outra, com os vectores tangentes
a curva e a outra com normais ou perpendiculares a superficies. E como se
transformam em diferentes sistemas de coordenadas.
Tomamos ui ≡ {u = u(t), v = v(t), w = w(t)}, onde t é um parâmetro
real. Os pontos assim parametrizados irão corresponder a uma curva γ , cujo
vector posição é:
r = x [u(t), v(t), w(t)] i + y [u(t), v(t), w(t)] j + [u(t), v(t), w(t)] k
O vector
d
(109)
→
−
r = ṙ dá o vector tangente a essa curva, e em concreto temos:
dt
37
dr
dr du dr dv
dr dw
=
+
+
dt
du dt
dv dt dw dt
= u̇(t)eu + v̇(t)ev + ẇ(t)ew ≡ u̇i (t)ei
(110)
mostrando que as derivadas u̇i (t) são as componentes do vector tangente a
uma curva na base “natural” {ei }.
Noutro contexto, consideremos a função Φ(u, v, w), a qual também pode
ser encarado como função da posição nas coordenadas (x,y z). O seu gradiente
→
−
é 5Φ = ∂Φ
i+ ∂Φ
j+ ∂Φ
k. Mas escrevendoΦ = (u(x, y, z), v(x, y, z), w(x, y, z))
∂x
∂y
∂z
vem
∂Φ
∂Φ ∂u ∂Φ ∂v ∂Φ ∂w
=
+
+
∂x
∂u ∂x
∂v ∂x ∂w ∂x
(111)
∂Φ
∂Φ ∂u ∂Φ ∂v ∂Φ ∂w
=
+
+
∂y
∂u ∂y
∂v ∂y ∂w ∂y
(112)
∂Φ
∂Φ ∂u ∂Φ ∂v ∂Φ ∂w
=
+
+
∂z
∂u ∂z
∂v ∂z ∂w ∂z
Reuniundo estas expressões, escrevemos que:
∂Φ
−
→
5Φ =
∂u
∂Φ
∂v
∂Φ
∂w
Ã
Ã
Ã
(113)
!
∂u
∂u
∂u
i+
j+
k +
∂x
∂y
∂z
!
∂v
∂v
∂v
i+
j+
k +
∂x
∂y
∂z
!
∂w
∂w
∂w
i+
j+
k =
∂x
∂y
∂z
∂Φ −→ ∂Φ −
→ ∂Φ −→
∇u +
∇v +
∇w
∂u
∂v
∂w
=
∂Φ u ∂Φ v ∂Φ w
∂Φ i
e +
e +
e =
e
∂u
∂v
∂w
∂ui
38
(114)
Tal mostra que as derivadas parciais
base{ei } onde se usa também a notção
−
→
as componentes x 5Φ na
∂Φ
são
∂ui
∂Φ
≡ ∂i = “ , i”
∂ui
assim
~ = ∂i Φei = Φ,i ei
∇Φ
(115)
.
Como usaremos adiante, o comprimento da curva γ é obtido integrando r,isto
é, usando
.
.
.
r2 = ui ei uj ej = gij ui uj
(116)
com o integral dado por:
L=
Z b
a
(gij ui uj )1/2 dt
(117)
A relatividade geral pretende ser uma teoria onde não há sistemas de
coordenadas preferencias.Assim, suponhamos que temos uma base de co0
0
0
ordenadas (u, v, w)e (u , v , w ). Vejamos como as componentes de vectores
definidos nas bases correspondentes se vão transformar. Seja então a base{ei0 }
0
0
0
0
a base associada a (u , v , w ) e a base {ei }a dual, assim como as bases {ei }e
→
−
{ei }. Um vector qualquer λ ≡ λ escreve-se como
0
0
−
→
λ = λi ei0 = λi0 ei = λi ei = λi ei
(118)
Numa região onde ambos sistemas sejam admitidos, temos
0
0
0
ui = ui (uj ), ui = ui (uj )
(119)
i.e.,
0
ui = f (uj ),
Assim podemos obter de ei =
que
dr
,
dui
0
ui = h(uj )
dr
,
dui0
ei0 =
(120)
usando regras de diferenciação
0
dr dui
dr
=
duj
dui0 duj
isto é,
0
ej = U ij ei0
39
(121)
onde,
0
0
Ui j =
dui
duj
(122)
De
0
λ = λj ej = λj U ij ei0
vem que
0
(123)
0
λi = U i j λj ,
(124)
sendo a formula de transformação para componentes contravariantes. Para
as componentes, covariantese a base {ej }, usando a definição
−
→
ei = ∇ui
0
−
→ 0
ei = ∇ui
e junto com
0
∂uj
∂uj ∂ui
=
∂x
∂ui0 ∂x
assim como com
e
temos que
isto é ,
0
∂uj
∂uj ∂ui
=
∂y
∂ui0 ∂y
0
∂uj ∂ui
∂uj
=
,
∂z
∂ui0 ∂z
∂uj −
−
→ j
→ i0
∇u =
0 ∇u
i
∂u
0
ej = U j i0 ei
(125)
onde U
∂uj
U i0 =
.
∂ui0
Para as componentes covariantes, temos que
j
(126)
→
µ≡−
µ = µj ej = µj Uij0 ei = µi0 ei
(127)
ui0 = U j i0 uj .
(128)
0
implicando que
Para as transformações inversas vem
40
0
λi = Uji0 λj
onde se usa a regra
0
0
ej = Uij0 ei
ej 0 = Uji0 ei ,
0
0
ui = Uij uj 0
0
Uik0 Uji = δjk
(129)
(130)
(131)
Vejamos o que podemos extrair relativamente a gij . Na base {ei }, vemos
que gij = ei ej e na base {ei0 } será gi0 j 0 . Assim
³
gi0 j 0 = ei0 · ej 0 = Uik0 ek
´³
´
Uje0 ee = Uik0 Uje0 ek ee = Uik0 Uje0 gje
(132)
verifica-se assim que as quantidades gij ou g ij se transformam como as componentes de vectores mas usando dois conjunto de transformações U . Temos
assim que uma teoria métrica da gravitação tem que incluir objectos designados de tensores. De facto, enquanto escalares e vectores são dominantes
no quadro da mecânica Newtoniana, os tensores são fundamentais em relatividade geral.
Um tensor corresponde essencialmente a um objecto que actuando num
vector produz outro vector com outras caracteristicas. O tensor é, em particular, linear nos vectores onde é aplicado:
T (αV + βU) = αT (V) + βT (U)
(133)
³−
→´ −
→
em que T N = F . Em componentes, se
→
−
N ≡ N = N j ej ,
−
→
−
→
F = Fi ei
temos que
³
´
−
→
→
ej = N j T (ej ) = N j T i j ei ⇒ F i = T ij N j
Fi ei = T N j −
(134)
→
−
→
→
ej ) na base {→
ei } ≡
ej , em que Tji são componentes de T (−
usando T (−
ej ) = Tji −
{ei }.
No contexto de transformação de coordenadas temos que numa base {ej 0 }
0
0
0
i0 −
i0
→
para coordenadas ui se pode escrever T (−
e→
= T ij 0 N j .
j 0 ) = T j 0 ei0 com F
Mas
0
0
0
0
F i = U ik F k , N j = U jl N l
41
pelo que se pode escrever
0
0
0
Uki F k N l = Tji0 Ulj N l ,
0
∀N
(135)
0
0
j
l
vindo que Uki Tlk = Tji0 Ulj e usando Ulj Um
0 = δm0 obtemos que
0
0
0
0
m k
Tmi 0 = Uki Um
0 Tm
(136)
Esta é então a regra de transformação de componentes para tensores que
pode ser generalizada e definida para qualquer tensor com vários indices.
Em particular, suponhamos que temos para cada sistema de coordenadas
c ,.....c
N r+s quantidades Td11,.....dsr que se transformam como
0
0
a ,.....a
0
c ,.....c
0
Tb01,.....b0 r = Xcar1 · · · Xcarr Xbd01 · · · Xbd0ss Td11,.....dsr
1
(137)
1
s
0
em que Xca e Xbd0 são matrizes Jacobianas de transformação. As quandidades
a ,.....a
Tb11,.....bsr são as componentes de um tensor do tipo (r,s). Assim vem que o
tensor T ab é do tipo (2, 0) e que o tensor Tab é do tipo (0, 2).
A verificação de que um conjunto de quantidades constitui um tensor
pode ser feita através do Teorema do Quociente. Como exemplo que pode
ser generalizado a quaisquer dimensões e número de indices tomemos N 3
números Tbca em que a, b, c = 1, ..., N . Se soubermos que para um vector
contravariante arbitrário λa os N 2 números Tbca λc se transformam como um
0
0
0
d f
tensor (1, 1), isto é, Tba0 c0 λc = Xda Xbe0 Tef
λ então podemos deduzir que Tbca
0
0
são componentes de um tensor do tipo (1, 2). Como λc = Xfc λf vem que
³
0
0
´
0
d
Tba0 c0 Xfc − Xda Xbe0 Tef
λf = 0, ∀λ
(138)
d
e tomando λf = δgf vem que Tba0 c0 Xgc = Xda Xbe0 Teg
e por fim usando Xgc Xhg0 =
0
δhc 0 obtemos que
0
0
0
0
0
d
Tba0 h0 = Xda Xbe0 Xhg0 Teg
0
(139)
No que diz respeito aos tensores, estes, tal como os vectores, podem-se adicionar, multiplicar por um escalar e também contrair indices. Note-se que o
tensor gab e g ab se usa para descer e subir indices, isto é,
Tab = gac T cb ,
42
Tba = gbc T ac
(140)
Mais ainda, o produto escalar de dois vectores é dado por
gab λa µb = g ab λa µb = λa µa = λa µa
(141)
Relembre-se que na relatividade geral a métrica do espaço- tempo não é
positiva definida i.e., gab λa λb ≥ 0, ∀λa sendo igual a zero quando λa = 0. Daı́
¯1/2
¯
¯
¯
que o comprimento de um vector é ¯gab λa λb ¯ e o ângulo entre dois vectores
é
gab λa µb
cos θ =
(142)
|gcd λc λd |1/2 |gef µe µf |1/2
Retornemos então à análise do movimento no espaço-tempo tal como
descrito por uma teoria métrica, podendo agora descrever como objectos
se movem sob acção da gravitação através de uma linguagem matemática
mais abrangente. Este procedimento implica usar o conceito de geodésica.
Uma geodésica no espaço Euclidiano constitui uma linha recta caracterizada
por ser a linha mais curta entre dois pontos. Esta propriedade pode ser
extrapolada para uma variedade espacio-temporal com a expressão
¯1/2
Z b¯
Z b ¯¯
¯
dxa dxb ¯¯
. a . b ¯1/2
¯
¯
L=
¯gab x x ¯
dt =
¯
¯gab
dt
dt dt ¯
a
a ¯
(143)
onde se procura agora o valor máximo no tempo próprio. No entanto, agora
involve um problema: se a métrica for indefinida como é o caso da relatividade
restrita com




ηµυ = 
1
0
0
0
0
−1
0
0
0
0
−1
0
0
0
0
−1





ν, µ = 0, 1, 2, 3 (t, x, y, z)
podemos ter curvas de comprimento nulo. Temos pois que empregar uma
outra condição.
Podemos então definir uma linha geodésica “direita” como aquela onde o
vector tangente aponta sempre na mesma direcção. Usando o comprimento
−
→
.
de arco s como parâmetro da curva, o vector tangente é λ = r (s) = ddsr e tem
comprimento constante (e unitário). Verifica-se então que numa geodésica se
tem
dλ
=0
ds
43
(144)
−
→
(λ = λ não varia nem em direcção, nem sentido, nem magnitude). Numa
base {ei } associada às coordenadas ui podemos escrever λ = λi ei e também
que
d (λi ei ) . i
dλ
=
=λ ei + λi ėi
(145)
0=
ds
ds
e escrevendo
.j
.
(146)
ei = (∂j ei ) u
podemos escrever
¶
µ
.i
.k
dλ
→
ei = 0
(147)
0=
⇒ λ +Γijk λj U −
ds
→
porque ∂j −
ei não é zero geralmente e na base {ei } tomamos a decomposição
em 27 quantidades (tri-dimensional), isto é,
∂j ei ≡ Γkij ek .
(148)
dU i
dS
(149)
E como
.i
λi =U =
podemos escrever ainda que
j
k
dλ
d 2 ui
i du du
⇒
+
Γ
=0
(150)
jk
ds
ds2
ds ds
que é a equação que define uma geodésica no espaço-tempo. Mas o que é a
quantidade Γijk ? Notemos então que
0=
→
→
∂ 2−
r
∂ 2−
r
K
K
K
−
→
∂j →
ei =
=
= ∂i −
ej → ΓK
ij ek . = Γji ek ⇒ Γij = Γji .
i
j
j
∂u ∂u
∂u ∂ui
(151)
Mais ainda, como gij = ei · ej podemos escrever
→
→
→
→
ej )
ei ) · −
ej + −
ei · (∂k −
∂k gij = (∂k −
´
³
m−
→
→
− −
→
e→
= (Γm −
m ) · ej + ei · Γ em
jk
ik
m
isto é, Γk gij = Γm
ik gmj + Γjk gim e daqui podemos obter
1
Γlki = g lj (∂k gij + ∂i gjk − ∂j gki )
2
44
(152)
Figura...
Figure 18: Representação de ...
No contexto de caracterizar o que é uma linha “direita” numa variedade
espacio-temporal, vamos encontrar também a sua relação com o conceito de
transporte paralelo de vector ao longo de uma curva.
Relativamente à figura junta, seja uma curva γ numa variedade parametrizada
por coordenadas ui (t) e seja P0 o ponto inicial onde o parâmetro t é t0 na
curva γ. Nesse ponto temos um vector λ0 . Como podemos transportá-lo ao
longo da curva referida sem mudar a sua direcção e sentido assim como magnitude, de forma a obter um vector paralelo λ(t) em qualquer outro ponto de
γ? Tal é obtido construindo essa campo de vectores ao longo da curva, gerados por um método de transporte paralelo ao longo de γ. Matemáticamente,
tal significa que se tem
dλ
= 0, λ(t0 ) = λ0
(153)
dt
a partir do qual se obtêm as componentes
λ̇i + Γijk λj u̇k = 0
(154)
e constituindo a forma em componentes para equação de transporte paralelo
de um vector numa variedade. A este propósito refira-se que a definição de
uma geodésica com parâmetro afim corresponde a uma curva caracterizada
por ter o seu vector tangente ẋa constituindo um campo de vectores paralelos
45
ao longo da geodésica. Igualmente se mencione que se um vector é assim
transportado ao longo de uma geodésica, então o ângulo desse vector com a
tangente à geodésica permanece constante.
Usualmente, associa-se o conceito de transporte paralelo em variedades
ao que é empregue no espaço Euclidiano que é plano. Mas não é assim. O
resultado numa variedade com curvatura depende do percurso seguido! De
facto, o vector obtido pelo transporte de um dado vector V de um ponto
P para um ponto Q irá depender do percurso tomado. Em particular, ao
longo de uma curva fechada (“loop”) um vector pode não retornar à situação
inicial...Há uma pequena discrepância que terá a ver com a curvatura. Mas
já lá vamos.
Uma pergunta que terá ficado por colocar mas que aqui tem o seu relvo
é a seguinte: Porque se chama “conexões” às conexões? A razão é que as
quantidades matemáticas Γijk realmente fornexem um modo de relacionar
entre os espaços tangentes de vectores em diferentes pontos da variedade,
permitindo-nos associar um vector num dado espaço tangente vectorial com
o vector paralelo a ele mas noutro ponto.
Suponhamos um ponto P com coordenadas xa e um outro ponto Q com
coordenadas xa + δxa . Seja γ uma curva parametrizada que liga P a Q,
onde a P se atribui o parâmetro u e a Q o valor u + δu. Sejam também
λ̄a = λa + δλa as componentes do vector em Q paralelo a um dado vector λa
em P . Como o vector em Q é obtido por transporte paralelo de λa de P ao
longo da curva γ, escreve-se
δλa '
e com
dλa
δu
du
dλa
dxc
= −Γabc λb
du
du
obtemos que
dxc
δu ' λa − Γabc λb δxc
(155)
du
Assim temos nesta aproximação uma aplicação linear do espaço tangente em
P para o espaço tangente de vectores em Q, em que o vector em P com
componentes λa é transformado no vector paralelo em Q com componentes
λ̄a ' λa − Γabc λb
λ̄a = Aa b λb ,
Aa b = δ a b − Γabc δxc
46
(156)
Em termos de transformação para outras coordenadas, ter-se-ia que
0
0
0
λ̇i0 + Γij 0 k0 λj u̇k = 0
0
0
0
0
(157)
0
Verifica-se que se λ̄a ≡ λa − Γab0 c0 λb δxc então
0
λ̄a X e a0 (Q) = λ̄e
(158)
e
∂x
onde X e a0 (Q) representa ∂x
a0 calculado em Q. I.e., a aplicação do espaço de
vectores em P para o espaço em Q não depende do sistema de coordenadas.
Neste resultado usa-se a propriedade de transformação de conexões
0
0
0
Γab0 c0 = Γdf g X a d X f b0 X g c0 + X d c0 b0 X a d
(159)
pelo que as conexões não são tensores.
Relacionado com o conceito de transporte paralelo e curvas definidas
numa variedade está a diferenciação de vectores e tensores numa variedade.
Consideremos um campo vectorial (por simplicidade) definido ao longo
de uma curva e tomemos as suas componentes como funções do parãmetro
u ao longo da curva. Verifica-se então que para λa (u) definido ao longo
a
de γ coordenatizada como xa (u), as n quantidades dλ
não constituem as
du
componentes de um vector. De facto, num outro sistema de coordenadas
a
a0
determina
temos dλdu e a sua relação com dλ
du
³
0
´
0
d
d X a d λd
dxc d
dλa
0 dλ
0
=
= Xa d
+ X a dc
λ
du
du
du
du
0
2 a0
(160)
a
∂ x
dλ
em que o termo em X a dc = ∂x
d ∂xc estaria ausente se du fossem as componentes de um vector. A razão para tal é que na equação
dλa
λa (u + δu) − λa (u)
= δu → 0lim
du
δu
(161)
tomamos a diferença de componentes em diferentes pontos de γ, daı́ a
origem do problema: os¯ coeficientes
da trasnformação dependem do ponto
¯
0 ¯
0 ¯
onde calculam, i.e., X a d ¯ 6= X a d ¯
. Assim a diferença entre componentes
u
u+δu
nunca
um vector pois no dado limite a diferença
¯ daria 0 as
¯ componentes de
a0 ¯
a ¯
a0
X d¯ − X d¯
produz X dc .
u
u+δu
47
Para que a derivada produza um vector temos que tomar a diferença de
componentes no mesmo ponto de γ. Tal é obtido através do conceito de
transporte paralelo.
Seja o ponto P na curva γ com parâmetro u e seja Q o ponto vizinho com
parâmetro u + δu. Então λa (u + δu) é um vector em Q, tal como é o vector
λ̄a , obtido por transporte paralelo de λa (u) desde P para Q. A diferença
λa (u + δu) − λ̄a é então um vector em Q, assim como o quociente
λa (u + δu) − λ̄a
δu
(162)
No limite em que δu → 0 obtemos uma nova derivada definida como
Dλa
λa (u + δu) − λ̄a
= δu → 0lim
du
δu
Como λa (u + δu) ' λa (u) +
dλa
δu
du
(163)
e λ̄a ' λa − Γabc λb (u)δxc então
λa (u + δu) − λ̄a
dλa
δxc
'
+ Γabc λb (u)
δu
du
du
e no limite temos
Dλa
dλa
dxc
≡
+ Γabc λb (u)
(164)
du
du
du
sendo que todas as componentes estão calculadas no ponto P de γ. Esta
derivada de um vector λ ao longo de uma curva envolve não só a derivada
a
usual dλ
mas também as conexões. Um vector transportado paralelamente
du
ao longo de uma curva pode ser caracterizado assim com
Dλa
=0
du
(165)
e reciprocamente, λa forma as componentes de um campo de vectores paralelo
a
D
ao longo da curva se Dλ
= 0. A derivada du
possui as seguintes propriedades:
du
i) Quando aplicada a um campo tensorial qualquer, produz um outro
campo tensorial do mesmo tipo
ii) É um operador linear: Du (KT ab ) = KDu (T ab ) e Du (αT ab + βU ab ) =
αDu T ab + βDu U ab .
iii) Obedece à regra de Leibniz: Du (T ab U cd ) = T ab Du U cd + (Du T ab )U cd
iv) Para um campo escalar (função) tem-se
Du Φ =
48
dΦ
du
(166)
v) Igualmente se tem
Dλa
dλa
dxc
≡
+ Γabc λb
du
du
du
(167)
dxc
Dλa
dλa
≡
− Γdac λd
du
du
du
(168)
d
d
DT ab
dT ab
a
cb dx
b
ac dx
≡
+ Γcd T
+ Γcd T
du
du
du
du
(169)
DTab
dTab
dxd
dxd
≡
− Γcad Tcb
− Γcbd Tac
du
du
du
du
(170)
d
d
DT a b
dT a b
a
c dx
c
a dx
≡
+ Γcd T b
− Γbd T c
du
du
du
du
(171)
Seja agora que o campo de vectores ou tensores não está limitado a uma
definição ao longo de uma curva mas está definido na variedade espaciotemporal ou numa região suficientemente grande e coordenatizada. Para
uma curva γ nessa região temos para vector com componentes λa a derivada
Dλa
≡ λ̇a + Γabc λb ẋc
du
mas com o uso de
λ̇a =
dλa c
ẋ
dxc
podemos escrever que
Dλa
=
du
Ã
!
dλa
+ Γabc λb ẋc
dxc
(172)
a
Notemos então que dλ
+Γabc λb não depende de γ mas apenas nas componentes
dxc
a
λ e suas derivadas, sendo válida para qualquer vector tangente ẋc . Pelo
teorema do quociente deduzimos então que
dλa
(173)
+ Γabc λb
dxc
constituem as componentes de um tensor do tipo (1, 1). Este tensor é a
derivada covariente do vector de componentes λb e por vezes escreve-se como
λa ;c ≡
dλa
+ Γabc λb = λa ,c + Γabc λb
dxc
49
(174)
Para objectos geométricos temos pois que para um campo escalar (função)
tem-se
Φ;a = Φ,a
(175)
e igualmente se tem
λa ;c = ∂c λa + Γabc λb
(176)
λa;c ≡ ∂c λa − Γdac λd
(177)
T ab;c ≡ ∂c T ab + Γacd T cb + Γbcd T ac
(178)
Tab;c ≡ ∂c Tab − Γcad Tcb − Γcbd Tac
(179)
T a b;c ≡ ∂c T a b + Γacd T c b − Γcbd T a c
(180)
Quando aplicada ao tensor da métrica, a derivada covariante é nula. De
facto, tomando Γabc = gad Γdbc e Γacd = Γadc , com ∂c gab = Γabc + Γbac , obtemos
que
∂c gab − Γdca gdb − Γdcb gad = gab;c = 0
(181)
Igualmente se tem g ab;c = 0, δ a b;c = 0 e claro que Du gab = Du g ab = Du δ a b =
0. Com esta propriedade do tensor da métrica estabelecemos que o produto
escalar de vectores se preserva sob acção de transporte paralelo assim como
obviamente a magnitude de um vector ou ângulo de dois vectores.
A derivada covariante generaliza a derivada parcial usual mas possui uma
diferença significativa. Nomeadamente a ordem em que essa derivação é feita.
Na derivada covariante, se trocarmos a ordem de derivação alteramos os
resultados. E tal está intrinsecamente relacionado com a noção de curvatura.
Tomando a derivada covariante (177) façamos λa;bc e escrevemos
³
³
´
´
³
´
λa;bc ≡ ∂c ∂b λa − ∂c Γdab λd −Γdab ∂c λd −Γeac ∂b λe − Γdeb λd −Γebc ∂e λa − Γdae λd
(182)
Se trocarmos b com c e subtrairmos temos
λa;bc − λa;cb ≡ Rd abc λd
50
(183)
onde
Rd abc ≡ ∂b Γdac − ∂c Γdab + Γeac Γdeb − Γeab Γdec
(184)
constitui o tensor curvatura de Riemann do tipo (1, 3), definido em termos
das conexões e suas derivadas. Notar que um espaço só pode ser classificado
a
de plano se todas as componentes Rbcd
são iguais a zero. De outra forma o
espaço-tempo tem curvatura. O tensor de curvatura de Riemann tem várias
propriedades, entre as quais:
a) tem n4 componentes onde n é a dimensão do espaço
b) devido a algumas simetrias, pode ter n2 (n2 − 1)/12
a
a
a
c) Rbcd
+ Rcdb
+ Rdbc
= 0 (identidade ciclica)
d) Rabcd = −Rbacd ;Rabcd = −Rabdc ;Rabcd = Rcdab
a
e) Racd
=0
a
a
a
f ) Rbcd;e + Rbde;c
+ Rbec;d
= 0 (identidades de Bianchi)
Além destas propriedades podemos construir outros objectos tensoriais
do tensor de Riemann. Em particular o tensor de Ricci,
c
Rab = Racb
(185)
Este tensor é simétrico tal que Rba = Rab e dele se obtem um escalar curvatura
dado por
Raa = R = g ab Rab
(186)
Temos também outro objecto que é o tensor de Einstein
1
Gab = Rab − Rgab
2
(187)
o qual é simétrico também e tem divergencia nula. ié,
1
(Rcb − R δcb );b = 0
2
(188)
Uma relação mais precisa entre curvatura, transporte paralelo e derivada
covariantge pode ser extraida se analisarmos o seguinte com auxilio de uma
figura. Mencionamos atrás que o transporte paralelo numa variedade curva
depende do percurso. Com a definição matemática rigorosa de curvatura
de Riemann podemos estabelecer uma expressão para a diferença ∆λa no
transporte paralelo numa pequena curva fechada γ parametrizada por t em
torno de um ponto P , tal que os pontos na curva são coordenatizados por
51
Figura...
Figure 19: Representação de ...
xa = xaP + ξ a , com |ξ a | ¿ 1. Seja então o vector com componentes λa que irá
ser transportado paralelamente desde λa0 num ponto inicial O. Temos que
dxc
dλa
= −Γabc λb
dt
dt
i.e.,
Z
a
λ =
λa0
−
Z
Γabc λb dxc
'
λa0
−
Γabc λb dξ c
(189)
Tomando agora xa = xaP + xia + yj a , onde {ia , j a } constituem um par ortogonal de vectores unitários em P , obtem-se que
∆λa
= − (Ra
2
A
bcd )P
λb0 ic j d
onde A é área dentro da curva γ e (Ra
bcd )P
é a curvatura no ponto P.
(190)
O efeito de curvatura do espaço-tempo também se manifesta no designado efeito do desvio geodésico. Tomemos então duas geodésicas vizinhas, γ
coordenatizada por xa e parametrizada por u, e γ̃ coordenatizada por xea e
tendo u também como parâmetro. Seja ξ a (u) a separação de pontos nessas
geodésicas com o mesmo valor de parâmetro:
ξ a (u) = xea (u) − xa (u)
52
(191)
Como γ e γe são geodésicas, temos que:
d2 xea e a dxea dxec
+ Γbc
=0
du2
du du
e
b
c
d2 xa
a dx dx
+
Γ
=0
bc
du2
du du
Tomando então a aproximação
e a = Γa + Γ a ξ d
Γ
bc
bc
bc,d
(192)
vamos obter que:
ξ¨a + Γabc,d ẋb ẋc ξ d + Γabc ẋb ξ c + Γabc ẋc ξ b = 0
que pode ser re-escrito como
´
d ³ ˙a
ξ + Γabc ξ b ẋc − Γabc,d ξ b ẋc ẋd − Γabc ξ b ẍc − Γabc,d ξ b ẋc ẋd + Γabc ξ c ẋb = 0
du
Usando então a equação da geodésica para ẍc , obtemos após simplificações
que
´
D2 ξ a ³ a
a
a e
a e
b c d
+
Γ
−
Γ
+
Γ
Γ
−
Γ
Γ
cd,b
bc,d
be dc
ed bc ξ ẋ ẋ = 0
du2
(193)
isto é,
D2 ξ a
a
+ Rcbd
ξ b ẋc ẋd = 0
du2
∂
D
a
Num espaço-tempo plano, Rbcd
= 0 e Du
= ∂u
, pelo que se tem
(194)
D2 ξ a
= 0 ⇒ ξ a (u) = Aa (u) + B a ,
(195)
2
du
onde A e B são constantes. Neste caso a separação entre objectos crescerá
(se for esse o caso) de forma linear. Mas se o espaço-tempo for curto já não se
obterá esta relação linear. Para melhor entender o desvio geodésico consideremos a seguinte situação. Sejam seres bidimensionais numa superfı́cie curva
(maça), seguindo geodésicas. Se nos concentrarmos numa pequena região
esta pode ser tomada como plana localmente.
53
Mas numa perspectiva mais abranjente tomemos dois desses percursos a
partir de dois pontos vizinhos e numa mesma linha de partida. Movendo-se
esses seres com igual velocidade constante partindo de um mesmo instante
seguirão geodésicas que são perpendiculares inicialmente à linha de partida.
As trajectórias parecem ser paralelas de inicı́o, mas a curvatura da superfı́cie
forçá-las-à a convergir, isto é, a sua separação já não é constante e ter-se-à
uma aceleração relativa não nula para esses seres que percorrem geodésicas
vizinhas com velocidades constantes. Neste sentido, a curvatura do espaçotempo implica o desvio geodésico que pode ser medido experimentalmente.
É notável referir que as partı́culas livres (isto é, aquelas que se movem
unicamente sob a acção da gravitação; esta já não sendo em relatividade
geral uma força) seguem trajéctórias geodésicas no espeço-tempo curvo mas
localmente o espaço-tempo da relatividade geral é o da relatividade restrita
sendo que a curvatura apenas se faz notar para escalas maiores.
54
4
As Equações de Einstein
A teoria da relatividade geral já está algo exposta em várias expressões
acima escritas como em muitos comentários e notas atrás presentes. Vamos
aqui nestre capitulo conferir uma formulação matemática rigorosa e escrever
as equações correspondentes, assim como alguns elementos que são ainda
necessários.
Ao progredir do espaço-tempo plano da relatividade restrita para a noção
de (variedade) espaço-tempo curvo que irá caracterizar a relatividade geral,
estamos a incluir os efeitos da gravitação, não como uma força no âmbito
Newtoniano mas agora em termos da curvatura do espaço-tempo. Para melhor entender “porque” e “como” relembremos que uma particula livre neste
contexto significa uma particula que se move sob acção apenas da gravitação.
Comparando a expressão
ν
σ
d2 xµ
µ dx dx
+ Γνσ
=0
dτ 2
dτ dτ
(196)
com a sua análoga no espaço-tempo da relatividade restrita
d2 xµ
=0
dτ 2
(197)
concluimos que os coeficientes de conexão têm um papel importante em explicar os efeitos gravitacionais. E como aqueles são função da métrica espaciotemporal, então é na métrica do espaço-tempo que estará a origem e conteúdo
da interacção gravitacional. Relembre-se que a primeira lei de Newton afirma
que um corpo mantem o seu estado de movimento uniforme em linha recta
ou repouso a não ser que actuado por uma força. E tal pode ser estendido
em que qualquer particula segue uma geodésica no espaço-tempo. Num referencial inercial podemos ignorar as conexões Γµνσ em (196) e as geodésicas
são descritas aproximadamente por (197). Se agora assumirmos um contexto
' 1 e as geodésicas descrevem-se como seria
não relativista então toma-se dτ
dt
d2 xi
de esperar por dt2 = 0. Assim, na descrição Newtoniana uma particula livre
segue movimento numa linha recta de forma uniforme no espaço e tem-se
2 i
livre
F i = m ddtx2 . A extensão Einsteiniana estabelece³ que uma particula
´
ν dxσ
2 xµ
dx
d
segue geodésicas no espaço-tempo e com F µ = m dτ 2 + Γµνσ dτ dτ .
55
Para aprofundar em mais detalhe este aspecto, tome-se o caso em que
temos uma situação e um sistema de coordenadas em que a métrica do espaçotempo se escreve como
gµν = ηµν + hµν
(198)
onde os termos hµν são tomados como pequenos. Mais ainda, assume-se que
o campo gravitacional (que estará representado em hµν ) é tal que
∂hµν
¿ ∂i hµν
(199)
∂t
i.e., é o limite de quasi-estático. Usemos então a coordenada temporal t (tal
que x0 = ct) em vez do tempo próprio τ . A equação para as geodésicas
escreve-se como
ν
σ
d2 xµ
dxµ
µ dx dx
+
Γ
=
h(s)
(200)
νσ
dt2
dt dt
dt
∂0 hµν = c−1
onde h(t) = −
se como
³
dt2
dτ 2
´³
dt
dτ
´2
. Dividindo por c2 a parte espacial de (200) escreve-
1 d 2 xi
2 i dxj
1 i dxj dxk
1
dxi
i
+
Γ
+
Γ
+
Γ
=
h(t)
(201)
00
c2 dt2
c 0j dt
c2 jk dt dt
c2
dt
em que se ignorará o último termo no lado esquerdo de (201). Escrevamos
agora hµν = η µσ η νρ hσρ e daqui que g µρ = η µρ −hµρ , Γµνσ = 21 η µρ (∂νhσρ + ∂σhνρ − ∂ρhνσ ) ,
³
´2
ν
σ
Γi00 = − 21 η ij ∂j h00 , Γi0j = − 12 δ ij (∂j h0k − ∂k h0j ) . Também de dτ
= c12 gσν dxdt dxdt
dt
√
2
se extrai que dτ
= 1 + h00 ' 1 + 12 h00 , pelo que ddt2τ = 2c h00,0 e 1c h(t) = h00,0 .
dt
Então para (201) podemos escrever que (após multiplicar por m)
d2 xi
m 2 = −mδ ij ∂j
dt
Ã
!
c2 00
dxj
h
+ mcδ ik (∂j h0k − ∂k h0j )
2
dt
(202)
O lado esquerdo de (202) representa o produto de massa com a aceleração,
i.e., uma força Newtoniana. O primeiro termo do lado direito é o gradiente
~ , em que o potencial é
na forma de −m∇U
1
(203)
U = c2 h00 + C
2
em que C é uma constante e o segundo termo é um termo dependente da
velocidade e envolve rotação, como na componente de Coriolis. Se ignorarmos
este termo, o que obtivemos foi
d2 xi
= δ ij ∂j U
dt2
56
(204)
que é a equação Newtoniana do movimento poara uma particula movendo-se
num campo gravitacional U , onde se faz a identificação
g00 = 1 +
2U
c2
(205)
fornecendo a relação entre a métrica do espaço tempo e o potencial Newtoniano.
A lei Newtoniana da gravitação é obtida se tomarmos a métrica do espaçotempo de Schwarzschild (ver capitulo 5 e equação (243)) que representa o
campo estático produzido por um corpo com massa M e simetria esférica:
µ
2
2
2
ds = c dτ = c
2
¶
µ
2GM
2GM
dt2 − 1 − 2
1− 2
cr
cr
¶−1
dr2 − r2 dθ2 − r2 sin2 θ dφ2
Usando x0 = ct, x1 = r sin θ cos φ, x2 = r sin θ sin φ, x3 = r cos θ obtemos a
métrica na forma gµν = ηµν + hµν , onde para valores GM
¿ 1, os termos hµν
c2 r
são pequenos e obtemos
g00 = 1 − 2
GM
GM
GM
⇒ h00 = −2 2 ⇒ U = −
2
cr
cr
r
(206)
e a equação (204) toma a forma esperada
m
d2~r2
~ = − GM m ~r
= −m∇U
2
dt
~r2 |~r|
Neste nosso percurso para obter as equações do campo gravitacional em
relatividade geral há ainda que identificar quais são os elementos (e que
forma devem ter) necessários para determinar a métrica e assim a geometria
do espaço-tempo a partir de uma dada distribuição de matéria. De facto, é
da presença desta que surge o campo gravitacional.
Recordemos que no espaço-tempo plano da relatividade restrita num referencial inercial a descrição de matéria emprega os seguintes elementos
n
o
• Quadri-vectores λ = {λµ } = λ0 , ~λ
• Uma particula teste tem massa em repouso m
• Usa-se o tempo coordenado t ou o tempo próprio τ , relacionados por
−1/2
dt
= γ = (1 − V 2 /c2 )
onde V é magnitude da velocidade espacial
dτ
usual da particula
57
• A energia total é dada por E = γmc2
• O quadri-vector velocidade é dado por uµ =
por pµ = muµ
n
dxµ
dτ
e o quadri-momento
o
• Relembre-se que se tem V µ = c, V~ onde V~ é a velocidade espacial
µ
dt µ
V .
usual, em que V µ = dxdt , tal que uµ = dτ
• Uma particula estacionária num ponto com coordenadas espaciais ~r0
r0 )
= (c, 0), pµ = m(c, 0). Quando em movimento, obtemtem uµ = d(cτ,~
dτ
µ
µ
se que p = mu = γmV µ = (E/c, p~); A energia e momento linear em
relatividade restrita correspondem às componentes temporal e espaciais
de um quadri-vector.
Mas como será para o caso de uma distribuição continua de matéria, onde
não possamos identificar particula a particula? Esta questão é importante
em relatividade restrita mas muito significativa em relatividade geral, pois
são corpos maciços e com extensão espacial que são a fonte do campo gravitacional. Na resposta a este questão temos que considerar a noção de fluido,
caracterizado por duas componentes; a densidade de energia (própria) ρ e a
µ
pressão P , junto com o vector uµ = dx
. E para relacionar conteúdo material
dτ
com o campo gravitacional que admite uma representação métrica, há que
encontrar uma representação tensorial para os termos de matéria-energia, a
qual constituirá a fonte para que surja um espaço-tempo curvo.
A resposta está no tensor energia-momento T = {T µν }. Para o caso de
um fluido perfeito, toma a forma de
µ
Tµν
¶
P
= ρ + 2 uµ uν − P gµν
c
(207)
o qual é simétrico como a métrica. De notar que a pressão contribui para o
conteúdo energético do fluido (ver primeiro termo de (207)) no lado direito.
Será que esta representação para energia e matéria é adequada? Assim é.
Note-se que
¶
µ
P
(208)
T µν uν = c2 ρ + 2 uµ − P uµ = c2 ρuµ
c
a qual constitui a projecção de T em uν , fornecendo a dendidade de energia. A divergência de T, i.e., T µν ,µ quando igualada a zero fornece equações
58
relevantes em mecânica. Assim em relatividade restrita e por simplicidade
temos
P µ ν P µ ν
u u + 2u u
c2 ,µ
c
P,µ µ ν
u u − P,µ η µν
2
c
(209)
µ
2
ν
Agora de uµ u = c obtemos por diferenciação que u ,µ uν = 0, pelo que
contraindo T µν ,µ = 0 com uν obtemos
T µν ,µ = 0 ⇔ (ρuµ ),µ uν + ρuµ uν,µ +
(ρuµ ),µ +
,µ
+
P µ
u
=0
c2 ,µ
(210)
com a qual a equação (209) se simplifica em
µ
¶
P
ρ + 2 uµ uν
c
³
,µ
´
= η µν − c−2 uµ uν P,µ
(211)
Pode então verificar-se que a equação (210) representa a equação de continuidade de um fluido e (211) a equação do movimento do fluido. Com
uµ = γV µ = γ(c, V~ ) para velocidades não relativistas, ignorando V /c e
tomando γ ≈ 1, junto com cP2 ¿ ρ, obtemos
∂ρ ~ ~
+ ∇(ρV ) = 0
∂t
e
Ã
!
∂
~ V~ = −∇P
~
ρ
+ V~ ∇
∂t
a qual é a equação de Euler para o movimento de um fluido perfeito.
(Na curvatura do espaço-tempo seguimos os passos acima, generalizando
para relatividade geral empregando derivadas covariantes em T µν ;µ = 0
e substituindo η µν por g µν . É interessante referir que em (211), usando
2 µ
uµ uν ,µ = ddτx2 se pode simplificar em
µ
P
ρ+ 2
c
¶ 2 µ
dx
dτ 2
³
´
= η µν − c−2 uµ uν P,µ
(212)
indicando
³ 2 µ
´que as particulas de um fluido são desvidas de uma linha geodésica
d x
= 0 pela presença de gradientes de pressão.
dτ 2
Estamos agora em condições de abordar a formulação das equações da
relatividade geral. As equações de campo da gravitação da relatividade geral
59
são designadas de equações de Einstein. Como já analisamos no contexto de
uma teoria métrica da gravitação (através de uma descrição tensorial, tanto
da matéria como da geometria), vamos ver como obter equações consistentes.
Einstein já sabia da analise de geodésicas que o tensor da métrica gµν descrevia a geometria do espaço-tempo associado a uma distribuição de matéria
e relacionava-se com o potencial gravı́tico em limites especificos. Esta quantidade possui informação sobre a geometria e o potencial gravitico (relembrar
o papel de g00 na identificação do potencial gravitico).
Sabendo que a matéria se descrevia pelo tensor energia-momento Tµν
Einstein considerou inicialmente
gµν = Tµν
Ambos são simétricos e de divergencia nula mas desta equação não se obtem
a equação de Poisson ∇2 U = 4πGρ. Uma hipótese seria então com os conhecimentos da geometria de Riemann, escrever Rµν = Tµν só que Rµν não
tem divergencia nula, apesar de ser simétrico.
No entanto seria de esperar a presença do tensor de Ricci (em alguma
forma tensorial) nas equações. Para ver porquê, comparemos a equação de
desvio geodésico na sua aproximação Newtoniana utilizando o tempo próprio
τ como parâmetro afim, tal que se tem
D2 ξ a
D2 ξ µ
a
b c d
+ Rcbd ξ ẋ ẋ = 0 ⇔
≡ K µ ν ξν
(213)
2
2
dτ
dτ
µ
µ
onde K µ ν = Rσνρ
ẋσ ẋρ = −Rσρν
ẋσ ẋρ . Na teoria Newtoniana, tomemos duas
particulas que se movem sob acção da gravitação em trajectórias próximas
dadas por xi (t) e x̃i (t), com equações do movimento dadas por
d2 x̃i
= δ ij ∂˜j U
dt2
d2 xi
= δ ij ∂j U,
dt2
(214)
Definindo então ξ i (t) = x̃i (t) − xi (t), para pequenas separações temos
∂˜k U = ∂k U + (∂j ∂k U ) ξ j (t)
pelo que se obtem então
onde K i
j
d2 ξ i
= −K i j ξ j
dt2
= δ ik ∂j ∂k U. Temos então a correspondência
µ
K µ ν = −Rσρν
ẋσ ẋρ ↔ K i j = δ ik ∂j ∂k U
60
(215)
(216)
Como no espaço vazio as equações de Newton levam a ∇2 U = 0, i.e., K i i = 0,
tal sugere que num espaço-tempo sem matéria se tome K µ µ = 0, i.e., Rσρ
ẋσ ẋρ . Para vectores arbitrários ẋρ , tangentes a geodésicas, podemos concluir
pelas propriedades de simetria do tensor de Ricci, que
K µ µ = 0 ⇔ Rσρ = 0
(217)
A comparação entre o desvio geodésico e sua aproximação Newtoniana sugerem assim que as equações da relatividade geral no vazio (ausencia de
matéria-energia) serão dadas por
Rµν = 0
(218)
Havia ainda que formular as equações completas, para a presença de
fontes de matéria-energia. Albert Einstein então deduziu que seria:
1
Rµν − Rgµν = KTµν = Gµν
(219)
2
Assim ambos os lados da equação são simétricos, tem divergencia nula, correspondem a 10 equações derivadas parciais não lineares acopladas e tem
limite adequado as equações da mecânica Newtoniana ( inclusive a equação
de Poisson). Como nota, refira-se que
K=−
8πG
c4
(220)
Outra forma de escrever esta equação é
1
Rµν = K(T µν − T g µν )
(221)
2
onde T = T µ µ . Convém enfatizar que o tensor energia-momento contem
todas as formas de matéria e energia. Daqui se expressa que uma região
do espaço-tempo onde não há matéria, i.e., T µν = 0, implica que Rµν = 0
também. O espaço vazio é assim caracterizado por Rµν = 0 mas isto não
implica que a curvatura de Riemann seja nula.
Para terminar, vamos mostrar as equações de Einstein com matéria,
constituem o que é necessário e consistente para uma teoria métrica da
gravitação. Tomemos então as componentes 00 dessas equações, isto é,
61
µ
¶
1
R00 = K T00 − T g00
(222)
2
Se o campo gravitico for fraco, usemos gµν = ηµν + hµν , onde hµν é pequeno.
Para a matéria, o tensor de energia momento é composto por particulas cujas
velocidades são V ¿ c, em que
Ã
V2
γ = 1− 2
c
!− 1
2
≈1
(223)
e
P
¿ρ
c2
(224)
Tµν = ρuu uν
(225)
Tomemos então que
isto é, T = ρc2 , vindo que
µ
R00
1
≈ Kρ u0 u0 − c2 g00
2
¶
(226)
e com u0 ≈ c e g00 ≈ 1, pomos
Como
1
Roo ≈ Kρc2
2
(227)
R00 = ∂0 Γµ0µ − ∂µ Γµ00 + Γ00µ Γµ00 − Γ000 Γµ0µ
(228)
na situação de um campo gravitico fraco, tal que podemos usar um sistema
Cartesiano aproximado para as coordenadas, as conexões são pequenas e
temos então:
e como
escrevemos que -
R00 ≈ −∂i Γi00
(229)
1
Γi00 = g ij ∂j h00
2
(230)
1
1 ij
δ ∂i ∂j h00 ≈ Kρc2
2
2
(231)
62
Mais ainda, δ ij ∂i ∂j = ∇2 e
2U
c2
vem que nesta aproximação de correcções relativistas à descrição Newtoniana
se pode escrever
1
∇2 U ≈ − Kρc4
(232)
2
que corresponde à equação Newtoniana de Poisson se
h00 =
K=−
8πG
⇒ ∇2 U ≈ 4πGρ
c4
63
(233)
5
A Solução de Schwarzschild
Nesta capitulo vamos abordar a solução de Schwarzchild, que se aplica à descrição em relatividade geral do campo gravı́tico criado por objectos massivos
como planetas e estrelas (incluindo buracos negros). Esta solução é obtida
das equações de Einstein assumindo que:
a) o campo é estático;
b) o campo tem simetria esférica;
c) o espaço-tempo é vazio (fora do objecto...);
d) o espaço-tempo é assimptoticamente plano;
Também se toma que o espaço-tempo é coordenatizado por t, r, θ, φ com
uma métrica do tipo:
ds2 = c2 dτ 2 = A (r) dt2 − B (r) dr2 − r2 dθ2 − r2 sin2 θdφ2
(234)
onde A e B são funções de r. Notar que:
i) Não há dependencia em t;
ii) A superfı́cie com r, t constante tem geometria com métrica ds2 =
r2 (dθ2 + sin2 θdφ2 );
iii) A e B serão obtidas de Rµν = 0;
iv) Temos que A (r) → c2 , B (r) → 1 quando r → ∞
v) B (r)não é necessáriamente igual a 1, pelo que não podemos assumir
que r é uma coordenada radial.
Usando a expressão de Rµν em função das conexões obtemos as seguintes
equações para Rµν = 0 :
R00
A00
A0
=−
+
2B 4B
R11
A0
A00
+
=
2A 4A
R22
Ã
Ã
A0 B 0
+
A
B
A0 B 0
+
A
B
1
r
= −1+
B
2B
Ã
!
−
!
−
A0 B 0
+
A
B
R33 = R22 sin2 θ = 0
64
A0
=0
rB
B0
=0
rB
(235)
(236)
!
=0
(237)
(238)
d
, “ . ” = dtd . Agora multipliquemos a primeira equação
onde se usa “ 0 ” = dr
B
por A e adicionemos à segunda equação. Obtemos que A0 B + AB 0 = 0, isto
é, AB= constante. Das condições (i)-(v) atrás escritas vem que:
AB = c2 ⇔ B =
c2
A
(239)
Indo à terceira equação, temos que
µ
¶
µ
¶
K
K −1
A (r) = c 1 +
B = 1+
(240)
r
r
onde K é uma constante relacionada com a massa do objecto (exemplo,
planeta ou estrela). Notar então que quando Kr é pequeno, isto é, r → ∞,
o elemento de linha ou métrica diferem muito pouco da que corresponde ao
espaço-tempo plano. E ainda, se usarmos as coordenadas x0 = ct, x1 =
r sin θ cos φ, x2 = r sin θ sin φ, x3 = r cos θ obtemos a métrica na forma
gµν = ηµν + hµν , em que h00 = Kr , e assim
2
h00 =
2U
MG
⇒ Uv = −
2
c
r
(241)
nesta aproximação concluimos que
K=−
2GM
c2
(242)
pelo que a solução de Schwarzchild correspondente ao exterior de um objecto
com massaM é:
µ
ds2 = c2 dτ 2 = c2 1 −
¶
µ
2GM
2GM
dt2 − 1 − 2
2
cr
cr
¶−1
dr2 − r2 dθ2 − r2 sin2 θ dφ2
(243)
Vamos agora tentar interpretar as consequências fisicas desta solução.
Notemos que −∞ < t < ∞. As coordenadas θ e φ são simples coordenadas
angulares em que 0 ≤ θ ≤ π e 0 ≤ φ ≤ 2π. A coordenada r variará entre ∞
, pois
e a fronteira fisica rF que será a superficie do objecto ou 2GM
c2
r→
2GM
⇒ g11 → ∞
c2
65
(244)
Figura issueH-iv
Figure 20: Representação de ...
Por simplicidade, façamos a identificação m ≡
toma então a forma:
µ
c2 dτ 2 = 1 −
¶
µ
2m 2 2
2m
c dt − 1 −
r
r
¶−1
2GM
.
c2
A métrica de Schwarzchild
dr2 − r2 dθ2 − r2 sin2 θdφ2
(245)
pelo que a distorção relativamente ao espaço-tempo plano é determinada pelo
factor 2m
. (Se este for zero temos a métrica do espaço-tempo plano). Vamos
r
pormenorizar estes aspectos.
Para uma esfera na solução de Schwarzchild com t e r constantes, o elemento de linha é
dl2 = r2 (dθ2 + sin2 θdφ2 )
correspondendo a uma esfera bidimensional de raio r no espaço Euclidiano.
Mas na solução de Schwarzchild, para θ e φ constantes, o elemento de linha
espacial é
µ
¶
2m −1
dR ≡ 1 −
dr
(246)
r
assim dR > dr e r não corresponde a medir distâncias. Este detalhe fica
melhor compreendido com a seguinte figura onde se relaciona a distância
66
³
´− 1
2
radial em Schwarzchild como dR = f (r)dr em que f (r) = 1 − 2m
.
r
Notemos então que f (r) → ∞, r → 2m e f (r) → 1, r → ∞. Os discos C1
e C2 estão na região S(m = 0) que corresponde a uma região do espaço
tempo plano enquanto que os discos C3 e C4 estão numa região S(m 6= 0),
respectivamente. É apenas na região S(m = 0) que a distância radial entre
esferas tem o valor dr, porque na geometria Schwarzchild, a distância radial
é dada por dR > dr. A analogia é a mesma relativamente a determinar
o quociente entre o perimetro de uma circunferência na superficie de uma
esfera e o seu raio nela localizado.
No que diz respeito à coordenada temporal sabemos que relógios registam
o tempo próprio ao longo de linhas do universo, dada por dτ . Este é pois o
tempo próprio na geometria de Schwarzchild, o qual (em r, θ, φ constantes)
dá a relação
µ
¶1
2m 2
dτ = 1 −
dt
(247)
r
e o que se assumirá no espaço tempo plano é que o tempo próprio é igual à coordenada temporal. No espaço-tempo de Schwarzchild, temos que dτ < dt.
Suponhamos então que um sinal luminoso é enviado de um emissor num
dado ponto rE, θE, φE, tal que descreve uma geodésica de luz e é observado
num receptor em rR, θR, φR . Se tE é a coordenada temporal da emissão e tR
a coordenada temporal da recepção, então a luz viajou ou progrediu entre acontecimentos com coordenadas (tE , rE, θE, φE ) e (tR , rR, θR, φR ). Seja u
o parâmetro ao longo da geodésica de luz tal que tE corresponde uE e a tR
corresponde uR . Para geodésicas de luz temos a equação
µ
¶
Ã
2m 2 dt
1−
c
r
du
!2
µ
2m
= 1−
r
¶−1 Ã
dr
du
!2
Ã
+r
2
dθ
du
!2
Ã
!
dφ
+ r sin θ
du
(248)
2
2
tal que
Ã
dt
du
!
1
=
c
"µ
2m
1−
r
¶−1
dxi dxj
gij
du du
#1
2
(249)
e integrando vem
1 Z uR
tR − tE =
c uE
"µ
2m
1−
r
67
¶−1
dxi dxj
gij
du du
#1
2
du
(250)
Figura issueH-v
Figure 21: Representação de ...
Notar que no lado direito desta expressão temos apenas coordenadas espaciais, pelo que para eventos com coodenadas espaciais fixas para o emissor e
receptor, o valor tR − tE é o mesmo para todos os sinais enviados, isto é,
(1)
(1)
(2)
(2)
tE − tR = tE − tR = ...... = ∆tR − ∆tE
(251)
Por outras palavras, a diferença de coordenada temporal no ponto de emissão
é igual à diferença de coordenada temporal no receptor. No entanto, o relógio
de um observador no ponto de emissão regista o tempo próprio e não o tempo
coordenado, em que os dois se relacionam como
µ
2m
∆τE = 1 −
rE
e como ∆τE = ∆τR , vem que
µ
¶1
2
2m
∆τR = 1 −
rR
∆tE ,
q
1−
∆τR
=q
∆τE
1−
2m
rR
2m
rE
¶1
2
∆tR
(252)
(253)
Esta é a expressão que determina a dilatação do tempo pela gravitação.
A expressão anterior permite extrair a forma do desvio espectral num
campo gravitico. Vamos então assumir que o emissor possui um átomo que
68
num intervalo de tempo próprio ∆τE emite n impulsos. O observador junto
com átomo regista uma frequência n/∆τE em que esta é a frequência própria
do átomo emissor. Um observador junto do receptor irá ver esses n impulsos
mas num intervalo de tempo próprio ∆τR , com frequência n/∆τR .E como
∆τE 6= ∆τR , temos uma diferença na frequência observada. De facto obtemos
que
q
1−
∆τR
=q
∆τE
1−
2m
rR
(254)
2m
rE
e para rE c2 À 2GM e rR c2 À 2GM , vem que
νr
GM
'1+ 2
νE
c
µ
1
1
−
rR rE
¶
∆ν
νR − νR
GM
⇒
=
' 2
νE
νE
c
µ
1
1
−
rR rE
¶
(255)
Assim, se o emissor estiver perto de um objecto massivo e o receptor afastado,
então r1R < r1E e temos um desvio espectral para o vermelho.
Estudemos agora o movimento e trajectória de objectos na geometria
de Shwarzschild, em particular as trajectórias de luz que irão corresponder
a geodésicas tipo luz e as trajectórias com massa em movimento que são
geodésicas tipo tempo.As equações das geodésicas podem ser obtidas das
equações de Euler-Lagrange a partir de
"
µ
µ
¶
2m 2
2m
1
1 2
c 1−
ṫ − 1 −
L(x , ẋ ) = gµν ẋσ ẋσ =
2
2
r
r
σ
σ
¶−1
#
2
2
ṙ − r dr
2
(256)
No caso da geometria de Schwarzschild que tem simetria esférica podemos
tomar para simplificar θ = π . Assim para as geodésicas temos que
µ
¶
µ
¶
2m −2 m 2
mc2
2m −1
ṙ − rφ̇2 = 0
(257)
r̈ + 2 ṫ2 − 1 −
2
r
r
r
r
Também temos que em virtude de t e φ serem coordenadas ciclicas vir que:
1−
µ
e
¶
2m
∂L
=C ⇒ 1−
ṫ = k
r
∂ ṫ
69
(258)
∂L
= C ⇒ r2 φ̇ = h
∂ φ̇
(259)
em que k, h são constantes. É de referir também c2 dτ 2 = gµν dxµ dxν leva,
com θ = π/2 a
µ
¶
µ
2m 2
2m
c 1−
ṫ − 1 −
r
r
Daqui também podemos escrever que
2
µ
c2
¶
µ
2m ṫ2
2m
1−
− 1−
2
r φ̇
r
¶−1
ṙ2 − r2 φ̇2 = c2
¶−1 Ã
!2
(260)
c2
φ̇2
(261)
c2 k 2 r2
2m
−
=0
1−
r
h2
(262)
2GM
2GM
u + 2 u3
2
h
c
(263)
dr
dφ
− r2 =
e usando as equações anteriores (258) e (259) vem
Ã
dr
dφ
Ã
!2
+r
c2 r 2
1+ 2
h
2
!µ
¶
e se usarmos agora u = 1r , obtemos
Ã
du
dφ
!2
+ u2 = E +
2
onde E = c2 (k h−1)
, sendo que esta equação representa uma conservação de
2
energia mas onde o termo 2GM
u3 é a correcção relativista. Esta equação dá
c2
a trajectória de U ou r em função de φ no plano θ = π/2.
Analisemos agora o caso da queda vertical. Temos que usar φ = C , isto
é h = 0 e a equação (259) não pode ser usada, mas com a equação (260) para
φ̇ = 0 vem
µ
¶
2m
ṙ − c k + c 1 −
=0
(264)
r
em que k 2 = 1 − 2m
, em que r0 é coordenda radial da posição inicial. Diferr0
enciando vem
2
2 2
Ã
2
!
GM
2mc2
2ṙr̈ +
ṙ = 0 ⇒ r̈ + 2 = 0
2
r
r
(265)
Esta equação é muito semelhante à equação Newtoniana. Mas r não é a
distância na vertical na geometria se Schwarzschild. Mais ainda, a derivação
70
é em relação ao tempo próprio τ e na mecânica Newtoniana usa-se o tempo
coordenado t. Podemos escrever então
µ
¶
1
1 2
1
ṙ = M G
−
(266)
2
r r0
O lado esquerdo da esquerdo da equação é positivo e tal determina que r < r0 .
É semelhante ao caso de uma particula de massa unitária em queda desde
o repouso em r0 , adquirindo energia cinética igual à sua perda de energia
gravitica potencial.
A equação acima permite determinar a variação de tempo próprio da
partı́cula em queda desde o repouso em r0 onde tomamos τ = τ0 . Integrando,
obtemos que
¶
Z r0 µ
1
r0 r 1/2
dr
τ=√
r0 − r
2GM r
(267)
notando que o limite de integração r pode ser tomado como 2m = 2GM
ou
c2
uma fronteira fisica (e.g., na superficie da esfera). Verifica-se que o integral
é finito para r = 2m. Só que para a coordenada temporal t a queda para
r = 2m dá um resultado ... infinito. Vamos clarificar esta análise usando
a velocidade dada por dr
= v(r) e comparando com o que sucede numa
dt
descrição unicamente Newtoniana com a função ṽ(r). Para r → ∞ temos
que
³
v(r) = 2mc2
´1/2 (r − 2m)
r3/2
(268)
e
(2mc2 )1/2
(269)
r1/2
pelo que com r a decrescer desde ∞, v(r) aumenta até um valor máximo e
depois decresce para v(r) → 0 em r → 2m. Quanto a ṽ(r), aumenta para
∞ quando r → 0. No caso do movimento circular, temos que θ = π/2 e r =
³ ´2
constante que ṙ = r̈ = 0, vem mc2 ṫ2 = r3 φ̇2 , onde dφ
= GM
, pelo que a
dt
r3
variação de coordenada temporal numa revolução (orbital) é
ṽ(r) =
∆t2 =
√
2π
71
r3
GM
(270)
Vamos agora analisar o que sucede para trajectórias de raios luminosos,
isto é, as trajectórias para fotões. Usando as equações (257) e (259) obtemos
que
µ
¶
µ
2m 2
2m
ṫ − 1 −
r
r
c2 1 −
¶−1
ṙ2 − r2 φ̇2 = 0
(271)
levando a
Ã
du
dφ
!2
+ u2 = F +
2GM 3
u
c3
(272)
2 2
onde F = chk2 . Esta equação é usada para demonstrar o encurvamento das
trajectórias luminosas. Também se verifica
que´ para ṙ = r̈ = 0 se obtem
³
φ̇2
φ̇2
mc2
2
= r3 e da equação anterior ṫ2 = c 1 − 2m
r.2 , o que mostra que para
r
ṫ2
r = 3m obtém trajectórias circulares para os fotões em órbita.
Para o desvio de raios luminosos, tomemos então a equação atrás indicada.
Para M = 0, vem
Ã
!2
du
+ u2 = F
(273)
dφ
cuja solução é da forma
u = u0 sinφ,
r = r0 sinφ.
(274)
Esta solução representa uma linha recta seguida pelo fotão originário desde
o infinito em φ = 0 e indo para ∞ em φ = π. Mas para M 6= 0, temos que
considerar a influência de ε = 2GM
. Tomando ε ¿ r e expandido em série
c2
de Taylor, vamos proceder da seguinte forma. Se u0 é o valor de u onde o
du
fotão está mais perto da estrela, verifica-se que dφ
= 0 e podemos escrever:
Ã
du
dφ
!2
+ u2 = u20 (1 − u0 ε) + εu3
(275)
Procuremos soluções da forma
u = u0 sinφ + εV
onde V é uma função de φ. Substituindo na equação acima, temos
Ã
dV
2
dφ
!
cos φ + 2V sin φ = u20 (sin2 φ − 1)
72
(276)
cuja solução é
µ
u = u0
¶
1
1
1 − εV sin φ + εV o2 (1 − cos φ)2
2
2
(277)
Espera-se algum encurvamento da trajectória da luz, pelo que para distâncias
infinitas a trajectória não seguirá ao longo de φ = π mas sim π + α, com
α ¿ 1. Usando as equações obtidas com u = 0 e φ = π + α, obtemos então
que
0 = −u0 α + 2εu20 , α = 2u0 ε
Daqui então o fotão é desviado ao passar por um corpo massivo com
α = 2εu0 =
4GM
r0 c2
que é o dobro do valor indicado pelo principio de equivalência.
73
(278)
6
Cosmologia Relativista
Neste último capitulo, vamos focar as consequências da relatividade geral
para a cosmologia. A força fundamental que mantém estrelas e outros sistemas com galáxias juntas é a força da gravidade. É pois de fundamental
importância usar a teoria da relatividade geral. para descrever a estrutura
em larga escala da distribuição de matéria no universo. Para isso vamos usar
algunmas simplificações:
a) O Universo é como que preenchido por um fluido macroscópico de“galáxias”
na forma de fluido perfeito, com tensor energia-momento
µ
Tµν
¶
P
= ρ + 2 uµ uν − P gµν
c
b) Tal deriva de tomar o Universo especialmente homogéneo, isto é, o
número de galáxias/unidade volume é muito aproximadamente uniforme no
espaço vasto do universo.
c) Também se assume que o universo é especialmente isotrópico, isto é, o
número de galáxias/unidade de ângulo sólido é o mesmo aproximadamente
em todas as direcções.
d) Também se emprega o facto que há um desvio para o vermelho no
comprimento de onda da luz emitida por galáxias.
e) Referir que existe uma radiação única de fundo uniforme de cerca de
2.7K preenchendo o Universo.
Para o cenário cosmológico atrás descrito é possivel propor uma geometria espácio-temporal. Esta é a métrica de Lemâitre-Friedman-RobertesonWalker (LFRW) baseada em espaços máximamente simétricos e assumindo
o prı́ncipio cosmológico: homogeneidade e isotropia espacial. Usando coordenadas t, r, θ, φ o elemento de linha da métrica de LFRW é
2
2
2
2
c dτ = dt − a (t)
·³
1 − kr
´
2 −1
¸
2
2
2
2
2
dr + r dθ + r sin θdφ
2
(279)
em que k = 0, ±1 determina a geometria espacial como plano, fechada ou
aberta (curvatura espacial nula, positiva ou negativa) e a(t) é um factor de
escala. O valor k = 0 dá pois um espaço tridimensional Euclidiano imerso
num espaço-tempo de Minkowski. Já k = 1 corresponde a uma esfera de 3
74
dimensões e tem volume finito. Para k = −1, temos um espaço de curvatura
com uma “sela” a 3 dimensões, com volume constante. O factor de escala a(t)
é resposável pelas fases em que se expande o espaço de uma forma uniforme
de tal forma que da
é positivo. O factor de escala opera no espaço como um
dt
todo independentemente da direcção e do valor de t.
A coordenada temporal t pode ser interpretada do seguinte modo. Atribuamos
a cada galáxia um relógio que regista o seu tempo próprio. Todos estes
relógios podesm ser sincronizados em a(t) = 0. E como o Universo é espacialmente homogéneo e isotrópico então não há razão para os relógios em
diferentes posições diferirem no seu registo. Além disso, atribuı́mos no sistema (t, r, θ, φ), as linhas do Universo das galáxias às linhas de coordenadas
r, θ ,φ = constante.
Temos pois um sistema de coordenadas co-movendo-se com as galáxias
onde t é também o tempo próprio τ , isto é, o tempo cósmico. Uma analogia
para entender melhor o contexto acima explicado é tomar um balão com
pintas, que representam galáxias. Suprando no balão este expande com o
tempo e a distância entre pintas (galáxias) irá depender apenas de um factor
de escala que cresce com o tempo tal que cada galáxia possui o mesmo registo
temporal t.
Assim, com o elemento de linha de LFRW vamos pesquisar modelos cosmológicos e extrair implicações da teoria da relatividade geral. Em particular
usando a definição de conexão indicada atrás assim como o tensor de Ricci,
escrevemos
R00 = −
3ä
a
(280)
R11 = −(aä + 2ȧ2 + 2k)/(1 − kr2 )
(281)
R22 = −(aä + 2ȧ2 + 2k)/r2
(282)
R33 = −(aä + 2ȧ2 + 2k)/r2 sin2 θ
(283)
e todos os outros são zero. Além disso, para c = 1 e uµ uµ = 1, temos
T = T ν ν = ρ − 3P
Além disso, no sistema de coordenadas U µ = δ0µ e Uµ = gµν U ν = gµν Uoν =
gµ0 = δµ0 vem que:
75
Tµν = (ρ + P )δµ0 δU0 − P gµν
(284)
e
1
1
Tµν − T gµν = (ρ + P )δµ0 δν0 − (ρ − P )gµν
2
2
Daqui se escreve que
(285)
1
1
T00 − g00 = (ρ + 3P )
2
2
(286)
1
1
T11 − T g11 = (ρ − P )a2 /(1 − kr2 )
2
2
(287)
1
1
T22 − T g33 = (ρ − P )r2 a2 sin2 θ
2
2
(288)
1
1
T33 − T g33 = (ρ − P )r2 a2 sin2 θ
(289)
2
2
sendo as outras nulas. No fim destes cálculos as equações de Einstein da
relatividade geral para a geometria de LFRW resumem-se apenas a duas
equações
3ä
= .4πG(ρ + 3P )
a
(290)
aä + 2ȧ2 + 2k = 4πG(ρ − P )a2
(291)
e destas duas equações ainda obtemos
ȧ2 + k =
8πG 2
ρa
3
(292)
conhecida pela equação de Friedman.
Utilizando agora T µν ; ν = 0 iremos obter as equações de continuidade e
movimento do fluido de partı́culas. Mais concretamente
(ρuµ );µ + P uµ ;µ = 0
(293)
(ρ + P )uν ;µ uµ = (g µν − uµ uν )P,µ
(294)
76
e escrevendo daqui que
ρ,µ uµ + (ρ + P )(uµ ,µ +Γµµν uν ) = 0
e com uµ =δ0µ vem que se reduz a
3ȧ
=0
(295)
a
As outras equações são identicamente zero nos dois lados, sendo automáticamente
satisfeitas. Isto significa que as particulas do fluido cosmológico seguem
geodésicas, o que seria de esperar pois como a pressão é uma função do
tempo apenas, não há gradientes de pressão para afastar das geodésicas.
ρ̇ + (ρ + P )
O Universo onde “hoje” nos encontramos parece ser dominado pela ausência
de pressão e apenas a presença de matéria (galáxias) sem contacto relevante.
Assim, usamos P ' 0 que implica que ρR3 = constante. Para os modelos de
k = ±1, 0, estes têm um ponto onde a(t) = 0 pelo que usamos t = 0 onde
R(0) = 0, isto é, a origem do Universo. Usando ρR3 = ρ0 R03 , a equação de
2
Friedman como ȧ2 + k = Aa , com A = 8πGρ0 a30 /3 > 0 e H [a (t)] ≡ aȧ como
parâmetro de Hubble temos então
Ã
3H02
k
8πGρ0
=
ρ0 −
2
a0
3
8πG


 k > 0 ↔ ρ0 > ρC
!
⇒


k = 0 ↔ ρ0 = ρC
k < 0 ↔ ρ0 < ρC
(296)
2
onde ρC = 3Ho
é a densidade critica. Também se define o parâmetro de
8πG
desaceleração q (q0 no seu valor actual) como
q=−
aä
ȧ2
(297)
0
Neste modelo em particular com P = 0 vem que q0 = 4πGρ
= 2ρρ0C .
3H02
Para o modelo plano, k = 0, ρ0 = 1/2 e da equação de Friedman vem
µ
¶
A
3A 2/3 2/3
da
= 1/2 ⇒ a(t) =
t
(298)
dt
a
2
Este modelo constitui a solução cosmológica de Einstein-DeSitter notando
que a → 0, quando t → ∞. Para o modelo fechado k = 1, ρ0 > ρC e
=
q0 > 21 , levando a da
dt
2
2
a = A sin Ψ/2 vem que
³
A2 −a
a
´1/2
, isto é, t =
77
R a ³ a ´1/2
da e usando
0 A2 −a
t = A2
Z Ψ
0
1 ZΨ
1
sin2 (Ψ/2) dΨ = A2
(1 − cos Ψ)dΨ = A2 (Ψ − sin Ψ)
2
2
0
i.e.,
1
1
a = A2 (1 − cos Ψ), t = A2 (Ψ − sin Ψ)
(299)
2
2
dando um Universo ciclico. O modelo aberto, tem k = −1, ρ0 < ρC e
q0 < 12 , donde vem que da
=
dt
2
2
a = A sinh Ψ/2 vem que
t = A2
Z Ψ
0
³
A2 +a
a
´1/2
, isto é, t =
R a ³ a ´1/2
da e usando
0 A2 +a
1 ZΨ
1
sinh2 (Ψ/2) dΨ = A2
(cosh Ψ − 1)dΨ = A2 (sinh Ψ − Ψ)
2
2
0
i.e.,
1
1
a = A2 (cosh Ψ − 1), t = A2 (sinh Ψ − 1)
(300)
2
2
A terminar, façamos um comentário relacionando teoria e observação
aravés da idade do Universo, t0 . Para o modelo k = 0 temos que H(t) =
ȧ(t)/a = 3t2 e se medirmos observacionalmente H(t0 ) = H0 . Podemos determinar que
2
t0 '
= 12 × 109 anos
(301)
3Ho
78
Download

t´opicos de relatividade e cosmologia