c °Paulo Rodrigues Lima Vargas Moniz TÓPICOS DE RELATIVIDADE E COSMOLOGIA Apontamentos para Aulas Teóricas (“Lecture Notes”) Departamento de Fı́sica Universidade da Beira Interior Setembro de 2003 -1 NOTA Aos (Às) aluno(a)s, a interessados, a criticos e para os que é “pouco, não chega, não é assim”: Esta é a versão −7 − λ, onde λ ∈ <+ e λ À 1. Falta bastante, mas pretende-se que a assistência tenha um guia para s “lectures”. Isto é pois um (very!!) modest and rough draft do que se wish it will become. Be patient...: Ad interim in medias res absit omen. 0 1 A Relatividade Restrita A teoria Newtoniana colocava o espaço e o tempo como conceitos totalmente separados. O tempo era absoluto, igual para todos os observadores e as distancias eram imutáveis entre observadores. A teoria da relativade restrita de A. Einstein vem colocar estas duas entidades numa única, o espaço-tempo quadri-dimensional. Para se formular sumáriamente a relatividade restrita há que tomar o conceito de referencial inercial S: um sistema de coordenadas, onde se tem as dimensões espaciais x, y, z, mutualmente ortogonais e um sistema de relógios (inerciais) sincronizados em repouso nesse referencial, fornecendo um tempo coordenado t. A caracteristica essencial destes referenciais é que a descrição do movimento é formulada nestas variáveis então a primeira lei de Newton é válida. Daqui vem que se um S e S 0 são referenciais inerciais então S 0 movese com velocidade constante e sem rotação relativamante a S. Refira-se que neste contexto as coordenadas (t, x, y, z) identificam pontos no espaço-tempo e cada ponto corresponde a um evento (ou acontecimento): por exemplo, um relâmpago súbito que em (t = T, x ± ∆x, y ± ∆y, z ± ∆z) ilumina todos as localizações espaciais (x ± ∆x, y ± ∆y, z ± ∆z) de uma sala às escuras imediatamente antes e depois. A relatividade restrita é baseada em dois postulados: • A velocidade da luz c é a mesma em todos os referenciais inerciais • As leis da natureza são as mesmas em todos os referenciais inerciais Assim sendo, então de dr dr0 = 0 (1) dt dt para a velocidade de um raio de luz no vazio nos referenciais S e S 0 , extraimos que c2 dt2 − dx2 − dy 2 − dz 2 = c2 dt02 − dx02 − dy 02 − dz 02 = 0 (2) c= implicando que há uma quantidade invariante em relatividade restrita interrelacionando tempo e espaço: ds2 ≡ c2 dt2 − dx2 − dy 2 − dz 2 1 (3) A quantidade ds é o elemento de linha espacio-temporal. A invariância está indicada em (2) para trajectórias luminosas e iremos ver como é noutros casos adiante. A presença desta invariância está ligada (como em vários outras situações semelhantes em fı́sica) à existência de determinadas simetrias no espaço-tempo quadri-dimensional. Em teoria da relatividade emprega-se usualmente a convenção xµ , onde µ = 0, 1, 2, 3 para indexar coordenadas no espaço-tempo através de x0 ≡ ct, x1 ≡ x, x2 ≡ y, x3 ≡ z (4) empregando uma representação matricial (ou tensorial, como se especificará em mais detalhe no capitulo 3) para o elemento de linha ou intervalo espaciotemporal ds2 ≡ ηµν dxµ dxν = ηµν dx0µ dx0ν (5) onde ηµυ = 1 0 0 0 0 −1 0 0 0 0 −1 0 0 0 0 −1 (6) representa a métrica do espaço-tempo (designado de Minkowski) e à qual corresponderá uma geometria Lorentziana (como já iremos explicar). Assumimos a convenção de soma de indices de Einstein. A matriz em (6) constitui uma representação do tensor da métrica de Minkowski. As leis da natureza serão equações (incluindo tensores) tal como (5) que são invariantes sob acção de uma transformação de coordenadas de S para S 0 . Essas aplicações entre referenciais inerciais são designadas de transformações de Lorentz. Na sua forma mais abrangente as transformações entre dois referenciais inerciais podem ser expressas na forma (admitindo uma representação matricial) 0 x0µ = Λµ ν xν + C µ (7) 0 onde Λµ ν e C µ são constantes. Diferenciando (7) e usando (5) obtemos que ηµυ = Λρ 0 µΛ σ0 ν ηρσ (8) e que caracteriza as trasformações de Lorentz. Para C µ = 0 temos as transformações homogéneas e para C µ 6= 0 temos as as transformações nãohomogeneas, constituindo o grupo de transformações de Poincaré. No caso homogéneo o grupod e transformações é designado de grupo de Lorentz, 2 Figura ... Figure 1: Representação de ... onde as origens dos referencias inerciais coicidem em t = t0 = 0. Além das rotações no espaço Euclidiano tri-dimensional onde (x, y, z) → (x0 , y 0 , z 0 ), incluem também o caso de transformações onde (t, x) → (t0 , x0 ), designadas de “boost”, associada a quando um dos referencias se move com velocidade relativa V constante e uniforme com respeito ao outro, como ilustrada na figura junta. Nesse caso simples de movimento ao longo do eixo dos xx, verifica-se que as transformações de Lorentz têm a forma µ 0 t = x0 = y0 = z0 = V γ t−x 2 c γ (x − V t) y z ¶ (9) (10) (11) (12) ou então na forma matricial ct0 x0 y0 z0 = γ −V γ/c −V γ/c γ 0 0 0 0 3 0 0 1 0 0 0 0 1 ct x y z (13) com à V2 γ ≡ 1− 2 c !−1/2 (14) Se fizermos tanh ψ = V /c, então também se pode escrever ct0 x0 y0 z0 = = = = ct cosh ψ − x sinh ψ x cosh ψ − ct sinh ψ y z (15) (16) (17) (18) o que é mais parecido (formalmente) com uma rotação espacial mas não sendo uma de forma alguma. Das transformações de Lorentz obtem (e.g., por diferenciação) que a lei de adição de velocidades é alterada, sendo para o caso de dois referencias inercias S e S 0 , onde S 0 se move no eixo dos xx com velocidade V relativamente a S e se um observador em S 0 regista um movimento de uma particula no eixo dos xx com velocidade W , então o observador S resgistas esse movimento no eixo dos xx com velocidade U= V +W 1 + V W/c2 (19) Analisemos agora as consequências fisicas da transformação de Lorentz em que (t, x) → (t0 , x0 ). Um facto imediato é que acontecimentos simultâneos num referencial S já não o serão em S 0 . Seja por exemplo o acender dos faróis de um carro em S que se tomam como simultâneos em t1 = t2 = t0 e separados espacialmente entre x´1 e x2 . Pela transformação de Lorentz (9) obtem-se em ³ V 0 0 S que ∆t = γ ∆x c2 : os acontecimentos em S 0 não são simultâneos, devido à separação espacial em S. O tempo em relatividade restrita adquire ainda um outro contexto bastante relevante. Cada referencial inercial possui o seu tempo coordenado. É possivel introduzir um conceito de tempo invariante associado com um dado observador cuja posição no espaço é um ponto. O seu percurso no espaçotempo é designado de linha ou percurso de existência (ou de história) 1 . Define-se então para esse observador (que coincide com a sua origem das coordenads) o seu tempo próprio τ, cujo intervalo dτ corresponde ao progresso 1 Em lingua Inglesa usa-se a designação “world line”, que alguns preferem traduzir como linha do universo. Propomos aqui uma designação diferente. 4 de um relógio comóvel com ele, registando para ele o tempo que progride enquanto segue ao longo da sua linha de existência. Para outro observador num referencial inercial S, com coordenadas t, x, y, z, regista as variações de coordenadas relacionando-as através de c2 dτ 2 = c2 dt2 − dr2 − dy 2 − dz 2 = ηµν dxµ dxν ou por à V2 dτ = 1 − 2 c (20) !1/2 dt (21) onde V é a velocidade do observador com tempo próprio τ relativamente a S. Para esse observador, o tempo próprio é o seu tempo coordenado; É o tempo registado por um relógio que se move junto com particula ou observador ao longo da sua linha de existência ou de história. Verifica-se então que de (21) se tem à !1/2 V2 ∆τ = 1 − 2 ∆t (22) c onde ∆t é o intervalo de tempo coordenado registado por relógios estacionários e sincronos em S, enquanto que ∆τ é o intervalo de tempo próprio para esses mesmos acontecimentos mas tal como registados por relógio que se move junto com o referencial onde esses acontecimentos ocorrem na mesma localização espacial. Um exemplo desses acontecimentos são os batimentos ou intervalos de progresso de um relógio em S 0 . Temos então que ∆t > ∆τ (23) pelo que um relógio em movimento progride mais lentamente relativamente a um relógio idêntico em S. Este é o fenómeno da dilatação do tempo. Também a noção de espaço ou comprimento espacial em relatividade restrita adquire um contexto importante. Suponhamos que temos uma régua rigida movendo-se na direcção do seu comprimento (e.g., a direcção positiva do eixo dos xx) com uma velocidade V relativamante ao referencial inercial S como na figura junta. Seja S 0 o referencial inercial onde a régua está fixa e assim em repouso. Define-se como comprimento próprio `0 como o comprimento dessa régua tal como medido em S 0 onde `0 = x02 − x01 5 (24) Figura ... Figure 2: Representação de ... em que x02 e x01 são as coordenadas espaciais das extremidades da régua em S 0 . Usando as transformações de Lorentz (10) para determinar as coordenadas espaciais das extremidades em S e tomando a diferença no mesmo instante de tempo t em S, obtemos que (para o comprimento medido em S dado por ` = x2 − x1 ) !1/2 à V2 `0 (25) `= 1− 2 c e assim ` < `0 (26) ao que corresponde uma contracção no comprimento para a régua que está em movimento e tal como registado em S. Saliente-se que se a régua se movesse numa direcção perpendicular ao seu comprimento (e.g., estivesse alinhada com eixo dos yy mas movimento fosse no eixo dos xx) não haveria contracção. Daı́ que para volumes (e claro para densidades) se deve tomar a contracção espacial como à V2 slV = 1 − 2 c !1/2 slV0 (27) Consideremos agora a descrição geométrica do espaço-tempo da relatividade restrita. Num espaço tempo quadri-dimensional introduz-se o conceito 6 de quadri-vector, com a notação de o n n o λ →λµ = λ0 , λ1 , λ2 , λ3 = λ0 , ~λ (28) empregando a métrica ηµν para levantar e baixar indices (no capitulo 3 ficará mais claro porquê) através de n λµ = ηµν λν = λ0 , −λ1 , −λ2 , −λ3 o (29) pelo que o produto escalar toma a forma λ · σ = λµ σ µ = ηµν λν σ µ = λ0 σ 0 − λ1 σ 1 − λ2 σ 2 − λ3 σ 3 (30) Um aspecto que é então pertinente de salientar é que um quadrivector pode determinar que ηµν λν λµ > 0 → tipotempo = 0 → tiponuloouluz < 0 → tipoespaço (31) Esta designação tem a ver com a estrutura e representação de espaço tempo em diagramas. Relembre-se que para um raio de luz c2 dt2 −dx2 −dy 2 −dz 2 = 0, pelo que se usa (ver figura junta) a convenção de representar o espaçotempo (ignorando uma dimensão espacial) com o eixo do tempo apontando na vertical e dois eixos espaciais de xx e yy, por exemplo, ortogonais ao primeiro definindo linhas e um plano horizontal. Os raios de luz fazem ângulos de 45o entre eixos com escala ct e o de xx (ou entre o eixo do tempo e o eixo de dimensão espacial, como yy, se tomarmos unidadees tais que c = 1). Todas as direcções percorridas por fotões a partir de um ponto O no espaço tempo define um cone de luz (ou nulo) de equação c2 t2 = x2 + y 2 + z 2 . De facto, são dois desses cones, um apontando para instantes futuros aos de O e outro para instantes passados. Ao primeiro chamamos de cone de luz do futuro e ao segundo cone de luz do passado. Constituem pois pontos ou acontecimentos no espaço-tempo que estão no futuro ou no passado de O, respectivamente, sendo alcançados por raios de luz. Todos os pontos no interior do cone de luz do futuro constituem com esse cone acontecimentos no futuro relativamente a O, enquanto que os no interior e no cone do passado são pontos que estão no passado causal de O. Estas duas regiões relacionam-se causalmente com O: As no cone de luz do passado e seu interior poderão influenciar O, enquanto que O 7 Figura ... Figure 3: Representação de ... pode influenciar os pontos no cone de luz e do futuro e seu interior. Tal deve-se a que a transmissão de qualquer sinal ou informação se fará com velocidades V ≤ c. As regiões fora destes cones contêm pontos que nunca poderão relacionar-se causalmente com O pois teriamos uma transformação de informação com V > c. Daı́ a designação em (31) onde um quadrivector que esteja orientado no espaço-tempo no interior do cone de luz diz-se tipo-tempo, se no seu exterior é designado de tipo-espaço e se sobre o cone de luz é designado de tipo-luz ou tipo-nulo. Fotões descrevem trajectórias sempre tangentes aos cones de luz enquanto que as linhas de existência ou de história de um corpo (pontual) com massa m descrevem trajectrias no espaço-tempo que têm V < c e por isso estão sempre no interior dos cones de luz definidos em cada ponto dessa trajectória, a qual é uma linha que pode ser parametrizada pelo tempo próprio τ. Os diagramas de Minkowski para o espaço-tempo da relatividade restrita permitem representar também as trnasformações de Lorentz entre dois referenciais inerciais S e S 0 . Note-se (como indicado na figura junta) que o eixo dos x0 x0 de S 0 é dado por t0 = 0, i.e., t = xV /c2 , enquanto que o eixo do tempo t0 é dado por x0 = 0, i.e., por x = V t. Fazendo c = 1 a inclinação do eixo dos x0 x0 relativamente a S é V enquanto que a inclinação do eixo do tempo t0 é dada por 1/V . Assim se os eixos do espaço-tempo em S estão ortogonais, 8 Figura ... Figure 4: Representação de ... a representação de S 0 neste diagrama não terá os eixos correspondentes do tempo e direcções espaciais ortogonais mas sim inclinados. Acontecimentos simultâneos em S são representados por uma linha paralela ao eixo dos xx enquanto que os simultâneos em S 0 constituem linhas paralelas a x0 x0 . Daı́ a dependencia do conceito de simultaniedade no referencial usado. Após a discussão cinemática da relatividade restrita feita atrás, podemos agora considerar alguns aspectos acerda da dinâmica relativista. A linha de existência ou de história de uma particula com massa m é dada por xµ (τ ) e tem como vector tangente a essa linha o quadrivector uµ = dxµ . Verifica-se que ηµν uν uµ = c2 , sendo um vector tipo-tempo e estando no dτ interior do cone de luz em cada ponto ou acontecimento da linha referida. A velocidade coordenada V µ (e que não é um é definida como n o n quadri-vector) o dxµ dt µ µ µ V = dt = c, V~ , tal que u = dτ V = γc, γ V~ . O quadri-momento é dado por pµ = muµ (32) onde m é a massa em repouso da particula. Também se escreve pµ = {E/c, p~} 9 (33) Para fotões temos pµ = h̄k µ onde h̄ = h , 2π (34) h sendo a constante de Planck e com o quadrivector de onda ½ µ k = ¾ 2π ~ ,k = λ ½ 2π 2π , ~n λ λ ¾ (35) sendo ~n um vector unitário na direcção de propagação. Tem-se que k µ kµ = 0 pelo que pµ pµ = 0 e a energia do fotão é E = hc/λ = hf. Notar que de (32) e (33) se tem que p~ = γmV~ e E/c = p0 = γmc. Temos então que 1 (36) E = γmc2 ' mc2 + mV 2 + · · · 2 Verifica-se que a parte espacial de pµ se reduz a p~ = mV~ quando V ¿ c mas a energia total reduz-se a um termo cinético usual na descrição Newtoniana somado de mc2 que constitui a sua energia em repouso. Da in0 variancia de pµ pµ = pµ pµ0 sob acção de uma transformação de Lorentz, usando que em S 0 (o referencial instantaneo de repouso da particula) onde 0 pµ = {mc, 0}obtemos que E 2 = p2 c2 + m2 c4 (37) A justificação de E = γmc2 pode ser feita do seguinte modo. Notemos que a segunda lei de Newton escreve-se como ~ ~ dp F · V ~ fµ = ≡ ,F c dτ µ (38) Igualmente se tem que dp0 dp0 γ = F~ · V~ ⇒ F~ · V~ = c dτ c dt (39) representando a taxa a que a força F~ produz energia transferida para a particula pelo que se pode definir a energia como E = cp0 . Neste contexto tem-se que em colisões e na ausência de forças externas se verifica a conservação de quadri-momento, na forma X pµ = cons tan te todasasparticulas 10 (40) Figura ... Figure 5: Representação de ... significando que se conserva a energia total assim como as componentes espaciais do momento. Um exemplo relevante é aquele em que um fotão colide elásticamente com um particula estacionária (e.g., um electrão). Podemos assumir para simplificar (ver figura junta) que o fotão inicialmente se move na direcção positiva do eixo dos xx e após a colisão a direcção do fotão faz um ângulo θ com o eixo dos xx e o electrão um ângulo φ. Antes da colisão temos ( (antes) µ pf otão (antes) µ pelectrão = ) hf hf , , 0, 0 c c (41) = {mc, 0, 0, 0} (42) e depois verifica-se ( (depois) µ pf otão (depois) µ pelectrão ) hf 0 hf 0 hf 0 , cos θ, sin θ, 0 c c c (43) = {γmc, γmV cos φ, −γmV sin φ, 0} (44) = Usando as leis de conservação (antes) pµfotão +(antes) pµelectrão =(depois) pµfotão +(depois) pµelectrão obtemos que a frequência final f 0 do electrão se relaciona com a 11 Figura ... Figure 6: Representação de ... frequência inicial f como f0 = f 1+ hf (1 mc2 − cos θ) (45) constituindo o efeito de Compton. Outro efeito de importante aplicação é o efeito de Doppler relativista. É inteiramente cinemático e pode ser exemplificado com recurso a outros elementos da teoria. Vamos mostrar que com uso das transformações de Lorentz aplicadas a k µ . O contexto fisico é o seguinte. Suponhamos que temos uma fonte luminosa que se move relativamente a um referencial inercial S com velocidade V na direcção positiva do eixos do xx. Num dado instante um observador na origem O recebe um fotão que faz um ângulo θ com a direcção positiva do eixo dos xx como indicado na figura junta. Assumamos que à fonte se associa o referencial inercial S 0 , cujos eixos são paralelos aos de S, estando a fonte em O0 . A relação entre o quadrivector k expresso em coordenadas de S na forma k µ e de S 0 com k µ0 procede de acordo com a trasformação de Lorentz 0 k µ0 = Λµ ν k ν (46) Usando (13) e (35) obtemos que o comprimento de onda próprio da radiação λ0 registado no referencial inercial comóvel com a fonte S 0 onde ela está em 12 repouso se relaciona com o comprimento de onda λ registado em S como ¸ · V (47) λ = λ0 γ 1 − cos θ c sendo por isso diferentes. Se a fonte se aproxima do observador em O ao longo do eixo dos xx então θ = 0 e à λ = λ0 1− 1+ V c V c !1/2 (48) tendo-se que λ < λ0 e assim um desvio no sentido do azul no espectro visivel. Se a fonte se afasta do observador em O ao longo do eixo dos xx então θ = π e à !1/2 1 + Vc λ = λ0 (49) 1 − Vc tendo-se que λ > λ0 e assim um desvio no sentido do vermelho no espectro visivel. Para uma situação transversal θ = ± π2 o efeito de Doppler corresponde ao efeito de dilatação do tempo. A terminar, consideremos como no formalismo da relatividade restrita se pode apresentar o essencial do electromagnetismo: as equações de Maxwell. Estas equações são consistentes com a relatividade geral e não com a mecânica Newtoniana. Escrevem-se usualmente como ~ ·B ~ = 0 ∇ ~ ·E ~ = ρ ∇ ε0 ~ ~ ×E ~ = − ∂B ∇ ∂t (50) ~ = ∇ ~ ×A ~ B (54) ~ ~ = −∇Φ ~ − ∂A E ∂t (55) (51) (52) ~ ~ ×B ~ = µ0 J~ + µ0 ε0 ∂ E ∇ (53) ∂t ~ é o campo eléctrico, B ~ o campo magnético, ρ a densidade de carga, onde E J~ é a densidade de corrente com µ0 e ε0 sendo a permeabilidade e a permis~ eB ~ obtêm-se de um sividade do vazio, em que µ0 ε0 = c−2 . Os vectores E ~ potencial vector A e de um potencial escalar Φ através 13 que satisfazem (50) e (51), sendo que os potenciais são determinados a menos de uma transformação ~ → A ~ + ∇Ω ~ A ∂Ω Φ → Φ− ∂t (56) (57) onde Ω é uma função arbitrária, designada de transformação de padrão2 . Escolhendo a condição de Lorentz ~ ·A ~ + µ0 ε0 ∂Φ = 0 ∇ ∂t ~ e Φ satisfazem as equações (52) e (53) implicam que A à ! ∂2 ~ = −µ0 J~ ∇ − 2 2 A c ∂t ρ Φ = − ε0 ~ ≡ A 2 (58) (59) No formalismo da relatividade restrita tomamos o quadri-potencial ½ µ A ≡ ¾ Φ ~ ,A c (60) e usando a representação (em tensor) para o campo electromagnético Fµν ≡ Aµ,ν − Aν,µ com a convenção como ∂ ∂xµ (61) ≡ “, µ”, as equações de Maxwell podem escrever-se F µν,ν = µ0 J µ Fµν,σ + Fνσ,µ + Fσµ,ν = 0 com [Fµν ] = 2 0 −E 1 /c −E 2 /c −E 3 /c E 1 /c 0 B3 −B 2 2 3 E /c −B 0 B1 E 3 /c B2 −B 1 0 Da palavra “gauge” em lingua Inglesa. 14 (62) (63) , (64) ³ ´ onde J µ = ρc, ~j como a quadri-densidade de corrente J µ = ρV µ = γρ0 V µ = ρ0 uµ , sendo ρ0 a densidade de carga própria, e com as equações de Maxwell covariantes sob acção da transformação de Lorentz. 2 O Principio da Equivalência Porque é que a Relatividade Restrita impõe uma nova teoria da gravitação, alterando a teoria Newtoniana? auto - impõe alteração? A gravitação domina em várias escalas ligando matéria nas estrelas e galáxias. A “forma” clássica dessa interacção era a seguinte F =G m1 m2 r2 e com muito sucesso. No entanto, não é compativel com a Relatividade Restrita. A razão é que esta lei não depende do tempo e actua instantaneamente . Mas, no quadro da Relatividade Restrita nenhum sinal se propaga a uma velocidade superior à da luz. O mesmo se aplica à´ lei de Coulomb, mas... ³ Q1 Q2 Na Lei de Coulomb r2 , no entanto, temos o caso limite das equações de Maxwell (as quais compatı́veis com relatividade restrita) em que as cargas se movem com velocidade inferior à da luz. O desejável é encontrar uma nova formulação da gravitação compativel com a Teoria da Relatividade e em que a Teoria Newtoniana surja assim como um limite. Sendo que a gravitação é causada pela presença de matéria, provocando efeitos de aceleração, vamos expor argumentos em que a descrição do espaçotempo em relatividade restrita com um referencial inércial é incompativel com a existência de matéria e os efeitos associados de gravitação. Recordemos então que na Relatividade Restrita: a. O tempo não é absoluto ou simultâneo; depende do estado de movimento relativo dos referenciais inérciais. b. Idem para os comprimentos espaciais. c. A invariância entre observadores é implementada com 15 Figura issueA-ii Figure 7: Representação de ... ∆s2 = c2 ∆t2 − ∆x2 − ∆y 2 − ∆z 2 d. Em um referencial inercial, constituido por uma rede infinita de réguas e relógios inérciais em cada ponto, todos estes estão sincronizados. e. A geometria da Relatividade Restrita é Lorentziana mas o espaço fisico é Euclidiano. f. As diferenças de registos espaciais e temporais são explicadas e formuladas com as transformações de Lorentzv entre referenciais inerciais. Consideremos então, um referencial não inercial e analisemos o que um observador nessas condições determina para o espaço e tempo. Esse referencial não inercial está acelerado e tomemos como exemplo uma placa giratória (em torno do eixo dos zz ). Esta roda de forma uniforme com velocidade angular ω e corresponde ao referencial S’. O referencial S’ assenta ou roda sobre referencial inercial S. Um ponto em S’ com coordenadas x = r e y = 0 move-se no circulo x2 + 2 y = r2 com aceleração ω 2 r. Portanto, todos os pontos em S’, exceptuando a origem, têm uma aceleração diferente consoante o valor de r. Seja o relógio C em S’ colocado a uma distância r da origem. Ao rodar passa por B ( relógio em S ) instantaneamente coincidindo com ele. Ao passar 16 2-Figuras issueA-iv Figure 8: Representação de ... por B, C tem uma velocidade instantânea de vC = ωr. Em um infinitésimo de tempo podemos aplicar resultados da relatividade restrita e concluir que (no referencial de repouso instantâneo de C ) a taxa de andamento de C se relaciona com a de B, tal que C parece progredir mais devagar em relação a B. De facto, para unidades de tempo (tiques do relógio) em B e C, tal como medido em B temos que τB τC = r 1− ³ ωr c ´2 (65) isto é,τB < τc . Os intervalos entre dois tiques de C, τC , são maiores que o intervalo de tempo entre dois tiques em B , de acordo com o observador no referencial inercial S. Assim, relógio C parece progredir mais lentamente que o relógio B. Ao fim de uma volta, ambos os observadores concordam que B se adiantou mais. No entanto, os relógios A e B estão sincronizados e têm o mesmo andamento. Mas o mesmo também se aplica a A e D em S’ , que coincidem na origem onde a aceleração é nula. Podemos então escrever que τD = τA = τB < τC (66) Assim, um relógio num ponto a um raio r 6= 0 em S’ progride mais lentamente 17 Figura issueA-v Figure 9: Representação de ... relativamente a um relógio na origem (r = 0) no mesmo referencial. Consideremos de novo a plataforma rotativa onde está um circulo de raio R’. Para o obter tomamos uma régua de comprimento R’ e mantendo uma extremidade fixa na origem vamos marcando um número de pontos A’,B’,C’,... igualmente espaçadas numa direcção perpendicular. Isto é realizado com o uso de uma régua padrão de comprimento L, que é colocada sucessivamente de forma perpendicular a R’. Assim podemos medir o comprimento de R’ em unidades de L, obtendo o número NR0 0 . Quanto à circunferência, usando 0 a régua L entre A’, B’,... obtemos um número NC¯ em termos das unidades L. Tomando L tão pequeno quanto possivel calculamos o quociente 0 NC¯ 2NR0 0 (67) o qual num referencial inercial (S ) daria π mas não é assim em S’. Observemos que o circulo de raio R’ em S’ pode ser comparado com um circulo de raio R em S. Em particular, note-se que a direcção do movimento em S0 é sempre perpendicular à linha unindo a origem com um ponto do circulo. Se a régua R’ em S’ coincidir com uma régua de igual comprimento R=R’ em S então o circulo em S’ “coincide” com um circulo em S, nesse caso, NR0 0 = NR , onde o N é o número de pequenas réguas de comprirmento L que completam a régua R0 em S 0 . 18 Em S, usando uma régua padrão L ao longo do cı́rculo obtemos que = π . A geometria é Euclidiana mas o comprimento da régua padrão L pode ser comparado instantaneamente com uma régua padrão em S 0 . Mas as réguas padrão em S’ ao longo do circulo surgem contraidas (mais curtas) do que as réguas padrão no circulo em S. PORQUÊ ? Porque se movem com velocidade ωR0 com respeito a S. Isto implica que um maior número de réguas padrão é necessário em S’ para completar o circulo e assim, NC¯ 2NR 0 NC¯ > NC¯ (68) 0 NC¯ >π 2NR0 0 (69) e logo Assim, a geometria espacial registada pelo observador na placa rotativa não é Euclidiana. Em suma, temos uma distorção do espaço e do tempo quando se emprega referenciais acelerados (não Lorentziano e não Euclidiano). Qualquer teoria da gravitação tem que ser consistente com a relatividade restrita. Mas a teoria Newtoniana não é. Uma nova teoria da gravitação é necessária, em que a relatividade restritaseja um limiteE tal teoria, envolvendo aceleração, não pode ter estrutura Lorentziana, não pode usar o espaço absoluto newtoniano nem o tempo correspondente (um limite da relatividade restrita). Igualmente importante, como a relatividade restrita é uma estrutura geométrica, também a nova teoria da gravitação terá que o ser. Para determinar como terá que ser a nova teoria da gravitação, analisemos alguns elementos intrinsecos da teoria da gravitação Newtoniana, associada à ocorrência de aceleração. Em primeiro lugar notemos o seguinte. A gravitação é uma força algo peculiar na mecânica Newtoniana. A segunda lei, F~ = m~a, relaciona a força total num corpo com a sua aceleração: F~ resulta sempre da acção exterior. A constante m é a massa inercial e representa a capacidade do corpo resistir à aceleração. Genericamente F~ poderá depender de vários factores tais como : massa, volume, carga, etc.... assim como do elemento actuante. No caso da gravitação temos que F~ = − n X Gmmi i=1 19 ~r − ~ri |~r − ~ri |3 (70) P −~ ri onde − ni=1 Gmi |~r~r−~ “representa” a acção de um conjunto de n massas. ri |3 Note-se, no entanto, que temos aqui “dois” ³ tipos de ´ massa gravitica. O G parâmetro m é uma massa gravitica passiva m ≡ mp , determinado a acção (sua magnitude) no corpo actuado ³ ´por outros. E também temos o equivalente G a uma massa gravitica activa ma que determina a força com que outros vão influenciar a mG p. É sabido desde Galileu que o movimento sob a acção da gravidade é independente da composição dos objectos (universalidade da queda livre). Esta universalidade pode ser exposta do seguinte modo: Vamos tomar dois corpos teste com massas m1 e m2 sob acção de um planeta com massa mplaneta . Temos então que, por um lado (assumindo por simplicidade que os três corpos estão colineares) F1 = m1 g ≡ mG 1,p g F2 = m2 g ≡ mG 2,p g onde g=− e também (71) G Gmplaneta ≡ mG a 2 2 r r F1 = mI1 a1 F2 = mI2 a2 (72) mI1 a1 = m1 g (73) Daqui vem que e mI2 a2 = µ2 g mas da universalidade da queda livre a1 = a2 e C = 1, temos então mI = mG p (74) mI1 m1 = mI2 mµ2 = C e tomando (75) O papel dual representado por m (mI e mG p ) implica que n X ~r − ~ri → − a =− Gmi |~r − ~ri |3 i=1 (76) isto é, a aceleração de qualquer particula é independente das sua massa. 20 Mas porque é então a gravitação tão anómala? Pode ser formulada uma teoria para uma força gravitacional, determinando que a aceleração gravitica de uma massa num campo gravitico é igual para todos e segue naturalmente? Vamos agora focar outro aspecto em mecânica Newtoniana da gravitação, relacionado com o contexto do principio da relatividade. O principio da relatividade afirma que as leis da fisica são as mesmo em qualquer referencial inercial. Mas Einstein não estava satisfeito com esta aparente “preferência ” pelos referenciais inerciais. Qual seria a razão desta “preferência”? Haveria algo na mecânica ou na relatividade restrita que atribuisse essa diferença? Em particular, Einstein apontou que a verificação da lei da inércia de Newton era um argumento circular (viciado). De facto, um corpo move-se sem aceleração se nenhuma força actuar nele, mas como é que sabemos se nenhuma força actua? Para forças de contacto é óbvio! Mas, e quanto a forças do tipo F ∼ r12 ( forças à distância)? Dizemos que não existem forças se o movimento for rectilineo e uniforme.... Outro aspecto importante a discutir é que a segunda lei não é válida em todos os referenciais. De facto, em F~ = m~a, temos em F~ o efeito num corpo tal como actuado por outros. É invariante e não depende do sistema de coordenadas. Em m~a a aceleração do corpo actuado depende do sistema de coordenadas. Num outo referencial F~ = m~a pode não ser válido. Considerese pois o seguinte exemplo: Seja um observador isolado no universo junto com uma particula teste, registando o movimento dessa particula teste. Se o observador está num referencial não acelerado e sem rotação, vê um objecto com velocidade constante, V~ constante, com um movimento uniforme e rectilineo. Mas, se o observador está em rotação, regista o corpo teste com o movimento de hélice (helicoidal). Há pois referenciais onde F~ = m~a = 0 e outros onde objectos ”espontaneamente” ou sem razão aparente aceleram. As leis de newton apenas podem ser empregues em referenciais inerciais: aqueles que se movem − → entre si com velocidade V constante. No entanto, podemos perguntar a um nivel mais fundamental: Porque é que (se de facto é assim) a natureza selecciona certos referenciais? E como? Em particular, como identificar um referencial inercial a partir do qual outros se podem definir? Note-se também que não é objecto da relatividade restrita resolver este assunto. A proposta de Newton é que existia uma identidade (estrutura): o espaço absoluto sem qualquer relação com os corpos (massas) exteriores sendo imutável. 21 De forma mais subtil é o espaço absoluto de Newton que “actua” na matéria e lhe confere inércia . Como pode este espaço ser entendido (“visualizado”)? A Terra é, em aproximação, um referencial inercial mas, o Sol é melhor como exemplo. Mas como o Sol se move tal como a via láctea chegamos no limite à conclusão que o espaço absoluto, no quadro Newtoniano, estaria identificado com as estrelas fixas, isto é, em mais detalhe, a distribuição de matéria em larga escala no Universo. Assim, o espaço absoluto era quilo que permitiria distinguir de referenciais inerciais de referenciais não inerciais. No entanto foram levantadas algumas objecções, em particular, por Leibniz e Berkeley. Estes afirmavam que um espaço sem matéria não tinha propriedades mecânicas, sendo mais preciso, a velocidade média da matéria no universo é que estabeleceria o padrão relativamente ao qual a inércia e aceleração se definiriam. Num ponto de vista ainda mais radical, E. Mach propõe que a inércia (massa inercial) de qualquer corpo é devida ao resto da matéria do universo. Esta ideia influenciou Albert Einstein. Mais especificamente, a hipótese é que a aceleração relativa à matéria distante é que vai determinar as propriedades de inércia. Neste contexto é interessante rever o referencial inercial de “estrelas fixas” e os referenciais inerciais como aqueles cujo movimento não acelera relativamente ao referencial de “estrelas fixas”. Consideremos então a questão das forças inerciais neste contexto de referenciais inerciais e referenciais não inerciais, assim como da equivalência entre mI e mG p. Seja a situação em que numa carruagem que subitamente acelera, o café contido numa chávena transborda. Ou de um carro que subitamente faz uma curva e somos “atirados” para as paredes. Isto é descrito nestes referenciais (comboio e carro) como forças de inércia (por exemplo, força centrifuga). Para outro observador num referencial inercial, o que sucede é que a chavena avança e o café fica no mesmo local e o passageiro do carro segue em linha recta. Podemos assim usar referenciais não inerciais e e refernciais inerciais transformando coordenadas entre ambos e na descrição do mesmo fenómeno, invocar ou não forças de inercia, as quais são ilusórias. E quanto à gravitação? Estas forças têm sido tratadas de forma diferente tal que a aceleração de um corpo em queda livre é causada pela presença de um campo de forças preenchendo o espaço. O que vamos ver é que como Einstein propôs, é possivel tratar a força gravı́tica de forma similar às forças de inércia. Isto é, como consequencia da escolha do referencial de observação. 22 3Figuras issueC-i Figure 10: Representação de ... Tal leva-nos ao principio da equivalência. Albert Einstein concluiu que a equivalência entre massa inercial e massa gravitica deveria ser justificada num contexto mais fundamental, relacionando aceleração e gravitação numa experiência hipotética. Considerou dois tipos de observadores sem conhecimento do seu estado de movimento. Irse-à assim ver que as forças gravitacionais são como as forças expressas ou presentes em referenciais acelerados e que constituem forças inerciais num referencial inercial, isto é, têm uma existência relativa e podem ser removidas através de uma transformação de coordenadas. A gravitação produz pois aceleração e vamos explorar este facto, nomeadamente a relação entre esses dois conceitos (aceleração e gravidade). Suponhamos que temos um observador num elevador estacionário no campo gravitico da Terra (suspenso). O observador larga um objecto e este cai (desloca-se verticalmente para baixo) com aceleração constante. Mas será que esta experiência pode ser distinguida de outra, em que na ausência de qualquer campo gravitico o elevador está numa nave espacial acelerada? Note-se que o observador não flutua mas é “empurrado” para o solo da cabine do elevador e se ele largar um objecto, este não está sujeito a qualquer força e prossegue a velocidade constante (zero ou não). Só que a nave acelera na vertical, afastando-se do objecto largado, depois eventualmente tocando-o no solo da cabine. Do ponto de vista do observador é o objecto que cai afastando-se dele com aceleração constante. É semelhante ao que ocorre no caso da cabine suspensa. 23 2Figuras issueC-ii Figure 11: Representação de ... Temos então dois tipos de observadores os quais largam o mesmo objecto numa experiencia. Nenhum deles pode afirmar se está num referencial acelerado no espaço vazio ou estacionário (suspenso) num campo gravı́tico. Claro que se toma a aceleração perto do planeta e da nave iguais. Neste contexto analisemos o caso de um referencial em queda livre. Seja um referencial inercial com coordenadas x, y, z, isto é, um referencial ideal, que descreve o movimento do elevador e do objecto largado. Neste referencial inercial a Terra está estacionária. Tomemos o elevador perto do planeta onde o objecto é largado pelo observador e simultaneamente o cabo que suspendia o elevador é cortado. Mantendo um sangue frio excepcional o observador, relativamente às paredes do elevador, identifica o referencial X, Y, Z e que o objecto largado do repouso vai continuando em repouso ainda que no referencial x, y, z, se veja o objecto acelerar para a Terra. Tomemos que a aceleração é g perto da superficie do planeta. No referencial inercial as posições do objecto e de um canto do elevador são dadas pelos vactores 1 ~r1 (t) = ~g t2 + V~1 (0) t + ~s1 2 (77) 1 ~r2 (t) = ~g t2 + ~s2 2 (78) e por 24 2Figuras issueC-iv Figure 12: Representação de ... Recorde-se a universalidade da queda livre (todos os objectos caiem com ~ , o qual é o vector posição do objecto a mesma aceleração). Mas ~r1 − ~r2 = R largado visto pelo observador em O ( origem das coordenadas em X, Y, Z), isto é, o referencial acelerado. Verifica-se então que: ~ = V~1 (0) t + (~s1 − ~s2 ) R (79) isto é, no referencial em queda livre, qualquer objecto visto a acelerar sob acção da gravidade no referencial inercial, move-se agora em linha recta e velocidade constante. O referencial em queda livre comporta-se então como um referencial inercial! A relação entre a gravitação e aceleração pode então ser investigada e diferenciada seguinte ponto de vista: Tomemos não um mas dois objectos para largar simultaneamente. E façamos isso no referencial acelerado da nave espacial ou no referencial estacionário do elevador junto à Terra. Se pudermos seguir os dois objectos numa região do espaço e/ou num intervalo de tempo suficientemente grande, iremos verificar que no referencial estacionário, os dois objectos aceleram para baixo mas aparentam convergir um para o outro com uma aceleração lateral. Tal não ocorre no referencial acelerado. Assim, é apenas localmente que a gravitação e a aceleração são equiva25 lentes. Esta definição de localidade é para as dimensões espaciais e temporais. Uma região local do espaço e tempo é aquela em que os efeitos não uniformes da gravitação não se fazem sentir. Neste contexto os referenciais em queda livre são equivalentes a inerciais apenas localmente. A definição de referencial em queda livre altera a nossa perspectiva de como a gravitação actua. Se um objecto é visto a acelerar verticalmente (caindo) pode ser interpretado não só como resultado da atracção gravı́tica mas também de um referencial acelerado, i.e., um referencial não inercial. Nos referenciais em queda livre a gravitação desaparece e o movimento sob acção da gravitação é removido. A gravitação não é uma força qualquer e por isso pode ser encarada numa nova perspectiva. Todos estes aspectos levaram Einstein a formular o principio da equivalencia sobre o qual a teoria da relatividade geral assenta. O principio da equivalencia afirma que o movimento de objectos numa região local adjacente à presença de matéria não pode ser distinguido através de qualquer experiência do movimento de um corpo idêntico na região local onde haja uma aceleração uniforme. Note-se que esta é a versão “fraca” do principio da equivalencia, envolvendo apenas experências mecânicas. A versão ”forte” afirma que é para qualquer tipo de experiências. Tomando então o principio da equivalencia, vejamos como este nos permite elucidar ainda mais como a perspectiva espacio-temporal da relatividade restrita é distorcida na presença de gravitação, i.e., na presença de matéria. Tomemos de novo a nave espacial como laboratório de experiências. Um feixe luminoso é enviado através da nave a qual se encontra no espaço vazio, fora do alcançe de qualquer interacção. O feixe sai de um ponto P0 e atinge também perpendicularmente a parede oposta em P1 . Mas se a nave ligar os motores e nesse instante enviar o feixe de P0 , como a nave acelera, o ponto de impacto do feixe já não será P1 mas sim P2 ,um pouco mais abaixo. Isto é consequencia da velocidade finita da luz e da aceleração da nave espacial. No entanto, de acordo com o principio da equivalencia esta situação não pode ser distinguida do cenário onde a nave está estacionária na presença de um campo gravitico uniforme criado pela presença de matéria exterior (planeta). A luz é assim “curvada” pela gravitação! As trajectórias curvilineas da luz num campo gravitico podem ser interpretadas em termos de equivalência entre massa e energia. A massa cria o campo gravitico e também sente a reacção (criado por outras massas). A 26 2Figuras issueC-vii Figure 13: Representação de ... 2Figuras issueC-x Figure 14: Representação de ... 27 2Figuras issueC-xii Figure 15: Representação de ... luz como energia também sentirá essa acção. Mas outra forma de relatar este fenómeno é afirmando que a luz segue sempre o caminho mais curto ou directo no espaço-tempo (a discutir melhor adiante). Mas já analisamos como efeitos de aceleração, isto é, gravitação (no quadro do principio de equivalência), distorcem o espaço-tempo, Assim, o campo gravitico “seria” essa distorção, curvando a luz que agora segue o percurso mais directo entre dois pontos. O desvio da luz ou qualquer radiação electromagnética pode ser usado para testar o principio de equivalência e a relatividade geral. Einstein calculou quanto um raio de luz é desviado ao passar junto ao Sol. Esse desvio implicaria um ângulo de variação entre a posição aparente da estrela e a sua posição real, tal foi e é possivel de realizar num eclipse solar. Mas deve ser referido que utilizando o principio da equivalência apenas se vê metade do desvio, cuja totalidade apenas é extraida no quadro da relatividade geral. O principio da equivalência pode também ser usado para mostrar em mais detalhe como a gravitação altera de forma fundamental as propriedades do espaço e do tempo. Analisemos então como relógios idênticos em diferentes localizações num referêncial estacionário com respeito a um agregado da matéria (campo gravItico) 28 2Figuras issueC-viii Figure 16: Representação de ... podem ter diferentes taxas de progressão (tiques...). Tomemos um relógio, onde por exemplo um átomo emite luz com uma determinada frequência.Vamos comparar a frequência da luz emitida por relógios idênticos em diferentes pontos do campo gravItico (da Terra) empregando o principio da equivalência para obter uma expressão para essa diferença de frequência. Como já discutimos o campo gravitico assume-se como uniforme e apontando na direcção vertical para baixo. Um raio de luz é emitido em H = 0 e recebido em H = H1 . Como é que a frequência recebida f 0 é diferente da frequência f gerada por idêntico processo atómico em H1 e em H0 ? Usando o principio de equivalência, o que tem lugar num campo gravı́tico uniforme também se pode descrever usando um referêncial acelerado e uniforme. Seja uma nave espacial inicialmente em repouso, quando a luz de frequência f é emitida em A, na base da nave. Esta liga os motores e acelera uniformemente no campo gravitico. A luz percorre então uma distância H1 até ao receptor em B com um ∆t = Hc1 . Usemos agora o referêncial instantâneo que quando a luz é emitida o átomo está instantâneamente em repouso com esse referêncial instantâneo (que é inercial!!). Quando a luz é emitida, a fonte está instantaneamente em repouso e poderia ter sido emitida por uma fonte em repouso S com velocidade nula. Quando a luz atinge o receptor , este move-se com uma velocidade instantânea de V = g∆t = gHc 1 29 com respeito a S. Esta luz também seria recebida por observador com velocidade constante V = gHc 1 : é o referencial instantâneo de repouso do receptor R. Por outras palavras: a luz recebida no receptor, com este movendo-se a velocidade constante durante um intervalo infinitésimal gHc 1 ,em respeito a S, é a velocidade do referêncial instantâneo em repouso de R (o receptor). Assim se o receptor se move afastando-se da fonte emissora com velocidade (instantânea) gHc 1 tal como registado em S, no instante de recepção da luz, a fonte emissora também se afasta do receptor com igual velocidade (instantânea) tal como registado em R. Neste contexto empregando os resultados do efeito de Dopph relativista temos que: Se uma fonte de luz com frequência f se afasta de um receptor com velocidade V , a frequência f 0 da luz observada no receptor irá ser diferente de f através de à f0 = f e com ³ ´2 V C µ f0 ≈ f 1 − << V C V C ¶ ⇒ 1− 1+ V C V C ³ !1 2 1− V C ´ = fµ ³ ´2 ¶ 12 1 − VC (80) << 1 temos que f0 − f ∆f V fV f gH1 ≡ = − ⇒ ∆f = − =− 2 f f C c c (81) Em conclusão, a luz recebida no topo da nave terá uma frequência mais baixa e por isso corresponde a um desvio para o vermelho. Se a luz for enviada na direcção oposta para baixo a fonte estará movendo-se para o receptor e dai a variação de ∆f é positiva (troca de sinal) e a luz sofre um desvio para o azul. Pelo principio da equivalência estas considerações também se aplicariam no caso de um campo gravitico correspondente. Note-se que este efeito não é uma consequência da gravitação a afectar o mecanismo de relógios. O argumento é baseado no principio da equivalência que envolve regiões locais onde o campo gravitico é uniforme. O desvio espectral gravitico e a correspondente dilatação temporal são uma propriedade do próprio espaço-tempo assim distorcido. Seja agora a figura junta, onde temos dois observadores A e B em diferentes pontos de de magnitude de um campo gravitico. Se a frequência da luz diminui quando esta“sobe” pelo campo gravı́tico, B verá o relógio de A progredir mais lentamente e A verá o relógio de B progredir mais rápido. 30 Figura issueC-xiii Figure 17: Representação de ... Tudo isto pode ser interpretado como A e B transmitindo fotões entre si, comparando a frequência do fotão recebido com a frequência das respectivas fontes. Devido à sua energia, trabalho tem que ser desenvolvido para o fotão “subir” pelo campo gravı́tico, de A para B. Tal como trabalho é realizado pelo campo gravittico no fotão quando este “cai” de B para A. Assim, um fotão de frequência f deixando A chega a B com uma frequência menor e menor energia, demorará então mais tempo em B para que o correspondente número de periodos de oscilação recebidos, passe com respeito às oscilações ou periodo do relógio (outra fonte) existente em B. Com o relógio B se conclui assim que um segundo demora mais em A do que no seu referêncial. Por outras palavras o tempo passa mais devagar junto a campos gravitacionais mais fortes ou onde é mais intenso. Um relógio no topo ganhará ou avançará com respeito ao relógio na base. Este é o fenómeno da dilatação temporal gravı́tico o qual não é simétrico entre A e B.Ambos concordam com o resultado. 31 3 Elementos de Geometria (Diferencial) Ao usarmos o principio da equivalência verificamos que os conceitos espaçotempo da relatividade restrita tinham que ser abandonados. Isto também implicou que é necessário encontrar outros métodos para descrever a mecânica (propriedades geométricas) no e do espaço-tempo. Mas como é que podemos fazer e onde encontrar pontos de partida? A primeira lei de Newton afirma que um corpo sem acção e forças descreve uma trajectória rectilinea com velocidade constante. Einstein afirmou (como iremos discutir em detalhe aqui) que na presença de matéria um corpo “continuará” ao longo de uma linha “direita” através do espaço-tempo distorcido. Em particular, a relatividade geral explica como um corpo se move sobre a acção da gravitação usando técnicas geométricas para resolver problemas de mecânica. De certa forma, encontrar a trajectória de uma particula é um problema que envolve geometria. Requere a parametrização de curvas, a definição do seu comprimento em diferentes coordenadas e em diferentes espaços: planos, superficie de uma esfera, etc. Para definir tais distâncias usar-se-à o conceito de métrica. Assim a relatividade geral constituirá uma teoria geométrica da gravitação: conceitos fundamentais como os geodésica (minimo e máximo de comprimento entre dois pontos do espaço-tempo) irão ser usados devidamente relacionados com o princı́pio da equivalência. Uma vez que a gravitação distorce a geometria do espaço-tempo, não podemos usar referenciais inerciais globais apenas locais (principio de equivalência). Não há pois sistemas de coordenadas priveligiados, onde as leis da natureza devem ser escritas. Tendo por isso que adquirir uma mesma nova forma com respeito a coordenadas generalizadas: covariância geral. Sendo mais preciso, na relatividade restrita as leis da natureza tomam a mesma forma em todos os referenciais inerciais. No contexto da relatividade geral num campo gravitico todas as leis da natureza irão tomar uma mesma forma em qualquer ponto do espaço-tempo assim como no referencial em queda livre. Temos assim que estudar as leis de transformação de coordenadas entre diferentes referenciais locais, de tal forma que a generalizaçã o de transformadas de coordenadas deve deixar manter a forma dessas leis da natureza independentemente do sistema de coordenadas. Na mecânica Newtoniana já temos “ingredientes” de natureza geométrica: 32 se soubermos as forças que actuam numa particula como é que essa particula se irá mover? A resposta é através de um conjunto de coordenadas x(t), y(t) e z(t) obtidas de equações diferenciais, os quais determinam a posição e também a trajectória da particula. Mas também podemos interpretar ou atribuir um outro contexto em que temos antes um cenário de geometria. Uma trajectória é também uma entidade geométrica. Por exemplo uma linha recta como trajectória é um percurso mais curto entre 2 pontos. Podemos assim atribuir também uma solução geométrica baseada nos conceitos de comprimento a qualquer problema de movimento. No caso de um plano espacial (bi-dimensional) a definição de linha recta é a distância (Euclidiana) mais curta entre dois pontos. De forma mais geral, a curva de comprimento espacial minimo é designada de geodésica. Como exemplo, tomemos um objecto pequeno (esférico) movendose com velocidade constante num: a) Plano (com qualquer orientação espacial), indo de A para B na ausência de gravidade (ou na sua presença com outras forças) b) Na superficie de uma esfera, na ausência de gravidade ou em (perspectiva tri-dimensional), na mesma esfera com a presença de forças. Para determinar a trajectória podemos usar as equações/leis de Newton em três dimensões, resolvendo-as para obter a trajectória OU usando o conceito de geodésica para os dois pontos no plano ou superficie da esfera. A trajectória em ambas as situações será a de mais curto percurso. A linha recta no plano ou no segmento de um grande cı́rculo na esfera. Para este último caso temos que saber a geometria da esfera. O exemplo anterior não pode ser extendido e aplicado a trajectórias de particulas em três dimensões espaciais sob acção da força da gravidade. De facto tomemos dois pontos A e B à superfı́cie da Terra (por exemplo) os quais podem ser unidos por diferentes percursos aos quais associam diferentes ângulos e velocidades iniciais. Como escolher então nessas condições a trajectória real entre todas as possı́veis? Não poderá ser através daquela com comprimento mı́nimo. No entanto notemos que as trajectórias ocorrem no espaço e no tempo e deveremos procurar a trajectória real como aquela que é uma geodésica no espaço-tempo quadridimensional e que tem uma duração máxima de tempo próprio. Na realidade o que observamos são linhas do universo (linhas espaço-temporais) no espaço-tempo e não somente percursos no espaço. Como iremos ver, a relatividade geral contém a gravitação como a man33 ifestação de um espaço tempo curvo no qual a relatividade restrita é uma aproximação, tal como o principio da equivalência indica. Mas esta distorção do espaço-tempo (lembrar que espaço-tempo da relatividade restrita é Lorentziana, isto é, plano) implica que a descrição de movimentos não pode ser feita com as coordenadas que caracterizam um referencial inercial local. Há que usar coordenadas arbitárias o que significa que não há sistemas de coordenadas preferenciais e temos que saber relacionar diferentes aspectos da teoria desta forma. Neste sentido vamos considerar o conceito de “variedade espaço-temporal”. Uma variedade M é caracterizada por um conjunto de pontos que podem ser coordenatizados com números reais (x1 , x2 , ..., xn ), havendo uma relação injectiva e bijectiva entre a variedade M e o espaço <n . A variedade M poderá não ter apenas um sistema de coordenadas. Vários poderão ser necessários. A esta colecção por vezes chama-se mapa de aplicações. É um mapa de aplicações entre M e <n . Onde os dois sistemas n de0 ocoordenadas se sobrepõem a podemos usar o sistema {x } , a = 1, ..., n ou xa , a0 = 1, ..., n. Requere-se que estas funções sejam continuas e diferenciaveis: 0 ∂xa ∂xa a X b≡ , X ≡ (82) 0 b ∂xb ∂xb0 existem e são continuas. A matriz Jacobiana é não-singular, o que implica que 0 X a b0 Xcb = δca (83) a0 e 0 0 (84) 1 se p=q 0 se p6=q (85) X a b X b c0 = δca0 onde δqp = n De forma a adquirir um contexto mais adequado à nossa percepção (e limite existencial ... imediato), vamos tomar como exemplo um espaço tridimensional, o qual contém superficies bidimensional. Seja então espaço Euclidiano com o sistema de coordenadas (x, y, z) usual associado a uma base de vectores (~i, ~j, ~k) ≡ (i, j, k). Mas devemos também usar outras quaisquer coordenadas (u, v, w). Podemos então relacioná-las: x = x(u, v, w); y = y(u, v, w); z = z(u, v, w) 34 (86) ou u = u(x, y, z); v = v(x, y, z); w = w(x, y, z). (87) As coordenadas de um vector ~r ≡ r podem assim ser escritas como: ~r ≡ r = x(u, v, w) i + y(u, v, w) j + z(u, v, w) k (88) fazendo w = wo = C com u e v livres temos ~r ≡ r = x(u, v, wo ) i + y(u, v, wo ) j + z(u, v, wo ) k (89) que parametrizam as coordenadas de uma superfı́cie w = wo , onde os parametros u e v são coordenadas. Fazendo agora v = vo = C e w = wo = C com u livre temos: ~r ≡ r = x(u, vo , wo ) i + y(u, vo , wo ) j + z(u, vo , wo ) k (90) que parametriza uma curva correspondente à intersecção das superficies v = vo e w = w o . Notemos que se diferenciármos a expressão para r = r(u, vo , wo ) ou us∂ armos derivadas parciais para r = r(u, v, w), temos que a diferenciação ∂u produz o vector tangente à curva indicada em que u é livre e v = vo e w = wo . De forma similar se obtêm tangentes às curvas em que ve w são os parametros respectivos. Neste contexto (u, v, w) e os vectores tangentes assim definidos permitem igualmente coordenatizr o espaço tridimensional Euclineano. Assim, as derivadas parciais eu ≡ ~eu ≡ ∂r ∂r ∂r , ev− ≡ ~ev ≡ , ew ≡ ~ew ≡ ∂u ∂v ∂w (91) fornecem uma base alternativa de vectores, os quais podem ser normalizados de forma obvia. Um vector λ ≡~λ qualquer pode ser expresso como λ = ai + bj + ck = αeu + βev + γew (92) − → em que (α, β, γ) são as componentes de λ ≡~λ na base {→ eu , − ev , − e→ w } ≡ {eu , ev , ew }. Curiosamente há outra forma em que o sistema (u, v, w) também pode ser usado para determinar uma base de vectores. Tomando u = u(x, y, z); v = v(x, y, z); w = w(x, y, z) 35 (93) vamos considerar os seguintes gradientes: ∂u ∂u −→ ∂u ∇u = i+ j+ k ∂x ∂y ∂z (94) ∂v ∂v −→ ∂v ∇v = i+ j+ k ∂x ∂y ∂z (95) ∂w ∂w −−→ ∂w ∇w = i+ j+ k (96) ∂x ∂y ∂z os quais são ortogonais às superficies de nivel com coordenadas u = uo , v = v o n− → − → −→o e w = wo . Temos assim, uma base alternativa ∇u , ∇v , ∇w que é dual à base n −→ v − → w −→o u → → {− eu , − ev , − e→ w }. Define-se esta nova base como e ≡ ∇u , e ≡ ∇v , e ≡ ∇w Desta forma o vector λ ≡~λ escreve-se como: − → λ = λu eu + λv ev + λw ew = λu eu + λv ev + λw ew (97) . Vamos clarificar a relação entre as duas bases e as respectivas componentes. Para simplificar e condensar a notação usemos n→ o (i = 1, 2, 3) então −u − →v − → w i i − → − → − → u ≡ (u, v, w), {ei } ≡ { eu , ev , ew } e {e } ≡ e , e , e . Tal que → → − λ ≡~λ = λ1 − e1 +λ2 − e2 +λ3 → e3 = X − → X − → − → − → → λi ei ≡ λi − ei = λi ei = λi ei = λ1 e1 +λ2 e2 +λ3 e3 i i (98) i Usando a definição de e e ej , podemos escrever que → r ∂ui ∂x ∂ui ∂y ∂ui ∂z ∂ui − → ∂− ei ej = ∇ui j = + + = = δji ∂u ∂x ∂uj ∂y ∂uj ∂z ∂uj ∂uj e com este procedimento podemos também determinar − → → λ · e j = λi − ei ej = λi δji = λj (99) e λ · e j = λj . (100) − → Em conclusão, as componentes de λ com respeito a uma dada base são − → determinadas pelo producto de λ com o elemento correspondente na outra base. Assim, − → → − → −→ → → λµ = λ − µ = λi − e i µj − ej = gij λi µj = λi ei µj ej = g ij λi µj (101) 36 em que → − gij ≡ − ei · → ej = ei · ej (102) g ij ≡ ei · ej . (103) → − → − →− λµ = λ → µ = λi ei µj − ej = λi µj δji = λi µi (104) → −→ λµ = λ − µ = gij λi µj = g ij λi µj = λj µj (105) g ij λi µj = λi µi ∀λi ⇒ g ij µj = µi (106) gij λi µj = λi µi ∀λi ⇒ gij µj = µi (107) e Também podemos escrever que: e donde o que mostra que gij e g ij podem ser usados para subir/baixar indices tal que : µi = g ij µj = g ij gjk µk ⇒ g ij gjk = δki (108) As componentes λi de λque correspondem ao uso da base {ei } são designadas de componentes contravariantes enquanto, que as componentes λi associadas à base {ei } são ditas de covariantes. Sejamos agora mais precisos acerca das coordenadas e bases genéricas {ei } e {ei } cuja relevância ocorre em sistemas coordenadoas genéricas, isto é, vamos ver como uma se relaciona com a outra, com os vectores tangentes a curva e a outra com normais ou perpendiculares a superficies. E como se transformam em diferentes sistemas de coordenadas. Tomamos ui ≡ {u = u(t), v = v(t), w = w(t)}, onde t é um parâmetro real. Os pontos assim parametrizados irão corresponder a uma curva γ , cujo vector posição é: r = x [u(t), v(t), w(t)] i + y [u(t), v(t), w(t)] j + [u(t), v(t), w(t)] k O vector d (109) → − r = ṙ dá o vector tangente a essa curva, e em concreto temos: dt 37 dr dr du dr dv dr dw = + + dt du dt dv dt dw dt = u̇(t)eu + v̇(t)ev + ẇ(t)ew ≡ u̇i (t)ei (110) mostrando que as derivadas u̇i (t) são as componentes do vector tangente a uma curva na base “natural” {ei }. Noutro contexto, consideremos a função Φ(u, v, w), a qual também pode ser encarado como função da posição nas coordenadas (x,y z). O seu gradiente → − é 5Φ = ∂Φ i+ ∂Φ j+ ∂Φ k. Mas escrevendoΦ = (u(x, y, z), v(x, y, z), w(x, y, z)) ∂x ∂y ∂z vem ∂Φ ∂Φ ∂u ∂Φ ∂v ∂Φ ∂w = + + ∂x ∂u ∂x ∂v ∂x ∂w ∂x (111) ∂Φ ∂Φ ∂u ∂Φ ∂v ∂Φ ∂w = + + ∂y ∂u ∂y ∂v ∂y ∂w ∂y (112) ∂Φ ∂Φ ∂u ∂Φ ∂v ∂Φ ∂w = + + ∂z ∂u ∂z ∂v ∂z ∂w ∂z Reuniundo estas expressões, escrevemos que: ∂Φ − → 5Φ = ∂u ∂Φ ∂v ∂Φ ∂w à à à (113) ! ∂u ∂u ∂u i+ j+ k + ∂x ∂y ∂z ! ∂v ∂v ∂v i+ j+ k + ∂x ∂y ∂z ! ∂w ∂w ∂w i+ j+ k = ∂x ∂y ∂z ∂Φ −→ ∂Φ − → ∂Φ −→ ∇u + ∇v + ∇w ∂u ∂v ∂w = ∂Φ u ∂Φ v ∂Φ w ∂Φ i e + e + e = e ∂u ∂v ∂w ∂ui 38 (114) Tal mostra que as derivadas parciais base{ei } onde se usa também a notção − → as componentes x 5Φ na ∂Φ são ∂ui ∂Φ ≡ ∂i = “ , i” ∂ui assim ~ = ∂i Φei = Φ,i ei ∇Φ (115) . Como usaremos adiante, o comprimento da curva γ é obtido integrando r,isto é, usando . . . r2 = ui ei uj ej = gij ui uj (116) com o integral dado por: L= Z b a (gij ui uj )1/2 dt (117) A relatividade geral pretende ser uma teoria onde não há sistemas de coordenadas preferencias.Assim, suponhamos que temos uma base de co0 0 0 ordenadas (u, v, w)e (u , v , w ). Vejamos como as componentes de vectores definidos nas bases correspondentes se vão transformar. Seja então a base{ei0 } 0 0 0 0 a base associada a (u , v , w ) e a base {ei }a dual, assim como as bases {ei }e → − {ei }. Um vector qualquer λ ≡ λ escreve-se como 0 0 − → λ = λi ei0 = λi0 ei = λi ei = λi ei (118) Numa região onde ambos sistemas sejam admitidos, temos 0 0 0 ui = ui (uj ), ui = ui (uj ) (119) i.e., 0 ui = f (uj ), Assim podemos obter de ei = que dr , dui 0 ui = h(uj ) dr , dui0 ei0 = (120) usando regras de diferenciação 0 dr dui dr = duj dui0 duj isto é, 0 ej = U ij ei0 39 (121) onde, 0 0 Ui j = dui duj (122) De 0 λ = λj ej = λj U ij ei0 vem que 0 (123) 0 λi = U i j λj , (124) sendo a formula de transformação para componentes contravariantes. Para as componentes, covariantese a base {ej }, usando a definição − → ei = ∇ui 0 − → 0 ei = ∇ui e junto com 0 ∂uj ∂uj ∂ui = ∂x ∂ui0 ∂x assim como com e temos que isto é , 0 ∂uj ∂uj ∂ui = ∂y ∂ui0 ∂y 0 ∂uj ∂ui ∂uj = , ∂z ∂ui0 ∂z ∂uj − − → j → i0 ∇u = 0 ∇u i ∂u 0 ej = U j i0 ei (125) onde U ∂uj U i0 = . ∂ui0 Para as componentes covariantes, temos que j (126) → µ≡− µ = µj ej = µj Uij0 ei = µi0 ei (127) ui0 = U j i0 uj . (128) 0 implicando que Para as transformações inversas vem 40 0 λi = Uji0 λj onde se usa a regra 0 0 ej = Uij0 ei ej 0 = Uji0 ei , 0 0 ui = Uij uj 0 0 Uik0 Uji = δjk (129) (130) (131) Vejamos o que podemos extrair relativamente a gij . Na base {ei }, vemos que gij = ei ej e na base {ei0 } será gi0 j 0 . Assim ³ gi0 j 0 = ei0 · ej 0 = Uik0 ek ´³ ´ Uje0 ee = Uik0 Uje0 ek ee = Uik0 Uje0 gje (132) verifica-se assim que as quantidades gij ou g ij se transformam como as componentes de vectores mas usando dois conjunto de transformações U . Temos assim que uma teoria métrica da gravitação tem que incluir objectos designados de tensores. De facto, enquanto escalares e vectores são dominantes no quadro da mecânica Newtoniana, os tensores são fundamentais em relatividade geral. Um tensor corresponde essencialmente a um objecto que actuando num vector produz outro vector com outras caracteristicas. O tensor é, em particular, linear nos vectores onde é aplicado: T (αV + βU) = αT (V) + βT (U) (133) ³− →´ − → em que T N = F . Em componentes, se → − N ≡ N = N j ej , − → − → F = Fi ei temos que ³ ´ − → → ej = N j T (ej ) = N j T i j ei ⇒ F i = T ij N j Fi ei = T N j − (134) → − → → ej ) na base {→ ei } ≡ ej , em que Tji são componentes de T (− usando T (− ej ) = Tji − {ei }. No contexto de transformação de coordenadas temos que numa base {ej 0 } 0 0 0 i0 − i0 → para coordenadas ui se pode escrever T (− e→ = T ij 0 N j . j 0 ) = T j 0 ei0 com F Mas 0 0 0 0 F i = U ik F k , N j = U jl N l 41 pelo que se pode escrever 0 0 0 Uki F k N l = Tji0 Ulj N l , 0 ∀N (135) 0 0 j l vindo que Uki Tlk = Tji0 Ulj e usando Ulj Um 0 = δm0 obtemos que 0 0 0 0 m k Tmi 0 = Uki Um 0 Tm (136) Esta é então a regra de transformação de componentes para tensores que pode ser generalizada e definida para qualquer tensor com vários indices. Em particular, suponhamos que temos para cada sistema de coordenadas c ,.....c N r+s quantidades Td11,.....dsr que se transformam como 0 0 a ,.....a 0 c ,.....c 0 Tb01,.....b0 r = Xcar1 · · · Xcarr Xbd01 · · · Xbd0ss Td11,.....dsr 1 (137) 1 s 0 em que Xca e Xbd0 são matrizes Jacobianas de transformação. As quandidades a ,.....a Tb11,.....bsr são as componentes de um tensor do tipo (r,s). Assim vem que o tensor T ab é do tipo (2, 0) e que o tensor Tab é do tipo (0, 2). A verificação de que um conjunto de quantidades constitui um tensor pode ser feita através do Teorema do Quociente. Como exemplo que pode ser generalizado a quaisquer dimensões e número de indices tomemos N 3 números Tbca em que a, b, c = 1, ..., N . Se soubermos que para um vector contravariante arbitrário λa os N 2 números Tbca λc se transformam como um 0 0 0 d f tensor (1, 1), isto é, Tba0 c0 λc = Xda Xbe0 Tef λ então podemos deduzir que Tbca 0 0 são componentes de um tensor do tipo (1, 2). Como λc = Xfc λf vem que ³ 0 0 ´ 0 d Tba0 c0 Xfc − Xda Xbe0 Tef λf = 0, ∀λ (138) d e tomando λf = δgf vem que Tba0 c0 Xgc = Xda Xbe0 Teg e por fim usando Xgc Xhg0 = 0 δhc 0 obtemos que 0 0 0 0 0 d Tba0 h0 = Xda Xbe0 Xhg0 Teg 0 (139) No que diz respeito aos tensores, estes, tal como os vectores, podem-se adicionar, multiplicar por um escalar e também contrair indices. Note-se que o tensor gab e g ab se usa para descer e subir indices, isto é, Tab = gac T cb , 42 Tba = gbc T ac (140) Mais ainda, o produto escalar de dois vectores é dado por gab λa µb = g ab λa µb = λa µa = λa µa (141) Relembre-se que na relatividade geral a métrica do espaço- tempo não é positiva definida i.e., gab λa λb ≥ 0, ∀λa sendo igual a zero quando λa = 0. Daı́ ¯1/2 ¯ ¯ ¯ que o comprimento de um vector é ¯gab λa λb ¯ e o ângulo entre dois vectores é gab λa µb cos θ = (142) |gcd λc λd |1/2 |gef µe µf |1/2 Retornemos então à análise do movimento no espaço-tempo tal como descrito por uma teoria métrica, podendo agora descrever como objectos se movem sob acção da gravitação através de uma linguagem matemática mais abrangente. Este procedimento implica usar o conceito de geodésica. Uma geodésica no espaço Euclidiano constitui uma linha recta caracterizada por ser a linha mais curta entre dois pontos. Esta propriedade pode ser extrapolada para uma variedade espacio-temporal com a expressão ¯1/2 Z b¯ Z b ¯¯ ¯ dxa dxb ¯¯ . a . b ¯1/2 ¯ ¯ L= ¯gab x x ¯ dt = ¯ ¯gab dt dt dt ¯ a a ¯ (143) onde se procura agora o valor máximo no tempo próprio. No entanto, agora involve um problema: se a métrica for indefinida como é o caso da relatividade restrita com ηµυ = 1 0 0 0 0 −1 0 0 0 0 −1 0 0 0 0 −1 ν, µ = 0, 1, 2, 3 (t, x, y, z) podemos ter curvas de comprimento nulo. Temos pois que empregar uma outra condição. Podemos então definir uma linha geodésica “direita” como aquela onde o vector tangente aponta sempre na mesma direcção. Usando o comprimento − → . de arco s como parâmetro da curva, o vector tangente é λ = r (s) = ddsr e tem comprimento constante (e unitário). Verifica-se então que numa geodésica se tem dλ =0 ds 43 (144) − → (λ = λ não varia nem em direcção, nem sentido, nem magnitude). Numa base {ei } associada às coordenadas ui podemos escrever λ = λi ei e também que d (λi ei ) . i dλ = =λ ei + λi ėi (145) 0= ds ds e escrevendo .j . (146) ei = (∂j ei ) u podemos escrever ¶ µ .i .k dλ → ei = 0 (147) 0= ⇒ λ +Γijk λj U − ds → porque ∂j − ei não é zero geralmente e na base {ei } tomamos a decomposição em 27 quantidades (tri-dimensional), isto é, ∂j ei ≡ Γkij ek . (148) dU i dS (149) E como .i λi =U = podemos escrever ainda que j k dλ d 2 ui i du du ⇒ + Γ =0 (150) jk ds ds2 ds ds que é a equação que define uma geodésica no espaço-tempo. Mas o que é a quantidade Γijk ? Notemos então que 0= → → ∂ 2− r ∂ 2− r K K K − → ∂j → ei = = = ∂i − ej → ΓK ij ek . = Γji ek ⇒ Γij = Γji . i j j ∂u ∂u ∂u ∂ui (151) Mais ainda, como gij = ei · ej podemos escrever → → → → ej ) ei ) · − ej + − ei · (∂k − ∂k gij = (∂k − ´ ³ m− → → − − → e→ = (Γm − m ) · ej + ei · Γ em jk ik m isto é, Γk gij = Γm ik gmj + Γjk gim e daqui podemos obter 1 Γlki = g lj (∂k gij + ∂i gjk − ∂j gki ) 2 44 (152) Figura... Figure 18: Representação de ... No contexto de caracterizar o que é uma linha “direita” numa variedade espacio-temporal, vamos encontrar também a sua relação com o conceito de transporte paralelo de vector ao longo de uma curva. Relativamente à figura junta, seja uma curva γ numa variedade parametrizada por coordenadas ui (t) e seja P0 o ponto inicial onde o parâmetro t é t0 na curva γ. Nesse ponto temos um vector λ0 . Como podemos transportá-lo ao longo da curva referida sem mudar a sua direcção e sentido assim como magnitude, de forma a obter um vector paralelo λ(t) em qualquer outro ponto de γ? Tal é obtido construindo essa campo de vectores ao longo da curva, gerados por um método de transporte paralelo ao longo de γ. Matemáticamente, tal significa que se tem dλ = 0, λ(t0 ) = λ0 (153) dt a partir do qual se obtêm as componentes λ̇i + Γijk λj u̇k = 0 (154) e constituindo a forma em componentes para equação de transporte paralelo de um vector numa variedade. A este propósito refira-se que a definição de uma geodésica com parâmetro afim corresponde a uma curva caracterizada por ter o seu vector tangente ẋa constituindo um campo de vectores paralelos 45 ao longo da geodésica. Igualmente se mencione que se um vector é assim transportado ao longo de uma geodésica, então o ângulo desse vector com a tangente à geodésica permanece constante. Usualmente, associa-se o conceito de transporte paralelo em variedades ao que é empregue no espaço Euclidiano que é plano. Mas não é assim. O resultado numa variedade com curvatura depende do percurso seguido! De facto, o vector obtido pelo transporte de um dado vector V de um ponto P para um ponto Q irá depender do percurso tomado. Em particular, ao longo de uma curva fechada (“loop”) um vector pode não retornar à situação inicial...Há uma pequena discrepância que terá a ver com a curvatura. Mas já lá vamos. Uma pergunta que terá ficado por colocar mas que aqui tem o seu relvo é a seguinte: Porque se chama “conexões” às conexões? A razão é que as quantidades matemáticas Γijk realmente fornexem um modo de relacionar entre os espaços tangentes de vectores em diferentes pontos da variedade, permitindo-nos associar um vector num dado espaço tangente vectorial com o vector paralelo a ele mas noutro ponto. Suponhamos um ponto P com coordenadas xa e um outro ponto Q com coordenadas xa + δxa . Seja γ uma curva parametrizada que liga P a Q, onde a P se atribui o parâmetro u e a Q o valor u + δu. Sejam também λ̄a = λa + δλa as componentes do vector em Q paralelo a um dado vector λa em P . Como o vector em Q é obtido por transporte paralelo de λa de P ao longo da curva γ, escreve-se δλa ' e com dλa δu du dλa dxc = −Γabc λb du du obtemos que dxc δu ' λa − Γabc λb δxc (155) du Assim temos nesta aproximação uma aplicação linear do espaço tangente em P para o espaço tangente de vectores em Q, em que o vector em P com componentes λa é transformado no vector paralelo em Q com componentes λ̄a ' λa − Γabc λb λ̄a = Aa b λb , Aa b = δ a b − Γabc δxc 46 (156) Em termos de transformação para outras coordenadas, ter-se-ia que 0 0 0 λ̇i0 + Γij 0 k0 λj u̇k = 0 0 0 0 0 (157) 0 Verifica-se que se λ̄a ≡ λa − Γab0 c0 λb δxc então 0 λ̄a X e a0 (Q) = λ̄e (158) e ∂x onde X e a0 (Q) representa ∂x a0 calculado em Q. I.e., a aplicação do espaço de vectores em P para o espaço em Q não depende do sistema de coordenadas. Neste resultado usa-se a propriedade de transformação de conexões 0 0 0 Γab0 c0 = Γdf g X a d X f b0 X g c0 + X d c0 b0 X a d (159) pelo que as conexões não são tensores. Relacionado com o conceito de transporte paralelo e curvas definidas numa variedade está a diferenciação de vectores e tensores numa variedade. Consideremos um campo vectorial (por simplicidade) definido ao longo de uma curva e tomemos as suas componentes como funções do parãmetro u ao longo da curva. Verifica-se então que para λa (u) definido ao longo a de γ coordenatizada como xa (u), as n quantidades dλ não constituem as du componentes de um vector. De facto, num outro sistema de coordenadas a a0 determina temos dλdu e a sua relação com dλ du ³ 0 ´ 0 d d X a d λd dxc d dλa 0 dλ 0 = = Xa d + X a dc λ du du du du 0 2 a0 (160) a ∂ x dλ em que o termo em X a dc = ∂x d ∂xc estaria ausente se du fossem as componentes de um vector. A razão para tal é que na equação dλa λa (u + δu) − λa (u) = δu → 0lim du δu (161) tomamos a diferença de componentes em diferentes pontos de γ, daı́ a origem do problema: os¯ coeficientes da trasnformação dependem do ponto ¯ 0 ¯ 0 ¯ onde calculam, i.e., X a d ¯ 6= X a d ¯ . Assim a diferença entre componentes u u+δu nunca um vector pois no dado limite a diferença ¯ daria 0 as ¯ componentes de a0 ¯ a ¯ a0 X d¯ − X d¯ produz X dc . u u+δu 47 Para que a derivada produza um vector temos que tomar a diferença de componentes no mesmo ponto de γ. Tal é obtido através do conceito de transporte paralelo. Seja o ponto P na curva γ com parâmetro u e seja Q o ponto vizinho com parâmetro u + δu. Então λa (u + δu) é um vector em Q, tal como é o vector λ̄a , obtido por transporte paralelo de λa (u) desde P para Q. A diferença λa (u + δu) − λ̄a é então um vector em Q, assim como o quociente λa (u + δu) − λ̄a δu (162) No limite em que δu → 0 obtemos uma nova derivada definida como Dλa λa (u + δu) − λ̄a = δu → 0lim du δu Como λa (u + δu) ' λa (u) + dλa δu du (163) e λ̄a ' λa − Γabc λb (u)δxc então λa (u + δu) − λ̄a dλa δxc ' + Γabc λb (u) δu du du e no limite temos Dλa dλa dxc ≡ + Γabc λb (u) (164) du du du sendo que todas as componentes estão calculadas no ponto P de γ. Esta derivada de um vector λ ao longo de uma curva envolve não só a derivada a usual dλ mas também as conexões. Um vector transportado paralelamente du ao longo de uma curva pode ser caracterizado assim com Dλa =0 du (165) e reciprocamente, λa forma as componentes de um campo de vectores paralelo a D ao longo da curva se Dλ = 0. A derivada du possui as seguintes propriedades: du i) Quando aplicada a um campo tensorial qualquer, produz um outro campo tensorial do mesmo tipo ii) É um operador linear: Du (KT ab ) = KDu (T ab ) e Du (αT ab + βU ab ) = αDu T ab + βDu U ab . iii) Obedece à regra de Leibniz: Du (T ab U cd ) = T ab Du U cd + (Du T ab )U cd iv) Para um campo escalar (função) tem-se Du Φ = 48 dΦ du (166) v) Igualmente se tem Dλa dλa dxc ≡ + Γabc λb du du du (167) dxc Dλa dλa ≡ − Γdac λd du du du (168) d d DT ab dT ab a cb dx b ac dx ≡ + Γcd T + Γcd T du du du du (169) DTab dTab dxd dxd ≡ − Γcad Tcb − Γcbd Tac du du du du (170) d d DT a b dT a b a c dx c a dx ≡ + Γcd T b − Γbd T c du du du du (171) Seja agora que o campo de vectores ou tensores não está limitado a uma definição ao longo de uma curva mas está definido na variedade espaciotemporal ou numa região suficientemente grande e coordenatizada. Para uma curva γ nessa região temos para vector com componentes λa a derivada Dλa ≡ λ̇a + Γabc λb ẋc du mas com o uso de λ̇a = dλa c ẋ dxc podemos escrever que Dλa = du à ! dλa + Γabc λb ẋc dxc (172) a Notemos então que dλ +Γabc λb não depende de γ mas apenas nas componentes dxc a λ e suas derivadas, sendo válida para qualquer vector tangente ẋc . Pelo teorema do quociente deduzimos então que dλa (173) + Γabc λb dxc constituem as componentes de um tensor do tipo (1, 1). Este tensor é a derivada covariente do vector de componentes λb e por vezes escreve-se como λa ;c ≡ dλa + Γabc λb = λa ,c + Γabc λb dxc 49 (174) Para objectos geométricos temos pois que para um campo escalar (função) tem-se Φ;a = Φ,a (175) e igualmente se tem λa ;c = ∂c λa + Γabc λb (176) λa;c ≡ ∂c λa − Γdac λd (177) T ab;c ≡ ∂c T ab + Γacd T cb + Γbcd T ac (178) Tab;c ≡ ∂c Tab − Γcad Tcb − Γcbd Tac (179) T a b;c ≡ ∂c T a b + Γacd T c b − Γcbd T a c (180) Quando aplicada ao tensor da métrica, a derivada covariante é nula. De facto, tomando Γabc = gad Γdbc e Γacd = Γadc , com ∂c gab = Γabc + Γbac , obtemos que ∂c gab − Γdca gdb − Γdcb gad = gab;c = 0 (181) Igualmente se tem g ab;c = 0, δ a b;c = 0 e claro que Du gab = Du g ab = Du δ a b = 0. Com esta propriedade do tensor da métrica estabelecemos que o produto escalar de vectores se preserva sob acção de transporte paralelo assim como obviamente a magnitude de um vector ou ângulo de dois vectores. A derivada covariante generaliza a derivada parcial usual mas possui uma diferença significativa. Nomeadamente a ordem em que essa derivação é feita. Na derivada covariante, se trocarmos a ordem de derivação alteramos os resultados. E tal está intrinsecamente relacionado com a noção de curvatura. Tomando a derivada covariante (177) façamos λa;bc e escrevemos ³ ³ ´ ´ ³ ´ λa;bc ≡ ∂c ∂b λa − ∂c Γdab λd −Γdab ∂c λd −Γeac ∂b λe − Γdeb λd −Γebc ∂e λa − Γdae λd (182) Se trocarmos b com c e subtrairmos temos λa;bc − λa;cb ≡ Rd abc λd 50 (183) onde Rd abc ≡ ∂b Γdac − ∂c Γdab + Γeac Γdeb − Γeab Γdec (184) constitui o tensor curvatura de Riemann do tipo (1, 3), definido em termos das conexões e suas derivadas. Notar que um espaço só pode ser classificado a de plano se todas as componentes Rbcd são iguais a zero. De outra forma o espaço-tempo tem curvatura. O tensor de curvatura de Riemann tem várias propriedades, entre as quais: a) tem n4 componentes onde n é a dimensão do espaço b) devido a algumas simetrias, pode ter n2 (n2 − 1)/12 a a a c) Rbcd + Rcdb + Rdbc = 0 (identidade ciclica) d) Rabcd = −Rbacd ;Rabcd = −Rabdc ;Rabcd = Rcdab a e) Racd =0 a a a f ) Rbcd;e + Rbde;c + Rbec;d = 0 (identidades de Bianchi) Além destas propriedades podemos construir outros objectos tensoriais do tensor de Riemann. Em particular o tensor de Ricci, c Rab = Racb (185) Este tensor é simétrico tal que Rba = Rab e dele se obtem um escalar curvatura dado por Raa = R = g ab Rab (186) Temos também outro objecto que é o tensor de Einstein 1 Gab = Rab − Rgab 2 (187) o qual é simétrico também e tem divergencia nula. ié, 1 (Rcb − R δcb );b = 0 2 (188) Uma relação mais precisa entre curvatura, transporte paralelo e derivada covariantge pode ser extraida se analisarmos o seguinte com auxilio de uma figura. Mencionamos atrás que o transporte paralelo numa variedade curva depende do percurso. Com a definição matemática rigorosa de curvatura de Riemann podemos estabelecer uma expressão para a diferença ∆λa no transporte paralelo numa pequena curva fechada γ parametrizada por t em torno de um ponto P , tal que os pontos na curva são coordenatizados por 51 Figura... Figure 19: Representação de ... xa = xaP + ξ a , com |ξ a | ¿ 1. Seja então o vector com componentes λa que irá ser transportado paralelamente desde λa0 num ponto inicial O. Temos que dxc dλa = −Γabc λb dt dt i.e., Z a λ = λa0 − Z Γabc λb dxc ' λa0 − Γabc λb dξ c (189) Tomando agora xa = xaP + xia + yj a , onde {ia , j a } constituem um par ortogonal de vectores unitários em P , obtem-se que ∆λa = − (Ra 2 A bcd )P λb0 ic j d onde A é área dentro da curva γ e (Ra bcd )P é a curvatura no ponto P. (190) O efeito de curvatura do espaço-tempo também se manifesta no designado efeito do desvio geodésico. Tomemos então duas geodésicas vizinhas, γ coordenatizada por xa e parametrizada por u, e γ̃ coordenatizada por xea e tendo u também como parâmetro. Seja ξ a (u) a separação de pontos nessas geodésicas com o mesmo valor de parâmetro: ξ a (u) = xea (u) − xa (u) 52 (191) Como γ e γe são geodésicas, temos que: d2 xea e a dxea dxec + Γbc =0 du2 du du e b c d2 xa a dx dx + Γ =0 bc du2 du du Tomando então a aproximação e a = Γa + Γ a ξ d Γ bc bc bc,d (192) vamos obter que: ξ¨a + Γabc,d ẋb ẋc ξ d + Γabc ẋb ξ c + Γabc ẋc ξ b = 0 que pode ser re-escrito como ´ d ³ ˙a ξ + Γabc ξ b ẋc − Γabc,d ξ b ẋc ẋd − Γabc ξ b ẍc − Γabc,d ξ b ẋc ẋd + Γabc ξ c ẋb = 0 du Usando então a equação da geodésica para ẍc , obtemos após simplificações que ´ D2 ξ a ³ a a a e a e b c d + Γ − Γ + Γ Γ − Γ Γ cd,b bc,d be dc ed bc ξ ẋ ẋ = 0 du2 (193) isto é, D2 ξ a a + Rcbd ξ b ẋc ẋd = 0 du2 ∂ D a Num espaço-tempo plano, Rbcd = 0 e Du = ∂u , pelo que se tem (194) D2 ξ a = 0 ⇒ ξ a (u) = Aa (u) + B a , (195) 2 du onde A e B são constantes. Neste caso a separação entre objectos crescerá (se for esse o caso) de forma linear. Mas se o espaço-tempo for curto já não se obterá esta relação linear. Para melhor entender o desvio geodésico consideremos a seguinte situação. Sejam seres bidimensionais numa superfı́cie curva (maça), seguindo geodésicas. Se nos concentrarmos numa pequena região esta pode ser tomada como plana localmente. 53 Mas numa perspectiva mais abranjente tomemos dois desses percursos a partir de dois pontos vizinhos e numa mesma linha de partida. Movendo-se esses seres com igual velocidade constante partindo de um mesmo instante seguirão geodésicas que são perpendiculares inicialmente à linha de partida. As trajectórias parecem ser paralelas de inicı́o, mas a curvatura da superfı́cie forçá-las-à a convergir, isto é, a sua separação já não é constante e ter-se-à uma aceleração relativa não nula para esses seres que percorrem geodésicas vizinhas com velocidades constantes. Neste sentido, a curvatura do espaçotempo implica o desvio geodésico que pode ser medido experimentalmente. É notável referir que as partı́culas livres (isto é, aquelas que se movem unicamente sob a acção da gravitação; esta já não sendo em relatividade geral uma força) seguem trajéctórias geodésicas no espeço-tempo curvo mas localmente o espaço-tempo da relatividade geral é o da relatividade restrita sendo que a curvatura apenas se faz notar para escalas maiores. 54 4 As Equações de Einstein A teoria da relatividade geral já está algo exposta em várias expressões acima escritas como em muitos comentários e notas atrás presentes. Vamos aqui nestre capitulo conferir uma formulação matemática rigorosa e escrever as equações correspondentes, assim como alguns elementos que são ainda necessários. Ao progredir do espaço-tempo plano da relatividade restrita para a noção de (variedade) espaço-tempo curvo que irá caracterizar a relatividade geral, estamos a incluir os efeitos da gravitação, não como uma força no âmbito Newtoniano mas agora em termos da curvatura do espaço-tempo. Para melhor entender “porque” e “como” relembremos que uma particula livre neste contexto significa uma particula que se move sob acção apenas da gravitação. Comparando a expressão ν σ d2 xµ µ dx dx + Γνσ =0 dτ 2 dτ dτ (196) com a sua análoga no espaço-tempo da relatividade restrita d2 xµ =0 dτ 2 (197) concluimos que os coeficientes de conexão têm um papel importante em explicar os efeitos gravitacionais. E como aqueles são função da métrica espaciotemporal, então é na métrica do espaço-tempo que estará a origem e conteúdo da interacção gravitacional. Relembre-se que a primeira lei de Newton afirma que um corpo mantem o seu estado de movimento uniforme em linha recta ou repouso a não ser que actuado por uma força. E tal pode ser estendido em que qualquer particula segue uma geodésica no espaço-tempo. Num referencial inercial podemos ignorar as conexões Γµνσ em (196) e as geodésicas são descritas aproximadamente por (197). Se agora assumirmos um contexto ' 1 e as geodésicas descrevem-se como seria não relativista então toma-se dτ dt d2 xi de esperar por dt2 = 0. Assim, na descrição Newtoniana uma particula livre segue movimento numa linha recta de forma uniforme no espaço e tem-se 2 i livre F i = m ddtx2 . A extensão Einsteiniana estabelece³ que uma particula ´ ν dxσ 2 xµ dx d segue geodésicas no espaço-tempo e com F µ = m dτ 2 + Γµνσ dτ dτ . 55 Para aprofundar em mais detalhe este aspecto, tome-se o caso em que temos uma situação e um sistema de coordenadas em que a métrica do espaçotempo se escreve como gµν = ηµν + hµν (198) onde os termos hµν são tomados como pequenos. Mais ainda, assume-se que o campo gravitacional (que estará representado em hµν ) é tal que ∂hµν ¿ ∂i hµν (199) ∂t i.e., é o limite de quasi-estático. Usemos então a coordenada temporal t (tal que x0 = ct) em vez do tempo próprio τ . A equação para as geodésicas escreve-se como ν σ d2 xµ dxµ µ dx dx + Γ = h(s) (200) νσ dt2 dt dt dt ∂0 hµν = c−1 onde h(t) = − se como ³ dt2 dτ 2 ´³ dt dτ ´2 . Dividindo por c2 a parte espacial de (200) escreve- 1 d 2 xi 2 i dxj 1 i dxj dxk 1 dxi i + Γ + Γ + Γ = h(t) (201) 00 c2 dt2 c 0j dt c2 jk dt dt c2 dt em que se ignorará o último termo no lado esquerdo de (201). Escrevamos agora hµν = η µσ η νρ hσρ e daqui que g µρ = η µρ −hµρ , Γµνσ = 21 η µρ (∂νhσρ + ∂σhνρ − ∂ρhνσ ) , ³ ´2 ν σ Γi00 = − 21 η ij ∂j h00 , Γi0j = − 12 δ ij (∂j h0k − ∂k h0j ) . Também de dτ = c12 gσν dxdt dxdt dt √ 2 se extrai que dτ = 1 + h00 ' 1 + 12 h00 , pelo que ddt2τ = 2c h00,0 e 1c h(t) = h00,0 . dt Então para (201) podemos escrever que (após multiplicar por m) d2 xi m 2 = −mδ ij ∂j dt à ! c2 00 dxj h + mcδ ik (∂j h0k − ∂k h0j ) 2 dt (202) O lado esquerdo de (202) representa o produto de massa com a aceleração, i.e., uma força Newtoniana. O primeiro termo do lado direito é o gradiente ~ , em que o potencial é na forma de −m∇U 1 (203) U = c2 h00 + C 2 em que C é uma constante e o segundo termo é um termo dependente da velocidade e envolve rotação, como na componente de Coriolis. Se ignorarmos este termo, o que obtivemos foi d2 xi = δ ij ∂j U dt2 56 (204) que é a equação Newtoniana do movimento poara uma particula movendo-se num campo gravitacional U , onde se faz a identificação g00 = 1 + 2U c2 (205) fornecendo a relação entre a métrica do espaço tempo e o potencial Newtoniano. A lei Newtoniana da gravitação é obtida se tomarmos a métrica do espaçotempo de Schwarzschild (ver capitulo 5 e equação (243)) que representa o campo estático produzido por um corpo com massa M e simetria esférica: µ 2 2 2 ds = c dτ = c 2 ¶ µ 2GM 2GM dt2 − 1 − 2 1− 2 cr cr ¶−1 dr2 − r2 dθ2 − r2 sin2 θ dφ2 Usando x0 = ct, x1 = r sin θ cos φ, x2 = r sin θ sin φ, x3 = r cos θ obtemos a métrica na forma gµν = ηµν + hµν , onde para valores GM ¿ 1, os termos hµν c2 r são pequenos e obtemos g00 = 1 − 2 GM GM GM ⇒ h00 = −2 2 ⇒ U = − 2 cr cr r (206) e a equação (204) toma a forma esperada m d2~r2 ~ = − GM m ~r = −m∇U 2 dt ~r2 |~r| Neste nosso percurso para obter as equações do campo gravitacional em relatividade geral há ainda que identificar quais são os elementos (e que forma devem ter) necessários para determinar a métrica e assim a geometria do espaço-tempo a partir de uma dada distribuição de matéria. De facto, é da presença desta que surge o campo gravitacional. Recordemos que no espaço-tempo plano da relatividade restrita num referencial inercial a descrição de matéria emprega os seguintes elementos n o • Quadri-vectores λ = {λµ } = λ0 , ~λ • Uma particula teste tem massa em repouso m • Usa-se o tempo coordenado t ou o tempo próprio τ , relacionados por −1/2 dt = γ = (1 − V 2 /c2 ) onde V é magnitude da velocidade espacial dτ usual da particula 57 • A energia total é dada por E = γmc2 • O quadri-vector velocidade é dado por uµ = por pµ = muµ n dxµ dτ e o quadri-momento o • Relembre-se que se tem V µ = c, V~ onde V~ é a velocidade espacial µ dt µ V . usual, em que V µ = dxdt , tal que uµ = dτ • Uma particula estacionária num ponto com coordenadas espaciais ~r0 r0 ) = (c, 0), pµ = m(c, 0). Quando em movimento, obtemtem uµ = d(cτ,~ dτ µ µ se que p = mu = γmV µ = (E/c, p~); A energia e momento linear em relatividade restrita correspondem às componentes temporal e espaciais de um quadri-vector. Mas como será para o caso de uma distribuição continua de matéria, onde não possamos identificar particula a particula? Esta questão é importante em relatividade restrita mas muito significativa em relatividade geral, pois são corpos maciços e com extensão espacial que são a fonte do campo gravitacional. Na resposta a este questão temos que considerar a noção de fluido, caracterizado por duas componentes; a densidade de energia (própria) ρ e a µ pressão P , junto com o vector uµ = dx . E para relacionar conteúdo material dτ com o campo gravitacional que admite uma representação métrica, há que encontrar uma representação tensorial para os termos de matéria-energia, a qual constituirá a fonte para que surja um espaço-tempo curvo. A resposta está no tensor energia-momento T = {T µν }. Para o caso de um fluido perfeito, toma a forma de µ Tµν ¶ P = ρ + 2 uµ uν − P gµν c (207) o qual é simétrico como a métrica. De notar que a pressão contribui para o conteúdo energético do fluido (ver primeiro termo de (207)) no lado direito. Será que esta representação para energia e matéria é adequada? Assim é. Note-se que ¶ µ P (208) T µν uν = c2 ρ + 2 uµ − P uµ = c2 ρuµ c a qual constitui a projecção de T em uν , fornecendo a dendidade de energia. A divergência de T, i.e., T µν ,µ quando igualada a zero fornece equações 58 relevantes em mecânica. Assim em relatividade restrita e por simplicidade temos P µ ν P µ ν u u + 2u u c2 ,µ c P,µ µ ν u u − P,µ η µν 2 c (209) µ 2 ν Agora de uµ u = c obtemos por diferenciação que u ,µ uν = 0, pelo que contraindo T µν ,µ = 0 com uν obtemos T µν ,µ = 0 ⇔ (ρuµ ),µ uν + ρuµ uν,µ + (ρuµ ),µ + ,µ + P µ u =0 c2 ,µ (210) com a qual a equação (209) se simplifica em µ ¶ P ρ + 2 uµ uν c ³ ,µ ´ = η µν − c−2 uµ uν P,µ (211) Pode então verificar-se que a equação (210) representa a equação de continuidade de um fluido e (211) a equação do movimento do fluido. Com uµ = γV µ = γ(c, V~ ) para velocidades não relativistas, ignorando V /c e tomando γ ≈ 1, junto com cP2 ¿ ρ, obtemos ∂ρ ~ ~ + ∇(ρV ) = 0 ∂t e à ! ∂ ~ V~ = −∇P ~ ρ + V~ ∇ ∂t a qual é a equação de Euler para o movimento de um fluido perfeito. (Na curvatura do espaço-tempo seguimos os passos acima, generalizando para relatividade geral empregando derivadas covariantes em T µν ;µ = 0 e substituindo η µν por g µν . É interessante referir que em (211), usando 2 µ uµ uν ,µ = ddτx2 se pode simplificar em µ P ρ+ 2 c ¶ 2 µ dx dτ 2 ³ ´ = η µν − c−2 uµ uν P,µ (212) indicando ³ 2 µ ´que as particulas de um fluido são desvidas de uma linha geodésica d x = 0 pela presença de gradientes de pressão. dτ 2 Estamos agora em condições de abordar a formulação das equações da relatividade geral. As equações de campo da gravitação da relatividade geral 59 são designadas de equações de Einstein. Como já analisamos no contexto de uma teoria métrica da gravitação (através de uma descrição tensorial, tanto da matéria como da geometria), vamos ver como obter equações consistentes. Einstein já sabia da analise de geodésicas que o tensor da métrica gµν descrevia a geometria do espaço-tempo associado a uma distribuição de matéria e relacionava-se com o potencial gravı́tico em limites especificos. Esta quantidade possui informação sobre a geometria e o potencial gravitico (relembrar o papel de g00 na identificação do potencial gravitico). Sabendo que a matéria se descrevia pelo tensor energia-momento Tµν Einstein considerou inicialmente gµν = Tµν Ambos são simétricos e de divergencia nula mas desta equação não se obtem a equação de Poisson ∇2 U = 4πGρ. Uma hipótese seria então com os conhecimentos da geometria de Riemann, escrever Rµν = Tµν só que Rµν não tem divergencia nula, apesar de ser simétrico. No entanto seria de esperar a presença do tensor de Ricci (em alguma forma tensorial) nas equações. Para ver porquê, comparemos a equação de desvio geodésico na sua aproximação Newtoniana utilizando o tempo próprio τ como parâmetro afim, tal que se tem D2 ξ a D2 ξ µ a b c d + Rcbd ξ ẋ ẋ = 0 ⇔ ≡ K µ ν ξν (213) 2 2 dτ dτ µ µ onde K µ ν = Rσνρ ẋσ ẋρ = −Rσρν ẋσ ẋρ . Na teoria Newtoniana, tomemos duas particulas que se movem sob acção da gravitação em trajectórias próximas dadas por xi (t) e x̃i (t), com equações do movimento dadas por d2 x̃i = δ ij ∂˜j U dt2 d2 xi = δ ij ∂j U, dt2 (214) Definindo então ξ i (t) = x̃i (t) − xi (t), para pequenas separações temos ∂˜k U = ∂k U + (∂j ∂k U ) ξ j (t) pelo que se obtem então onde K i j d2 ξ i = −K i j ξ j dt2 = δ ik ∂j ∂k U. Temos então a correspondência µ K µ ν = −Rσρν ẋσ ẋρ ↔ K i j = δ ik ∂j ∂k U 60 (215) (216) Como no espaço vazio as equações de Newton levam a ∇2 U = 0, i.e., K i i = 0, tal sugere que num espaço-tempo sem matéria se tome K µ µ = 0, i.e., Rσρ ẋσ ẋρ . Para vectores arbitrários ẋρ , tangentes a geodésicas, podemos concluir pelas propriedades de simetria do tensor de Ricci, que K µ µ = 0 ⇔ Rσρ = 0 (217) A comparação entre o desvio geodésico e sua aproximação Newtoniana sugerem assim que as equações da relatividade geral no vazio (ausencia de matéria-energia) serão dadas por Rµν = 0 (218) Havia ainda que formular as equações completas, para a presença de fontes de matéria-energia. Albert Einstein então deduziu que seria: 1 Rµν − Rgµν = KTµν = Gµν (219) 2 Assim ambos os lados da equação são simétricos, tem divergencia nula, correspondem a 10 equações derivadas parciais não lineares acopladas e tem limite adequado as equações da mecânica Newtoniana ( inclusive a equação de Poisson). Como nota, refira-se que K=− 8πG c4 (220) Outra forma de escrever esta equação é 1 Rµν = K(T µν − T g µν ) (221) 2 onde T = T µ µ . Convém enfatizar que o tensor energia-momento contem todas as formas de matéria e energia. Daqui se expressa que uma região do espaço-tempo onde não há matéria, i.e., T µν = 0, implica que Rµν = 0 também. O espaço vazio é assim caracterizado por Rµν = 0 mas isto não implica que a curvatura de Riemann seja nula. Para terminar, vamos mostrar as equações de Einstein com matéria, constituem o que é necessário e consistente para uma teoria métrica da gravitação. Tomemos então as componentes 00 dessas equações, isto é, 61 µ ¶ 1 R00 = K T00 − T g00 (222) 2 Se o campo gravitico for fraco, usemos gµν = ηµν + hµν , onde hµν é pequeno. Para a matéria, o tensor de energia momento é composto por particulas cujas velocidades são V ¿ c, em que à V2 γ = 1− 2 c !− 1 2 ≈1 (223) e P ¿ρ c2 (224) Tµν = ρuu uν (225) Tomemos então que isto é, T = ρc2 , vindo que µ R00 1 ≈ Kρ u0 u0 − c2 g00 2 ¶ (226) e com u0 ≈ c e g00 ≈ 1, pomos Como 1 Roo ≈ Kρc2 2 (227) R00 = ∂0 Γµ0µ − ∂µ Γµ00 + Γ00µ Γµ00 − Γ000 Γµ0µ (228) na situação de um campo gravitico fraco, tal que podemos usar um sistema Cartesiano aproximado para as coordenadas, as conexões são pequenas e temos então: e como escrevemos que - R00 ≈ −∂i Γi00 (229) 1 Γi00 = g ij ∂j h00 2 (230) 1 1 ij δ ∂i ∂j h00 ≈ Kρc2 2 2 (231) 62 Mais ainda, δ ij ∂i ∂j = ∇2 e 2U c2 vem que nesta aproximação de correcções relativistas à descrição Newtoniana se pode escrever 1 ∇2 U ≈ − Kρc4 (232) 2 que corresponde à equação Newtoniana de Poisson se h00 = K=− 8πG ⇒ ∇2 U ≈ 4πGρ c4 63 (233) 5 A Solução de Schwarzschild Nesta capitulo vamos abordar a solução de Schwarzchild, que se aplica à descrição em relatividade geral do campo gravı́tico criado por objectos massivos como planetas e estrelas (incluindo buracos negros). Esta solução é obtida das equações de Einstein assumindo que: a) o campo é estático; b) o campo tem simetria esférica; c) o espaço-tempo é vazio (fora do objecto...); d) o espaço-tempo é assimptoticamente plano; Também se toma que o espaço-tempo é coordenatizado por t, r, θ, φ com uma métrica do tipo: ds2 = c2 dτ 2 = A (r) dt2 − B (r) dr2 − r2 dθ2 − r2 sin2 θdφ2 (234) onde A e B são funções de r. Notar que: i) Não há dependencia em t; ii) A superfı́cie com r, t constante tem geometria com métrica ds2 = r2 (dθ2 + sin2 θdφ2 ); iii) A e B serão obtidas de Rµν = 0; iv) Temos que A (r) → c2 , B (r) → 1 quando r → ∞ v) B (r)não é necessáriamente igual a 1, pelo que não podemos assumir que r é uma coordenada radial. Usando a expressão de Rµν em função das conexões obtemos as seguintes equações para Rµν = 0 : R00 A00 A0 =− + 2B 4B R11 A0 A00 + = 2A 4A R22 à à A0 B 0 + A B A0 B 0 + A B 1 r = −1+ B 2B à ! − ! − A0 B 0 + A B R33 = R22 sin2 θ = 0 64 A0 =0 rB B0 =0 rB (235) (236) ! =0 (237) (238) d , “ . ” = dtd . Agora multipliquemos a primeira equação onde se usa “ 0 ” = dr B por A e adicionemos à segunda equação. Obtemos que A0 B + AB 0 = 0, isto é, AB= constante. Das condições (i)-(v) atrás escritas vem que: AB = c2 ⇔ B = c2 A (239) Indo à terceira equação, temos que µ ¶ µ ¶ K K −1 A (r) = c 1 + B = 1+ (240) r r onde K é uma constante relacionada com a massa do objecto (exemplo, planeta ou estrela). Notar então que quando Kr é pequeno, isto é, r → ∞, o elemento de linha ou métrica diferem muito pouco da que corresponde ao espaço-tempo plano. E ainda, se usarmos as coordenadas x0 = ct, x1 = r sin θ cos φ, x2 = r sin θ sin φ, x3 = r cos θ obtemos a métrica na forma gµν = ηµν + hµν , em que h00 = Kr , e assim 2 h00 = 2U MG ⇒ Uv = − 2 c r (241) nesta aproximação concluimos que K=− 2GM c2 (242) pelo que a solução de Schwarzchild correspondente ao exterior de um objecto com massaM é: µ ds2 = c2 dτ 2 = c2 1 − ¶ µ 2GM 2GM dt2 − 1 − 2 2 cr cr ¶−1 dr2 − r2 dθ2 − r2 sin2 θ dφ2 (243) Vamos agora tentar interpretar as consequências fisicas desta solução. Notemos que −∞ < t < ∞. As coordenadas θ e φ são simples coordenadas angulares em que 0 ≤ θ ≤ π e 0 ≤ φ ≤ 2π. A coordenada r variará entre ∞ , pois e a fronteira fisica rF que será a superficie do objecto ou 2GM c2 r→ 2GM ⇒ g11 → ∞ c2 65 (244) Figura issueH-iv Figure 20: Representação de ... Por simplicidade, façamos a identificação m ≡ toma então a forma: µ c2 dτ 2 = 1 − ¶ µ 2m 2 2 2m c dt − 1 − r r ¶−1 2GM . c2 A métrica de Schwarzchild dr2 − r2 dθ2 − r2 sin2 θdφ2 (245) pelo que a distorção relativamente ao espaço-tempo plano é determinada pelo factor 2m . (Se este for zero temos a métrica do espaço-tempo plano). Vamos r pormenorizar estes aspectos. Para uma esfera na solução de Schwarzchild com t e r constantes, o elemento de linha é dl2 = r2 (dθ2 + sin2 θdφ2 ) correspondendo a uma esfera bidimensional de raio r no espaço Euclidiano. Mas na solução de Schwarzchild, para θ e φ constantes, o elemento de linha espacial é µ ¶ 2m −1 dR ≡ 1 − dr (246) r assim dR > dr e r não corresponde a medir distâncias. Este detalhe fica melhor compreendido com a seguinte figura onde se relaciona a distância 66 ³ ´− 1 2 radial em Schwarzchild como dR = f (r)dr em que f (r) = 1 − 2m . r Notemos então que f (r) → ∞, r → 2m e f (r) → 1, r → ∞. Os discos C1 e C2 estão na região S(m = 0) que corresponde a uma região do espaço tempo plano enquanto que os discos C3 e C4 estão numa região S(m 6= 0), respectivamente. É apenas na região S(m = 0) que a distância radial entre esferas tem o valor dr, porque na geometria Schwarzchild, a distância radial é dada por dR > dr. A analogia é a mesma relativamente a determinar o quociente entre o perimetro de uma circunferência na superficie de uma esfera e o seu raio nela localizado. No que diz respeito à coordenada temporal sabemos que relógios registam o tempo próprio ao longo de linhas do universo, dada por dτ . Este é pois o tempo próprio na geometria de Schwarzchild, o qual (em r, θ, φ constantes) dá a relação µ ¶1 2m 2 dτ = 1 − dt (247) r e o que se assumirá no espaço tempo plano é que o tempo próprio é igual à coordenada temporal. No espaço-tempo de Schwarzchild, temos que dτ < dt. Suponhamos então que um sinal luminoso é enviado de um emissor num dado ponto rE, θE, φE, tal que descreve uma geodésica de luz e é observado num receptor em rR, θR, φR . Se tE é a coordenada temporal da emissão e tR a coordenada temporal da recepção, então a luz viajou ou progrediu entre acontecimentos com coordenadas (tE , rE, θE, φE ) e (tR , rR, θR, φR ). Seja u o parâmetro ao longo da geodésica de luz tal que tE corresponde uE e a tR corresponde uR . Para geodésicas de luz temos a equação µ ¶ à 2m 2 dt 1− c r du !2 µ 2m = 1− r ¶−1 à dr du !2 à +r 2 dθ du !2 à ! dφ + r sin θ du (248) 2 2 tal que à dt du ! 1 = c "µ 2m 1− r ¶−1 dxi dxj gij du du #1 2 (249) e integrando vem 1 Z uR tR − tE = c uE "µ 2m 1− r 67 ¶−1 dxi dxj gij du du #1 2 du (250) Figura issueH-v Figure 21: Representação de ... Notar que no lado direito desta expressão temos apenas coordenadas espaciais, pelo que para eventos com coodenadas espaciais fixas para o emissor e receptor, o valor tR − tE é o mesmo para todos os sinais enviados, isto é, (1) (1) (2) (2) tE − tR = tE − tR = ...... = ∆tR − ∆tE (251) Por outras palavras, a diferença de coordenada temporal no ponto de emissão é igual à diferença de coordenada temporal no receptor. No entanto, o relógio de um observador no ponto de emissão regista o tempo próprio e não o tempo coordenado, em que os dois se relacionam como µ 2m ∆τE = 1 − rE e como ∆τE = ∆τR , vem que µ ¶1 2 2m ∆τR = 1 − rR ∆tE , q 1− ∆τR =q ∆τE 1− 2m rR 2m rE ¶1 2 ∆tR (252) (253) Esta é a expressão que determina a dilatação do tempo pela gravitação. A expressão anterior permite extrair a forma do desvio espectral num campo gravitico. Vamos então assumir que o emissor possui um átomo que 68 num intervalo de tempo próprio ∆τE emite n impulsos. O observador junto com átomo regista uma frequência n/∆τE em que esta é a frequência própria do átomo emissor. Um observador junto do receptor irá ver esses n impulsos mas num intervalo de tempo próprio ∆τR , com frequência n/∆τR .E como ∆τE 6= ∆τR , temos uma diferença na frequência observada. De facto obtemos que q 1− ∆τR =q ∆τE 1− 2m rR (254) 2m rE e para rE c2 À 2GM e rR c2 À 2GM , vem que νr GM '1+ 2 νE c µ 1 1 − rR rE ¶ ∆ν νR − νR GM ⇒ = ' 2 νE νE c µ 1 1 − rR rE ¶ (255) Assim, se o emissor estiver perto de um objecto massivo e o receptor afastado, então r1R < r1E e temos um desvio espectral para o vermelho. Estudemos agora o movimento e trajectória de objectos na geometria de Shwarzschild, em particular as trajectórias de luz que irão corresponder a geodésicas tipo luz e as trajectórias com massa em movimento que são geodésicas tipo tempo.As equações das geodésicas podem ser obtidas das equações de Euler-Lagrange a partir de " µ µ ¶ 2m 2 2m 1 1 2 c 1− ṫ − 1 − L(x , ẋ ) = gµν ẋσ ẋσ = 2 2 r r σ σ ¶−1 # 2 2 ṙ − r dr 2 (256) No caso da geometria de Schwarzschild que tem simetria esférica podemos tomar para simplificar θ = π . Assim para as geodésicas temos que µ ¶ µ ¶ 2m −2 m 2 mc2 2m −1 ṙ − rφ̇2 = 0 (257) r̈ + 2 ṫ2 − 1 − 2 r r r r Também temos que em virtude de t e φ serem coordenadas ciclicas vir que: 1− µ e ¶ 2m ∂L =C ⇒ 1− ṫ = k r ∂ ṫ 69 (258) ∂L = C ⇒ r2 φ̇ = h ∂ φ̇ (259) em que k, h são constantes. É de referir também c2 dτ 2 = gµν dxµ dxν leva, com θ = π/2 a µ ¶ µ 2m 2 2m c 1− ṫ − 1 − r r Daqui também podemos escrever que 2 µ c2 ¶ µ 2m ṫ2 2m 1− − 1− 2 r φ̇ r ¶−1 ṙ2 − r2 φ̇2 = c2 ¶−1 à !2 (260) c2 φ̇2 (261) c2 k 2 r2 2m − =0 1− r h2 (262) 2GM 2GM u + 2 u3 2 h c (263) dr dφ − r2 = e usando as equações anteriores (258) e (259) vem à dr dφ à !2 +r c2 r 2 1+ 2 h 2 !µ ¶ e se usarmos agora u = 1r , obtemos à du dφ !2 + u2 = E + 2 onde E = c2 (k h−1) , sendo que esta equação representa uma conservação de 2 energia mas onde o termo 2GM u3 é a correcção relativista. Esta equação dá c2 a trajectória de U ou r em função de φ no plano θ = π/2. Analisemos agora o caso da queda vertical. Temos que usar φ = C , isto é h = 0 e a equação (259) não pode ser usada, mas com a equação (260) para φ̇ = 0 vem µ ¶ 2m ṙ − c k + c 1 − =0 (264) r em que k 2 = 1 − 2m , em que r0 é coordenda radial da posição inicial. Diferr0 enciando vem 2 2 2 à 2 ! GM 2mc2 2ṙr̈ + ṙ = 0 ⇒ r̈ + 2 = 0 2 r r (265) Esta equação é muito semelhante à equação Newtoniana. Mas r não é a distância na vertical na geometria se Schwarzschild. Mais ainda, a derivação 70 é em relação ao tempo próprio τ e na mecânica Newtoniana usa-se o tempo coordenado t. Podemos escrever então µ ¶ 1 1 2 1 ṙ = M G − (266) 2 r r0 O lado esquerdo da esquerdo da equação é positivo e tal determina que r < r0 . É semelhante ao caso de uma particula de massa unitária em queda desde o repouso em r0 , adquirindo energia cinética igual à sua perda de energia gravitica potencial. A equação acima permite determinar a variação de tempo próprio da partı́cula em queda desde o repouso em r0 onde tomamos τ = τ0 . Integrando, obtemos que ¶ Z r0 µ 1 r0 r 1/2 dr τ=√ r0 − r 2GM r (267) notando que o limite de integração r pode ser tomado como 2m = 2GM ou c2 uma fronteira fisica (e.g., na superficie da esfera). Verifica-se que o integral é finito para r = 2m. Só que para a coordenada temporal t a queda para r = 2m dá um resultado ... infinito. Vamos clarificar esta análise usando a velocidade dada por dr = v(r) e comparando com o que sucede numa dt descrição unicamente Newtoniana com a função ṽ(r). Para r → ∞ temos que ³ v(r) = 2mc2 ´1/2 (r − 2m) r3/2 (268) e (2mc2 )1/2 (269) r1/2 pelo que com r a decrescer desde ∞, v(r) aumenta até um valor máximo e depois decresce para v(r) → 0 em r → 2m. Quanto a ṽ(r), aumenta para ∞ quando r → 0. No caso do movimento circular, temos que θ = π/2 e r = ³ ´2 constante que ṙ = r̈ = 0, vem mc2 ṫ2 = r3 φ̇2 , onde dφ = GM , pelo que a dt r3 variação de coordenada temporal numa revolução (orbital) é ṽ(r) = ∆t2 = √ 2π 71 r3 GM (270) Vamos agora analisar o que sucede para trajectórias de raios luminosos, isto é, as trajectórias para fotões. Usando as equações (257) e (259) obtemos que µ ¶ µ 2m 2 2m ṫ − 1 − r r c2 1 − ¶−1 ṙ2 − r2 φ̇2 = 0 (271) levando a à du dφ !2 + u2 = F + 2GM 3 u c3 (272) 2 2 onde F = chk2 . Esta equação é usada para demonstrar o encurvamento das trajectórias luminosas. Também se verifica que´ para ṙ = r̈ = 0 se obtem ³ φ̇2 φ̇2 mc2 2 = r3 e da equação anterior ṫ2 = c 1 − 2m r.2 , o que mostra que para r ṫ2 r = 3m obtém trajectórias circulares para os fotões em órbita. Para o desvio de raios luminosos, tomemos então a equação atrás indicada. Para M = 0, vem à !2 du + u2 = F (273) dφ cuja solução é da forma u = u0 sinφ, r = r0 sinφ. (274) Esta solução representa uma linha recta seguida pelo fotão originário desde o infinito em φ = 0 e indo para ∞ em φ = π. Mas para M 6= 0, temos que considerar a influência de ε = 2GM . Tomando ε ¿ r e expandido em série c2 de Taylor, vamos proceder da seguinte forma. Se u0 é o valor de u onde o du fotão está mais perto da estrela, verifica-se que dφ = 0 e podemos escrever: à du dφ !2 + u2 = u20 (1 − u0 ε) + εu3 (275) Procuremos soluções da forma u = u0 sinφ + εV onde V é uma função de φ. Substituindo na equação acima, temos à dV 2 dφ ! cos φ + 2V sin φ = u20 (sin2 φ − 1) 72 (276) cuja solução é µ u = u0 ¶ 1 1 1 − εV sin φ + εV o2 (1 − cos φ)2 2 2 (277) Espera-se algum encurvamento da trajectória da luz, pelo que para distâncias infinitas a trajectória não seguirá ao longo de φ = π mas sim π + α, com α ¿ 1. Usando as equações obtidas com u = 0 e φ = π + α, obtemos então que 0 = −u0 α + 2εu20 , α = 2u0 ε Daqui então o fotão é desviado ao passar por um corpo massivo com α = 2εu0 = 4GM r0 c2 que é o dobro do valor indicado pelo principio de equivalência. 73 (278) 6 Cosmologia Relativista Neste último capitulo, vamos focar as consequências da relatividade geral para a cosmologia. A força fundamental que mantém estrelas e outros sistemas com galáxias juntas é a força da gravidade. É pois de fundamental importância usar a teoria da relatividade geral. para descrever a estrutura em larga escala da distribuição de matéria no universo. Para isso vamos usar algunmas simplificações: a) O Universo é como que preenchido por um fluido macroscópico de“galáxias” na forma de fluido perfeito, com tensor energia-momento µ Tµν ¶ P = ρ + 2 uµ uν − P gµν c b) Tal deriva de tomar o Universo especialmente homogéneo, isto é, o número de galáxias/unidade volume é muito aproximadamente uniforme no espaço vasto do universo. c) Também se assume que o universo é especialmente isotrópico, isto é, o número de galáxias/unidade de ângulo sólido é o mesmo aproximadamente em todas as direcções. d) Também se emprega o facto que há um desvio para o vermelho no comprimento de onda da luz emitida por galáxias. e) Referir que existe uma radiação única de fundo uniforme de cerca de 2.7K preenchendo o Universo. Para o cenário cosmológico atrás descrito é possivel propor uma geometria espácio-temporal. Esta é a métrica de Lemâitre-Friedman-RobertesonWalker (LFRW) baseada em espaços máximamente simétricos e assumindo o prı́ncipio cosmológico: homogeneidade e isotropia espacial. Usando coordenadas t, r, θ, φ o elemento de linha da métrica de LFRW é 2 2 2 2 c dτ = dt − a (t) ·³ 1 − kr ´ 2 −1 ¸ 2 2 2 2 2 dr + r dθ + r sin θdφ 2 (279) em que k = 0, ±1 determina a geometria espacial como plano, fechada ou aberta (curvatura espacial nula, positiva ou negativa) e a(t) é um factor de escala. O valor k = 0 dá pois um espaço tridimensional Euclidiano imerso num espaço-tempo de Minkowski. Já k = 1 corresponde a uma esfera de 3 74 dimensões e tem volume finito. Para k = −1, temos um espaço de curvatura com uma “sela” a 3 dimensões, com volume constante. O factor de escala a(t) é resposável pelas fases em que se expande o espaço de uma forma uniforme de tal forma que da é positivo. O factor de escala opera no espaço como um dt todo independentemente da direcção e do valor de t. A coordenada temporal t pode ser interpretada do seguinte modo. Atribuamos a cada galáxia um relógio que regista o seu tempo próprio. Todos estes relógios podesm ser sincronizados em a(t) = 0. E como o Universo é espacialmente homogéneo e isotrópico então não há razão para os relógios em diferentes posições diferirem no seu registo. Além disso, atribuı́mos no sistema (t, r, θ, φ), as linhas do Universo das galáxias às linhas de coordenadas r, θ ,φ = constante. Temos pois um sistema de coordenadas co-movendo-se com as galáxias onde t é também o tempo próprio τ , isto é, o tempo cósmico. Uma analogia para entender melhor o contexto acima explicado é tomar um balão com pintas, que representam galáxias. Suprando no balão este expande com o tempo e a distância entre pintas (galáxias) irá depender apenas de um factor de escala que cresce com o tempo tal que cada galáxia possui o mesmo registo temporal t. Assim, com o elemento de linha de LFRW vamos pesquisar modelos cosmológicos e extrair implicações da teoria da relatividade geral. Em particular usando a definição de conexão indicada atrás assim como o tensor de Ricci, escrevemos R00 = − 3ä a (280) R11 = −(aä + 2ȧ2 + 2k)/(1 − kr2 ) (281) R22 = −(aä + 2ȧ2 + 2k)/r2 (282) R33 = −(aä + 2ȧ2 + 2k)/r2 sin2 θ (283) e todos os outros são zero. Além disso, para c = 1 e uµ uµ = 1, temos T = T ν ν = ρ − 3P Além disso, no sistema de coordenadas U µ = δ0µ e Uµ = gµν U ν = gµν Uoν = gµ0 = δµ0 vem que: 75 Tµν = (ρ + P )δµ0 δU0 − P gµν (284) e 1 1 Tµν − T gµν = (ρ + P )δµ0 δν0 − (ρ − P )gµν 2 2 Daqui se escreve que (285) 1 1 T00 − g00 = (ρ + 3P ) 2 2 (286) 1 1 T11 − T g11 = (ρ − P )a2 /(1 − kr2 ) 2 2 (287) 1 1 T22 − T g33 = (ρ − P )r2 a2 sin2 θ 2 2 (288) 1 1 T33 − T g33 = (ρ − P )r2 a2 sin2 θ (289) 2 2 sendo as outras nulas. No fim destes cálculos as equações de Einstein da relatividade geral para a geometria de LFRW resumem-se apenas a duas equações 3ä = .4πG(ρ + 3P ) a (290) aä + 2ȧ2 + 2k = 4πG(ρ − P )a2 (291) e destas duas equações ainda obtemos ȧ2 + k = 8πG 2 ρa 3 (292) conhecida pela equação de Friedman. Utilizando agora T µν ; ν = 0 iremos obter as equações de continuidade e movimento do fluido de partı́culas. Mais concretamente (ρuµ );µ + P uµ ;µ = 0 (293) (ρ + P )uν ;µ uµ = (g µν − uµ uν )P,µ (294) 76 e escrevendo daqui que ρ,µ uµ + (ρ + P )(uµ ,µ +Γµµν uν ) = 0 e com uµ =δ0µ vem que se reduz a 3ȧ =0 (295) a As outras equações são identicamente zero nos dois lados, sendo automáticamente satisfeitas. Isto significa que as particulas do fluido cosmológico seguem geodésicas, o que seria de esperar pois como a pressão é uma função do tempo apenas, não há gradientes de pressão para afastar das geodésicas. ρ̇ + (ρ + P ) O Universo onde “hoje” nos encontramos parece ser dominado pela ausência de pressão e apenas a presença de matéria (galáxias) sem contacto relevante. Assim, usamos P ' 0 que implica que ρR3 = constante. Para os modelos de k = ±1, 0, estes têm um ponto onde a(t) = 0 pelo que usamos t = 0 onde R(0) = 0, isto é, a origem do Universo. Usando ρR3 = ρ0 R03 , a equação de 2 Friedman como ȧ2 + k = Aa , com A = 8πGρ0 a30 /3 > 0 e H [a (t)] ≡ aȧ como parâmetro de Hubble temos então à 3H02 k 8πGρ0 = ρ0 − 2 a0 3 8πG k > 0 ↔ ρ0 > ρC ! ⇒ k = 0 ↔ ρ0 = ρC k < 0 ↔ ρ0 < ρC (296) 2 onde ρC = 3Ho é a densidade critica. Também se define o parâmetro de 8πG desaceleração q (q0 no seu valor actual) como q=− aä ȧ2 (297) 0 Neste modelo em particular com P = 0 vem que q0 = 4πGρ = 2ρρ0C . 3H02 Para o modelo plano, k = 0, ρ0 = 1/2 e da equação de Friedman vem µ ¶ A 3A 2/3 2/3 da = 1/2 ⇒ a(t) = t (298) dt a 2 Este modelo constitui a solução cosmológica de Einstein-DeSitter notando que a → 0, quando t → ∞. Para o modelo fechado k = 1, ρ0 > ρC e = q0 > 21 , levando a da dt 2 2 a = A sin Ψ/2 vem que ³ A2 −a a ´1/2 , isto é, t = 77 R a ³ a ´1/2 da e usando 0 A2 −a t = A2 Z Ψ 0 1 ZΨ 1 sin2 (Ψ/2) dΨ = A2 (1 − cos Ψ)dΨ = A2 (Ψ − sin Ψ) 2 2 0 i.e., 1 1 a = A2 (1 − cos Ψ), t = A2 (Ψ − sin Ψ) (299) 2 2 dando um Universo ciclico. O modelo aberto, tem k = −1, ρ0 < ρC e q0 < 12 , donde vem que da = dt 2 2 a = A sinh Ψ/2 vem que t = A2 Z Ψ 0 ³ A2 +a a ´1/2 , isto é, t = R a ³ a ´1/2 da e usando 0 A2 +a 1 ZΨ 1 sinh2 (Ψ/2) dΨ = A2 (cosh Ψ − 1)dΨ = A2 (sinh Ψ − Ψ) 2 2 0 i.e., 1 1 a = A2 (cosh Ψ − 1), t = A2 (sinh Ψ − 1) (300) 2 2 A terminar, façamos um comentário relacionando teoria e observação aravés da idade do Universo, t0 . Para o modelo k = 0 temos que H(t) = ȧ(t)/a = 3t2 e se medirmos observacionalmente H(t0 ) = H0 . Podemos determinar que 2 t0 ' = 12 × 109 anos (301) 3Ho 78