Mecânica Quântica June 24, 2013 Contents 1 Introdução 1.1 Ondas e partículas . . . . . . . . . . . . . 1.2 Ondas de Partículas . . . . . . . . . . . . 1.2.1 Espalhamento de um único elétron 1.3 Pacotes de ondas . . . . . . . . . . . . . . 1.3.1 Velocidade de grupo . . . . . . . . 1.4 Incertezas . . . . . . . . . . . . . . . . . . 1.5 A verdade (pelo menos até agora) . . . . . 1.6 O átomo de Bohr . . . . . . . . . . . . . . 1.7 Quantização de Sommerfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 7 10 11 13 15 18 21 25 2 Mecânica 34 2.1 Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.2 Equações de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . 35 2.2.1 Coordenadas generalizadas . . . . . . . . . . . . . . . . . 36 3 Transformada de Legendre 40 4 Equações de Hamilton 4.0.2 Signi…cado físico da Hamiltoniana 4.1 Princípio variacional (opcinal) . . . . . . . 4.1.1 Exemplo: a braquistocrôna. . . . . 4.1.2 Equações de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Parênteses de Poisson 41 43 44 48 50 52 6 Vetores e equações lineares 6.1 Operadores, autovetores e autofunções no Rn 6.1.1 Produto externo . . . . . . . . . . . . 6.1.2 Auto-vetores . . . . . . . . . . . . . . 6.2 Mudança de base . . . . . . . . . . . . . . . . 6.3 Espaço de Hilbert . . . . . . . . . . . . . . . . 6.4 O espaço L2 . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 61 62 66 67 69 72 6.5 6.6 6.7 6.8 6.9 6.10 Rigged Hilbert space . . . . . . . . . . Operadores simétricos, ou hermitianos Operadores diferenciais . . . . . . . . . Domínio dos operadores . . . . . . . . Operadores auto-adjuntos . . . . . . . Operadores lineares . . . . . . . . . . . . . . . . . 78 80 86 93 94 95 7 Postulados da Mecânica Quântica 7.1 Interpretação probabilística . . . . . . . . . . . . . . . . . . . . . 7.2 Conseqüências físicas do primeiro postulado . . . . . . . . . . . . 7.3 Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 100 102 103 8 Quantização canônica 8.1 Evolução temporal . 8.2 Resumo . . . . . . . 8.3 Realização do espaço 8.4 Rotações . . . . . . . 8.5 Espinores . . . . . . 105 106 113 113 134 138 . . . . . . . . . . . . de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Ressonância 143 10 Observáveis compatíveis 149 10.1 Relações de incerteza . . . . . . . . . . . . . . . . . . . . . . . . . 153 11 Sistemas de várias partículas 154 11.1 Interação de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . 157 11.2 Dois spins acoplados . . . . . . . . . . . . . . . . . . . . . . . . . 161 12 Realização de espaços de dimensão in…nita 12.1 O operador de multiplicação . . . . . . . . . . . 12.2 O operador de posição . . . . . . . . . . . . . . 12.3 O operador de momento . . . . . . . . . . . . . 12.4 O problema do ordenamento . . . . . . . . . . . 12.5 Partícula na caixa . . . . . . . . . . . . . . . . 12.6 O momento da partícula . . . . . . . . . . . . . 12.6.1 Sistemas com vários graus de liberdade 12.7 O oscilador harmônico . . . . . . . . . . . . . . 12.7.1 Normalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 168 170 174 175 177 183 186 187 192 13 Potenciais centrais 195 13.1 Autovalores e autovetores do momento angular . . . . . . . . . . 196 13.2 O átomo de hidrogênio . . . . . . . . . . . . . . . . . . . . . . . . 204 13.2.1 Acoplamento spin-órbita . . . . . . . . . . . . . . . . . . . 208 14 Teoria das perturbações 210 14.1 Acoplamento spin-órbita (continuação) . . . . . . . . . . . . . . . 215 2 1 Introdução Nesta parte do curso vamos estudar a MQ não relativística. Neste modelo se considera, por exemplo, uma partícula carregada (um elétron) se movendo num certo potencial (o núcleo). A estrutura quântica do próprio núcleo não é muito relevante, mas apenas o potencial (ou o campo) que ele gera. Neste caso, dizemos que o campo é externo, i.e., o próprio campo não é quantizado. Este é o setor de uma partícula da mecânica quântica (MQ) não-relativística. Para a análise de estruturas internas do próprio núcleo esta abordagem é completamente inadequada. Uma vez que a dinâmica dos processos ocorre em uma escala relativística e, o que é mais importante, a intensidade dos campos é su…ciente para criar novas partículas. Destarte, não podemos mais nos limitar ao setor de uma partícula e precisamos trabalhar no chamado espaço de Fock, ou, de outra forma, realizarmos a segunda quantização. Onde se considera como a primeira quantização a quantização canônica (ou de Dirac), ou a associação de observáveis clássicos com operadores quânticos. Ao estudarmos a segunda quantização estamos entrando nos domínios da Teoria Quântica de Campos (TQC). Este será um assunto da última parte deste curso. Vamos relembrar alguns pontos vistos no curso de quântica e de Física modera. 1. Hipótese de Planck: A troca de energia entre as paredes do negro e a cavidade são quantizadas. Ou seja, a parede é tratada como osciladores que só podem oscilar múltiplos inteiros de sua freqüência natural. Mas a própria radiação não é quantizada. Esta hipótese resolvia o problema da catástrofe do ultravioleta. 2. Hipótese de Einstein: Além da radiação é emitida em múltiplos inteiros da freqüência natural e está localizada no espaço na forma de pacotes de energia (fótons). Isso explica o efeito fotoelétrico. Nesta descrição a radiação se comporta como inda enquanto se propaga (com todos os fenômenos ondulatórios de interferência) e como uma partícula quando é detectada. Temos a dualidade onda-partícula para a radiação eletromagnética. 3. Hipótese de De Broglie: não apenas a luz (partículas sem massa) apresenta uma dualidade onda-partícula, mas todas as entidades da natureza. Ou seja,qualquer quantidade que possua um momento p terá a ele associado uma onda. Esta hipótese foi comprovada pelo espalhamento de elétrons pelas camadas subseqüentes de um cristal. 1.1 Ondas e partículas O que signi…ca a dualidade onda-partícula? Vamos primeiro analisar a diferença nos conceitos clássicos de ondas e partículas. Imagine a superfície de um aquário cuja metade está separada por uma parede com duas fendas. Na parte do aquário antes da parede batemos (de 3 Figure 1: Figura 2 - Retirada de The Feynman Lectures on Physics. forma bem regular) na superfície da água com uma régua. Isso gerará ondas planas, com uma certa freqüência (igual ao ritmo da régua), que chegarão até a parede com os furos. Do outro lado desta parede temos um detector que pode medir a intensidade da onda que chega, ou seja, ele mede a amplitude (claro que a amplitude vai variar com o tempo, mas registramos apenas o máximo) que a água sobe e desce (o que equivale à energia da onda). Estamos interessados, na verdade, na razão entre a amplitude que sai dos dois furos e a amplitude que chega até o detector. Imagine também que não há re‡exão nas paredes do nosso aquário. Primeiro nós tampamos um dos furos (o 2), movemos o nosso detector em toda a coordenada x e vemos o que ele registra. Como a onda é circular, para manter a energia constante, a amplitude deve cair com o raio. Assim, o detector registrará uma maior intensidade quanto mais próximo ele estiver do furo 1. Um grá…co desta intensidade teria a forma I1 (x) da …gura 2-b. Se repetirmos agora o experimento com apenas a fenda 2 aberta, o detector irá registrar a intensidade I2 mostrada na …gura 2-b. O que ocorre então quando os dois furos estão abertos? Neste caso a distribuição da intensidade não é tão simples. Como as duas ondas circulares são produzidas em pontos diferentes haverá certos pontos onde a crista de uma onda encontrará a crista da outra, se intensi…cando, e outros onde a crista de uma encontrará o vale da outra, se anulando. Mais especi…camente, qualquer ponto cuja diferença da distância entre os furos seja um múlti4 plo inteiro do comprimento de onda a combinação, ou a interferência, será máxima. Para pontos onde esta diferença tenha um valor semi-inteiro do comprimento de onda esta interferência será completamente destrutiva. Com isso, a intensidade registrada pelo detector será como a I12 (x) mostrada na …gura 2-c. Vamos dar ao processo acima uma descrição mais precisa. Ao tamparmos o furo 2 e colocarmos o detector num certo ponto x a amplitude da onda varia com o tempo como a parte real da quantidade A1 = h1 exp (i!t) ; h1 2 C : A quantidade h1 é complexa para levar em conta todas as diferentes fases da oscilação em diferentes pontos do espaço. Toda a dependência na posição está nesta fase h1 = h1 (x), ou seja, em pontos diferentes a onda oscila com a mesma freqüência, mas com fase diferente. Pontos a mesma distância do furo estão em fase. Em especial, para diferentes valores de x a onda terá fase diferente, pois a onda é circular e estes pontos estão em raios diferentes h1 = jh1 j exp (i 1 ) ; 1 = 1 (x) : Nesta descrição, a intensidade da onda registrada pelo detector quando o furo 2 está tampado é proporcional (não é igual, porque estamos dividindo pela intensidade total dos furos, h1 = h1 (r)) a 2 2 I1 / jA1 j = jh1 j : O mesmo valendo para o experimento com o furo 1 tampado A2 = h2 exp (i!t) ; h2 2 C ; 2 2 I2 / jA2 j = jh2 j : Quando os dois furos estão abertos a intensidade, no mesmo ponto x acima, será proporcional a 2 2 2 I12 / jA1 + A2 j = jh1 exp (i!t) + h2 exp (i!t)j = j(h1 + h2 )j 2 2 / jh1 j + jh2 j + 2 jh1 j jh2 j cos = (x) = 1 (x) 2 (x) Ou seja, toda a oscilação da amplitude I12 esta na fase das quantidades complexas h1 e h2 . Se chamarmos de A a intensidade total que sai dos dois furos, podemos escrever: 1 2 2 jh1 j + jh2 j + 2 jh1 j jh2 j cos : I12 (x) = A Remark 1 É importante deixar claro que, nesta descrição, a onda que sai de um furo interfere com a onda que sai do outro furo. Ou seja, quando falamos em interferência queremos dizer sempre a interferência entre, no mínimo, duas coisas. 5 Figure 2: Figura 3 - Retirada de The Feynman Lectures on Physics. O que acontece agora se …zermos um experimento semelhante ao anterior, mas com partículas e não ondas. Imagine uma metralhadora montada num cavalete não muito bem …xado. Na frente desta metralhadora temos uma parede com dois furos e, depois desta parede um dispositivo capaz de coletar as balas que passam pelo furo. Este dispositivo pode ser colocado em qualquer ponto ao longo da parede numa posição que marcamos com a coordenada x. O experimento é realizado colocando o detector em uma posição x, ligando a metralhadora, em seguida desligamos a metralhadora (isso é importante), pegamos o detector e contamos o número de balas no seu interior. Esta quantidade, dividida pelo número de balas que passou pelos furos, pode ser interpretado como a intensidade I de balas em x. Realizamos primeiro o experimento com a fenda 2 fechada. Como os buracos são da ordem de grandeza das balas estes as espalharão em todas as direções e podemos esperar que estas se acumulem preferencialmente na frente do buraco 1 (ou em algum outro ponto em torno deste, devido a geometria do furo). Isso nos daria uma intensidade registrada na forma I1 da …gura. Se agora repetimos o experimento com a fenda 1 tampada, esperamos obter uma intensidade I2 como a da …gura. Problem 2 O que acontece agora se ambas as fendas estão abertas? Neste caso, devemos esperar que as balas se espalhem como a soma destas intensidade I12 (x) = I1 (x) + I2 (x) : O que nos dá o valor de I12 mostrado na …gura. Ou seja, 6 Remark 3 para partículas não observamos os efeitos de interferência apresentado pelas ondas. Temos agora uma questão no mínimo curiosa: 1. É sabido desde tempos remotos que a luz apresenta o fenômeno de interferência. Quando a luz passa por um experimento de duas fendas observamos as …guras de interferência descritas na experiência do aquário. 2. A teoria de Einstein dos fótons, bem como os dados experimentais do espalhamento Compton e do efeito fotoelétrico, nos mostram que a radiação é composta por quantidades bem localizadas no espaço, ou seja, se comporta como partículas. Mas, como deve ter …cado claro, ondas e partículas são coisas diferentes e devem se comportar de forma diferente. Este comportamento bizarro da luz de, para certos experimentos, se comportar como onda e, para outros, se comportar como partícula, foi chamado de dualidade onda-partícula. Como veremos, este estranho efeito é a chave da mecânica quântica. 1.2 Ondas de Partículas O problema descrito na seção anterior toma uma proporção ainda maior com a hipótese de de Broglie (apresentada em sua tese de doutorado em 1924). Segundo está o comportamento onda-partícula (ou a dualidade onda-partícula) não seria peculiar a luz, mas a todas as quantidades presentes na natureza. De acordo com a hipótese de Einstein temos que a luz é composta de fótons com energia E E = h =) = h Ou, em termos do comprimento de onda, = c )E=h c ) = hc : E Se o fóton viaja a velocidade da luz (hipótese de Einstein) este não deve ter massa, mas, por ter energia, ele possui um momento E2 2 (cp) = 0 =) E = cp : Substituindo na expressão para o comprimento de onda e uma frequência = h hc = ; E p = E : h A hipótese de de Broglie foi estender este resultado, valido para o fóton, e a…rmar: qualquer quantidade que possua um momento p terá a ele associado uma onda cujo comprimento vale = 7 h : p Problem 4 O que signi…ca exatamente “ter associado uma onda”? Na época de de Broglie isso signi…ca apenas que todas as entidades com um momento p apresentariam um comportamento ondulatório, de interferência etc, correspondente a uma onda de comprimento . Falaremos mais sobre isso depois, mas agora vamos ver uma conseqüência deste fato. Se a hipótese de de Broglie é verdadeira, um elétron em movimento deve se comportar como uma onda com o comprimento de ondas acima. Assim, se realizarmos um experimento de dupla fenda (ou experimento de Young1 ) com elétron, devemos observar uma …gura de interferência. Este experimento foi feito e esta …gura foi observada! O experimento original realizado envolve o espalhamento de elétrons pelas diferentes camadas de um cristal, mas experiências mais modernas são bem mais próximas a do experimento de Young. Para descrever este experimento você deve imaginar algo como a nossa experiência com a metralhadora. Ou seja, existe um dispositivo que emite elétrons (e.g., um …o aquecido), estes elétrons são atirados com uma certa velocidade contra uma chapa com furos (e.g., através de um campo elétrico) e, ao passarem pelo furo, são coletados por algum detector. Temos então uma intensidade I de elétrons no detector. Se os elétrons se comportarem como partículas, devemos esperar a intensidade I12 = I1 + I2 ; (1) igual a da metralhadora. Já se eles se comportarem como ondas, devemos esperar uma intensidade 2 I12 / jA1 + A2 j ; (2) igual a das ondas no aquário. O fato é que, se o diâmetro e a distância entre os furos for da ordem de grandeza do comprimento de onda dos elétrons emitidos, realmente uma …gura de interferência (2) é observada! Temos aqui algo muitíssimo mais curioso: No experimento das ondas no aquário, temos que a onda plana inicial, ao passar pelos furos, cria duas outras ondas e estas se interferem. Ou seja, é a interferência de uma onda com a outra. Entretanto, em experimentos com elétrons é possível obter uma intensidade muito pequena do feixe. De sorte que é possível garantir que apenas um elétron seja emitido, por exemplo, num intervalo de alguns segundos. Neste caso, apenas um elétron passa pelos furos de cada vez. Estes elétrons se acumulam na parede com o detector formando uma …gura de interferência. Problem 5 Se o elétron bateu na parede antes do próximo ser lançado, com o que ele interferiu para temos uma …gura de interferência? 1 Thomas Young, 1800. 8 Mais ainda, é possível colocar detectores para saber por qual fenda o elétron passou. Ao colocarmos estes detectores, podemos garantir que o elétron passou apenas por uma das fendas (i.e., diferente das ondas, não detectamos uma parte dos elétrons em cada fenda). Mas, sempre que colocamos estes detectores (e podemos com isso garantir que o elétron é uma partícula) a …gura de interferência desaparece e passamos a observar uma intensidade (1) igual a das balas da metralhadora. Por que o elétron muda o seu comportamento dependendo da nossa observação? Discussões deste tipo estarão presentes em todo o nosso curso. Uma vez que a hipótese acima uni…ca o comportamento de todas as entidades na natureza, podemos agora descrever de forma, num certo sentido, equivalente o nosso experimento com ondas e com balas, i.e., partículas. Ou seja, tanto as ondas como as partículas possuem uma onda associada que descreve o seu comportamento. Mas como descrever então as duas …guras de intensidade diferente? Imagine então um emissor (uma metralhadora) que atira partículas (e.g., elétrons) ou fótons com comprimento de onda e freqüência = h ; p = E h Ambos são agora descritos por como uma onda que vamos supor na forma A = h exp (i!t) ; h 2 C lembrando que a fase de h, que depende de é diferente em cada ponto do espaço, = (x). Quando esta onda atinge os dois furos temos o comportamento peculiar às ondas de gerarem duas novas ondas em cada furo (como descrito no caso das ondas no aquário) A1 = h1 exp (i!t) ; h1 2 C A2 = h2 exp (i!t) ; h2 2 C onde, por terem a sua fonte em pontos distintos, cada hi possui uma fase i diferente. Onde chamamos de hi a amplitude da onda i. Separamos a nossa onda desta forma porque estamos interessados no seu comportamento num determinado ponto x. Isto é um comportamento ondulatório, i.e., ao assumirmos que uma quantidade se comporta como uma onda, estamos dizendo que este comportamento existe. Entretanto você não deve pensar que o elétron se dividiu em dois, cada um representando uma das ondas do furo, nem que ele passou pelos dois furos. A interpretação do que signi…ca esta divisão da onda em duas é um problema central em mecânica quântica. Como veremos, a interpretação deste efeito é o que separa a chamada antiga da nova mecânica quântica. Mas voltemos para as nossas ondas. (Soma das intensidades) A intensidade de cada onda no ponto x, quando um dos furos está tampado, é proporcional a 2 Ii / jhi j 9 (lembre que Ii tinha a mesma forma para ondas e balas). Agora, supondo que, ao …m da experiência, você observou uma …gura de interferência, i.e., você observou I12 da …gura 2, isso signi…ca que a intensidade …nal é proporcional à 2 I12 / jh1 + h2 j (3) Suponha agora que, por alguma razão, você não observou uma …gura de interferência, i.e., você observou uma intensidade I12 como a da …gura 3, isso signi…ca que esta intensidade é proporcional a soma das intensidades: 2 2 I12 / jh1 j + jh2 j Assim, a mesma descrição permite obter os dois tipos de comportamento. Ou seja: 1. quando as entidades se comportam como ondas a intensidade …nal é o módulo quadrado da soma das amplitudes (quantidades complexas), 2. mas quando se comporta como partículas, a intensidade …nal é a soma dos módulos quadrados das intensidades. A razão da nossa entidade se comportar de uma ou outra forma está relacionado com uma série de características do experimento, e.g., o diâmetro e a separação dos furos em relação ao comprimento de onda. Além das possíveis interferências que possamos causar no sistema (ou outros mistérios que surgirão com a interpretação da nova MQ). Os detalhes de quando devemos esperar um ou outro comportamento serão discutidos nas seções seguintes. 1.2.1 Espalhamento de um único elétron Primeiro vamos tentar entender porque é razoável supor que o elétron, ou o fóton, é uma partícula. Ou seja, que o comportamento ondulatório apresentado pelo elétron não se refere a uma onda no sentido físico (algo que carrega alguma forma de energia). Em primeiro lugar temos o fato descrito que ao colocarmos detectores no experimento de duas fendas sempre detectamos a entidade em apenas uma das fendas e não detectamos absolutamente nada (nenhuma forma de energia) na outra fenda. Vamos agora preparar um experimento de duas fendas com um único elétron. Neste experimento preparamos a fonte para emitir um único elétron, o fazemos passar através de um anteparo com duas fendas e o detectamos no …nal. Bem, por ser apenas um elétron não esperamos ter nenhuma …gura de interferência. Imagine ago que preparamos várias cópias deste experimento, exatamente iguais, e os enviamos para cientistas nas mais diferentes partes do mundo, ou do universo. Cada cientista, ao receber o experimento, ira acioná-lo e registrar o ponto onde a partícula caiu. Em seguida ele pegará este dado e nos envia de volta o resultado da medida. Depois de algum tempo, tendo recebido os dados de todos os experimentos, nós os plotarmos em um único grá…co. O que obtemos com isso: uma …gura de interferência! 10 Remark 6 Observe que não importa quando cada cientista realize o experimento, tudo que importa é que todos sejam iguais. Imagine agora que cada cientista colocou um detector para saber, por qual fenda o elétron passou. Neste caso, como seria de se esperar, não teremos nenhuma …gura de interferência. Ou seja, a medida interferiu no sistema e destruiu a …gura de interferência. Imagine agora que todos …zeram o experimento sem trapacear (sem tentar detectar o elétron). Mas uma parte deles (digamos uns 60%) não nos enviou os dados. O que acontece com a …gura neste caso? Neste caso teremos uma menor intensidade no número de elétrons detectado em cada ponto, mas, mesmo assim, continuaríamos observando a …gura de interferência. Podemos ainda imaginar que, depois de digitados os dados no computador, um problema no HD nos fez perder 60% dos dados. Plotando os dados que não se perderam ainda temos a nossa …gura. Remark 7 Ou seja, podemos jogar fora uma boa parte dos nossos dados sem comprometer em nada a …gura. Imagine agora o seguinte variante. Cada cientista escolheu aleatoriamente uma das fendas e colocou um detector apenas em uma fenda. Ao realizar o experimento este cientista pode ter ou não detectado algo. Entretanto, mesmo que ele não tenha detectado absolutamente nada ele sabe por que fenda o elétron passou. Ou seja, se ele não detectou o elétron na fenda onde colocou o detector, é porque ele passou pela outra fenda. Feito isso, apenas os cientistas que não detectaram nada nos enviam os seus dados. Assim, nós recebemos apenas os dados dos cientistas que não in‡uenciaram na trajetória do elétron. Ou seja, neste caso não podemos dizer que o elétron foi espalhado por nada emitido pelo nosso detector. De nenhuma forma interagimos com o elétron, mas sabemos exatamente por qual fenda cada elétron passou. Desta forma, novamente perderemos uma parte dos dados (digamos 60%). Mas o que ocorre agora se plotarmos os dados? A …gura de interferência foi destruída! Resumindo, nós sabemos que o elétron é uma partícula, porque quando o detector não detectou o elétron ele também não detectou nada (não detectou a presença de nenhuma onda) e não interagimos com esta partícula. E mesmo assim destruímos a …gura de interferência. 1.3 Pacotes de ondas Uma onda, e.g., na direção x e de comprimento está espalhada por toda a direção x. Mas uma partícula, e.g., um elétron, ocupa uma região …nita do espaço. Como então compatibilizar o comportamento ondulatório com o de uma partícula? A idéia aqui, que vai sofrer algumas modi…cações no futuro, é que é possível se atenuar a intensidade de uma onda através da superposição de outras ondas. Por exemplo, considere duas ondas de mesma amplitude, uma de número de 11 Figure 3: Figura 4 onda k e outra com número de onda k + k, com freqüência, respectivamente e + . A sobreposição destas ondas nos dará = sin (kx !t) ; 2 = sin ((k + k) x (! + !) t) ; = 1 + 2 = sin (kx + !t) + sin ((k + k) x + (! + !) t) ; 1 usando ago sin A + sin B = 2 cos 1 (A 2 B) sin 1 (A + B) 2 temos (x; t) = 2 cos 1 ( !t 2 kx) sin (kx !t) + 1 ( kx 2 !t) ; considerando kx !t >> kx !t ; podemos escrever (x; t) = 2 cos 1 ( !t 2 kx) sin (kx !t) ou seja, para um tempo …xo, e.g., t = 0, temos (x; 0) = 2 cos 1 ( kx) sin (kx) 2 como k << k a nossa onda oscila com número de onda k maior (igual a da onda original), mas toda ela tem uma amplitude modulada por k. Desta forma, podemos atenuar a onda em alguns pontos do espaço. Se continuarmos este processo somando uma in…nidade de ondas, podemos obter um pacote de ondas concentrado em apenas uma região do espaço. Este processo é o mesmo de tomar a decomposição em série de Fourier da onda acima. Remark 8 Podemos obter uma onda localizada numa certa região do espaço através de um pacote de ondas. 12 Figure 4: Figura 5 1.3.1 Velocidade de grupo Uma onda se move com velocidade V = =k. Entretanto, quando trabalhamos com a combinação de um grupo de ondas formando um pacote, temos também a velocidade de movimento do pacote como um todo. Lembre-se que cada onda tem uma velocidade e a velocidade do pacote não é igual a velocidade de nenhuma destas ondas individualmente. Além disso, não estamos supondo que o pacote mantém a sua forma com o tempo. Ou seja, como as ondas têm velocidades diferentes o pacote pode se deformar (se espalhar, ou se contrais) com um tempo, mas continua sendo um pacote e estamos falando da velocidade do movimento deste pacote. Esta velocidade é chamada de velocidade de grupo g e está relacionada com a velocidade da envoltória que modula nosso pacote. Voltando ao nosso exemplo anterior de duas ondas temos (x; t) = 2 cos 1 ( !t 2 kx) sin (kx !t) + 1 ( kx 2 !t) : Se seguirmos a velocidade da primeira crista, ou do primeiro nó, temos que neste ponto o cosseno tem seu valor máximo (igual a um), ou seja, 1 ( !t 2 kx) = 0 =) usando k= 2 x = t ; !=2 ! d =2 =g k dk ; temos que a primeira, parte do produto (que é a envoltória da nossa onda) possui uma velocidade d g=2 ; dk 13 usando a hipótese de De Broglie 2 = k = temos h ; p = E : h dE d = dk dp g=2 Usando agora a relação relativística E2 2 (pc) = mc2 2 ) 2E dE = c2 2p dp temos p : E Usando as expressões da energia e do momento relativístico g = c2 mc2 ; p = pi = m E = c:p0 = q u2 1 c2 i m =q 1 u2 c2 ui onde u é a velocidade da partícula de massa m, temos g=u ou seja, a velocidade de grupo é igual a velocidade u da partícula. Exercise 9 Repita o cálculo acima para o caso de fótons (m = 0) e mostre que g = c. Assim, uma quantidade localizada no espaço (uma partícula) pode ser vista como um pacote de ondas se movendo com a velocidade de grupo (mas esta interpretação será alterada no futuro). Mas se a nossa “partícula” é formada por uma in…nidade de ondas com freqüências e comprimentos de número de onda diferentes e sabemos que p= h = h k ; E=h : 2 Problem 10 Qual é a…nal o momento e a energia da nossa onda (ou da partícula associada)? Esta é mais uma das questões centrais da mecânica quântica. 14 1.4 Incertezas Voltando então ao problema dos nossos pacotes de onda, resta-nos entender como as várias freqüências e comprimentos de onda presentes no pacote se relacionam com o momento e a energia da partícula. Um resultado muito conhecido em problemas envolvendo pacotes de onda é que o pacote não possui um comprimento de onda de…nido, mas sim todo um range de comprimentos que varia de a + (ou k a k + k). Da mesma forma, usando a relação de de Broglie h h k; p= = 2 podemos a…rmar que a partícula associada ao pacote não possui um momento determinado, mas que seu momento está dentro do range entre p e p+ p Entretanto, sempre que a partícula interage com algo transferindo momento, e.g., num problema de espalhamento, esta transfere um momento bem de…nido. O que indica que, dos valores no range acima, apenas um determinado valor se manifesta quando observamos a interação do pacote em algum experimento. Na velha mecânica quântica este fenômeno foi explicado como se, quando observado, a entidade perdesse seu comportamento ondulatório e agisse como uma partícula de posição e momento bem de…nidos. Observe que o mesmo acontece no problema de espalhamento de duas fendas, mesmo quando temos a formação da …gura de interferência. Cada elétron, ou fóton, é detectado numa posição especí…ca, com momento e energia bem determinados. Mesmo que, ao passar pelas fendas, estes apresentem um comportamento puramente ondulatório (permitindo a interferência entre duas ondas).Assim, mais uma vez, na interpretação da velha mecânica quântica, as entidades, quando não observadas, se comportam como ondas (espalhadas numa certa região do espaço e com momento dentro de um range), mas, quando observadas, toda esta região se concentra numa área compatível com as dimensões das partículas associadas, ou ainda, no caso de elétrons e fótons, toda a região da onda se contrai, ou colapsa, num único ponto e todo o seu range de momento colapsa num único valor. Este fenômeno foi chamado de colapso da função de onda. Assim, a todo pacote de onda temos associada um range de valores do momento que, ao ser observada a partícula, nos dará um valor especí…co (mas um valor qualquer dentro deste range). Dizemos então que a partícula associada a onda possui um (único) momento, mas este valor possui uma incerteza dentro do range p e p+ p Ou ainda, quando uma partícula é descrita por um pacote de ondas, o momento associado ao seu comportamento corpuscular possui uma incerteza dentro dos valores acima. 15 O mesmo ocorre com a manifestação da posição do comportamento corpuscular da entidade. Um pacote de onda, como o da …gura 5, se estende por uma região do espaço geralmente muito maior que as dimensões da partícula a ele associada. Dizemos então que, quando este pacote colapsar, o caráter corpuscular da partícula poderá se manifestar em toda a região x. Ou ainda, a posição da partícula possui uma incerteza x. Assim, a toda a entidade está associada um pacote de onda, que, ao ser observado, irá colapsar numa partícula. Antes deste colapso, a partícula associada ao pacote possui uma incerteza x em sua posição e p em seu momento. Se usarmos o exemplo simples do nosso pacote de duas ondas senoidais 1 ( !t 2 (x; t) = 2 cos kx) sin (kx !t) + 1 ( kx 2 !t) ; podemos estimar a espessura de um dos pacotes como a distância entre os pontos x1 e x2 tais que x1 = x2 = k 2 k 1 2 1 = 2 cos 2 ; 0 = 2 cos k ;0 k sin (kx) = 0 k 2 k sin (kx) = 0 com o que temos x = x2 x1 = k =) x k= : Este resultado pode ser generalizado para um conjunto de in…nitas ondas formando um pacote verdadeiramente concentrado. Utilizando resultados obtidos com as desigualdades das transformadas de Fourie (uma conseqüência do chamado teorema de Plancherel ) é possível obter a desigualdade x k 1 2 Não vamos nos preocupar aqui com este desenvolvimento matemático, pois no futuro obteremos o mesmo resultado através de argumentos mais simples e, num certo sentido, mais gerais. Usando agora a relação de de Broglie p= h k =) 2 temos k= 2 h p 1 h ~ h =) x p ; ~= 22 2 2 com ~ (agá-barra) uma constante introduzida por Dirac. Este resultado representa um caso particular de um desenvolvimento (devido a Dirac) que veremos no futuro e é conhecido como relação de incerteza de Heisenberg. x p 16 Em especial, observe que se não há incerteza no número de onda, nossa partícula é descrita apenas por uma única onda que, conseqüentemente, estará espalhada em todo o espaço. Ou seja, uma partícula de momento bem de…nido tem a incerteza na posição in…nita. Relações semelhantes podem ser derivadas quanto estudamos o range de freqüências do pacote. Neste caso temos uma relação entre o tempo e a energia do sistema: ~ E t 2 Exercise 11 Usando t ! 1 2 obtenha a relação acima. Esta relação é um pouco mais difícil de ser interpretada e, por isso, voltaremos a ela apenas quando estudarmos alguns exemplos concretos. Uma analogia (talvez) útil seria a a…nação de um instrumento musical. A soma de duas freqüências próximas produz o efeito de batimento, ou seja, se duas freqüências muito próximas são tocadas juntas ouvimos uma variação na intensidade do som. Quanto mais as freqüências se aproximam maior o intervalo entre os picos desta variação. Isso é usado para a…nar um instrumento com uma freqüência padrão. Quando o tempo é longo, o instrumento está a…nado. Entretanto, para garantir que a freqüência seja exatamente a desejada, precisaríamos garantir que o tempo do batimento é in…nito. Neste sentido, quanto maior a incerteza na energia de um sistema, por exemplo entre dois níveis de energia, maior será a instabilidade do sistema e, para garantirmos que o sistema está num nível de energia bem de…nido, teríamos de veri…car que jamais haverá transição entre os dois níveis. A relação acima representa uma das maiores diferença entre a mecânica quântica e toda a física anterior. Estes conceitos de incertezas em quantidades físicas já eram utilizados em várias teorias anteriores, como, por exemplo, a mecânica estatística. Mas, neste caso, a incapacidade de se observar com precisão as características do sistema estavam relacionadas com alguma limitação prática. Por exemplo, em mecânica estatística o grande número de constituintes dos sistemas físicos torna impraticável a aplicação da mecânica clássica como o desenvolvimento de cada ente. Assim, estas teorias trabalham com médias sujeitas a desvios. Entretanto, o caráter da incerteza da MQ é inerente a própria teoria. Ou seja, não é possível se determinar com precisão absoluta a posição e o momento de qualquer entidade física. Conseqüentemente, não apenas estes valores, mas toda a evolução temporal da entidade (que na mecânica é uma conseqüência da posição e momento) possuirá também uma incerteza. Não sabemos o estado …nal de nenhum sistema, mas apenas intervalos de valores onde ele pode se encontrar. Este comportamento pode ter duas interpretações. Na primeira o sistema possui um valor bem de…nido de posição e momento, mas não nos é permitido conhecer estes valores (como se estes valores estivessem “escondidos” no sistema). Neste caso é como se a 17 partícula existisse, mas não fossemos capazes de olhar para ela. Na segunda, estes valores realmente não existem bem de…nidos em nenhuma entidade física, até o momento em que esta é observada. Neste caso, é como se a partícula realmente não existisse enquanto não olhamos para ela. A defesa dos pontos de vista acima (ou de algo parecido com eles) gerou uma verdadeira ruptura entre os defensores e fundadores da MQ. Einstein, um grande defensor do primeiro ponto de vista chegou a dizer coisas como “então a lua não está lá quando eu não estou olhando pra ela”. Um ponto ainda mais importante sobre estes dois pontos de vista é que, a primeira vista, eles podem parecer apenas diferenças …losó…cas. Entretanto, em 1964, John Stewart Bell apresentou meios quantitativos que permitiriam, através de experimentos, veri…car qual destes pontos de vista correspondia com o comportamento da natureza. Mas isso é uma outra história... 1.5 A verdade (pelo menos até agora) Vamos primeiro fazer uma breve retrospectiva. Em 1901 Planck apresentou seu trabalho solucionando o problema da radiação do corpo negro. Neste trabalho surge a estranha idéia da energia dos osciladores (elétrons) poder assumir apenas valores separados por intervalos discretos. Como se, de alguma forma, o movimento destes elétrons não tivesse uma forma contínua. Esta mesma idéia está por trás do problema do calor especí…co, onde, como se por conseqüência da quantização dos níveis de energia, os graus de liberdade não fossem mais acessíveis para energias muito baixas. O movimento das coisas não se apresentava de forma contínua em escalas muito baixas de energia. Em seguida, 1905, temos a explicação de Einstein do efeito fotoelétrico, nesta explicação, a radiação (quantizada por Planck) emitida por cargas em movimento, não apenas tinha uma quantidade discreta de energia, mas também estava localizada numa região …nita do espaço. Esta interpretação deu a luz, que até então era tratada como uma onda, um caráter corpuscular. Temos então o curioso efeito da dualidade onda-partícula da luz. O espalhamento Compton, veri…cado em 1922, corroborou a hipótese de Einstein. As coisas se tornam ainda mais estranhas com a hipótese de de Broglie, em 1925, de que o comportamento dual onda-partícula, não era uma peculiaridade da luz, mas sim de todas as entidades da natureza. Temos então a idéia das “ondas de matéria”. Todas as coisas então possuem um comportamento ondulatório, mas, ao serem detectadas, comportam-se como partículas. A hipótese de de Broglie foi comprovada em 1927 no experimento de Davisson-Germer através do espalhamento de elétrons por cristais. Um grande problema para esta nova teoria é a interpretação do que signi…ca …sicamente a função de onda associada às partículas. Por não transportar nenhuma forma de energia, esta onda certamente não poderia ser reconhecida como uma onda no sentido ordinário da física. Como veremos adiante, a teoria evoluiu muito, no sentido de fazer várias previsões que foram con…rmadas experimentalmente e explicar uma série de dados até então inexplicáveis. Todos estes 18 resultados foram obtidos a partir do modelo atômico de Bohr (1913), e do desenvolvimento de duas formulações independentes de como este novo conceito de “ondas de matéria” deve ser aplicado. Estas formulações foram propostas por Schrödinger, em 1926, e a outra por Heisenberg, em 1927. Mas todos estes resultados e formulações não foram su…cientes para elucidar o mistério do signi…cado físico da função de onda. As relações de incerteza de Heisenberg, apresentadas em 1925, permitiram quanti…car quando deveríamos esperar um comportamento ondulatório ou corpuscular das entidades físicas. Se a incerteza na posição x é pequena, a entidade estará localizada no espaço e se comportará como um corpúsculo. Já quando a incerteza no momento p é pequena, a entidade não estará localizada no espaço e se comportará como uma onda. Entretanto, estas relações não explicavam porque, por maior que fosse a incerteza na posição, a entidade sempre era detectada numa região. Ou seja, qual o mecanismo do colapso da função? As idéias de Niels Bohr e Heisenberg sobre as incertezas inerentes nos processos de detecção das partículas (quando falamos partículas, estamos dizendo qualquer coisa) remetem naturalmente as idéias de medida de posição e velocidade da mecânica estatística e, naturalmente, a idéia de probabilidades. Mas foi apenas em 1927 que Max Born apresentou o que é considerado hoje a correta interpretação da função de onda. O postulado de Born a…rma que: A intensidade da função de onda associada à partícula representa a probabilidade da partícula ser detectada naquela região do espaço. Ou seja, se (x; y; z) é um pacote de onda associado a uma partícula (lembre que a intensidade é proporcional ao módulo quadrado da função de onda) então 2 2 j (x; y; x)j dx dy dz = j j dV ; é a probabilidade da partícula ser detectada no volume dV . Dentro desta interpretação a função de onda associada à partícula perde todo o seu caráter físico, no sentido de não estar relacionado com o transporte de nenhuma quantidade mensurável. Ou seja, não é possível se medir, ou observar, diretamente a função de onda. Além disso, uma vez que partículas podem ser observadas e preservam a sua “realidade física”, no sentido usual de serem detectadas, esta interpretação privilegia a idéia de que as entidades físicas em todos os processos são partículas. Sendo as ondas a probabilidade de se encontrar a partícula em algum lugar (usaremos a partir daqui esta linguagem). Esta interpretação elimina o problema do colapso da função de onda, mas, obviamente, temos ainda de encontrar um “sentido físico” para os fenômenos de interferência causados por esta função de onda. A…nal, como algo que não transporta nenhuma quantidade física (momento, energia etc) pode interferir no comportamento das quantidades físicas. Este problema está diretamente relacionado com a formulação da MQ proposta por Feynman, em 1948. Voltaremos a este problema quando tratarmos especi…camente da hipótese de Born, ou da chamada Interpretação 19 de Copenhague. Só é importante ter em mente que uma boa parte do desenvolvimento a seguir foi feito antes desta interpretação. Mas, mesmo que seus criadores não tivessem esta interpretação em mente (ou mesmo não a aceitassem posteriormente), tudo se torna bem mais fácil de entender se, desde já, seguirmos as idéias de Born. 20 1.6 O átomo de Bohr Por que os átomos (em especial o átomo de hidrogênio) emitem radiações apenas em freqüências com intervalos bem de…nidos? E por que o elétron não colapsa no núcleo átomico? O problema acima foi resolvido por um modelo proposto por Bohr em 1913, através dos seguintes postulados: 1. O átomo de hidrogênio existe apenas em níveis discretos de energia. Estes níveis são caracterizados pelos seguintes valores discretos do momento angular dos elétrons em órbitas circulares 2 p = nh ; n 2 N : onde p é o momento angular do elétron. Quando o elétron possui um destes valores de momento angular, ele está estável, i.e., não irradia. 2. Quando um átomo efetua uma transição do nível de energia En para um Em ele irradia (se En > Em ) ou absorve (se En < Em ) um fóton de energia: h = jEn Em j : Uma boa motivação para estes postulados foi apresentada por de Broglie em 1924??, usando a sua própria hipótese de ondas. O elétron pode ser descrito por uma onda. Se ele está numa orbita onde a sua energia está bem de…nida (pois sabemos exatamente a energia que ele emite ao sair desta órbita), então a sua função de onda deve ser uma onda de freqüência bem de…nida e não um pacote. Esta onda de comprimento bem de…nido está distribuída por todo o percurso acessível ao elétron. Com isso, pela hipótese de uma órbita circular de raio r, no perímetro da circunferência deve caber um número inteiro do comprimento de onda 2 r=n Usando a relação = h ; p temos 2 rp = nh ; onde rp é o momento angular do elétron p = rp Com isso, sendo a força coulombiana uma força central (que preserva o momento angular), podemos escrever I I I 2 rp = pr d = prd = p d = nh ; 21 Figure 5: Órbita de Bohr e a onda de de Broglie para n = 4. Figura retirada do Libo¤. que é a primeira hipótese de Borh. Ou seja, esta hipótese esta relacionada com o argumento que a onda que descreve o elétron tem comprimento de onda bem de…nido e este comprimento deve ser condizente com o tamanho da órbita. A segunda hipótese de Bohr está diretamente relacionada com as hipóteses de Einstein e Planck de que a radiação eletromagnética é emitida em pacotes com energia h . Vejamos agora quê resultados podemos obter do modelo de Bohr. Primeiramente, o colapso do átomo é eliminado por um postulado. Como a órbita é estável, a força centrípeta (estamos usando o sistema de unidades Gaussiano) v2 p2 mac = m = ; r mr3 deve contrabalançar a atração da força coulombiana (para o núcleo tendo a mesma carga do elétron) e2 p2 p2 = =) r = : r2 mr3 e2 m Usando a primeira hipótese de Bohr I p d = nh =) 2 p = nh =) p = n~ temos rn = ~2 n2 ~ 2 = n2 a0 ; a0 = 2 e m me2 22 (4) Onde a0 ( 0,53 Å) é chamado raio de Bohr e corresponde ao primeiro raio permitido do modelo. A energia do elétron numa dada órbita é a soma de sua energia cinética e potencial: E= 1 mv 2 2 e2 p2 = r 2mr2 e2 r usando (4) e2 p2 p2 p2 =) E = = = 2 2 r mr 2mr mr2 Usando agora o valor de rn e a hipótese de Bohr p2 2mr2 2 En = = ~2 1 n2 ~ 2 1 = 2 2m n a0 2ma20 n2 R1 ~2 ; R = 1 n2 2ma20 o valor negativo apenas indica que a força é de ligação. Ou seja, o elétron tem energia zero no in…nito e, quanto mais perto do núcleo, mais ligado (i.e., mais estável) e menor a sua energia. O rótulo n, que caracteriza o nível de energia, é chamado de número quântico principal. O resultado acima nos permite calcular a energia de transição entre dois níveis de energia h n!m = Em En = R1 1 m2 1 n2 = En!m : Tudo que precisamos agora é comprara este resultado com o experimental, i.e., com a séries de Balmer e Lyman. Primeiro vamos esquecer a constante e escrever: 1 1 En!m / 2 n m2 com n = 1 para a série de Lyman (??) e n = 2 para a série de Balmer (??). Em outras palavras, se o modelo de Bohr está correto, a série de Lyman representa transições dos níveis excitados para o nível de menor energia (nível fundamental), enquanto a série de Balmer representa as transições dos níveis mais excitados para o primeiro nível excitado. Isso é fácil de entender. Como as medidas de Balmer se referem a espectro estelar, ou outros corpos em alta temperatura, o menor nível que o átomo de hidrogênio pode atingir neste ambiente (por estar em equilíbrio térmico) é o primeiro estado excitado. Caso ele tente ir para o estado fundamental, o próprio meio fornecerá energia para que ele se excite. Já os resultados de Lyman se referem a gases a temperatura ambiente, onde o nível do primeiro estado excitado (como veremos) é muito maior que a energia térmica do meio, de sorte que os átomos podem perfeitamente se encontrar no estado fundamental. O grande sucesso do modelo de Bohr para explicar e prever o comportamento atômico foi um grande triunfo para a MQ. Uma vez que este modelo estava 23 Figure 6: Figura retirada do Eisberg. em completo acordo com as hipóteses de Einstein e de Broglie e com dados experimentais. Entretanto, como veremos, o modelo de Bohr é muito simpli…cado e não pode dar conta de todos os fenômenos observados no espectro do átomo de hidrogênio. Naquela época, medidas mais precisas das linhas espectrais mostravam que os níveis de energia En eram, na verdade, vários níveis muito próximos, i.e., são observadas radiações com freqüências muito próximas. Esta é a chamada estrutura …na do átomo de hidrogênio. Voltaremos a este problema, juntamente com outras características não contempladas pelo modelo de Bohr, no futuro. 24 1.7 Quantização de Sommerfeld A teoria quântica estava sendo criada, então a idéia (que não é muito diferente da de hoje) seria procurar as características peculiares desta teoria para um caso especí…ca e generalizar para todos os casos. Como fez de Broglie com a dualidade onda-partícula do fóton. A solução de Planck para o corpo negro corresponde a uma quantização nos níveis de energia (ou das amplitudes de oscilações) do oscilador harmônico. Enquanto a quantização de Bohr do átomo de hidrogênio corresponde a uma quantização do momento angular (ou das órbitas) do elétron no átomo. Existe alguma relação entre estes dois processos? Perceba que para obter os níveis de energia e os raios das órbitas de Bohr, partimos do modelo clássico, cuja energia é dada por E= 1 mv 2 2 e2 p2 = r 2mr2 e2 : r E impusemos que estes níveis são discretizados segundo a regra: p = n~ : O mesmo equivale (teoria de Planck) a partir da expressão clássica para o oscilador harmônico e impor uma regra de quantização nas amplitudes. Todos estes dois modelos partem de uma teoria clássica conhecida e "quantizam" o problema clássico através de uma certa regra de quantização sobre alguma quantidade física mensurável. Remark 12 Existiria uma forma de sistematizar esta regra de quantização das quantidades físicas, de sorte que pudéssemos obter as versões quânticas de outros sistemas classicamente conhecidos. A um procedimento deste tipo damos o nome de regra de quantização, ou simplesmente, quantização. Remark 13 Quantização é o problema central da física teórica atual. Em primeiro lugar, na mecânica clássica qual quantidade precisa ser conhecida para descrevermos completamente o comportamento de um sistema (i.e., a sua evolução temporal)? Na formulação de Hamilton da mecânica toda a evolução de um sistema clássico pode ser determinado conhecendo-se a chamada hamiltoniana do sistema, H (q; p; t). A hamiltoniana é uma função dos momentos p e das coordenadas q generalizadas do sistema e, no geral, do tempo. Neste formalismo a evolução do sistema é dada pelas equações de Hamilton p_i = @H @H ; q_i = @qi @pi Para sistemas conservativos, nos quais H (q; p) não depende do tempo, a hamiltoniana pode ser identi…cada com a energia do sistema. 25 Uma grande vantagem no uso das equações de Hamilton e das coordenadas generalizadas é que as equações para cada coordenada têm a mesma forma independente do sistema de coordenada escolhido. Isso não acontece, por exemplo, na equação de Newton. Para coordenadas cartesianas, as equações do movimento são: dxi Fi = m =) Fx = m• x ; Fy = m• y dt Já se usarmos coordenadas polares x1 = r cos ; x2 = r sin ; ^ = y^ cos x ^ sin ; r^ = x cos + y^ sin ; as equações passam a ter a forma Fr = m• r + mr _2 ; F = mr • + 2mr_ _ : Inclusive, uma forma simples de se obter as expressões acima é usando as equações de Hamilton. Em coordenadas polares, a energia da partícula, num potencial U , vale: 2 1 1 1 1 2 2 2 m (v ) + m (vr ) = m r _ + m (r) _ 2 2 2 2 Introduzindo o momento angular p e o momento radial pr K= p = rp = rmv = r2 m _ pr = mvr = mr_ podemos escrever p2 p2r + 2mr2 2m assim, a energia total do sistema e, conseqüentemente, a hamiltoniana, tem a forma p2 p2r H= + + U (r; ) 2mr2 2m De onde temos as equações de Hamilton: K= @H @U @H = ; p_r = = @ @ @r _ = @H = p ; r_ = @H = pr @p mr2 @p2 m p_ = @U @r p2 mr3 Para obter, por exemplo, a equação para r, podemos derivar a última das equações acima com relação ao tempo r• = p_r m 26 E usar a equação para p_r : @U @r m• r = p_r = p2 mr3 usando a expressão para o momento angular, p = r2 m _, temos m• r + rm _2 = @U = Fr : @r e o mesmo procedimento pode ser usado para obter F = @U=@ . Vejamos como …ca a descrição do oscilador harmônico na mecânica de Hamilton. Para um oscilador harmônico E= 1 p2 1 mv 2 + kx2 =) H (q; p) = + kx2 2 2 2m Assim, as equações de Hamilton têm a forma @H = kx ; @x @H p x_ = = @p m p_ = Derivando a segunda equação do relação ao tempo e usando a primeira temos x •= p_ =) x •= m kx =) m• x + kx = 0 ; m que é conhecida equação do oscilador harmônico. Como toda a informação esta contida na hamiltoniana e esta depende apenas das posições e momentos, podemos descrever a evolução do sistema através de uma curva no plano p q, chamado espaço de fase. Por exemplo, no caso do OH, para uma dada energia (i.e., um valor …xo de H) temos p2 1 E= + m! 2 x2 2m 2 ou seja, as trajetórias formam uma …gura fechada, neste caso, mais especi…camente, uma elipse. Isso acontece porque a coordenada x é periódica. Assim, para qualquer coordenada periódica, a trajetória no espaço de fase forma uma …gura fechada. Por ser fechada, esta …gura certamente encerra uma área. Classicamente esta área pode assumir qualquer valor, mas, se a energia só puder assumir valores discretos, conseqüentemente esta área também só poderá assumir valores discretos. Assim, ao quantizar os níveis de energia do OH, automaticamente quantizamos as áreas das trajetórias do oscilador no espaço de fase. Esta idéia está diretamente relacionada com ás relações de incerteza pois, enquanto classicamente os estados das partículas são pontos, quanticamente devem ser áreas com valores ~ : q p 2 27 Ou seja, a relação de incerteza implica que as órbitas de um oscilador, ou de qualquer outra variável periódica, não pode ter uma área menor que q p ~=2. Em especial: Remark 14 O oscilador, cujo centro da órbita é conhecido, não pode parar e, obrigatoriamente, tem uma energia mínima diferente de zero! O mesmo vale para um elétron numa orbita circular em torno do próton. Como a massa do próton é muito maior que a do elétron, seu comprimento de onda (do próton), para uma mesma velocidade, é muito menor. Assim, podemos localizar o próton (centro da orbita), numa região muito menor que poderíamos localizar o elétron. Assim, imaginando que sabemos onde está o próton, o elétron numa órbita circular de raio r deve respeitar r = 2 r =) r p ~ =) r p 2 p ~ : 4 Resumindo, as relações de incerteza implicam valores mínimos para as áreas das coordenadas periódicas no espaço de fase. E a hipótese de Planck implica ainda que estas áreas crescem apenas em quantidades discretas. 28 A regra de quantização de Sommerfeld, ou a regra de quantização da velha MQ, é uma generalização dos resultados acima. Esta regra impõe que: Para qualquer coordenada periódica a órbita da trajetória no espaço de fase só pode assumir valores múltiplos da constante de Planck I pi dqi = ni h : H(q;p)=E O fator inteiro de proporcionalidade ni recebe o nome de número quântico. (Planck) Vejamos como esta regra está relacionada com a hipótese de Planck. O primeiro passo é identi…car a coordenada periódica. Neste caso, obviamente estamos falando da posição (coordenada cartesiana) do oscilador. Qualquer ponto a ser alcançado pelo oscilador será revisitado periodicamente. Então, a nossa coordenada periódica é x e o momento a ela conjugado é o momento linear p = mx. _ Agora precisamos escrever a hamiltoniana, do sistema usando esta coordenada e momento. Como o sistema é conservativo, a hamiltoniana não depende do tempo e é igual a energia total do oscilador H (p; x) = 1 p2 + m! 2 x2 = E 2m 2 Como a energia do sistema se conserva, para uma dada energia (amplitude de oscilação), podemos escrever s 1 p = 2m E m! 2 x2 2 Com o que podemos calcular I I r p p dx = 2mE 1 m 2 2 ! x dx 2E fazendo (aqui está implícito que x é periódica) r r 1 2E m !x = sin =) dx = cos d 2E ! m e usando que para um período completo 2 [0; 2 ] temos r I Z 2 p 1 2E p 2mE 1 sin2 cos d p dx = ! m 0 Z E 2 2 =2 cos d ! 0 29 usando cos2 a = 1 (cos (2a) + 1) 2 temos I p dx = E ! =2 Z 2 cos (2 ) d + 0 Z 2 1d 0 E E = : ! Usando a regra e quantização de Sommerfeld I E p dx = = nh ) En = nh obtermos a regra de quantização de Planck. (Bohr) Vejamos agora como esta regra está relacionada com os postulados de Bohr. Assumindo o modelo de Bohr, temos que as órbitas são circulares em torno do núcleo. Mais uma vez, precisamos identi…car a coordenada periódica. Neste caso, obviamente estamos falando do ângulo que identi…ca a posição para um certo raio R. Como a nossa variável de posição é um ângulo, o momento a ela relacionado é um momento angular p = R2 me _. Neste caso, como a força coulombiana é central e conserva momento angular, temos I Z 2 p d =p d =2 p 0 Usando agora a regra de quantização de Sommerfeld temos: I p d = nh = 2 p =) p = n~ Que é o primeiro postulado de Bohr. Assim, a aplicação direta da regra de quantização de Sommerfeld permite obter (sistematicamente) os resultados de Planck e Bohr. A grande vantagem do processo está no fato de podemos agora aplicar esta regra para outros sistemas. Isto foi feito por Sommerfeld para tentar explicar a estrutura …na do átomo de hidrogênio. O ponto de partida é que a restrição de Bohr de que as órbitas devem ser circulares talvez seja forte demais. Vamos então (seguindo Sommerfeld) relaxar esta restrição e admitir órbitas elípticas. Neste caso, continuamos tendo a variável angular periódica, mas, agora, a variável radial r também pode variar dentro de um valor mínimo a (raio menor da elipse) até um valor máximo b (raio maior da elipse). A energia cinética total do sistema agora é a soma da energia cinética de cada uma das variáveis: K= 1 1 1 2 2 m (v ) + m (vr ) = m r _ 2 2 2 30 2 1 2 + m (r) _ : 2 E temos agora dois momentos, um conjugado a variável angular (momento angular) p p = rp = rmv = r2 m _ =) _ = 2 ; r m e outro conjugado a variável radial (momento linear radial) pr = mvr = mr_ =) r_ = pr : m Com estes momentos a energia cinética pode ser escrita como K= p2 p2 + r 2 2mr 2m E, mais uma vez como o sistema é conservativo, a hamiltoniana é a energia total do sistema: p2 p2 e2 H (pr ; p ; ; r) = + r =E (5) 2 2mr 2m r Antes de tudo, note que a variável radial também é periódica r 2 [a; b]. Temos agora duas variáveis periódicas e, conseqüentemente, dois números quânticos I I p d = n h ; pr dr = nr h : Como o potencial do nosso problema não mudou, continuamos tendo a conservação do momento angular e, conseqüentemente, continuamos tendo a regra de quantização I p d = n h =) p = n ~ Para a coordenada radial, usamos novamente a lei de conservação de energia, e escrevemos s p2 e2 pr = 2m E + r 2mr2 Onde o sinal de + se refere a trajetória de a ! b e o de de b ! a. Como só estamos admitindo órbitas elípticas, temos I Z bs p2 e2 a 2m E + 1 : pr dr = 2 dr = 2 p 2 r 2mr b a Aplicando agora a regra de quantização de Sommerfeld temos I a nr a pr dr = hnr =) p 1 = ~nr =) = b n b onde, para uma órbita circular a = b =) nr = 0 31 1 ou seja nr 2 N ; n 2 N : Além disso, seguindo um procedimento análogo ao que …zemos para encontrar os níveis de energia do átomo de Bohr, para uma órbita estável devemos ter p2 e2 p2 + r =0; 2 2mr 2m r de onde obtemos as relações 2 a= (n + nr ) ~2 n ; b=a : 2 Ze (n + nr ) Voltando para (5) 1 Z 2 e4 : 2~2 (n + nr )2 Enr ;n = De…nindo n nr + n podemos escrever a= n n2 ~ 2 ; b=a ; En = Ze2 n Z 2 e4 1 2~2 n2 Nosso problema tem dois números quânticos. Com a energia depende apenas de n, continuamos usando este número e chamado de número quântico principal. Além disso, temos agora o número quântico azimutal n . (Degenerescência) O ponto novo nesta descrição é o surgimento de estados de energia degenerados, i.e., estado diferentes com o mesmo valor de energia. Por exemplo, para o primeiro estado excitado devemos ter n = 2. Mas isso pode ser obtido tanto fazendo nr = 0; n = 2; numa orbita circular, ou nr = 1; n = 1: numa órbita elíptica. Estes dois níveis são diferentes (estados, ou con…gurações, diferentes para o elétron), mas representam elétrons com a mesma energia. Ou seja, agora especi…car o estado de energia do elétron não é su…ciente para sabermos em que estado ele está. Para isso, devemos dar nr e n , ou n e n . Da mesma forma, para n = 3 podemos ter n = 3 =) nr = 0 n = 2 =) nr = 1 n = 1 =) nr = 2 32 De forma geral, para um dado nível de energia n temos n estados degenerados. Para os químicos, os níveis com nr = 0 (maior n ) é chamado de s (sharp), o nível nr = 1 é chamado de p (principal ). O procedimento segue este esquema com a nomenclatura d para nr = 1 (sharp, principal, di¤ use, e fundamental, o restante sendo nomeado em ordem alfabética). Um nível é nomeado pelo valor de n e nr , ou seja, o estado fundamental (único) é chamado 1s (n = 1; nr = 0 ou n = 1; n = 1). Já para o primeiro estado excitado, temos dois estados 2s e 2p, e assim segue 1s 2s 2p 3s 3p 3d .. . Esta divisão dos níveis (dependendo da excentricidade da órbita) está relacionada com a estrutura …na do átomo de hidrogênio. Como dissemos acima, todos os níveis com mesmo n possuem a mesma energia. Mas as linhas espectrais observadas se referem a freqüências diferentes e, conseqüentemente, a diferentes energias. Exercise 15 Então como estes estados de mesma energia podem gerar transições com diferentes energias? O ponto observado por Sommerfeld é que todo o tratamento usado até aqui é clássico e não leva em conta os efeitos da Teoria da Relatividade. Ao se mover no campo puramente elétrico gerado pelo núcleo, o elétron, em seu referencial, enxerga um campo magnético e este campo faz com que órbitas circulares e elípticas tenham uma energia diferente. Este efeito pode ser acentuada colocando-se o átomo num campo magnético externo. O resultado obtido por Sommerfeld usando a mecânica relativística foi En;n = 2 Z 2 e4 1 + Z2 2 2 2~ n n 1 n 3 4n ; onde ' 1=137 é a chamada constante de estrutura …na. Voltaremos a falar sobre isso (com detalhes) no tratamento do átomo de hidrogênio no …nal deste curso. Mas agora já sabemos que os níveis de energia do átomo de hidrogênio possuem a estrutura da …gura abaixo. O modelo de Sommerfeld, apesar de explicar adequadamente os níveis de energia tomando em conta a estrutura …na, ainda não é su…ciente para explicar outras observações. Medidas ainda mais precisas mostram que mesmo os níveis descritos acima possuem uma separação em outros níveis. Esta nova diferença, muito menor que a anterior, é chamada de estrutura hiper…na do átomo de hidrogênio. Esta estrutura não aparece no nosso modelo porque ele ainda é muito simpli…cado. O elétron, além de massa e carga, possui também uma característica interna chamada spin. Para dar conta da estrutura hiper…na, precisamos incluir esta característica no nosso modelo. 33 2 Mecânica Como vimos no caso da quantização de Sommerfeld, a descrição da Mecânica Clássica (MC) adequada para se introduzir um processo de quantização não é a formulação de Newton. Isso é verdade em geral. Tanto para os processos da velha mecânica quântica, quanto da nova até a sua evolução relativística (a Teoria Quântica de Campos). Um primeiro ponto que podemos salientar é que, tendo como base uma descrição ondulatória, as equações envolvidas no processo de descrição quântica devem, assim como a equação de onda, envolver derivadas parciais. Enquanto a mecânica de Newton envolve derivadas totais. Além disso, como veremos a seguir, existe uma semelhança muito grande (notada bem antes do advento da MQ) entre estas outras descrições da MC (Hamilton, Lagrange etc) e a descrição das características da luz na óptica geométrica. De uma forma geral, não só nesta parte do curso como na segunda parte (Moderna II) é impossível apreciar o processo de surgimento e evolução da MQ sem um conhecimento (ainda que enciclopédico) da descrição clássica da Mecânica Analítica. Destarte, dedicaremos algum tempo para ganharmos uma certa familiaridade com os termos e expressões envolvidos na Mecânica Analítica. 2.1 Preliminar Se f = f (a; b) é uma função de duas variáveis a; b então df = @f @f da + db @a @b e, da mesma forma, se df = g:da + h:db =) f = f (a; b) 34 não importando de quais variáveis depende g e h. Pois, independente desta variáveis, a função f só varia quando alteramos a e b. Se @f @f df = g:da + h:db =) g = ; h= @a @b 2.2 Equações de Euler-Lagrange Partindo da equação de Newton temos d2 xi dt2 (6) @U d = m x_ i @xi dt (7) Fi = m Para forças conservativas Fi = A energia cinética em coordenadas cartesianas é dada por (onde, assim como na notação da relatividade, estamos admitindo que sempre existe uma somatória implícita quando dois índices se repetem) T = X 1 2 2 (x_ k ) ; (x_ k ) = x_ 2k 2 i com isso temos @T @ x_ k m @ 1 = (x_ k ) (x_ k ) = @ x_ i 2 @xi 2 @ x_ i m [( ik ) x_ k + x_ k ik ] = mx_ i = 2 x_ k + x_ k @ x_ k @ x_ i Voltando em (7) @U d @T d d @T @U = mx_ i = =) + = 0 ; i = 1; 2; 3: @xi dt dt @ x_ i dt @ x_ i @xi (8) Para siatema conservativos a energia potencial depende apenas das coordenadas U = U (xi ; t). Enquanto a energia cinética é, em coordenadas cartesianas2 , uma função apenas das velocidades, T = T (x_ i ). Podemos com isso de…nir uma função que depende de x e x_ L (xi ; x_ i ; t) = T (x_ i ) com isso 2 Em U (xi ; t) @T @L @L = ; = @ x_ i @ x_ i @xi @U @xi coordenadas polares, por exemplo, a energia cinética T = 1 r_ 2 + r_ 2 _2 m depende da coordenada 6 r. 35 ; Substituindo em (8) temos d @L dt @ x_ i @L =0 @xi A função L é chamada de lagrangiana do sistema e as (3) equações acima as equações de Lagrange. 2.2.1 Coordenadas generalizadas Pela construção acima vemos que as equações diferenciais parciais de Lagrange são equivalente a equações de Newton. A princípio equações diferenciais parciais são mais complicadas que EDO. Entretanto, existe uma grande vantagem nas equações de Lagrange. Suponha que você queira resolver o problema de pêndulo sob a ação da gravidade. O ideal, neste caso, é usar a coordenada polar . Para obter as equações do movimento na mecânica de Newton você deve escrever x = R cos ; y = R sin ; calcular x • e y•, substituir na equação de Newton e usar o vínculo x2 + y 2 = R2 : Vamos ver como obter as equações do movimento na mecânica de Lagrange. Primeiro nos obtemos a energia cinética T = 1 1 mv 2 ; v = R _ =) T = mR2 _2 2 2 enquanto a energia potencial é dada por V ( ) = mgR (1 cos ) Com isso temos L=T V = 1 mR2 _2 2 mgR (1 cos ) Se esquecermos por um instante que estamos usando coodenadas polares e usarmos as equações de Lagrange (trocando x por ) temos @L @ 1 = mR2 _2 @ @ 2 @L @ 1 = mR2 _2 _ @ @_ 2 @ (cos ) = @ mgR (1 cos ) = mgR mgR (1 cos ) = mR2 _ com isso, d @L dt @ _ @L d = mR2 _ + mgR sin @ dt = mR2 • + mgR sin = 0 36 mgR sin ou ainda • + g sin = 0 : R Que é precisamente a equação que seria obtida a partir da equação de Newton e o laborioso processo descrito acima. Este resultado pode ser provado de forma geral usando uma transformação geral de coordenadas. Para veri…car isso imaginamos uma transformação qualquer (inversível) das coordenadas (também chamado transformação de ponto) xi = xi (q; t) ; qi = qi (x; t) com isso, podemos escrever L = L (q; q; _ t) ou3 L = L (x; x; _ t) Resultados que vamos precisar 1. Calculando q_j = @qj dxi @qj dx_ i @qj @qj @qj dqj = + + = x_ i + dt @xi dt @ x_ i dt @tj @xi @t vemos que q_j = dqj @qj @qj = x_ i + dt @xi @t (9) 2. Lembrando agora que qi = qi (x; t) =) @qj @qj = fij (x; t) ; = gi (x; t) @xi @t podemos escrever4 q_j = fij x_ i + gi 3 Na verdade, a função L (x; x; _ t) não é a mesma função das coordenadas L (q; q; _ t), ou seja, se formos rigorósos devemos esvrece ~ (q; q; L _ t). Mas podemos esquecer o til lembrando que estamos usando a de…nição de que a lagrangiana é uma função escalar das coordenadas. Seu valor num determinado ponto físico não se altera por uma mudança das coordenadas. 4 Lembre que se qi = qi (q; t) ; temos mas d qi = fi (q; q; _ t) ; dt @qi = fi (q; t) : @t 37 e calcular @ q_j @fij @ x_ i @gi = x_ i + fij + @ x_ m @ x_ m @ x_ m @ x_ m onde nem f nem g dependem de x, _ @ q_j @ x_ i = fij = fij @ x_ m @ x_ m im = fmj = @qj @xm ou seja, @qj @ q_j = : @xi @ x_ i (10) 3. Usando (9) temos @qj @qj =) x_ i + @xi @t @ q_m @ 2 qm @qm @ x_ j @ 2 qm @ 2 qm @ 2 qm = x_ j + + = x_ j + @xi @xi @xj @xj @xi @xi @t @xi @xj @xi @t q_j = (11) 4. Vamos agora calcular L (q; q; _ t) =) @L @L @qm @L @ q_m = + : @xi @qm @xi @ q_m @xi Substituindo (11) temos @L @L @qm @L @ 2 qm @ 2 qm = + x_ j + @xi @qm @xi @ q_m @xi @xj @xi @t (12) 5. lembrando que d @f @f f (x; t) = x_ m + dt @xm @t fazendo fkj (x; t) = temos @qk @xj d @qk @ 2 qk @ 2 qk = x_ m + dt @xj @xm @xj @t@xj (13) Voltaldo agora para a nossa lagrangiana L (q; q; _ t) temos @L @L @qk @L @ q_k = + @ x_ j @qk @ x_ j @ q_k @ x_ j e lembrando que q não depende de x_ @L @ q_k @L = @ x_ j @ q_k @ x_ j 38 (14) Usando (10) @L @L @qk = @ x_ j @ q_k @xj Derivando em relação ao tempo d @L = dt @ x_ j d @L dt @ q_k @qk @L d @qk + @xj @ q_k dt @xj (15) Substituindo (13) na relação acima d @L = dt @ x_ j d @L dt @ q_k @qk @L + @xj @ q_k @ 2 qk @ 2 qk x_ m + @xm @xj @t@xj : (16) Subtraindo (16) e (12) temos d @L dt @ x_ i @L = @xi = = d @L dt @ q_k @qk @L + @xi @ q_n @ 2 qn @ 2 qm x_ m + @xm @xi @t@xi d @L @qk @L @ 2 qn + dt @ q_k @xi @ q_n @xm @xi d @L @L @qm dt @ q_m @qm @xi @L @qm @qm @xi @ 2 qn @ 2 qm x_ m + @xi @xm @t@xi @L @ 2 qn @ 2 qn x_ j + @ q_n @xi @xj @xi @t @ 2 qn @xi @t Como a nossa transformação é geral e L (x; x; _ t) obedece as EL, podemos a…rmar que d @L @L =0: dt @ q_m @qm Ou seja, as EL têm a mesma forma para qualquer sistema de coordenada. Assim, utilizando as equações de Lagrange temos uma liberdade completa na escolha das coordenadas do sistema, o que pode ser utilizado explorando as simetrias do problema. Ou seja, a principal vantagem das equações de Lagrange é que elas independem do sistema de coordenadas usados. Com isso, se qi é um conjunto qualquer de coordenadas que descrevem um sistema mecânico, este sistema deve obedecer as equações de Lagrange d @L dt @ q_i @L =0: @qi (17) As coordenadas qi são chamadas de coordenadas generalizadas. Remark 16 Mais uma vez, enquanto a equação de Newton (6) só tem esta forma em coordenadas cartesianas, as equações de Lagrange (17) têm esta forma em qualquer sistema de coordenadas. Exercise 17 Uma conta (miçanguinha) de massa m pode se mover livremente numa barra rígida e reta que gira com velocidade constante !. Escreva a equação do movimento da conta. 39 @L @qm @qm @xi 3 Transformada de Legendre Em uma série de problemas em física é importante mudarmos as variáveis que usamos num problema. Por exemplo, na termodinâmica uma quantidade muito importante é a energia interna de um sistema U (S; V ). Um inconveniente desta quantidade é que ela depende da entropia S, uma quantidade que não pode ser medida diretamente com nenhum instrumento. Entretanto, pelas leis da termodinâmica, sabemos que a temperatura T de um corpo é a variação da sua energia interna com a entropia @U : @S T = (18) Vamos então de…nir uma nova quantidade F como F = T:S U (19) Diferenciando esta quantidade temos dF = T dS + SdT dU ; Sabendo que U = U (S; V ) temos dU = @U @U dS + dV ; @S @V (20) com isso @U dS @S dF = T dS + SdT = @U @S T dS + SdT @U dT @T @U dV @V O fato importante na de…nição de F é que, usando (18), temos dF = SdT @U dV ; @V (21) ou seja, a função (19) assim de…nida não depende da entropia F = F (T; V ) Com isso dF = @F @F dT + dV ; @T @V comparando com (21) temos S= @F @F ; = @T @V @U : @V O importante da quantidade F , chamada energia livre de Helmholtz, é que ela depende da temperatura e do volume, ambas quantidades que, diferente da entropia, podem ser medidas com instrumentos usuais. 40 Ou seja, podemos determinar F estudando as variações das característica do sistema com respeito ao seu volume e a sua temperatura. O procedimento acima é um exemplo de um procedimento mais geral chamado de transformada de Legendre. De forma geral, se f = f (x1 ; x2 ; :::; y1 ; y2 ; :::) podemos de…nir uma nova função g = pi y i f (somatória em i) onde pi = @f @yi com isso dg = (dpi :yi + pi :dyi ) df @f @f dxi + dyi @xi @yi @f dyi + dpi :yi dxi @xi = (dpi :yi + pi :dyi ) = pi @f @yi que, pela de…nição de pi , @f dxi @xi dg = yi :dpi Ou seja a função g não depende mais de yi , mas sim de um novo conjunto de variáveis pi . 4 Equações de Hamilton Nosso objetivo agora é usar a transformada de Legendre nas equações de Lagrange. Primeiramente lembramos que, pela de…nição acima L = L (qi ; q_i ) ; ou seja, a Lagrangiana depende das posições e das velocidades. Agora vamos de…nir a quantidade H = pi q_i onde pi = L (22) @L @ q_i é chamado momento conjugado da variável qi (i.e., para q = x temos um momento linear, para q = um momento angular e, no caso geral, um momento 41 conjugado). Das equações de Lagrange temos que, se uma determinada coordenada qm não aparece na Lagrangiana (chamada de coordenada cíclica) d @L @L = 0 =) = p_i = 0 =) pi = const: @qm dt @ q_i então o momento associado a esta coordenada se conserva (e.g., para uma partícula livre L = T o momento linear em qualquer direção se conserva). Seguindo o procedimento da seção anterior temos dH = dpi :q_i + pi :dq_i dL : Lembrando que L = L (q; q) _ temos dL = @L @L dqi + dq_i ; @qi @ q_i com isso @L @L dqi + dq_i @qi @ q_i @L @L dq_i + q_i :dpi dqi ; @ q_i @qi dH = dpi :q_i + pi :dq_i = pi e pela de…nição de pi dH = q_i :dpi @L dqi @qi ; (23) e, como esperávamos, a função H assim obtida é uma função de q e p e não mais de q, _ H = H (q; p). A quantidade H assim de…nida é chamada de Hamiltoniana. Sabendo que H = H (q; p) temos dH = @H @H dqi + dpi : @qi @pi Lembrando agora que q e p são coordenadas independentes em H (assim como q e q_ eram em L, i.e, obviamente q_ depende de q, mas é exatamente está relação que queremos encontrar ao resolver a equações de Lagrange) e comparando com (23) temos @H @L @H = q_i ; = @pi @qi @qi Se usarmos agora as equações de Lagrange temos @L d @L = @qi dt @ q_i Lembrando a de…nição de p pi = @L @L d =) = pi = p_i @ q_i @qi dt 42 Com o que @H @H = q_i ; = @pi @qi p_i : (24) Estas são as chamadas equações de Hamilton (EH). Qual a vantagem destas equações? Uma vantagem prática destas equações é que elas possuem apenas derivadas de primeira ordem. Como a equação de Newton, a equação de Lagrange possui derivadas das velocidades o que resulta em derivadas de segunda ordem na posição. Obviamente perdemos algo ao ganharmos esta facilidade. O ponto é que temos dois pares de EH, ou seja, usando a transformada de Legendre conseguimos transformar um sistema de n equações diferenciais de segunda ordem num sistema de 2n equações diferenciais de primeira ordem5 . 4.0.2 Signi…cado físico da Hamiltoniana No caso geral, a energia cinética de um sistema é uma função quadrática das velocidades generalizadas T = aij q_i q_j ; aij = aij (q) (somatória em i e j) no caso de coordenadas cartesianas aij = ciando a expressão acima temos 1 ij 2 m. Diferen- X @T @ q_i @ q_j = aij q_j + aij q_i @ q_k @ q_k @ q_k X = (aij ik q_j + aij q_i jk ) X X = aij ik q_j + aij q_i jk ij = X akj q_j + j = X X ij aik q_i i aki q_i + i X aik q_i i Multiplicando por q_k e efetuando uma somatória em k temos X @T X X q_k = aki q_i q_k + aik q_i q_k @ q_k k i;k i;k = T + T = 2T 5 Na verdade, esta não é a maior vantagem da EH, mas sim que, além de todo o conjunto de transformações de coordenadas disponíveis na formulação de Lagrange, tempos agora um conjunto muito maior de transformações a nossa disposição. Voltaremos a isso quando falarmos em transformações canônicas. 43 Este resultado é conhecido como teorema de Euler. Se usarmos agora este resultado na de…nição de H temos X H= pi q_i L i X @L q_i = @ q_i i X @T = q_i @ q_i i (T U) (T U) = 2T T + U =T +U : Ou seja, a hamiltoniana é a energia total do sistema. Observe que, diferente da Lagrangiana (T U ) a energia total do sistema é uma quantidade que pode ser medida e, além disso, é uma quantidade conservada para um sistema isolado. Esta é outra vantagem da teoria de Hamilton. Assim, utilizando a mecânica de Hamilton podemos, a partir da energia total do sistema e de um sistema de 2n equações de primeira ordem, estudar a dinâmica dos corpos. 4.1 Princípio variacional (opcinal) Um problema importante e comumente encontrado é o seguinte: dada uma função y = f (x) para quais valores de x a função f , e conseqüente y, possui valores máximos e mínimos (estes valores são chamados de extremos da função). A resposta, obviamente, são os pontos onde a derivada de f se anula. Um problema bem mais complicado, e interessante, é o seguinte: considere a integral Z b I= F (y (x) ; y 0 (x) ; x) dx a onde F é uma dada função de y (x), y 0 = dy=dx e x. Assim, para cada função y (x) diferente I assume um valor diferente. Para quais funções y(x) a integral I é um extremos? Antes um pouco de nomenclaturas. Dada uma certa função y(x) podemos calcular o valor de I. A quantidade I, que depende de uma função, e não apenas de um número, é chamada de funcional. Outro ponto importante é que dado dos valores y(x0 ) = a1 e y0(x0 ) = a2 é sempre possível encontrar uma função y(x) que satisfaça esta condição. Neste sentido, as variáveis y e y0 são tratadas em F como sendo independentes. Agora, para calcular I nós não podemos dar apenas o valor de y(x) num dado ponto x0 , mas sim o valor desta função em todo o intervalo x 2 [a; b], ou seja, precisamos dar toda uma curva y(x). Dada uma curva o valor da derivada desta curva está completamente determinada. Assim, em I não é possível se especi…car separadamente o valor de y e y0. Resumindo enquanto F é uma função de y, y0 e x F = F (y; y 0 ; x) 44 Figure 7: Figura retirada do Marion. enquanto I é um funcional apenas de y I = I [y] : Nosso problema de encontrar a função y para a qual I é um extremo é um problema do chamado cálculo variacional. Por que a derivada de uma função é nula nos extremos? Isso ocorre porque a variações do parâmetro (x) em torno deste ponto não geram variações na função y(x) (pelo menos até primeira ordem em dx). O mesmo acontece com uma função de duas variáveis (o que pode ser visualizado facilmente) ou com funções com um número qualquer de variáveis (o que não é tão simples de visualizar). Ou seja, se estivermos num ponto extremo da função, ao deslocarmos o argumento uma quantidade in…nitesimal não haverá variação da nossa função. A idéia por detrás do cálculo variacional é exatamente a mesma. Se tivermos encontrado a função y(x) para a qual nosso funcional I [y] é um extremos, esperamos que ao variamos um pouco esta função (ou seja, pegarmos uma curva y(x) muito próxima a y (x)) o valor do nosso funcional não irá variar (Figura). Suponha que y (x) é a função que resolve este problema (obviamente esta é a função que queremos encontra). O fato de y (x) ser um extremo de I signi…ca então que com pequenas variações em torno de y (x) o valor do integrando não varia apreciavelmente (de forma análoga ao cálculo ordinário). Vamos então analisar como I varia se substituímos y pela função (Figura) y (x) = y (x) + " (x) 45 para uma função (x) que, apesar de arbitrária, vamos supor dada, i.e., vamos variar apenas o valor de ". Como queremos estudar todas as funções que passam pelo mesmo ponto inicial e …nal devemos ter y (a) = y (a) ; y (b) = y (b) =) y (a) = y (b) = 0 : Para a variação acima (onde y e são funções conhecidas) nosso integrando I passa a ser uma função (pois " é um número) de " Z b I [y] ! I (") = F (y + " ; y 0 + " 0 ; x) dx : a O ponto é que agora, como é uma função, podemos usar o resultado do cálculo usual é dizer que para " = 0 a nossa função I é um extremo e, consequentemente, sua derivada é nula, ou seja, dI =0: (25) d" "=0 Tudo que precisamos agora é de…nir a diferencial dI=d". Fazemos isso da forma usual "Z # Z b b I [y + "] I [y] 1 dI 0 0 0 = lim = lim F (y + " ; y + " ; x) dx F (y; y ; x) dx "!0 " d" "!0 " a a Z 1 b [F (y + " ; y 0 + " 0 ; x) F (y; y 0 ; x)] dx = lim "!0 " a Z b [F (y + " ; y 0 + " 0 ; x) F (y; y 0 ; x)] = dx : lim " a "!0 Agora F (y + " ; y 0 + " 0 ; x) = F (y; y 0 ; x) + ou seja F (y + " ; y 0 + " 0 ; x) "!0 " lim com isso dI = d" Z a b @F @F " + 0 " 0 + O "2 @y @y F (y; y 0 ; x) @F @F + 0 @y @y 0 = @F @F + 0 @y @y dx : 0 (26) Lembrando que 0 = d =dx podemos integrar o segundo membro da expressão acima por partes Z b Z b b @F d @F d @F dx = dx : (27) 0 dx 0 @y @y dx @y 0 a a a Agora usamos o fato de que a função (x) (apesar de arbitrária) deve se anular nos extremos (a) = (b) = 0 Z b Z b @F d d @F dx = dx : 0 dx @y dx @y 0 a a 46 Substituindo em (26) temos dI = d" = Z b a Z b a @F @y d @F dx @y 0 @F @y d @F dx @y 0 dx dx : (28) Voltando agora para (25) temos dI d" =0= Z b a "=0 @F @y d @F dx @y 0 dx Para qualquer função (x). Isso só é possível se o integrando for zero @F @y d @F dx @y 0 =0: Para F uma função de várias variáveis este resultado tem de ser válido independentemente para cada variação @F @yi d @F dx @yi0 =0 (29) Esta é a chamada equação de Euler. Observe que, no …nal, a nossa expressão (28) não depende de ". Além disso, para lembrar que não estamos falando do cálculo usual, as pessoas inventam um novo símbolo para a derivada (mas é apenas um símbolo) Z b dI I [y] = F (y; y 0 ; x) dx : d" a E lesse a variação funcional de I. Ou ainda, se mudarmos a notação para e usarmos a notação acima, (28) pode ser escrita como Z b d @F dI @F I [y] = y dx d" @y dx @y 0 a y (30) e, em analogia com o cálculo ordinário de uma função f (x), costuma-se escrever Z b Z b I @F d @F df dx ! I [y] y dx = y dx ; df = dx y @y dx @y 0 a a ou seja, I @F = y @y d @F dx @y 0 e lesse, a derivada funcional de I [y] em relação a função y (x). Mais uma vez, isso é apenas uma notação6 , mas é importante que você a conheça porque ela é muito usada em livros e artigos. 6 Obviamente existe muito mais por trás do cálculo variacional. Mas se trabalharmos apenas com funções bem comportadas (e.g., diferenciáveis em todos os pontos), na grande maioria dos casos podemos encarar apenas como uma notação. 47 Figure 8: Figura retirada do Marion de Mecânica. Com isso, nesta simbologia, a nossa expressão …ca I [y] = Z b F (y; y 0 ; x) dx = 0 =) a I = y d @F dx @yi0 @F =0: @yi e lesse que, o fato da derivada funcional de I ser um extremo implica na equação de Euler. 4.1.1 Exemplo: a braquistocrôna. Um problema variacional bastante famoso, proposto em numa revista ciêntí…ca por Bernoulli em 1696, é o chamado problema da braquistocrôna (do grego, o tempo mais curto). Imagine dois pontos num plano, (x1 ; y1 ) e (x2 ; y2 ), se uma força constante for aplicada na direção x e uma partícula de massa m se mover do primeiro ponto ao segundo sob ação desta força, qual o caminho que esta partícula deve percorrer para efetua o trajeto no menor tempo possível? Imagine que você quer colocar um cano para guiar o movimento de uma bolinha e quer saber a forma do cano para minimizar o tempo de percurso. A resposta do problema acima é exatamente a trajetória que a sua pedra terá de fazer. Ou ainda, imagine que você pendure uma corrente entre os dois pontos acima (onde a força é, novamente, a gravidade), que curva esta corrente irá desenhar (esta curva se chama catenária)? Todos estes exemplos se referem ao mesmo problema. Vamos então a sua solução. Para fazer uma referência mais natural a força gravitacional, colocamos os eixos como na …gura abaixo Sabemos que a energia total do sistema T + U se conserva. Colocando o zero do potencial no ponto de início (x1 ; y1 ) e considerando que a partícula foi lançada do repouso na direção x (podemos ignorar qualquer velocidade na direção y pois, como não há forças nesta direção, ela se conserva) temos que no 48 ponto inicial Ei = T + U = 0 Seguindo a analogia da força gravitacional temos F = mg = T = @U )U = @x mgx 1 mv 2 2 A conservação de energia nos dá T + U = 0 =) v = Com isso 1 ds = v ) dt = ds ) t = dt v onde 2 2 p 2gx Z (x2 ;y2 ) (x1 ;y1 ) 1 ds v 2 (ds) = (dx) + (dy) Finalmente, o tempo vale Z (x2 ;y2 ) q 1 2 2 p t= (dx) + (dy) 2gx (x1 ;y1 ) Z (x2 ;y2 ) s Z (x2 ;y2 ) r 1 1 + y 02 1 + y 02 = dx = p dx 2gx x 2g (x1 ;y1 ) (x1 ;y1 ) y0 = dy dx Ou seja, o nosso problema se reduz a minimizar a integral (como (2g) uma constante) s Z (x2 ;y2 ) 1 + y 02 I= F (y 0 ; x) dx ; F (y 0 ; x) = 2gx (x1 ;y1 ) 1=2 é Onde, neste caso, a função F não depende explicitamente de y. A solução do nosso problema é, então, a função y que obedece a equação de Euler (29) @F @y d @F dx @y 0 =0 Como, neste caso, F não depende explicitamente de y @F d @F @F =0) =0) =C @y dx @y 0 @y 0 r @F @ 1 + y 02 y0 p = = =C @y 0 @y 0 x x (1 + y 02 ) 49 Assim, a curva que a partícula deve seguir y (x) deve ser solução da equação s y0 xC 2 02 2 02 2 0 p = C ) y = xC + xy C ) y = ; (1 xC 2 ) x (1 + y 02 ) ou ainda, dy = dx s xC 2 )y= (1 xC 2 ) 2a = 1=C 2 Z x2 x1 x p (2ax x2 ) dx ; Fazendo x = a (1 cos ) ) dx = a sin d temos Z y= ou seja, a curva procurada é y = a( a (1 cos ) d = sin ) + const. Com isso, a nossa curva obedece x = a (1 cos ) ; y = a ( sin ) que são as equações paramétricas de uma curva chamada ciclóide. Se a sua partícula for uma conta guiada por um …o (com massa) e você prender o …o nos pontos acima o …o assumirá exatamente esta a forma que levará a partícula entre os dois pontos no menor tempo, i.e., o …o formará uma catenária. A parte da curva entre o ponto (x1 ; y1 ) até o seu mínimo é chamada de curva tautocrônica (como muito bem observado pela senhorita Palma), i.e., é a curva na qual o tempo gasto por um objeto para deslizar sem fricção em gravidade uniforme até seu ponto de mínimo é independente de seu ponto de partida (este problema foi resolvido por Christiaan Huygens em 1659). 4.1.2 Equações de Euler-Lagrange O ponto importante para nós no desenvolvimento acima é o seguinte: suponha que a nossa variável é o tempo (x ! t) e que a função que procuramos seja a trajetória de uma partícula com coordenada generalizada q(t) (y (x) ! q (t)). Alem disso, suponha que a função F que estamos integrando seja exatamente a lagrangiana L do sistema. Com isso Z a b 0 F (y; y ; x) dx ! 50 Z a b L (q; q; _ t) dt Figure 9: Figura retirada do Marion de Mecânica. e a expressão (28) toma a forma: Z b L (q; q; _ t) dt = 0 =) a d @L dt @ q_i @L =0: @qi Que é exatamente a equação de Lagrange obtida anteriormente. Por isso estas equações são chamadas de equações de Euler-Lagrange (EL). A integral Z L (q; q; _ t) dt S [q] é chamada de ação. Usando a linguagem do cálculo funcional, podemos obter as equações de EL se impusermos que a derivada funcional da ação seja um extremo. Esta exigência recebe o nome de princípio da mínima ação (ou princípio de Hamilton). Neste sentido as equações de Lagrange e, consequentemente, toda a mecânica, podem ser construídas a partir do princípio da mínima ação e esta construção é equivalente a mecânica de Newton (perceba que este é um caminho diferente do seguido no início deste texto). O fato da mecânica de Lagrange ser uma conseqüência do princípio da mínima ação tem uma conseqüência crucial na questão do comportamento ondulatório ou corpuscular da luz. Porque todos os resultados da óptica geométrica podem ser obtidos a partir de um princípio muito semelhante chamado princípio de Fermat do tempo mínimo. Este princípio estabelece que ao atravessar meios diferentes, dentre todos os caminhos possíveis o feixe luminoso escolhe aquele que minimiza o tempo da sua trajetória. Este princípio determina todos 51 os efeitos de refração e re‡exão. Como analogia, imagine que você está de bicicleta na praia e quer atravessar a avenida da orla para chegar num ponto a 45o da normal à avenida. Qual caminho você deve seguir para chegar mais rápido? O menor caminho é, obviamente, uma linha reta. Mas, como a bicicleta se move com maior facilidade no asfalto é conveniente que você passe menos tempo na areia. Porém, se você se mover na direção normal na praia a distância percorrida será muito maior. Encontrar o caminho que minimize este tempo é um problema de cálculo variacional. Assim, a trajetória tanto da luz como das partículas pode ser obtida por um princípio de mínimo de um funcional. 5 Parênteses de Poisson Existe uma forma bastante compacta de se escrever as EH através dos chamados parênteses de Poisson (PP). Os PP de duas funções f (q; p) e g (q; p) são de…nidos como X @g @f @f @g ff; gg = @q @p @q i i i @pi i Vamos calcular os PP de uma função g em relação ao Hamiltoniano fg; Hg = X i @g @H @qi @pi @H @g @qi @pi Usando agora as eq. de Hamilton temos fg; Hg = = X i X i = X i = X i @g @H @qi @pi @H @g @qi @pi @g (q_i ) @qi ( p_i ) @g @pi @g @g q_i + p_i @qi @pi @g dqi @g dpi + @qi dt @pi dt Lembrando agora que dg = X i dg = dt X i temos g_ = @g @g dqi + dpi @qi @pi @g dqi @g dpi + @qi dt @pi dt dg @g = fg; Hg + dt @t 52 + @g dt @t + @g @t Ou seja, calculando os PP de qualquer função da posição e momento com o hamiltoniano temos a variação temporal desta função. Em especial, para as variáveis de posição e momento temos q_k = fqk ; Hg = X X @qk @H @qi @pi i @qk @H @H = = ik @q @p @p i i k i X @pk @H p_k = fpk ; Hg = @qi @pi i @H @qk @qi @pi @H @pk @qi @pi = @H @qk Ou seja, podemos escrever as EH como p_k = fpk ; Hg ; q_k = fqk ; Hg Observe que ff; gg = fg; f g de sorte que fh; hg = 0 Assim, do resultado acima temos @H @H H_ = fH; Hg + = @t @t Ou, se o Hamiltonianao (a energia) não depende explicitamente do tempo H_ = 0 =) H = E = const. A energia do sistema se conserva. Mais ainda, para qualquer quantidade h (q; p) que não dependa explicitamente do tempo, temos que se fh; Hg = 0 =) h = const. Quando os PP de duas quantidades é nulo ff; gg = 0 dizemos que estas quantidades comutam. Assim, uma quantidade se conserva se ela comuta com o H. Se calcularmos os PP das próprias variáveis q e p temos fqk ; pm g = = X i X @qk @pm @qi @pi ik im i fqk ; pm g = km 53 @pm @qk @qi @pi Que são chamadas regras canônicas de comutação. E as variáveis são chamadas de canonicamente conjugadas. Como vimos anteriormente, as EL mantém a sua forma para qualquer transformação de ponto nas coordenadas. Dos resultados acima vemos que as EH manterão a mesma forma (e, conseqüentemente, descreverão a mesma dinâmica) para qualquer transformação inversível Pk = Pk (p; q) ; Qk = Qk (p; q) que mantenha as regras canônicas de comutação fQk ; Pm g = fqk ; pm g = km : Vemos assim que a liberdade na escolha das coordenadas e dos momentos é na teoria de Hamilton. Transformações que mantém a forma canônica dos PP são chamadas de transformações canônicas. Resumindo: 1. na MC toda a informação que caracteriza o sistema está contido nas variáveis (q; p). Estas quantidades podem ser desenhadas em um grá…co que se chama espaço de fase. Ou seja, dado um ponto no espaço de fase eu sei o momento é a posição do sistema. Diz-se então que pontos no espaço de fase representam os estados físicos do sistema. 2. Para um sistema conservativo (onde H não depende explicitamente do tempo) toda a dinâmica do sistema (variação temporal das quantidades) depende apenas de H. Dado H a evolução de qualquer quantidade f pode ser calculada pelos parêntese de Poisson f_ = ff; Hg : 3. A liberdade na escolha das coordenadas que descrevem corretamente a dinâmica do sistema está contida nas regras canônicas de comutação fqk ; pm g = km : Estes são os resultados necessários para se entender o processo de quantização canônica. 6 Vetores e equações lineares Além da mecânica analítica, um segundo ferramental indispensável para o nosso desenvolvimento é a álgebra linear e vetores. Uma das estruturas mais simples e fundamentais que temos são os números inteiros (Z). Neste conjunto temos a de…nição de duas operações: soma e multiplicação. A generalização desta idéia, ou seja, a …xação destas propriedades 54 algébricas relaxando uma ou outra característica leva a construção de outras estruturas matemáticas como monóides, grupos, anéis, espaços vetoriais etc. Um espaço vetorial V é qualquer conjunto de elementos onde de…nimos uma regra de composição entre estes elementos, que simbolizamos geralmente pelo sinal de soma (+ : V ! V ). Ou seja, dado dois elementos quaisquer v1 ; v2 2 V , sabemos realizar a composição: 8 v1 ; v2 2 V : v1 + v2 = v3 2 V ; (closure) Ademais estabelecesse uma outra regra, chamada de produto com um escalar ( : R; V ! V ), da composição dos elementos deste conjunto sobre o corpo dos reais (ou dos complexos). Ou seja: 8 v1 2 V; a 2 R : a:v1 = av1 = v3 2 V ; Além disso, esta operação de soma deve respeitar (lembre-se que podemos de…nir diferentes somas, e.g., soma de setas, de matrizes.): a Associativa: v1 + (v2 + v3 ) = (v1 + v2 ) + v3 . b Comutativa: v1 + v2 = v2 + v1 . c Elemento identidade: 9 0 2 V : v + 0 = v; 8 v 2 V . d Elemento inverso: 8 v 2 V; 9 v 2 V : v + ( v) = 0 : e Distributiva pelo produto com um escalar: a (v1 + v2 ) = av1 + av2 . f Distributiva pela soma escalar: (a1 + a2 ) v = a1 v + a2 v g compatível com a multiplicação escalar do carpo: a1 (a2 v) = (a1 a2 ) v Um conjunto ordenado de n números reais x1 ; x2 ; ::xn pode ser chamado de um vetor de dimensão n, ou um vetor num espaço n dimensional, denotamos este espaço por Rn (i.e., a coleção de n números reais). Usualmente esta quantidade é simbolizada como jxi. Cada um dos elementos xi (i = 1; 2; ::; n) é chamado de componente i do vetor. Se todas as componentes são nulas, o vetor é chamado de vetor nulo e usualmente simbolizado por 0 (mas lembre-se que este símbolo é, na verdade, a coleção de n zeros). Para n = 2, ou n = 3 o vetor pode ser interpretado geometricamente como as coordenadas cartesianas de uma seta que inicia na origem e termina neste ponto. Para n > 3 a visualização geométrica não é possível, mas as expressões algébricas e a terminologia continuam as mesmas. Para números reais arbitrário a; b 2 R a quantidade a jxi+b jyi = jzi fornece um novo vetor (também de dimensão n) cujas componentes são dadas por zi axi + byi : 55 Uma estrutura adicional que podemos incluir no nosso espaço vetorial (mas que não faz parte da de…nição desta estrutura) é a operação hxj yi = x1 y1 + x2 y2 + ::: + xn yn = n X xi yi ; (31) i=0 chamada de produto interno dos vetores jxi e jyi. Esta quantidade também é chamada de projeção de jyi em jxi, ou a componente de jyi na direção jxi (ou vice-versa). Fácil ver que o produto interno de…nido acima é: 1. Simétrico: hxj yi = hyj xi 2. Linear: jzi = a jyi + b jwi : hxj zi = a hxj yi + b hxj wi Observe que podemos obter a expressão da linearidade acima se simbolicamente escrevermos hxj zi = (hxj) (a jyi + b jwi) = hxj a jyi+hxj b jwi = a hxj jyi+b hxj jwi a hxj yi+b hxj wi Ou seja, a linearidade permite interpretar a quantidade hxj a esquerda do símbolo de produto como sendo também um vetor, chamado de vetor dual do vetor jxi. Esta notação simbólica é chamada notação de Dirac. Ou seja, hxj é um outro espaço vetorial também formado por uma seqüência de número e de…nido com as operações de soma e produto acima. Dizer que este espaço é outro espaço vetorial signi…ca, em especial, dizer que não podemos realizar composições do tipo hxj + jwi =? Dizemos que dois vetores jxi e jyi são ortogonais quando hxj yi = 0 : Para n = 2 e 3 esta terminologia possui um signi…cado imediato. Pois, neste caso, numa representação geométrica onde cada termo da seqüência é a componente de uma seta num sistema cartesiano, quaisquer dois vetores que respeitam a igualdade acima fazem entre si um ângulo de 90o . Por exemplo, para n = 2, os vetores jxi = (1; 1) ; jyi = (1; 1) temos hxj yi = 1 1=0: E é fácil ver que estes vetores no plano tem entre si um ângulo de 90o . Mais uma vez, para n > 3, a interpretação geométrica não pode ser mais usada, mas a nomenclatura continua a mesma. O produto interno de um vetor com ele mesmo hxj xi 56 2 jxj é chamado de norma do vetor. A raiz positiva da norma p hxj xi jxj 0 é chamado de comprimento do vetor (alguns autores chamam esta raiz de norma). Mais uma vez, para n = 2 ou 3, esta quantidade representa o comprimento (ou a distância) da origem até as coordenadas do ponto. Observe que hxj xi = 0 =) jxi = 0 ; xi = 0 ; i = 1; 2; :::n : Um vetor para o qual hxj xi = 1 ; é chamado de vetor unitário, ou vetor normalizado. As de…nições acima também podem ser escritas identi…cando os vetores jxi com matrizes de n linhas 0 1 x1 B x2 C B C jxi = B . C @ .. A xn Neste caso, o produto vetorial pode ser realizado identi…cando o dual do vetor como a matriz de n colunas (ou a transposta) correspondente hxj = x1 x2 xn e identi…cando a operação de produto interno com a multiplicação usual de matrizes 0 1 x1 n B x2 C X B C yn B . C = hyj xi = hxj jyi = y1 y2 xi yi : @ .. A i=0 xn Um conjunto de m vetores jx1 i ; jx2 i ; ::: jxm i são ditos linearmente dependentes, se m m X X 9ai (i = 1; ::; m) 2 R ; a2i 6= 0 : ai jxi i = 0 i=1 i=1 caso contrário, eles são linearmente independentes. Num espaço de dimensão n qualquer conjunto de n vetores jwi i (distintos e não nulos) e linearmente independentes formam uma base do espaço. Ou seja, qualquer vetor jxi pode ser escrito como: 9ai (i = 1; ::; n) 2 R ; m X i=1 a2i 6= 0 : jxi = 57 m X i=1 ai jwi i : Ou, de outra forma, num espaço de dimensão n dado o conjunto de n vetor fjwi ig (não nulos) LI, qualquer outro vetor é LD a este conjunto. Ou ainda, num espaço de dimensão n qualquer conjunto de n + 1 vetores é LD. As quantidades ai da expressão acima são chados de componente do vetor jxi na base fjwi ig. Se o conjunto de n vetores LI jwi i são também ortogonais entre si hwi j wj i = 0 para i 6= j dizemos que esta base é ortogonal. Um conjunto de m vetores jei i que respeitam hei j ej i = ij ; (32) i.e., são ortogonais entre si e normalizados, são chamados de ortonormais. Se m = n (onde n é a dimensão do espaço) estes vetores formam uma base, chamada de base ortonormal. Observe que, se fjwi ig é uma base ortogonal do nosso espaço, podemos facilmente construir com eles uma base ortonormal fjei ig fazendo jei i = 1 1 jwi i = p jwi i jwi j hwi j wj i Este procedimento se chama a normalização dos vetores jwi i. Dada uma base ortonormal fjei ig podemos facilmente usar o produto interno para encontrar as componentes de um vetor qualquer nesta base. Basta para isso tomar o produto interno do vetor expandido com os elementos da base jxi = a1 je1 i + a2 je2 i + ::: =) he1 j jxi = a1 he1 j e1 i + a2 he1 j e2 i + :: Usando agora (32) temos he1 j xi = a1 he1 j e1 i = a1 ou, de forma geral ai = he1 j xi : Assim, numa base ortonormal as componentes do vetor nesta base é o produto interno do vetor com cada elemento da base (ou a projeção de jxi na direção jei i). Além disso, para uma base ortonormal, temos 3 " n #2 n n X n X X X hxj yi = ai hei j 4 bj jej i5 = ai aj hei j ej i i=1 = n X n X i=1 j=1 j=1 ai bj ij = i=1 j=1 n X ai bi : i=1 Que é uma expressão idêntica a de…nição anterior do produto interno (31), mas agora com as componetes do vetor na base fjej ig. Assim, o produto interno 58 entre dois vetores pode ser calculado pelas componentes originais deste vetor ou pela suas componentes em qualquer base ortonormal. Lembre que o nosso vetor é a seqüência ordenada x1 ; x2 ; ::: ou seja 0 1 x1 B x2 C B C jxi = B . C @ .. A xn Estas são as componentes do vetor e não se referem à base alguma. Já as quantidades ai acima são as componentes numa determinada base. Em especial, para o produto interno de um vetor com ele mesmo, i.e., a norma deste vetor, temos 3 " n #2 n n X n X X X 2 aj jej i5 = ai aj hei j ej i jxj = hxj xi = ai hei j 4 j=1 i=1 = n n X X ai aj ij = n X i=1 j=1 a2i : i=1 i=1 j=1 Exemplo: Voltando para o nosso exemplo em 2 dimensões tomemos o vetor com componentes x1 = 1; x2 = 2. Que na representação matricial assume a forma 1 jxi = 2 a norma deste vetor vale 2 2 2 jxj = (x1 ) + (x2 ) = 12 + 22 = 5 Uma base para este espaço é qualquer conjunto de dois vetores LI. Por exemplo, temos a base 1 2 jf1 i = ; jf2 i = 1 3 Fácil ver que a jf1 i + b jf2 i = 0 = a 1 1 2 3 +b ) a + 2b = 0 ) a = 2 + 3b = 0 ) a = 2b ; 3b que só pode ser satisfeita para a = b = 0. Logo jf1 i e jf2 i são LI e, consequentemente, formam uma base do espaço. Entretando hf1 j f2 i = 1 2 3 1 = 5 6= 0 ; esta base não é ortogonal. As componentes de jxi na base fjfi ig valem jxi = c1 jf1 i + c2 jf2 i = c1 1 1 + c2 2 3 = c1 + 2c2 = 1 ) c1 = 1 2c2 ; c1 + 3c2 = 2 ) 1 2c2 = 2 3c2 ) c2 = 1 ) c1 = 59 c1 + 2c2 c1 + 3c2 1: = 1 2 (temos de resolver o sistema de equações). Assim, as componentes de jxi na base fjfi ig valem: c1 = 1, c2 = 1. Fácil ver que 2 2 2 2 (c1 ) + (c2 ) = 1 + 1 = 2 6= 5 = (x1 ) + (x2 ) ; ou seja, não podemos usar estas componentes para calcular a norma do vetor. Tomemos agora outros dois vetores 1 1 jw1 i = jf1 i ; jw2 i = : Facil ver que estes vetores também são LI. Mas, além disso hw1 j w2 i = 1 1 1 1 =1 1=0: Assim, fjwi ig é uma base ortogonal. As componentes c0i de jxi nesta base valem c01 1 1 1 1 + c02 = 1 2 c01 + c02 = 1 ) c01 = 1 c01 c02 = 2 ) c02 = c02 1 2 3 1 = 2 2 c01 = 1 + Mais uma ver 9 1 41 + = 6= 5 : 5 4 20 Mas, como a nossa nova base fjwi ig é ortogonal, podemos aplicar o processo de normalização e de…nir uma nova base fjei ig com 2 2 (c01 ) + (c02 ) = jw1 i 1 =p jw1 j 2 jw2 i 1 je2 i = =p jw2 j 2 je1 i = 1 1 1 1 As componentes c00i de jxi na base fjei ig valem 1 jxi = c001 je1 i + c002 je2 i = p 2 p p c001 + c002 = 2 ) c001 = 2 c002 p p 2 c001 c002 = 2 2 ) c002 = 2 p p 2 3p 00 c1 = 2 + = 2 2 2 60 c001 + c002 c001 c002 = 1 2 onde agora podemos usar a projeção 1 c001 = he1 j xi = p 2 1 c001 = he2 j xi = p 2 1 1 2 1 1 1 3 =p ; 2 1 1 = p ; 2 2 (não precisamos resolver o sistema de equações). Além disso, nas componentes de jxi na base ortonormal fjei ig temos 2 2 (c001 ) + (c002 ) = 1 9 2 2 2 + = 5 = (x1 ) + (x2 ) = jxj 2 2 Um conjunto de m vetores fjei ig ortonormais, com m = n, é também chamado de um conjunto ortogonal completo. Para m < n os vetores fjei ig são chamados de um conjunto ortogonal incompleto. Este conjunto forma uma base para um sub-espaço de dimensão m do espaço vetorial de dimensão n. Assim, encontrar uma base para um espaço vetorial é equivalente a encontrar um conjunto completo de vetores ortogonais (e normalizá-los). Uma base bastante muito conveniente (e simples de construir) é a seguinte 0 1 0 1 0 1 1 0 0 B 0 C B 1 C B 0 C B C B C B C B C B C B C je1 i = B 0 C ; je2 i = B 0 C ; je3 i = B 1 C ; ::: B 0 C B 0 C B 0 C @ A @ A @ A .. .. .. . . . Fácil ver que esta base é ortonormal. Além disso, nesta base as componentes do vetor são exatamente as componentes do vetor na base 0 1 x1 n B x2 C X jxi = @ ai jei i ) ai = hei j xi = xi : (33) A= .. i=1 . Esta é a chamada base canônica. 6.1 Operadores, autovetores e autofunções no Rn Em Rn dado um conjunto de n2 números reais Mij (i; j = 1; 2; :::n) podemos de…nir o seguinte mapa entre as componentes de dois vetores jxi e jyi deste espaço n X yi = Mik xk k=1 ou, simbolicamente ^ jxi jyi = M 61 onde o chapéu indica que M não é um número, mas sim o que chamamos de operador. Ou seja, dado um espaço vetorial, um operador é um mapa entre vetores ^ : V ! V ). Na notação matricial introduzida anteriormente, os deste espaço (M operadores podem ser identi…cados como matrizes n n. Como exemplo, vamos estudar as operações de rotações num plano. Ou seja, vamos trabalhar num espaço com n = 2. Suponha que um vetor neste espaço tenha coordenadas (x1 ; x2 ). Se aplicarmos uma rotação de um ângulo no sentido anti-horário, neste vetor quais as componentes (x01 ; x02 ) do novo vetor obtido? Fazendo desenhos no plano é fácil ver que x01 x02 = cos sin sin cos x1 x2 : Ou seja, o conjunto de quatro números Rij , ou a matriz ^( )= R cos sin sin cos ; é um operador de rotação no nosso espaço bidimensional. Um caso particular é o operador de rotação de um ângulo de 1800 ^( )= R 1 0 0 1 : Um outro exemplo é o operador que troca a troca a coordenada x1 por x1 (i.e., coloca um espelho no plano normal a x2 ), chamado de operador de paridade em x1 1 0 P^1 = : (34) 0 1 Observe que isso não é nenhuma rotação. 6.1.1 Produto externo Além do produto interno, realizado entre vetores de um certo espaço vetorial, podemos também de…nir o produto entre vetores de dois (ou mais) espaços vetoriais diferentes a b ; a 2 V1 ; b 2 V 2 : A quantidade assim obtida é um novo vetor num terceiro espaço vetorial V3 com dimensão dim V3 = dim V1 : dim V2 : Na representação matricial, onde todo vetor é uma matriz m n, uma forma 62 bastante conveniente de implementar o produto tensorial é através da de…nição 0 0 1 1 a11 a1m a11 B a1m B B C .. .. C B B .. .. .. A B = @ ... @ A . . . . A . a1n anm a1n B anm B ! ! 1 0 B11 B11 a1m B a11 C .. .. .. .. B C . . . . B C B C . . .. .. .. (35) =B C : . B C ! ! B C B B 11 11 @ A a1n anm .. .. .. .. . . . . Ou seja, é a matriz formada quando multiplicamos a matriz da direita com cada elemento da matriz da esquerda. Este é o chamado produto de Kronecker. No espaço vetorial das seqüência, que estamos trabalhando, temos dois espaços vetoriais diferentes: o espaço dos vetores e o espaço dos duais. Podemos assim estabelecer o produto externo entre dois elementos de cada um destes espaços ^ = jxi hyj : M Pela de…nição acima é fácil ver que esta nova matriz tem componentes ^ ij = xi yj : M ^ é a matriz ou seja, neste caso, M 0 x1 y1 B x2 y1 ^ =B M B .. @ . xn y1 x1 y2 x2 y2 .. . xn y2 .. . (36) x1 yn x2 yn .. . xn yn 1 C C C : A Usando o produto de Kronecker, para o produto de espaço com n = 3 temos 0 1 0 x1 y1 y2 x1 @ x2 y1 y2 y1 y 2 y3 jxi hyj = @ x2 A x3 x3 y1 y2 dois vetores temos num y3 y3 y3 1 0 x1 y2 x2 y2 x3 y2 (37) que na mais é que a expressão (??) organizada numa forma matricial. A quantidade acima é chamada um tensor de segunda ordem. 63 x1 y1 A = @ x2 y1 x3 y1 1 x1 y3 x2 y3 A ; x3 y3 Da de…nição acima é fácil ver que 20 1 x1 T y1 y 2 y3 (jyi hxj) = 4@ x2 A x3 0 1 y1 @ y2 A x1 x2 x3 y3 = jxi de forma geral (A 3T 5 hyj : T B) = B T AT : Se jxi 2 V e dim V = n a quantidade acima pode ser vista como um vetor num espaço V 0 de dimensão n2 , ou, por ser uma matriz n n, como um operador agindo no espaço V . Ou seja, matematicamente um tensor de segunda ordem pode ser pensado visto como um operador. Para o produto de…nido acima ^ como (entre um tensor e o dual), em MQ estamos interessados apenas em M um operador agindo em V . A aplicação deste operador num vetor jzi é a multiplicação matricial 0 10 1 0 Pn zi x1 yi x1 y1 x1 y2 x1 yn z1 Pi=1 n B B x2 y1 x2 y2 C B C x y z 2 n CB 2 C i=1 zi x2 yi B ^ jzi = (jxi hyj) jzi = B =B M B .. C B C .. . . .. . .. .. A @ .. A @ @ . . Pn . xn y1 xn y2 xn yn zn i=1 zi xn yi 0 1 1 0 1 0 Pn x1 Pi=1 zi yi x1 x1 hyj zi B x2 n zi yi C B x2 hyj zi C B x2 C i=1 C C B C B B =B C = B .. C hzj yi C=B .. .. @ @ @ A A . A . Pn. xn xi i=1 zi yi xn hyj zi = jxi hzj yi (38) A notação de Dirac possui uma forma muito conveniente de expressar o ^ produto externo acima e, ao mesmo tempo, salientar a interpretação de M como um operador: jxi hyj jxi hyj pois, com isso, a aplicação deste produto externo num vetor jzi pode ser simbolicamente calculado como (jxi hyj) jzi (jxi hyj) jzi = jxi hyj jzi jxi hyj zi : Que é exatamente a expressão (38). A de…nição acima, apesar de ser apenas uma mudança de notação, simpli…ca absurdamente a nossa vida. Suponha, por exemplo, que você tenha 2 operadores P^1 = je1 i 1 je1 i = p 2 je2 i ; P^1 = je2 i 1 1 1 ; je2 i = p 2 64 je2 i 1 1 1 C C C A e quer saber qual operador corresponde a composição destes operadores P^ = P^1 P^2 . Na notação matricial temos: 1 2 1 = je2 i je1 i = 2 1 1 = P^1 P^2 = 1 4 1 1 1 = 1 1 2 P^1 = je1 i P^2 P^ 1 1 je2 i = 1 1 1 1 ; 1 1 1 1 1 1 1 1 = 1 4 2 2 2 2 Usando a notação de Dirac, temos P^ = P^1 P^2 = (je1 i he2 j) (je2 i he1 j) = je1 i he2 j e2 i he1 j = je1 i he1 j = 1 2 1 1 1 1 Ou seja, apenas no …nal das contas precisamos usar a forma explicita das matrizes. Além disso, a notação de Dirac nos permite identi…car uma série de propriedades de certos operadores. Vejamos, por exemplo, o seguinte operador ^ = M n X i=1 jei i n X hei j = i=1 jei i hei j onde fjei ig é uma base ortonormal qualquer de um espaço de dimensão n. Assim, qualquer vetor pode ser decomposto em jxi = n X k=1 ck jek i e a aplicação do nosso operador em jxi fornece ^ jxi = M = n X jei i hei j i=1 n X n X i=1 k=1 n X k=1 ck jei i ck jek i = ik = n X k=1 n X n X i=1 k=1 ck jei i hei j ek i ck jek i = jxi para qualquer vetor do nosso espaço. Com isso concluímos que ^ jxi = jxi ; 8 jxi 2 V ) M ^ =I M Onde I é o operador identidade no nosso espaço (numa representação matricial 65 a matriz unitária). O argumento pode também ser facilmente invertido jxi = = n X ck jek i ) ck = hek j xi ) jxi = k=1 n X k=1 ! n X jek i hek j jxi ) k=1 n X k=1 hek j xi jek i = n X k=1 jek i hek j xi jek i hek j = I : Estas manipulações mostram a força da notação de Dirac. A expressão n X jek i hek j = I ; (39) k=1 chama-se resolução da identidade. Entretanto em MQ ocorre também o produto externo de dois vetores e não apenas de um vetor com o dual. Neste caso, para jxi 2 V1 ; jyi dim V1 = 2 e jyi 2 V2 ; dim V2 = 3, temos 0 0 1 1 0 1 y1 x1 y1 0 1 B x1 @ y2 A C B x1 y2 C B C B C y1 B C B C x1 @ y2 A = B 0 y3 1 C = B x1 y3 C jxi jyi jxyi = B C B C x2 y1 B C B x2 y1 C y3 @ x2 @ y2 A A @ x2 y2 A x2 y3 y3 Que, obviamente, não é um operador nem em V1 nem em V2 , mas sim um vetor num novo espaço com dim = 2 3 = 6. Como veremos com detalhes no futuro, este produto descreve um sistema quântico composto de dois subsistemas jxi e jyi (e.g., duas partículas). 6.1.2 Auto-vetores Uma relação entre operadores e vetores que é de especial interesse é quando a aplicação de um operador sobre um vetor resulta num vetor na mesma direção (i.e., proporcional) ao vetor original. Isso é, quando: ^ jxi = a jxi ; a 2 R ; jxi = M 6 0: ^ e que a é o autovalor Neste caso, dizemos que jxi é um autovetor do operador M do autovetor jxi. Por exemplo, se aplicarmos o operador P^ (34) no vetor 0 1 jp1 i = teremos P^ jp1 i = 1 0 0 1 0 1 66 = 0 1 = jp1 i ; Ou seja, o vetor jp1 i é um autovetor de P^ com autovalor 1. Já o vetor jp2 i = 1 0 1 0 ) P^ jp2 i = 0 1 1 0 1 0 = Assim, jp2 i é outro autovetor de P^ , mas com auto valor jp3 i = 1 1 1 0 ) 0 1 1 1 = 1 0 = 1 1 = jp2 i : 1: Já o vetor 6= a jp3 i então, jp3 i não é auto vetor de P^ . Da mesma forma, qualquer vetor é au^ ( ) com autovalor 1, pois tovetor de R ^ ( ) jxi = R 1 0 0 1 x1 x2 = x1 x2 = jxi : ^ ( =2) não possui nenhum autovetor. Além disso, o operador R ^ com autovalor m, Observe que, se jxi é autovetor de M ^ jxi = m jxi ; M o vetor jx0 i = a jxi ; a 2 R ; também será autovetor com o mesmo autovalor ^ jx0 i = M ^ a jxi = aM ^ jxi = am jxi = m (a jxi) = m jx0 i : M Com isso, dizemos que jxi e jx0 i são os mesmos autovetores. Usualmente estaremos interessados em vetores normalizados, assim, teremos apenas um vetor e a constante multiplicativa é determinada no processo de normalização. 6.2 Mudança de base Como vimos anteriormente, a forma explicita das componentes do vetor dependem de qual base escolhemos. Se numa certa base fjei ig um vetor jvi tem componentes X jvi = vi jei i i numa outra base fje0i ig este mesmo vetor terá outras componentes X jvi = vi0 je0i i i Se você escolher uma certa base ortonormal fjei ig, como comparar suas quantidades com as de algém que ecolheu outra base ortonormal fje0i ig? Ou seja, como vi se relaciona com vi0 ? 67 Para saber isso basta lembrar que todos estes vetores fomam uma base do espaço. Assim, podemos escrever X jei i = aij e0j ; j onde, sendo nossa base ortonormal, os coe…cientes desta expanção tem a forma X e0j ei i je0i i aij = e0j ei i =) jei i = j Assim, para um vetor qualquer jvi podemos escrever jvi = X i vi jei i = XX i j vi e0j ei i e0j = X X j i ! vi e0j ei i e0j : (40) Ou seja, se vi são as componentes de jvi na base fjei ig as componentes vi0 deste mesmo vetor na base fje0i ig são X vj0 = vi e0j ei i i As quantidades he0i j ej i também podem ser organizadas numa matriz com linha i e coluna j. Esta matriz é chamada de matriz de mudança da base fjei ig para a base fje0i ig. Vemos assim como é conveniente identi…carmos nossos vetores com matrizes. De forma geral, todas as quantidades com um único índice podem ser vistos como uma matriz coluna de n elementos e qualquer quantidade com dois índices como uma matriz n n. A expressão (40) acima pode ser facilmente obtida se usarmos a resolução da identidade (39) n X e0j e0j = I : j=1 Pois jvi = = X vi jei i = I jvi = i n n XX j=1 i=1 vi e0j n X j=1 e0j e0j n X i=1 vi jei i e0j ei i : Ou seja, a resolução da identidade nos permite mudar de base num espaço vetorial. 68 6.3 Espaço de Hilbert Nosso objetivo aqui é obter uma generalização dos resultados da seção anterior. O primeiro ponto é lembrar que nossos vetores, e os números que multiplicam estes vetores, são todos reais. Assim, a primeira generalização que podemos fazer é dizer que um vetor num espaço de dimensão n é qualquer seqüência de números complexos 1 ; 2 ; :::; n ( i 2 C) e que nossos vetores podem se multiplicados também por números complexo j i+ j i=j i ; ; 2C; com i = i + i : Até aqui nada mudou. O ponto agora é que devemos lembrar que se número complexo, podemos ter 2 é um <0; (e.g., para = i). Isso implica que a somatória do quadrado de números complexo não é uma quantidade positiva de…nida e, consequentemente, a norma de…nida anteriormente pode nos dar valores negativos. Não queremos ter vetores de norma negativa (isso é, na verdade, contra a de…nição do que é uma norma). Podemos resolver este problema lembrando que : 0; 8 2 C onde, além disso, : =0) =0: Assim, podemos recuperar a característica de positividade da nossa norma se, no lugar de (31) de…nirmos o produto interno como h j i= 1 1 + 2 2 + ::: + n n = n X i i ; (41) i=1 com isso temos, novamente, 2 j j =h j i= com n X i i 0 i=0 2 j j = 0 =) j i = 0 : A única diferença neste produto interno é que, no lugar da simetria, temos agora uma simetria conjugada h j i= n X i=0i i i = n X ( i i) i=0 = n X i=0 69 i i ! =h j i: Da mesma forma, no que se refere a representação matricial, continuamos representando nossos vetores por matrizes coluna 0 1 1 B 2 C B C j i=B . C @ .. A n mas, para ser compatível com o produto interno (41), devemos de…nir o dual de j i, não apenas como o transposto, mas como o transposto conjugado h j= 1 2 n : Com a de…nição acima vemos que, para o produto externo entre os vetores, no lugar de T jxi hyj = (jyi hxj) : temos agora T j i h j = (j i h j) : A segunda generalização que vamos fazer é permitir que a dimensão do espaço assuma qualquer valor, incluindo o in…nito. Ou seja, vamos admitir espaços com n = 1. Esta é, na verdade, a motivação deste desenvolvimento. Neste caso, obviamente não podemos mais representar nossos vetores por matrizes. Mas podemos continuar usando todas as expressões anteriores (fazendo n = 1).A grande diferença é que antes, bastava que cada elemento do nosso vetor estivesse bem de…nido (não fosse in…nito) e, certamente, todas as expressões de…nidas também estariam bem de…nidas. Agora, para n = 1, pode acontecer de cada elemento do nosso vetor estar bem de…nido, e mesmo assim não conseguirmos calcular quantidades como, por exemplo, o produto interno. Ou seja, agora precisamos exigir que as somatórias de…nidas anteriormente convirjam. Por exemplo, podemos de…nir as componentes do nosso “vetor” como 1 ; k2N : k 1=2 Cada componente está bem de…nida. Em especial, para n ! 1 xk = x1 = 1 1=2 (1) =0: Entretanto, se desejarmos calcular a norma deste “vetor” teremos7 2 jxj = 7 Lembre 1 1 X X 1 1 1 = 1=2 1=2 k k k k=1 k=1 que diverge para s 1. 1 X 1 ns n=1 70 !1: E não podemos utilizar para estas componentes a noção de norma que é indispensável em todas as nossas análises. Destarte, se quisermos de…nir um espaço vetorial tratável, devemos exigir que os vetores do nosso espaço respeitem a restrição 1 X j kj < 1 : k=1 Ou seja, para nós agora, vetores são todas as seqüência, …nitas e in…nitas, sobre o corpo dos complexos, tal que a soma do módulo quadrado convirja. Um espaço vetorial de dimensão arbitrária (incluindo in…nito) sobre o corpo dos complexos onde (para todo elemento) está de…nido um produto interno, juntamente com uma condição técnica de completeza8 forma um espaço de Hilbert. Todo o desenvolvimento da MQ, é o estudo do espaço de Hilbert. Todos os conceitos desenvolvidos anteriormente, incluindo a noção de ortogonalidade e base, são válidos no EH. A diferença é que agora a nossa base pode conter in…nitos termos. Problem 18 Mas será que, como os casos anteriores, este espaço possui uma base? Para um espaço de dimensão N (…nito) qualquer, podemos sempre construir uma base fjei ig na forma canônica 0 1 0 1 0 1 .. 0 1 B . C B 1 C B 0 C B C B C B C (42) ; jeN i = B 0 C : je1 i = B 0 C ; je2 i = B 0 C ; @ 0 A @ A @ A .. .. 1 . . Sendo cada jei i uma matriz N 1. escrito como: 0 x1 B x2 B jxi = B . @ .. xN Obviamente, qualquer vetor jxi pode ser 1 N C X C xk jek i C= A k=1 Onde, como vimos, as componentes de um vetor qualquer na base canônica são as próprias componentes do vetor. Além disso, esta base é ortonormal hei j ej i = 8 Convergência ij de todas as seqüências de Cauchy j 71 : n lj ! 0. Podemos imaginar uma base do nosso espaço de Hilbert das seqüenciais in…nitas como uma coleção de in…nitos termos na forma (42). Ou seja, 0 1 0 1 0 1 0 0 1 B 1 C B 1 C B 0 C B C B C B C (43) je1 i = B 0 C ; je2 i = B 0 C ; je3 i = B 0 C ; @ A @ A @ A .. .. .. . . . O ponto aqui é que, para qualquer um destes elementos, temos hei j ei i = 1 < 1 =) jei i 2 H ; i = 1; 2; 3; ::: Ou seja, todos os (in…nitos) elementos desta seqüência estão em H. Além disso, qualquer elemento de H pode ser escrito como j i= 1 X k=1 k jek i ; k 2C: Com isso, fjek ig forma uma base do nosso espaço H. Esta base possui in…nitos elementos e, conseqüentemente, nosso espaço tem dimensão in…nita. 6.4 O espaço L2 A generalização da dimensão introduzida anteriormente parece a mais geral que podemos fazer. Isso seria verdade se não existissem vários tipos de in…nito, também chamado de cardinalidade. Este é um assunto bastante complicado da teoria dos conjuntos. Na verdade, a cardinalidade mede o “tamanho” de um conjunto. Mas, como vimos, a dimensão de um espaço está diretamente relacionada com o tamanho (ou o número de elementos) da base. Para um conjunto qualquer podemos considerar duas noções: tamanho do conjunto e o número de elementos deste conjunto. Para qualquer conjunto com um número …nito de elementos estas noções coincidem. Um conjunto com três elementos tem um tamanho, ou cardinalidade, três. Além disso, para conjuntos …nitos, sempre que pegamos uma parte deste conjunto (um subconjunto) este tem um tamanho menor que o original. A comparação entre os tamanhos dos conjuntos está ligada com a idéia de bijeção entre os elementos destes conjuntos. Remark 19 Se podemos criar uma bijeção entre dois conjuntos, então estes conjuntos tem o mesmo tamanho. Assim, o conjunto de 3 frutas tem o mesmo tamanho do conjunto de 3 animais. Esta idéia também é válida para conjuntos com in…nitos termos. Mas, neste caso, a noção de cardinalidade e número de elementos não é mais a mesma. Por exemplo, tomemos o conjunto dos naturais N e o conjunto dos números pares P . Certamente estes conjuntos não têm os mesmos elementos. Em especial o número 1 está no primeiro conjunto e não está no segundo. Mais ainda, qualquer elemento do segundo conjunto está no primeiro,mas o contrário não é verdade. 72 Problem 20 Qual destes conjuntos é maior? Poderíamos então imaginar que o conjunto dos naturais é maior que o conjunto dos números pares. Entretanto, é possível estabelecer uma bijeção entre os naturais e os números pares. Obviamente, dado um número natural n, podemos fácilmente associar a ele o número par p = 2n Mas, além disso, dado um número par p 2 P associamos a ele (de forma unívoca) o natural p n= 2 Ou seja, a cada número inteiro temos um (único) número par associado e vice-versa. Isto mostra que os dois conjuntos têm o mesmo tamanho, ou a mesma cardinalidade. Assim, para conjuntos in…nitos, podemos pegar apenas uma parte deste conjunto e obter um conjunto com o mesmo tamanho. Vejamos um exemplo um pouco mais complicado. Recapitulando, um dos resultados da teoria dos conjuntos é que sempre que for possível estabelecer uma bijeção entre dois conjuntos estes conjuntos têm a mesma cardinalidade. Peguemos, por exemplo, o conjunto dos naturais N, i.e., a seqüência 0 1 1 B 2 C B C B 3 C @ A .. . e a seqüência de um par ordenado de naturais, o produto N N, i.e., as seqüências 1 0 1; 1 1; 2 B . C B 2; 1 2; 1 .. C A @ .. .. . . Problem 21 Qual destes conjuntos é maior? Aparentemente o segundo conjunto tem mais elementos que o primeiro. Entretanto, estes dois conjuntos podem ser mapeados (um-pra-um) através do diagrama de Cantor identi…cando n ! (x; y) ou seja 0 ! (0; 0) ; 1 ! (1; 0) ; 2 ! (0; 1) ; 3 ! (2; 0) ; 4 ! (1; 1) ; 5 ! (0; 2) ; 6 Desta forma, o par ordenado N N tem a mesma cardinalidade de N, ou seja, são do mesmo tamanho e tem o mesmo tipo de in…nito. Como resultado disso, os números racionais Q, que podem ser escritos como a=b, com a; b 2 N e b > 0 tem a mesma cardinalidade dos naturais. 73 ! (3; 0) ::: Figure 10: Figura da Wikipedia Mais ainda, com argumentos semelhantes é possível mostrar que qualquer seqüência …nita de números naturais N N ::: N pode ser mapeado nos naturais N e conseqüentemente, tem a mesma cardinalidade. Esta cardinalidade é chamada de in…nito (pois N é in…nito) contável. Também chamado de @0 (aleph-0). Remark 22 Assim, se os elementos que formam a base de um conjunto tem uma cardinalidade contável (possui uma bijeção com N) dizermos que a dimensão do espaço é contável. Talvez você imagine com isso que todos os conjuntos in…nitos têm a mesma cardinalidade, mas isso não é verdade. Agora, se você considerar o conjunto dos reais, é impossível estabelecer uma relação um-pra-um entre este conjunto e os naturais. Mais precisamente, é possível estabelecer a relação N !R; mas a inversa não R9N: Podemos dizer que, apesar de ambos serem in…nitos, o conjunto dos reais é maior que o dos naturais. Mais ainda, qualquer intervalo …nito da reta real, e.g. [0; 1], tem mais elemento que qualquer seqüência …nita de todos os naturais. Assim, se você …zer um HD de computador capaz de armazenar todos os naturais, este HD pode encher e não registrar os reais (ou mesmo um internalo dos reais). 74 Com isso, os reais são de uma cardinalidade diferente (maior) que os naturais. Dizemos que o conjunto dos reais é um in…nito incontável. Também chamado de @1 (aleph-1). Remark 23 Assim, se não for possível estabelecer uma bijeção entre os elementos da base e N, mas for possível estabelecer entre R, os elementos que formam a base de um conjunto tem uma cardinalidade incontável dizermos que a dimensão do espaço é incontável. Remark 24 Vemos então que todo o desenvolvimento apresentado na seção anterior sobre o espaço de Hilbert diz respeito, na verdade, apena a in…nitos contáveis. Do que foi dito acima, vemos que o nosso espaço H, de…nido anteriormente, tem dimensão in…nita, mas contável. Pois possui uma base com um in…nito contável de elementos fjek ig. A existência de diferentes tipos de in…nito nos leva a crer (o que é verdade) que possam existir também espaços com uma dimensão (e consequentemente uma base) in…nita incontável. Considere agora uma função f (x) sobre os reais num intervalo x 2 [a; b]. Esta função pode ser considerada uma seqüência 1 0 f (x1 ) B f (x2 ) C C B B f (x3 ) C C B C B .. A @ . f (xn ) entretanto, neste caso o índice da nossa seqüência (x) não é um número natural N, mas um número real R. Pois podemos fazer x2 x1 < " para qual valor de ". Assim, entre quaisquer dois elementos existem in…nitos elemento: 0 1 f (x1 ) B C .. B C . B C B f (x1;0001 ) C B C B C .. (44) B C . B C B f (x2 ) C B C B C .. @ A . f (xn ) Este tipo de seqüência é, certamente, diferente da de…nida anteriormente. Mais precisamente, a nossa seqüência, assim como a anterior, possui in…nitos termos, mas esta seqüência possui um in…nito incontável de termos. Assim, aquele HD hipotético capaz de registrar uma seqüência in…nita (xk ), não seria capaz de registrar a função acima.Certamente o procedimento anterior para a construção de uma base canônica falha neste caso. 75 Com isso, não há nenhuma razão para crer que os resultados desenvolvidos na seção anterior sejam válidos para funções sobre os reais. Vamos então tentar construir um espaço vetorial para as nossas funções f . Como uma extensão natural da notação anterior, se queremos um vetor que represente a nossa função f (x) ; x 2 [a; b], podemos chamá-lo de jf i. Ou seja, jf i é a coleção ordenada de todos os valores da função num certo intervalo (a “seqüência” simbólica (44)). Observe que jf i não é a função calculada num ponto, mas uma quantidade abstrata que representa uma coleção in…nita de termos. A soma destas quantidades pode ser de…nido de forma análoga a anterior. Ou seja, a “seqüência” simbólica jwi = jf i + jgi ; ; 2C é de…nida como a coleção ordenada de todos os pontos w (x) = f (x) + g (x) ; x 2 [a; b]. Na construção do nosso espaço, assim como …zemos anteriormente, o primeiro ponto é a construção de um produto interno. Podemos fazer isso apenas generalizando a expressão anterior para o caso de duas “seqüências contínuas” jf i e jgi (todas de…nidas, sempre, no mesmo intervalo) h j i= n X i i i=0 ! hf j gi = Z b f (x) g (x) dx : a Com isso, novamente, garantimos a positividade do produto hf j f i 0 ; hf j f i = 0 =) jf i = 0 ; onde a última igualdade signi…ca f (x) = 0 para x 2 [a; b]. Novamente, para que o nosso produto faça sentido, devemos exigir que hf j f i = Z a b 2 jf (x)j dx < 1 : (45) Ou seja, o nosso espaço é o espaço das funções de quadrado integrável no intervalo [a; b], também chamado L2 (a; b). O fato de que a soma (de…nida acima) de duas funções de quadrado integrável é também ser de quadrado integrável, garante que L2 (a; b) é um espaço vetorial (assim como as nossas seqüências em H). O ponto (e toda a di…culdade do trabalho) é estudar a dimensão deste espaço. Para isso, podemos invocar aqui o resultado de Fourie. Para qualquer função (bem comportada) que respeite (45), de…nida no intervalo [ ; ] existe uma correspondência unívoca entre esta função e a seqüência (contável) f (x) = 1 X xk exp (ikx) k= 1 76 (46) onde Z b 1 xj = p f (x) exp ( ikx) dx (47) 2 a Ou seja, registrar a seqüência contável xj é equivalente a registrar a função (de…nida num intervalo incontável) f (x). Assim, apesar do HD hipotético não poder registrar o valor da função em todos os pontos, ele pode registrar a seqüência fxk g e, com isso, reconstruir a função (exatamente) em todos os pontos. Ou ainda, mesmo estando a função de…nida num contínuo de pontos, não precisamos de um conjunto incontável para especi…car a função. O fato de esta ser de quadrado integrável cria uma relação entre estes pontos, de sorte que eles possam ser especi…cados pelo conjunto menor formado por uma seqüência contável de pontos. Mais ainda, existe uma relação unívoca entre o espaço das funções em L2 (a; b) e o espaço das seqüências contáveis in…nitas. O que mostra que estes dois espaços têm a mesma dimensão. Ou seja, se existir uma base contável para a seqüência fxk g existirá também uma base contável para L2 . Observe que ainda não falamos nada sobre as sequencias acima (em especial, não sabemos se estas seqüências pertencem a um espaço de Hilbert). Ou ainda, existe uma base contável para o espaço L2 (a; b). Além disso, existe um resultado, devido a Parseval, que a…rma Z 1 X 2 jf (x)j dx = x2j j= 1 Ou seja, se a seqüência xj pertence ao nosso espaço de Hilbert H se f 2 L2 . Ou seja, para toda sequencia xk 2 H existe uma função f (x) = 1 X k= 1 xk exp (ikx) ; f 2 L2 e para toda a função f 2 L2 existe uma seqüências Z b 1 f (x) exp ( ikx) dx ; fxk g 2 H : xj = p 2 a Podemos assim considerar L2 (a; b) como um espaço de Hilbert H. E dizer que a função f (x) pertence ao espaço de Hilbert L2 . Observe que as próprias funções 1 p exp ( ikx) 2 pertencem a L2 ( ; ). Assim, se chamarmos estas funçõespde jek i (ou seja, jek i é a coleção de todos os valores da função exp ( ikx) = 2 no intervalo ( ; )), podemos escrever (46) como jf i = 1 X k= 1 77 xk jek i : Observe que hek j ej i = 1 2 Z exp ( i (k j) x) dx = kj : Ou seja, fjek ig é uma base (contável) para o nosso espaço L2 ( ; ) e esta base é ortonormal. Além disso, xk são as componentes de jf i nesta base. Sendo nossa base ortonormal, as componentes de f nesta base são simplesmente a projeção: Z b 1 f (x) exp ( ikx) dx ; (48) xk = hek j f i = p 2 a que são as componentes xk da série de Fourie (47). Estas funções fjek ig são um exemplo de funções ortogonais. Assim, dado um vetor jf i 2 L2 podemos trabalhar com as componentes deste vetor f (x), ou com as componentes xk deste vetor na base fjek ig. Vemos então que todo o ferramental desenvolvido para seqüência de quadrado somável é válido para funções de quadrado integrável. Além disso, as noções de norma p jf j = hf j f i e ortogonalidade hf j gi = 0 podem agora ser estendida para estas funções. Mais ainda, quando valamos agora sobre um vetor j i, podemos estar falando de uma matriz coluna, de uma seqüência in…nita, ou mesmo de uma função. Toda as manipulações formais com j i são idênticas e, apenas quando precisarmos calcular alguma quantidade explicitamente, precisamos especi…car qual dos espaços de Hilbert estamos falando. 6.5 Rigged Hilbert space Para o caso em que o intervalo se torna in…nito [ 1; 1], as nossas funções de base 1 p exp ( ikx) 2 não pertencem mais a H. Entretanto, ainda assim é possível escrever Z 1 1 hek0 j ek i = exp [i (k k 0 ) x] dx (k k 0 ) ; 2 1 E, mais ainda, para qualquer função f (k) bem comportada temos Z 1 (k k 0 ) f (k) dk = f (k 0 ) : 1 78 Mas agora, como tanto k como x são contínuos, podemos também introduzir os “vetores” fjex ig, cujas componentes são 1 ex (k) = p exp ( ikx) = (ek (x)) 2 Da mesma forma que antes temos Z 1 1 hex0 j ex i = exp [i (x0 2 1 com Z 1 (x x) k] dk = (x0 x) x0 ) f (x) dx = f (x0 ) 1 No que segue, mudaremos a notação para jex i jxi ; jek i jki Se para qualquer vetor (este sim um vetor) legitimo jf i 2 L2 ( 1; 1) de…nirmos a quantidade Z 1 jf i = jx0 i hx0 j f i dx0 1 temos hxj f i = Z 1 1 0 Z 0 hxj x i hx j f i dx = 1 1 (x0 x) hx0 j f i dx = f (x) Podemos dizer que a projeção de jf i na direção do “vetor” jxi é exatamente a componente f (x). Da mesma forma, fazendo Z 1 jf i = jk 0 i hk 0 j f i dk 0 1 Lembrando agora que (48) 1 f (k) = hkj f i = p 2 Z b f (x) exp ( ikx) dx ; a é exatamente a componente de Fourie da função f (onde estamos usando f (k) e não xk porque k é contínuo) temos: Z 1 Z 1 0 0 0 hk jf i = hkj k i f (k ) dk = (k 0 k) f (k 0 ) dk 0 = g (k) 1 1 Podemos dizer que a projeção de jf i na direção do “vetor” jki é exatamente a componente f (k). As funções ex (k) e ek (x) acima estão de…nidas no chamado espaço de Hilbert generalizado. Neste espaço podemos tratar os vetores fjxig e fjkig como uma 79 base e dizer que f (x) são as componentes de jf i na base fjxig e f (k) suas componentes na base fjkig. Além disso, pela resolução da identidade temos Z 1 Z 1 0 0 0 jk 0 i hk 0 j dk 0 = I jx i hx j dx = 1 1 temos Z 1 Z 1 jx0 i hx0 j f i dx0 jx i hx j f i dx = I 1 1 Z 1Z 1 jk 0 i hk 0 jx0 i hx0 j f i dk 0 dx0 = jf i = 1 0 0 0 1 da forma explicita das funções temos 1 hkj xi = p exp ( ikx) : 2 é a matriz de mundança da base fjxig para a base fjkig. Podemos assim tratar a transformada de Fourie apenas como uma mudança de base. 6.6 Operadores simétricos, ou hermitianos Como vimos anteriormente, o produto externo de dois vetores j i e j i pode ^ é de…nido como ser visto como um operador. Se um operador M ^ = j ih j ; M ^ + será então, seu hermitiano conjugado (ou o seu adjunto) M ^+ M j ih j : Para o caso do espaço de dimensão …nita, este operador é apenas o transposto ^ , mas a nomenclatura continua para o caso de dimenconjugado da matriz M são in…nita. Neste caso podemos imaginar nossos operadores como matrizes quadradas in…nitas. ^ jxi com o vetor jyi vale O produto interno do vetor jzi = M ^ jxi hyj zi = hyj M ; podemos eliminar o parênteses acordando que o operador sempre age no vetor a direita (o que é equivalente a acordar que o conjugado do operador age no dual ^ + jyi, mas basta convencionar do vetor a esquerda, hyj zi = hwj xi com jwi = M que ele age a direita). Com isso, temos ^ jxi = hy j i h jxi = h jyi hx j i = hx j i h jyi = hxj M ^ + jyi hyj M 80 (49) onde usamos hy j i = h jyi : ^ acima é dito simétrico, ou hermitiano se O operador M ^ =M ^+ ) j ih j = j ih j : M ^ : H ! H podemos de…nir o seu De forma geral, para qualquer operador M + ^ adjunto M : H ! H usando (49) ^ + jyi ; 8x; y 2 H : ^ + : hyj M ^ jxi = hxj M M Assim, para um operador simétrico, ou hermitiano, temos ^ =M ^ + ) hyj M ^ jxi = hxj M ^ jyi ; M (50) ou seja, para espaços de dimensão …nita são matrizes cuja transposto conjugado é igual a ela mesma. Por exemplo, qualquer matriz na forma 0 1 a11 a12 a13 B a12 a22 a23 C B C B a13 a23 a33 C ; aii 2 R ; i = 1; 2; 3:: @ A .. .. .. .. . . . . Propriedades dos operadores hermitianos: Imagine agora que você encontrou um autovetor j i de um operador her^ com autovalor , ou seja, mitiano M ^ j i= M j i ; observe que estamos usando a mesma letra apenas por conveniência, mas enquanto j i 2 H. Com isso, a propriedade acima fornece ^ jyi =) ^ jxi = hxj M hyj M ^ j i = h j j i = h j i = h jM j i = h j j i = h j i : h jM Mas h j i=h j i com isso h j i= h j i como h j i= 6 0 ; h j i < 1, 81 2C temos = ) 2R: Ou seja, todos os autovalores de um operador hermitiano são reais. Na mecânica clássica os estados de um sistema são identi…cados como pontos no chamado espaço de fase. Ou seja, dado um ponto no espaço de fase eu sei tudo sobre o sistema. Já na mecânica quântica estes estados são identi…cados com vetores no espaço de Hilbert. Ou seja, saber qual vetor representa o sistema é saber tudo sobre ele. Além disso, observáveis (quantidade que podem ser medidas) são associadas a operadores agindo neste espaço. Um dos postulados da MQ a…rma que os valores possíveis de se obter numa medida deste observável são (apenas) o autovalor do operador correspondente. Outro postulado a…rma que este operador é hermitiano. O resultado acima mostra que esta exigência é necessária para que valores medidos sejam reais. Exemplo: Num espaço de dimensão 2 o operador ^2 = 0 i i 0 : (em MQ este é um dos operadores associados ao spin das partículas). É hermitiano. Vamos encontrar seus autovalores. O processo geral é o seguinte: Encontrar um autovetor signi…ca resolver a equação ^ j i= M ^ j i) M I j i=0: ^ A quantidade M I é um novo operador. Para um espaço de dimensão …nita, este operador é uma nova matriz. Vamos chamar esta nova matriz de ^ T^ = M I Nossa equação …ca T^ j i = 0 Se T^ é uma matriz inversível, podemos calcular T^ lados da expressão acima T^ 1 T^ j i = T^ 1 1 e multiplicar pelos dois 0)j i=0: ^ não terá Ou seja, se T^ é inversível, o vetor j i é único e vale j i = 0. Assim, M ^ ^ ^ autovetor. Portanto: A única forma de M ter autovetor é que T = M I não tenha inversa. Para que uma matriz não tenha inversa, basta que ^ det T^ = det M Para o nosso caso ^ = ^2 M 82 I =0: Logo devemos exigir que det (^2 I )= 0 i i 0 1 0 0 1 = i i =0; ou seja, 2 ( i:i) = 2 1 = 0 =) 2 = 1 =) = 1: Vemos então que ^2 tem dois autovaloes 1 = 1 e 2 = 1 e, como esperado, ambos são reais. Suponha agora que temos dois autovetores de um operador hermitiano ^ j i= M ^ j i= j i ; M j i com 6= : Para estes vetores podemos calcular ^ j i=h j j i= h jM ^ j i=h j j i= h jM h j i ; h j i além disso, usando (49) temos ^ j i = h jM ^ j i =) h jM onde usamos que ; h j i= h j i= h j i 2 R. Com isso [ Se usarmos agora h j i= 6= ]h j i = 0 : a igualdade acima implica h j i=0: Ou seja, autovetores correspondentes a autovalores distintos são ortogonais. O resultado acima fornece uma forma prática e bastante útil de encontramos bases ortogonais para um espaço qualquer. Bastando, para isso, encontrarmos operadores hermitianos neste espaço. Exemplo: Voltemos a nossa matriz 2 = 0 i i 0 Sendo esta matriz hermitiana, devemos esperar que seus auto vetores sejam ortogonais. Encontremos então estes autovetores. Voltando a equação de autovalores, i 1 ( 2 I) j i = 0 ) =0 i 2 83 sabemos que = 1. Para 1 i = 1 temos i 1 1 i 1 =0) 2 i 1 =0 =0 2 2 Primeiro note que, se multiplicarmos a primeira equação por i 1 2 i temos =0 que é idêntica a segunda equação. Assim, na verdade, temos apenas uma equação e duas incógnitas. Isso nada mais é do que uma conseqüência do fato da matriz 1 i i 1 não possuir inversa (ou ter determinante nulo). Lembre-se que construímos os valores de impondo esta exigência. Assim, usando a única equação que temos i 1 2 =0)i = 1 2 Ou seja, o nosso autovetor tem a forma j +i 1 = i = 1 i 1 1 para qualquer valor 1 2 C. Lembre-se que, se multiplicarmos um autovetor por uma constante ele continua sendo um autovetor (pois apontará na mesma direção). Portanto não há nada de estranho em termos um fator arbitrário. Tudo isso está relacionado com o fato da nossa matriz não ser inversível. Isso é uma característica geral destes problemas. Para um sistema qualquer ^ exigindo de dimensão N , construímos seus autovalores de um operador M ^ que a matriz M I não tenha inversa. Isso faz com que, para estes valores de , tenhamos um sistema de N 1 equações para N incógnitas. Com isso sempre teremos uma parâmetro livre nos nossos autovetores. É a existência deste parâmetro que nos permite normalizar nossos vetores. Ou seja, escolhemos este parâmetro de forma que nossos vetores tenham norma 1. Com isso, o autovetor associado ao autovalor 1 vale + = +1 ; j +i = 1 i 1 : Da mesma forma, encontramos o autovetor associado ao auto-valor 1 i i 1 1 2 =0) 1 i 1 i + 2 2 = 1 =0 : =0 Onde já sabemos que podemos usar apenas uma destas equações. Assim, usando a segunda equação, i 1+ 2=0) i 1= 2 84 Ou seja, o autovetor associado ao auto-valor = Como vimos, uma vez que sejam ortogonais. De fato h +j i= + 1 ;j 6= 1 1 i= = 1 vale 1 i 1 : devemos esperar que os vetores j i 1 i 1 =j 2 1j (1 iej +i 1) = 0 : Assim, fj + i ; j ig formam uma base ortogonal do nosso espaço. Podemos ainda normalizar esta base fazendo je i = p h j 1 = p ei 2 j i i 1 i = 1 p j 1j 1 + 1 ; 1 =p 2j 1 i 1 1 1j 1 i 2 R: Ou seja, a nossa normalização também está de…nida a menos de uma constante. Como veremos, os princípios da MQ nos permitem …xar arbitrariamente esta constante. Escolhendo o caso mais simples = 0 temos 1 je i = p 2 1 i : Da mesma forma, podemos de…nir o vetor normalizado 1 je+ i = p 2 1 i estes vetores respeitam he+ j e i = 0 ; he+ j e+ i = he j e i = 1 e, consequentemente, formam uma base ortonormal do nosso espaço. Este resultado é geral. Para um espaço de Hilbert H de dimensão N qual^ neste espaço, os autoquer, inclusive in…nito, dado um operador hermitiano M vetores deste operador formam uma base deste espaço. Assim, qualquer vetor j i 2 H pode ser escrito como j i= N X ck j = k k=1 ki onde ^j M ki 85 j ki : Os resultados anteriores nos permitem também veri…car diretamente a relação de completeza. Calculando 1 2 1 je+ i he+ j = 2 je i he j = 1 i 1 i 1 1 i i = = 1 2 1 i i 1 1 2 1 i 1 i i 1 i 1 ; ; temos je i he j + je+ i he+ j = 6.7 1 2 1 i i 1 + = 1 0 0 1 : Operadores diferenciais Recapitulando os resultados do exemplo anterior: ao resolvermos o problema de autovetores para o operador 2 2 R2 obtivemos dois vetores ortogonais num espaço de duas dimensões. Um resultado que vamos usar sem provar, pois isso consumiria um tempo razoável, é: Remark 25 Dado um operador hermitiano (não degenerado) num espaço de Hilbert de dimensão N , este operador possui N autovetores (que, como sabemos, são ortogonais). Consequente, a coleção de todos os autovetores de um operador hermitiano forma uma base para o espaço de dimensão arbitrária N . Esta é uma forma bastante prática para construir bases para espaços e é exatamente o que vamos usar para construir nossas funções ortogonais. Para qualquer espaço de dimensão …nita o procedimento anterior para encontrar os autovetores pode ser aplicado (obviamente com uma di…culdade algébrica crescente). Mas e quando N = 1? Como resolver um sistema de in…nitas equações? Primeiramente, vamos analisar melhor o tipo de operadores que podem surgir em espaços de dimensão in…nita. Como vimos a correspondência Z X 1 f (x) exp ( ikx) dx jf i = ck jek i ; ck = hf j ek i = 2 k para funções L2 permite tratar a função (de…nida num intervalo contínuo), como a seqüência discreta ck . Lembre que, uma vez de…nida uma base, podemos pensar nos operadores como atuando, não diretamente nos vetores, mas nos elementos da base. Ou ^ agindo em H dado pelo produto esterno seja, para um operador D ^ = j ih j ; D e cada um destes vetores possui uma decomposição na base escolhida X X j i= i jei i ; j i = i jei i i i 86 signi…ca que nosso operador, nesta mesma base, possui a decomposição X ^ = D Dmn jem i hen j mn onde Dmn = m n : A ação deste operador num vetor j i pode ser escrito como X X X X ^ j i= Dmn jem i hen j Dmn i jei i ) D j i = i jei i = i mn mn i ^ j i tem componentes Ou seja, o novo vetor j i = D X X j i= Din i jei i ; i = n n jem i : (51) : n i ^ em H como a atuação da Podemos assim pensar na atuação do operador D matriz Dnm nas componentes do vetor numa determinada base ortonormal e ^ j i como calcular D X Din n ; n que nada mais é que o produto da matriz quadrada D pela matriz coluna . Lembre que, apesar de estarmos usando a mesma letra, j i e são quantidades diferentes. O vetor 0 1 x1 B C j i = @ x2 A .. . representa uma seqüência xk que independe da base, enquanto as componentes k dependem da base. Assim, se vamos trabalhar com o produto matricial D devemos lembrar que todas estas quantidades (diferente de xk ) dependem da base. O ponto da explicação acima é que operadores atuando em vetores podem ser vistos, uma vez …xada uma base, como matrizes atuando nas componentes do vetor nesta base. Isso implica que: ^ agindo no espaço das funções, existe uma matriz D A cada operador D (in…nita) agindo no espaço das seqüências in…nitas que de…nem as componentes do vetor jf i 2 L2 . Assim como podemos tratar tanto as seqüência como as ^ : L2 ! L2 quanto com D : C1 ! C1 funções, podemos trabalhar tanto com D dependendo da conveniência. Mais ainda, a cada operador agindo em C1 , ou seja, uma matriz quadrada in…nita, corresponde um operador agindo em L2 . Voltemos para a nossa base fjek ig com componentes 1 ek (x) = p exp (ikx) 2 87 e, para os coe…cientes ck da nosso função f de…nidos nesta base (i.e., os coe…cientes da série de Fourie) X jf i = ck jek i ; (52) n vamos estudar a ação do seguinte operador 0 .. .. .. .. .. .. . . . . . B . B i:2 0 0 0 0 B B 0 i:1 0 0 0 B 0 0 0 0 0 D=B B B 0 0 0 i:1 0 B B 0 0 0 0 i:2 @ .. .. .. .. .. .. . . . . . . 1 . C C C C C C= C C C C A .. . .. mn (in) : Ou seja, a matriz diagonal onde a k-ésima componente é a multiplicação de i pór k. Lembre-se que, pela de…nição da soma de nossos vetores em L2 o vetor jf i (52) tem componentes 1 X f (x) = p ck exp (ikx) : 2 n ^ atuando em jf i cuja ação é o Pelo que vimos acima, existe um operador D produto da matriz acima com as suas componentes, ou seja, a aplicação deste operador no vetor jf i fornece (51) X X ^ jf i = jf i = ck jek i =) D Dmn cn jem i mn k Lembrando agora que, no nosso caso, Dmn = i temos ^ jf i = D jgi X i mn ncn mn mn n jem i = X n incn jen i : ^ jf i valem Ou seja, as componentes do vetor jgi = D X g (x) = incn exp (inx) : n Mas estas componentes também podem ser escritas como g (x) = X n cn d d X d exp (inx) = cn exp (inx) = f (x) dx dx n dx 88 Assim, as componentes do novo vetor jgi são as derivadas das compo^ associando a matriz D nentes de jf i. Podemos então identi…car o operador D com o operador diferencial d=dx agindo nas componentes do vetor jf i, ou ainda, como um operador diferencial ^ = d D dx agindo no espaço das funções de quadrado integrável. Da mesma forma, podemos construir operadores que correspondem à diferenciais de ordem mais alta. Assim, um tipo bastante especial de operadores que agem em L2 são operadores diferenciais. Cabe aqui uma observação sobre a MQ. O exposto acima nos diz que a igualdade X ck jek i ; jf i 2 L2 (a; b) : jf i = k nos da a liberdade de trabalhar tanto no lado esquerdo, i.e., operadores diferenciais agindo no espaço das funções, quanto no direito, i.e., matrizes agindo em seqüência contáveis. Nos primórdios da MQ havia duas teorias quânticas aparentemente independentes. A teoria de Schroedinger, baseada numa equação diferencial, e a teoria de Heisenberg, baseada na álgebra de matrizes. Grosso modo, podemos dizer que estas duas teorias são as mesmas (ou equivalentes). Apenas que a teoria de Schroedinger trabalha no lado esquerdo da igualdade acima (i.e., no espaço L2 ), enquanto a teoria de Heisenberg trabalha no lado esquerdo (i.e., no espaço R1 ). Dizemos que é a mesma teoria utilizando uma representação diferente do espaço de Hilbert. ^ é um operador em L2 este se relaciona Da mesma forma que em R1 , se M com seu adjunto pela relação (49) ^ + jf i ; ^ jgi = hf j j i h j jgi = h jf i hg j i = hg j i h jf i = hgj M hf j M ou, explicitando o produto interno, ^ jgi = hf j M ^ + jf i = hgj M Z b a Z a b i h ^ g (x) dx f (x) M h i ^ + f (x) dx g (x) M ^ jgi = hgj M ^ + jf i Usando a igualdade hf j M Z a b Z h i ^ g (x) dx = f (x) M a b Z h i ^ + f (x) dx = g (x) M a b Z h i ^ + f (x) dx = g (x) M A relação acima de…ne o adjunto dos operadores agindo em L2 . Em especial, para operadores hermitianos, temos a relação (47) ^ jgi = hgj M ^ jf i : hf j M 89 a b (53) h i ^ + f (x) g (x) dx M que fornece Z a b Z h i ^ g (x) dx = f (x) M b a h i ^ f (x) g (x) dx ; M ^ no espaço das funções a igualdade acima permite assim, dado um operador M veri…car se este operador é (ou não) hermitiano. Exemplo: vamos veri…car se o operador ^ = d D dx agindo em L2 (a; b) é hermitiano. Para isso calculamos ^ jgi = hf j D Z b a Z i h ^ (x) dx = f (x) Dg b dg dx f a dx : Usando agora uma integração por partes temos Z b a f dg dx dx = f g b a Z a b df g dx dx Ou ainda, se observamos que df df = dx dx temos Z a b h i ^ f Dg dx = f g b a Z b a h Z i ^ g dx 6= Df a b h i ^ g dx Df Ou seja, nosso operador não é simétrico em L2 (a; b). Mais ainda, para o caso de operadores de dimensão in…nita, não basta termos a forma do operador, mas precisamos também …xar certas características nas nossas funções. b Observe que, graças ao termo de fronteira f g a , devemos esperar que nenhum operador diferencial seja hermitiano em L2 (a; b). Entretanto, podemos tentar contornar este problema. Uma vez que nosso operador não é simétrico em todo o espaço L2 (a; b), podemos tentar encontrar um sub-espaço de L2 onde (talvez) ele seja simétrico. Vamos, por exemplo, de…nir o subespaço das funções que valem zero nas extremidades. Ou seja, nosso espaço não é todo o espaço L2 , mas: L2 (a; b) L02 (a; b) g; g 0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c: Onde estamos exigindo 1. as funções pertençam a L2 (a; b), obviamente; 90 2. a derivada das funções também pertençam a L2 (a; b). Isso é necessário porque nosso operador é uma diferencial e, para que este seja um operador no nosso espaço, ele deve levar funções do espaço em outras funções do ^ 2 L2 (a; b). Esta exigência deve ser ampliada mesmo espaço. Ou seja, Df quando tratamos de operadores diferenciais de ordem mais alta. 3. as funções sejam nulas nas extremidades, f (a) = f (b) = 0. Isso é necessário (na nossa esperança de simetrizar o operador) para eliminar o termo de fronteira da integração por partes; 4. Finalmente, as funções devem ser absolutamente contínuas (a:c:). Este é um detalhe técnico intrincado, mas podemos simpli…cá-lo dizendo que, grosso-modo, funções absolutamente contínuas são aquelas que podem ser integradas por partes. Isso certamente é válido para todas as funções bem comportadas que vamos trabalhar. Ou seja, esta teoria vale também para funções que não sejam in…nitamente diferenciáveis e que possuem certas descontinuidades em suas derivadas. Mas isso é muito mais do que precisamos. Neste espaço L02 (a; b) temos Z b h Z i 0 ^ f D g dx = a a b h Z i 0 ^ D f g dx 6= a b h i ^ 0 f g dx D Onde colocamos uma linha no operador para indicar que este age no espaço L0 . Mas, ainda assim, nosso operador não é hermitiano. Mais ainda, podemos escrever a relação acima como Z b h Z bh i i 0 ^ ^ 0 f g dx f D g dx = D a a lembrando da relação (53) temos Z b Z h i ^ 0 g (x) dx = f (x) D a b a comparando as duas relações acima temos ^ 0+ = D h i ^ 0+ f (x) g (x) dx D ^0 : D (54) Entretanto, tudo isso era de se esperar, pois se olharmos para a matriz relacionada com este operado 0 B B B D=B B B @ .. . .. . .. .. .. . . . i2 0 0 0 0 0 0 0 i2 .. .. .. . . . 91 1 . C C C C C C A .. . .. vemos que os elementos diagonais desta matriz não são reais. Além disso, se tirarmos o transposto conjudado desta matriz temos 1 0 .. .. .. .. .. . C . B . . . C B i2 0 0 C B T C= D B 0 0 0 D =B C C B 0 0 i2 A @ . . .. .. .. . .. .. . . que nada mais é que a relação (54). O exemplo acima mostra que, se quisermos um operador hermitiano, devemos partir de uma matriz hermitiana. Partamos então da matriz 1 0 .. .. .. .. .. . . .. . . . . . . . C B C B 2 0 0 0 0 C B C B 0 1 0 0 0 C B C ; B 0 0 0 0 0 D2 = B C C B 0 0 0 1 0 C B C B 0 0 0 0 2 A @ .. .. .. .. .. . . .. . . . . . . . que pode ser hermitiana ao agir sobre certas seqüência. Observe que D2 = iD ; o que, obviamente, fornece ^ 2 = iD ^ =i d : D dx Vamos então calcular novamente Z b Z h i ^ ^ hf j D2 jgi = f (x) D2 g (x) dx = a b a f i dg dx Usando novamente uma integração por partes temos Z b Z b dg df b f i dx = i f g a i g dx dx dx a a Observe agora que i pois { = df df =i = dx dx i. Com isso temos Z b dg f i dx a dx = i f g 92 b a i + Z a df ; dx b i df g dx dx dx ^0 Novamente, para eliminarmos o termo de fronteira, de…nimos o operador D 2 02 que atua no espaço L (a; b) de…nido anteriormente, com isso Z b Z b d d f i g dx = i f g dx dx dx a a que pode ser escrito como Z b h Z i ^ 20 g dx = f D a Ou seja, o operador 6.8 ^0 D 2 a b h i ^ 0 f g dx D 2 é hermitiano. Domínio dos operadores Um ponto extremamente importante no que foi exposto acima é que o operador ^ 2 , que age em L2 , não é hermitiano, mas já o operador D ^ 0 , que age em D 2 L02 (a; b) g; g 0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c: é hermitiano. Certamente um operador que é hermitiano é diferente de um operador que ^ 2 é diferente de D ^ 0 . Assim, apesar destes dois não é hermitiano, ou seja, D 2 operadores terem a mesma forma d dx ou seja, atuam da mesma maneira, eles atuam em espaços diferentes e, conseqüentemente, são operadores diferentes. O espaço de atuação de um operador é também chamado de domínio deste ^ por D D ^ , ou seja operados. Indicamos o domínio de D i ^ 0 = g; g 0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c: D D 2 Assim: Remark 26 Em espaços de dimensão in…nita, um operador não é apenas uma regra de atuação mas também a especi…cação do domínio onde esta atuação é válida. A mesma regra, para domínios diferentes, especi…ca operadores diferentes. A especi…cação deste domínio não apenas traduz as características físicas do sistema na descrição quântica, mas também in‡uencia nos resultados teóricos esperados. Na prática as características do nosso operador, como ser ou não hermitiano, depende da …xação das condições de fronteira do problema. Além disso, para o caso de funções com singularidades, depende da especi…cação do comportamento destas funções nas fronteiras dos pontos de singularidade. Além disso, como veremos no futuro, estas condições de fronteira estão diretamente ligadas com propriedades físicas do sistema. 93 6.9 Operadores auto-adjuntos Voltemos nossa atenção agora para o operador adjunto. Ou seja, qual o domínio ^ + para que D ^ 2 seja hermitiano? do operador adjunto D 2 ^ pode ser de…nido pela expressão Como vimos, o adjunto de um operador M (53) Z b Z bh i h i + ^ ^ g (x) dx ; 8g 2 D M ^ ;f 2 D M ^+ ; M f (x) g (x) dx f (x) M a a ^ agem em g, i.e., g 2 D M ^ , enquanto onde devemos notar que o operador M ^ + age em f , i.e., f 2 D M ^ + . A pergunta acima pode ser o operador M ^ ) no qual M ^ é formulada da seguinte forma: Uma vez …xado um domínio D(M + ^ simétrico, qual o domínio de M que não quebra esta simetria? ^ 0 sabemos que Para o nosso operador D 2 ^ 20 = g; g 0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c: D D E quais podem ser as funções f para que a relação Z bh Z b h Z i i 0 0 ^ ^ f D2 g dx = D2 f g dx = a a a b h : (55) i ^ 0+ f g dx D 2 ^ 0 no lado direito da igualdade é, na verdade, o se mantenha (lembrando que D 2 ^ 0 ). Voltemos para a forma completa da integral por partes adjunto de D 2 Z b h Z bh i i ^ 0 g dx = i f g b + ^ 0 f g dx f D D 2 2 a a = Z a b h i a ^ 0 f g dx + i f (b) g (b) D 2 f (a) g (a) Para que nosso operador seja simétrico, basta que o último termo se anule. Então, a nossa pergunta se torna: quais podem ser as funções f para que o último termo se anule? ^0 Lembrando que, pela de…nição do domínio (55) de D 2 Z b h Z bh Z i i ^ 0 g dx = ^ 0 f g dx + i f (b) :0 f (a) :0 = f D D 2 2 a a a b h i ^ 0 f g dx ; D 2 para qualquer valor …nito de f (b) e f (a) e, consequentemente, para qualquer ^ + não precisam se valor de f (b) e f (a). Ou seja, as funções f onde age D 2 2 anular nas fronteiras. Ou ainda, além de serem L não precisamos colocar ^ +0 , para mais nenhuma restrição nestas funções. Assim, o domínio de D 2 ^ 2 seja hermitiano vale que D ^ +0 = f; f 0 2 L2 (a; b) ; a:c: D D 2 94 : Vemos explicitamente que ^ +0 6= D D ^ 20 D D 2 ; ou seja, apesar de terem a mesma forma ^ +0 = i d ^ 20 = i d ; D D 2 dx dx ^0 e D ^ +0 são operadores difer(pois o operador é simétrico) os operadores D 2 2 entes. Este ponto pode parecer uma tecnicalidade, mas será importante no futuro. ^ 2 que não é hermiNo procedimento acima, partimos de um operador D ^ 0 (que tem a mesma forma de D ^ 2 , mas tiano e de…nimos um novo operador D 2 ^ 2 . Feito atua num espaço diferente) que é, fazendo uma restrição no domínio de D ^ +0 que não quebre esta simetria. isso, podemos obter o domínio do adjunto D 2 Além disso, como veremos no futuro, a especi…cação do domínio do operador (ou das condições de fronteira) é como introduzimos as características físicas do nosso problema na descrição quântica. ^ para os quais Operadores hermitianos M ^ =D M ^+ D M são chamados de operadores auto-adjuntos. Ou seja, todo operador auto-adjunto é hermitiano, mas o contrário não é verdade. 6.10 Operadores lineares Como vimos, um tipo de operador que age em nosso espaço L2 são operadores diferenciais. Da forma mais geral possível, um operador diferencial linear, agindo no espaço das funções de quadrado integrável tem a forma tem a forma 2 ^ = a0 (x) + a1 (x) d + a2 (x) d + ::: L dx dx2 m n X d = an (x) n dx n=0 (56) onde m é chamado a ordem do operador. Estes operadores são lineares ^ (c1 L 1 + c2 2) ^ = c1 L 1 ^ + c2 L 2 ; c1 ; c2 2 C ^ i 2 L2 . se exigirmos que L Obviamente nem todas as funções em L2 possuem sua derivada de ordem m em L2 , além disso, como vimos no exemplo anterior, condições de contorno (ou considerações físicas) podem impor certas restrições nas funções nas fronteiras, i.e., …xar o valor de (a) e (b). Assim, geralmente, um operador não atua em todo L2 , mas sim num subconjunto D (L) L2 . 95 ^ devemos sempre informar sua Remark 27 Para especi…carmos um operador L expressão diferencial (56) e seu domínio de atuação. Uma equação diferencia linear tem a forma ^ = f (x) : L O caso com f 0 é chamado de equação homogênea. Pela condição de linearidade, vemos que, se 1 e 2 são soluções da equação ^ então qualquer combinação c1 1 + c2 2 também homogênea para o operador L ^ De forma mais geral, uma combinação será solução da equação homogênea de L. arbitrária de soluções da equação homogênea também é uma solução. Este é o princípio da superposição. ^ chamado de L ^ + , é de…nido O hermitiano conjugado de um operador L, através do produto interno e através da expressão (??) h ^+ 2j L j 1i ^ =h 1j L j 2i ; ^ de…nimos o seu conjugado pela expressão ou seja, dado um operador L Z Z b [L+ 1 (x)] (x) dx 2 a b a h ^ (x) L 1 2 i (x) dx : Exemplo: Se ^= d L dx e D (L) são as funções 2 L2 (a; b) com 0 2 L2 e (a) = (b) = 0 encontre ^ + . Este é o mesmo exemplo que resolvemos acima. Pela de…nição temos L h ^ 1j L j 2i = Z a b h ^ 1 (x) L Z i (x) dx = 2 b 1 (x) a d dx 2 (x) dx se nossas funções são absolutamente contínuas, i.e., podem ser integradas por partes, temos Z b 1 (x) a d dx 2 (x) dx = [ = 1 (x) Z a b b 2 (x)]a d dx 1 (x) Z b a [ 2 d dx 1 (x) [ (x)] dx = Z a assim ^+ = L 2 b (x)] dx h ^+ L 1 i (x) 2 (x) dx d dx ^ + . Para de…nirmos completamente este operador Esta é a forma diferencial de L precisamos ainda especi…car D (L+ ). Exemplo: O operador ^=c; c2C L 96 Novamente h ^+ 2j L j 1i Z = h b a Z = b ^+ L 1 i (x) 1 (x) [c 2 2 (x) dx h ^ 1j L j 2i (x)] dx a Z = b [c a Z = h b a 1 ^+ L (x)] 2 (x) dx i (x) 1 2 (x) dx ; assim ^+ = c : L ^ + pode ser todos o espaço L2 (e, é claro, a restrição A princípio o domínio de L + 2 ^ ^ L 2 L ). Entretanto, podemos impor certas característica no operador L (e.g., hermiticidade) que, para serem mantidas, restringem também o domínio ^+. de L Exemplo: Como vimos anteriormente, o operador ^=i d ; D L ^ = L dx 0 ; 2 L2 (a; b) ; (a) = (b) = 0; a:c: é hermitiano, mas não é auto-adjunto. Pois ^ + = f; f 0 2 L2 (a; b) ; a:c: 6= D L ^ D L : Vamos agora de…nir o operador ^c = i d ; D L ^c = L dx ; 0 2 L2 (a; b) ; a:c: ; Usando o procedimento usual temos E D ^ c 2 = [ 1 (x) 2 (x)]b + L ^ h 1j L a = 1 (b) = [ 1 (b) D ^c 1 6= L 2 1 (a) = c (b) 2i D ^ (a) + L D ^ 1 c 1 (a)] 2 (b) + L (b) 1 (a) 2 ; c2C 1 2i 2i 2i ^+ Para tentar simetrizar este operador, vamos tentar de…nir o domínio de D L como ^+ = D L c ; 0 2 L2 (a; b) ; a:c: ; 97 ^ (a) = c (b) = D L com isso, h 1j ^ L 2 E D ^ 1 2i (b) + L D ^ 1 2i = [ 1 (b) cc 1 (b)] 2 (b) + L D ^ 1 2i = [1 cc ] 1 (b) 2 (b) + L h i D 2 ^ = 1 jcj 2i 1 (b) 2 (b) + L 1 =[ 1 (b) c 1 (a)] 2 Vemos então que nosso operador será simétrico se (e somente se) 2 jcj = 1 =) c = ei ; 2R: ou seja, se de…nirmos o operador ^ =i d ; D L ^ L dx = ; 0 2 L2 (a; b) ; a:c: ; (a) = ei (b) ; 2R: ^ , diferente de L, ^ é um operador auto-adjunto. Assim, o novo operador L A fase , apesar de não possuir um análogo clássico (i.e., não é possível especi…car esta fase apenas olhando o sistema clássico), pode in‡uenciar nos resultados esperados (e.g., níveis de energia) para certos potenciais. Assim, para estes potenciais esta fase pode ser determinada experimentalmente através da medido do espectro de energia do sistema. ^ + é maior que Dos exemplos acima vemos que, no primeiro caso o D L ^+ ^ ,D L oD L ^+ ^ , enquanto no segundo caso D L D L ^ . É =D L ^ ^ + , i.e., o domínio de L ^ nunca é maior que possível provar que D L D L ^ + . O que …zemos no segundo exemplo foi restringir o domínio o domínio de L ^ + , que chamamos de D L ^ + . Obviamente D L+ de L D (L+ ). Assim, se D (L+ ) 6= D (L), como no primeiro exemplo, as vezes (mais nem sempre) é possível reduzir o domínio do adjunto de forma que o novo operador seja auto-adjunto. Vemos assim que todo operador auto-adjunto é, por de…nição, hermitiano, mas o contrário não é verdade. Esta diferença, que a primeira vista parece uma tecnicalidade, possui importantes conseqüências tanto matemáticas quanto físicas. 7 Postulados da Mecânica Quântica A MQ pode ser construída através de algumas regras ou postulados. Como um primeiro postulado temos: 98 Remark 28 O estado de um sistema físico é completamente descrito por um vetor (normalizado) no espaço de Hilbert j i2H : E vetores que di…ram apenas por uma fase representam o mesmo estado físico. Sabendo-se agora qual vetor representa o sistema, sabemos todas as características físicas deste sistema. Neste momento não podemos falar muito sobre este postulado, mas voltaremos a isso no futuro. Contudo, precisamos começar por ele uma vez que todo o desenvolvimento depende desta associação. Uma vez preparado um sistema no laboratório, este sistema “será”um vetor no espaço de Hilbert. Precisamos agora saber como descrever (dentro da teoria) a manipulação, a evolução temporal e as possíveis medidas que fazemos neste sistema. Quando um sistema no estado j i sofre qualquer tipo de modi…cação ele passa a ser descrito por um novo vetor j 0 i. Ou seja (qualquer) modi…cações no sistema são transições j i ! j 0i Estas transições podem ser descritas por operadores agindo em H, ^j i j 0i = M Assim, tudo que acontece com o sistema pode ser representado por um operador agindo em H. Um tipo muito especial destes operadores são exatamente as medidas que podemos fazer no sistema (e.g., sua energia), ou seja, tudo o que podemos observar do sistema. Estas quantidades são chamadas de observáveis. Outro postulado da MQ a…rma que : Remark 29 A todas quantidades clássicas mensuráveis (e.g., H) estão associ^ agindo nos vetores de H: H ! H ^ . ados operadores auto-adjuntos (H) Para sistemas de dimensão …nita podemos de…nir os observáveis como operadores hermitianos. Assim, na maior parte do que segue pense neste observáveis como matrizes simétricas. Para entendermos melhor este postulado, precisamos ainda de um terceiro postulado. (Valores são auto-valores) ^ é um operador (hermitiano) relacionado com um observável m (i.e., Se M m é o valor que o aparelho que mede esta quantidade pode marcar), e se no laboratório efetuarmos uma medida deste observável os únicos valores pos^ (ou seja, o valor m síveis de se obter são os auto-valores do operador M ^ ). Ou seja: marcado no aparelho é necessáriamente um autovalor de M 99 ^ pode fornecer apenas autovalores Remark 30 Uma medida do observável M deste operador e, logo após uma medida em que se obteve o valor mn o sistema estará no estado j n i. ^ é o operador que representa a energia do sistema, sabemos que Assim, se H este operador possui uma série de auto-vetores e auto-valores. ^j H ni = En j ni O que o postulado acima sobre os autovalores nos diz é que, numa medida da energia do sistema, podemos obter apenas um dos valores En acima. 7.1 Interpretação probabilística Problem 31 Mas qual é a física por trás de toda esta descrição matemática? Esta física está descrita pela chamada interpretação probabilística. A qual a…rma que: Se um sistema se encontra num determinado estado, dado por um vetor j i, a probabilidade de que este sistema seja encontrado num estado j i é dado por: ( P N ; j i ; j i 2 RN 2 R b i=1 i i jh j ij = : (x) (x) dx ; j i ; j i 2 L2 (a; b) a Problem 32 Mas o que signi…ca o sistema estar num estado e ser encontrado em outro? Este é o ponto principal de tudo que …zemos até aqui e a maior diferença ^ entre a teoria clássica e quântica. Lembre-se que um operador hermitiano H possui um conjunto de autovetores e autovalores reais ^j H ni = En j ni ; En 2 R : Além disso, o conjunto de seus auto-vetores formam uma base do espaço H. Isso signi…ca que qualquer vetor j i pode ser escrito como j i= N X i=1 cn j ni ; cn 2 C : Podemos também fazer a a…rmação inversa e dizer que a todo vetor temos associado um estado físico. Assim, por exemplo, imagine que o sistema está num estado j i cuja decomposição é dada por j i = c1 j 1i + c2 j 2i Este é um vetor especí…co e algum estado especí…co do sistema. 100 Problem 33 Qual a energia deste estado? Pelo postulado sobre a medida e os autovalores, sabemos que, numa medida da energia do sistema, podemos obter apenas os valores En . Isso é geral. Para sabermos o que iremos obter numa medida do estado j i acima, lembramos que, logo após uma medida, o sistema se encontra no auto-estado do auto-valor correspondente. Assim, podemos fazer a pergunta: qual a probabilidade P (E1 ) de, numa medida da energia, obtermos o valor E1 . Neste caso, logo após a medida, o sistema se encontrará no estado (observe que a medida modi…cou o sistema9 ) j 1 i. Assim, pela interpretação probabilística, a resposta a nossa pergunta vale: P (E1 ) = jh 2 1j ij : Para cálcular efetivamente este valor, lembramos que os auto-estados de um operador hermitiano são ortogonais (i.e., eles formam uma base ortonormal) h 1j i = h 1 j (c1 j = c1 1i + c2 j 2 i) e a quantidade procurada vale P (E1 ) = jh 1j 2 2 ij = jc1 j : Assim, o módulo quadrado do coe…ciente da expansão de um vetor numa certa base de um observável é a probabilidade de se obter o autovalor correspondente na medida deste observável. Da mesma forma a quantidade h ^ 2j A j 1i 2 (57) (i.e., o módulo quadrado do produto interno de dois vetores no espaço de Hilbert), deve ser interpretado como a probabilidade de um sistema que se encontrava inicialmente no estado j 1 i, mudar para o estado …nal j 1 i após a ^ ação do operador A. Remark 34 Um ponto importante é que esta descrição probabilística não é uma ignorância nossa sobre o sistema (como ocorre na teoria clássica), mas uma característica intrínseca do sistema. Por exemplo, classicamente você pode produzir uma partícula e, por uma ignorância no processo de construção, você não sabe exatamente qual a energia desta partícula. Assim, usando uma certa descrição clássica (por exemplo, usando o ferramental da mecânica estatística) você é capaz de fazer uma previsão desta energia e calcular qual a probabilidade da partícula ter energia E1 . Mas então você faz uma 9 Dizemos assim que o sistema que estava numa superposição de ondas (ou num pacote de ondas) colapsou para uma das ondas do pacote. Este efeito é chamado de colapso da função de onda. 101 medida da energia e obtém (porque é tudo uma probabilidade) uma energia E2 . Suponha agora que você seja capaz de produzir com este mesmo equipamento, exatamente sobre as mesmas condições (o que é possível em teoria), uma segunda partícula idêntica a primeira (ou você construiu dois equipamentos exatamente iguais). Neste caso, dentro das condições ideais colocadas, pelo resultado da primeira partícula você sabe que, para esta segunda, P (E1 ) = 0 e que, numa medida da energia, você obterá certamente o valor E2 . Quanticamente isso não é necessariamente verdade. Se você produzir duas partículas idênticas no estado j i acima (e isso é possível!) e efetuar uma medida da energia destas duas partículas você poderá obter valores diferentes com probabil2 2 idade P (E1 ) = jc1 j e P (E2 ) = jc2 j . Remark 35 Outro ponto a se notar é que sob certas condições (como vimos no átomo de Bohr) observáveis como energia podem assumir apenas valores discretos. Não existe nenhum análogo clássico para este comportamento. 7.2 Conseqüências físicas do primeiro postulado Pela de…nição de probabilidade, sabemos que se P (E1 ) e a probabilidade de numa medida do observável obtermos o valor E1 e P (E2 ) de se obter o valor E2 . Então a probabilidade de se obter E1 ou E2 vale P (E1 jE2 ) = P (E1 ) + P (E2 ) : Assim, a quantidade N X i=1 2 jcn j ; é a probabilidade de se obter qualquer valor possível, ou ainda a probabilidade do sistema ser encontrado em um estado qualquer, conseqüentemente, N X i=1 2 jcn j = 1 : Que, como você deve se lembrar, signi…ca que as própria seqüências cn possíveis formam um espaço de Hilbert. Outra forma de dizer a mesma coisa acima é exigir que o estado esteja normalizado 2 jh j ij = 1 : Que pode ser lida como: se sabemos que o sistema está no estado j i a probabilidade dele ser encontrado neste estado é 100%. Observe que, para todo estado quântico 2 jh j ij < 1 =) j i 2 H : e além disso 2 jh j ij = 1 (normalizado): 102 Além disso, se de…nirmos uma novo estado j 0 i = ei j i que di…ra apenas por uma fase temos 2 jh 0 j ij = h j ei i 2 2 = ei =1 Ou seja, este estado apresenta a mesma probabilidade (i.e., a mesma característica física) de j i (no futuro veremos que estes estados são …sicamente indistinguiveis). Vemos então como a interpretação probabilística se relaciona com o primeiro postulado. Além disso, vemos que o processo de normalização, que antes possuía uma utilidade técnica bastante conveniente na de…nição das bases de H, agora está relacionado como a interpretação probabilística da MQ. Ou seja, para usarmos a interpretação probabilística obrigatoriamente devemos exigir que nossos vetores estejam normalizados. Um ponto importante é observar que a fase referida acima deve ser global. Como vimos, na descrição quântica um sistema pode estar numa superposição de dois estados j i = a j 1i + b j 2i ; o estado acima é equivalente ao estado j 0 i = ei [a j 1i + bj 2 i] 1i + bj 2i ; mas não é equivalente ao estado j 00 i = ei a j : A fase não-global presente no estado j 00 i gera fenômenos de interferência que permitem (…sicamente) distinguir este estado de j i. Podemos ver também o signi…cado físico da ortogonalidade dos auto-estados de um operador hermitiano. Ou seja, se após uma medida obtivermos o valor E2 o sistema estará no estado j 2 i a probabilidade de, logo após esta medida, o sistema ser encontrado no estado j 3 i deve ser nulo h 3 j 2i =0: E o fato destes vetores j n i formarem uma base signi…ca que nosso sistema pode, em princípio assumir qualquer valor do observável, com uma certa prob2 abilidade jcn j . Além disso, o fato de operadores hermitianos terem apenas autovalores reais está relacionado com medidas nos darem apenas valores reais. 7.3 Valor esperado Dada uma in…nidade de cópias idênticas do sistema, podemos nos perguntar sobre o valor médio de algum observável. Ou seja, pegamos uma in…nidade 103 de exemplares desta coleção de sistema, efetuamos em cada um a medida de um certo observável M e tiramos a média deste valor para obter hM i. Esta quantidade é também chamada de valor esperado do observável. Classicamente, se cada exemplar do nosso sistema tem uma probabilidade Pi de que o observável M forneça o valor mi , esta média pode ser calculada como X hM i = P i mi i somado para todos os valore mi possíveis do observável M . No caso de m ser uma variável contínua, temos Z hM i = mP (m) dm onde P (m) dm é a probabilidade do sistema ter o valor medido entre m e m + dm. O próximo postulado da MQ a…rma que, se o sistema está no estado j i, o ^ é dado por valor esperado do observável M ^j i : hM i = h j M (58) Esta expressão está diretamente relacionada a noção clássica de média. Sendo ^ um observável, podemos escrever: M X j i= ci j i i i onde ^ j i i = mi j i i M Substituindo em (58) temos 2 3 " # X X XX ^ j i=4 ^ h jM h j j cj 5 M ci j i i = cj ci h j = XX j = X i i i cj ci h 2 jci j mi = j j mi X j ii = XX j j i mi cj ci ^ j ii jj M ij i Pi mi ; i 2 onde usamos que jci j é a probabilidade de se obter o valor mi numa medida de ^. M Um ponto importante deste postulado está no fato de geralmente, em experiências, não estamos tratando apenas com uma entidade, mas sim uma coleção destas entidades. Por exemplo, uma corrente de elétrons, um feixe de laser (vários fótons), ou um feixe de partículas. Assim, o que nossos aparelhos registram pode não ser o valor possível do observável, mas sim uma média destes 104 valores. Com isso, o valor esperado de um observável quântico está diretamente relacionado com o limite clássico no valor deste observável. Ou seja, se temos um feixe de partículas (e.g., elétron) no estado j i = c1 j 1i + c2 j 2i onde ^ j i i = Ei j i i H são autoestados da energia, se medirmos a energia do feixe (não de um único elétron) nosso aparelho clássico mostrará o valor ^ j i = E1 jc1 j2 + E2 jc2 j2 : E = hHi = h j H O ponto descrito acima é apenas um exemplo de uma característica mais geral da teoria quântica de, sob certas circunstâncias, o valor esperado reproduz os mesmo resultados da teoria clássica. Por exemplo, para um grande número de partículas, ou para altas energias. Este é o chamado Princípio da Correspondência. Este princípio, que na velha MQ foi usado apenas para testar certas teorias e estabelecer um link entre as previsões da teoria e os fenômenos observados em laboratório, será de importância crucial no processo de quantização de sistemas com in…nitos graus de liberdade. 8 Quantização canônica O ponto, obviamente crucial, que ainda não foi respondido é: como encontrar o ^ que corresponde à quantidade clássica M . Um procedimento qualoperador M quer que permite associar quantidades clássicas a operadores (ou quantidades quânticas) é chamado de quantização. O procedimento mais geral e e…ciente de quantização foi proposto por Dirac. Este processo parte da descrição hamiltoniana do sistema clássico e, por isso, é chamado de quantização canônica. Este processo está relacionado com a seguinte conseqüência do Princípio da correspondência: ^ j i) deve corRemark 36 A dinâmica da médias dos operadores (e.g., h j M responder evolução temporal da respectiva quantidade clássica M (t). De outra forma, a pergunta a ser respondida pelo processo de quantização ^ j i = j?i. Para responder esta pergunta, é como agem os operadores. Isto é, H voltamos à mecânica clássica. Na mecânica clássica, um elemento crucial para se descrever a dinâmica dos sistemas são os parênteses de Poisson ff; gg = @f @g @x @p @f @g : @p @x Dirac mostrou que, para se respeitar a condição acima (o princípio da correspondência), basta exigir que para dois observáveis f e g tenhamos i h^ i h^ i ff; gg ! f ; g^ ; f ; g^ = f^g^ g^f^ : (59) ~ 105 Em outras palavras, se os operadores f^ e g^ respeitarem a relações acima, chamada relações canônica de comutação, o princípio da correspondência está garantido. Por incrível que pareça, isto é tudo que precisamos! Diferente do processo de quantização de Sommerfeld, ou mesmo o de Schroedinger (i.e., a equação de Schroedinger) este processo permite obter não apenas certas características do sistema (e.g., posição e energia), mas como descrever quanticamente praticamente qualquer quantidade classicamente observável. Além disso, podemos com este método introduzir novas características no nosso sistema. 8.1 Evolução temporal Uma das principais características de uma teoria (clássica ou quântica) é fazer previsões. Ou seja, informar como as quantidades evoluem no tempo. Como vimos, tudo que ocorre em MQ é descrito pela ação de um operador. Isso não seria diferente com a dinâmica dos sistemas. Precisamos então determinar qual é o operador de evolução temporal na MQ. Remark 37 Um ponto a se salientar é que, diferente dos demais observáveis, o tempo não é um operador em MQ. Esta quantidade é utilizada apenas para parametrizar os estados do sistema. Da mesma forma que a dinâmica dos sistemas eram descritos por trajetórias no espaço de fase, em MQ esta dinâmica é dada pela mudança do vetor que descreve o sistema em H. Ou seja, é uma trajetória no espaço de Hilbert. Assim, a dinâmica do sistema (sua evolução temporal) também é descrita por um operador. Ou seja, se um sistema está no estado j 0 i no tempo t0 seu estado num tempo posterior t será j ti = U (t; t0 ) j 0i : A primeira exigência sobre o operador U é que este seja unitário U (t) U + (t) = I^ ; para todo t ; (60) onde I^ é o operador identidade em H. Dizemos que na MQ toda evolução é unitária. Remark 38 Assim, a MQ lida apenas com sistemas conservativos e reversíveis. O requerimento acima está relacionado com a interpretação probabilística (conservação da probabilidade) h t j ti =h 0j U + (t; t0 ) U (t; t0 ) j 0i =h 0 j 0i : Além disso, exigimos que U (t2 ; t0 ) = U (t2 ; t1 ) U (t1 ; t0 ) ; t2 = t1 = t0 e U (t0 ; t0 ) = I^ : 106 (61) Supondo que U é um operador contínuo com relação ao parâmetro t, podemos escrever para uma evolução in…nitesimal dt, U (t + dt; t) = 1 + T^dt : onde T^ = T^ (t) é um novo operador, que precisamos determinar, cuja forma é conhecida no instante t. A condição de U ser unitário (60) 1 + T^dt 1 + T^dt + =1; 2 implica que T^ é anti-unitário (até ordem de (dt) ), T^+ = T^ : Da lei de composição (61) temos U (t + dt; t0 ) = U (t + dt; t) U (t; t0 ) = 1 + T^dt U (t; t0 ) U (t + dt; t0 ) dt U (t; t0 ) dU = T^U : dt = T^U (t; t0 ) =) (62) Tudo que precisamos agora é achar T^. Para isso, mais uma vez, invocamos o princípio da correspondência e a relação (59). Ou seja, estudamos a evolução temporal da média de um observável qualquer A^ (que é uma função em R2 e não e um vetor em H). Pelo postulado dos valores médios temos h (t)j A^ j (t)i = h 0j U + ^ j AU 0i ; e a evolução temporal deste valor é dada por d h dt 0j U + ^ j AU 0i _ + AU ^ + U + A^U_ j =h 0j U =h 0j + T^U 0i ^ + U + A^ T^U j AU 0i ^ + U + A^T^U j U + T^AU 0i Usando a anti-initariedade de T^ d h dt 0j U + ^ j AU 0i =h 0j = h = = =h onde ^ T^AU ^ h 0 j T^U + AU 0j U h T^A^ (t) 0j 0j h + A^ (t) ; T^ ^ A^ (t) = U + AU 107 i U + A^T^U j ^ T^ j U + AU A^ (t) T^ j j 0i : 0i 0i 0i : (A (t) é um operador na representação de Heisenberg). Ou seja, o valor médio de qualquer operador A^ evolui no tempo como h i d ^ A (t) = A^ (t) ; T^ : dt (63) Agora, na mecânica clássica sabemos que a evolução temporal de uma função A (t) no espaço de fase pode ser escrita como dA = fA; Hg : dt Assim, usando (63) e (62), invocando novamente a relação (59), temos i h ^ ^ i h ^ ^i A; H = A; T =) T^ = ~ dA = fA; Hg ! dt com isso i ^ H ; ~ dU i ^ dU = T^U =) = HU : (64) dt dt ~ Diferente do que ocorre para funções ordinárias a solução da equação diferencial acima para um operador não é, em geral, uma simples exponencial. Pois a identi…cação 1 a N X an a ; e = lim 1 = N !1 N n! n=0 depende de uma reorganização dos elementos da somatória que, por sua vez, depende da comutação destes elementos. Entretanto, para o caso geral, podemos ter h i ^ (t1 ) ; H ^ (t2 ) 6= 0 : H Por exemplo, num sistema com dois níveis de energia, pode ocorrer que ^ (t1 ) = H 3 1 0 = 0 1 ^ (t2 ) = ; H 1 0 1 = 1 0 : com isso, h i ^ (t1 ) ; H ^ (t2 ) = H = 1 0 0 2 0 1 0 1 1 0 0 1 1 0 1 0 0 1 2 0 No futuro veremos alguns exemplos físicos deste caso. Podemos escrever a solução formal do nosso problema (64) na forma U (t; t0 ) = 1 i ~ Z t ^ ( ) U ( ; t0 ) d ; H t0 108 (65) pois, com isso, dU (t; t0 ) d = 1 dt dt i ~ Z t ^ ( ) U ( ; t0 ) d H d i dt ~ = t0 Z t ^ ( ) U ( ; t0 ) d H t0 Usando o teorema fundamental do cálculo Z b @ f (x) dx = f (b) ; @b a temos Z d dt t ^ ( ) U ( ; t0 ) d = H t0 i ^ H (t) U (t; t0 ) ~ e, com isso, i ^ dU (t; t0 ) = H (t) U (t; t0 ) : dt ~ A expressão (65) é uma solução do nosso problema. Entretanto, dizemos que esta solução é formal porque ela não nos dá um resultado que possa ser efetivamente aplicado nos vetores de H, uma vez que estamos escrevendo o operador U em função deste mesmo operador. Entretanto podemos obter uma expressão melhor iterando esta de…nição: Z i t ^ H ( ) U ( ; t0 ) d U (t; t0 ) = 1 ~ 0 Z Z i i t ^ ^ ( 1 ) U ( 1 ; t0 ) d 1 d H( ) 1 H =1 ~ t0 ~ t0 Z Z Z 1 i t ^ i i ^ ( 2 ) U ( 2 ; t0 ) d 2 d ^ =1 H H( ) 1 H ( 1) 1 ~ t0 ~ t0 ~ t0 .. . Podemos agora abrir o produto e reorganizar os temos na ordem U (t; t0 ) = 1 + .. . + .. . Z i ~ i ~ n t ^( ) d + H t0 Z tZ t0 t0 ::: Z n 1 i ~ 2 Z tZ t0 ^ ( )H ^ ( 1) d H 1 d t0 ^ ( )H ^ ( 1 ) :::H ^( H n 1) d n 1 :::d 1 d t0 Onde, pela expressão original, …ca claro que na expressão acima t0 t. 2 1 109 n 1 ::: 1 d Assim, nosso operador temporal pode ser calculado como U (t; t0 ) = 1 X n i ~ n=0 Z tZ t0 t0 ::: Z n 1 ^ ( )H ^ ( 1 ) :::H ^( H n 1) d n 1 :::d 1 d t0 (66) A expressão acima pode ser colocada numa forma mais simples mudando todos os integrandos para o mesmo limite. Suponha que o hamiltoniano comute em tempos diferentes. Com isso é fácil ver que Z tZ Z Z 1 t t ^ 0 0 ^ ^ ^ ( 1 ) d 1 d ; (H ^ comuta) H ( )H ( ) d d = H ( )H 2 t0 t0 t0 t0 Pois se antes a região de integração era um triângulo agora é um quadrado (i.e., estamos contando a área 2 vezes e o integrando envolve o produto do mesmo operador). De forma geral temos Z tZ Z n 1 ^ ( )H ^ ( 1 ) :::H ^ ( n 1 ) d n 1 :::d 1 d ::: H t0 = t0 1 n! Z tZ t0 t0 t t0 ::: Z t ^ ( )H ^ ( 1 ) :::H ^( H n 1) d n 1 :::d 1 ^ comuta) d (H t0 Entretanto a restrição natural de ordenamento temporal presente na série original através dos limites de integração não existe mais. Assim, para o caso em que o hamiltoniano não comuta em instantes diferentes (i.e., quando esta ordem é importante) precisamos explicitar que a ordem temporal t0 1 t deve ser mantida. Para fazer isso usamos o símbolo T , 2 ::: n 1 110 chamado de operador de ordenamento temporal Z n 1 Z tZ ^ ( )H ^ ( 1 ) :::H ^ ( n 1) d ::: H t0 t0 1 = n! Z tZ t0 t0 t Z ::: t0 t t0 h ^ ( )H ^ ( 1 ) :::H ^( T H n 1 :::d 1 i n 1) d d n 1 :::d 1 d Esta simbologia indica que (assim como acontece no lado esquerdo da expressão) os termos dentro do sinal de integral devem ser colocados em ordem crescente do tempo. Com isso, nosso operador de evolução temporal pode ser escrito como Z i t ^ U (t; t0 ) = T exp H( ) d ~ t0 Z t h 1 nZ tZ t i X 1 i ^ ( )H ^ ( 1 ) :::H ^ ( n 1 ) d n 1 :::d 1 d ::: T H n! ~ t0 t0 t0 n=0 (67) Obviamente tanto a expressão (66) quanto (67) podem ser usadas para se determinar a evolução temporal do sistema. O cálculo da série acima é, em geral, um problema extremamente complicado que, na verdade, não pode ser resolvido na maior parte dos casos. Mas, felizmente, nem todos os problemas são tão complicados assim. Para o caso mais simples em que o hamiltoniano comuta em diferentes instantes i h ^ (t1 ) ; H ^ (t2 ) = 0 ; H podemos esquecer completamente o ordenamento temporal e simplesmente reorganizar a série e escrever Z Z i t ^ i t ^ H ( ) d ! exp H( ) d ; T exp ~ t0 ~ t0 ou seja, usando (67) sem o operador T , Z Z Z Z t i t ^ 1 t t ^ ( ) :H ^ ( 1 ) ::H ^ ( n 1 ) d n 1 :::d 1 d : exp H( ) d = ::: H ~ t0 n! t0 t0 t0 Z t Z t 1 nZ t X 1 i ^( ) d ^ ( 1 ) d 1 ::: ^ ( n 1) d = H H H n! ~ t0 t0 t0 n=0 n 1 n Z t X 1 i ^ = H( ) d ; n! ~ t0 n=0 ou seja, neste caso U (t) = exp i ~ Z 0 t H( ) d = 1 X n=0 111 i ~ n Z 0 n t H( ) d : (68) n 1 Além disso, para o caso ainda mais simples onde o hamiltoniano não depende do tempo temos Z Z i ^ t i ^ i t ^ H d = exp d = exp U (t) = exp H Ht ~ 0 ~ ~ 0 1 n X i ^n : = t H ~ n=0 O caso mais complicado onde o hamiltoniano não comuta para diferentes instantes geralmente não pode ser resolvido exatamente e exige o auxílio de técnicas aproximativas (e.g., teoria da perturbação). Assim, nesta primeira parte do curso vamos trabalhar apenas com o caso onde o hamiltoniano comuta para diferentes instantes do tempo. Da expressão (68) vemos porque é tão conveniente expandir as soluções em autovetores do Hamiltonio (estados de energia bem de…nido). Pois a evolução de um dado estado j 0 i j ti i ^ Ht j ~ = exp 0i envolve a exponencial de um operador. Uma quantidade, em geral, extremamente difícil de se calcular (quando possível!). Agora se j n i são os autovetores ^ com autovalores n , sempre podemos escrever de H X ^ j n i = En j n i =) j 0 i = cn j n i ; H n ^ independente do tempo, com isso, para o caso de H X X i ^ j ti = exp H t cn j n i = cn (t) j ~ n n i En t ~ cn (t) = cn exp ni ; : Onde a expressão acima envolve apenas números (não mais operadores). (Unitáriedade dos coe…cientes) A unitáriedade do operador de evolução temporal garante que para qualquer ^ se observável A, X j 0i = an j n i ; A^ j n i = an j n i ; n então X n 2 2 jan (t)j = 2 X n 2 jan j = 1 ; apesar de, em geral, jan (t)j 6= jan j . Assim, expandindo a nossa função na base de autovetores do hamiltoniano podemos introduzir toda a evolução temporal do sistema nos coe…cientes da expanção. 112 8.2 Resumo As regras do processo de quantização canônica, ou os postulados acima, podem ser resumidos como: 1. O estado de um sistema físico é completamente descrito por um vetor (normalizado) no espaço de Hilbert j i2H: (69) E vetores que di…ram apenas por uma fase representam o mesmo estado físico. Sabendo-se agora qual vetor representa o sistema, sabemos todas as características físicas deste sistema; 2. A todo o observável esta relacionado um operador hermitiano; ^ pode fornecer apenas autovalores deste 3. Uma medida do observável M operador e, logo após uma medida em que se obteve o valor mn o sistema ^ com autovalor mn ; estará no estado n , auto-estado de M 4. A dinâmica da médias destes operadores ^j i ; h jM hM i corresponde evolução temporal da respectiva quantidade clássica M (t); 5. A evolução temporal de um sistema no estado inicial j ^ (t) comutativo) caso de H j 8.3 t i = U (t) j ^ 0 i ; U (t) = exp i ~ Z 0i é dado por (no t ^ dt H : 0 Realização do espaço de Hilbert Toda a descrição acima é bastante abstrata e, para calcularmos alguma coisa, precisamos escolher um espaço de Hilbert especí…co para trabalhar, ou, como se diz, realizar o nosso espaço de Hilbert. Vamos então aplicar tudo que foi visto acima num sistema físico real e veri…car como o processo de quantização pode ser efetivamente implementado. Para isso vamos começar tratando sistemas com graus …nitos de liberdade. Uma espira por onde passa uma corrente induz um campo magnético que pode ser descrito pelo chamado momento magnético do sistema. Classicamente, um sistema com momento magnético imerso num campo magnético B possui uma energia potencial U= B Que dá origem a uma força F = r( 113 B) Para B = B z^, temos @B ; @z O momento magnético na presença de um campo magnético gera também um torque = B: F = r( z B) = z Entretanto, como mostrado nos trabalhos de Einstein e de-Hass, o momento magnético não se curva em direção do campo, mas apenas passa a precessionar nesta direção. Assim, quando um sistema com momento magnético é colocado num campo magnético, ele se desloca na direção de variação do campo, sem variar a projeção do momento na direção do campo. Ou ainda, mantendo B constante. Além disso, qualquer variação nesta projeção alteraria a energia U do sistema e esta energia teria de vir do campo. Concluindo: o momento magnético não se alinha com o campo, mas o sistema como um todo se desloca na direção da variação do campo. Pelo comportamento de algumas partículas num campo magnético, sabemos experimentalmente que estas possuem um momento magnético. Um dispositivo para medir este momento magnético seria fazer passar um feixe destas partículas por um campo variável na direção z. Este é o chamado experimento de SternGerlach. O feixe é produzido termicamente, de sorte que seus constituintes possuem todos os valores possíveis de momento magnético. Classicamente, se um tal feixe passar pelo experimento acima, esperamos que ele sofra uma força Fz = z @B ; @z que depende da projeção de na direção do campo. Assim, classicamente esperamos que as partículas sejam de‡etidas continuamente dede o valor z = 0 até um valor máximo z = j j. Entretanto, quando o experimento foi realizado nos idos de 1922 não foi isso que se observou. Ao passar pelo aparato o feixe se dividiu em duas componentes com valor B ~ : 2 Assim, fazendo ~ 2 temos que o momento magnético z é proporcional ao spin Sz e este pode assumir apenas os valores discretos ~=2. Os constituintes dos átomos, bem como combinações destes constituintes possuem está característica. O próprio experimento foi realizado com átomos de prata que dos seus 47 elétrons 46 estão emparelhados e anulam seus spins. Sobrando apenas o spin do elétron da camada mais externa. Além disso, o momento magnético de todos os constituintes vale gs S; = 2m z = B Sz ; Sz = 114 de sorte que podemos ignorar a in‡uência do momento magnético do núcleo. Sendo o átomo neutro, apenas o spin do último elétron in‡uência no comportamento de todo o átomo. Partículas com esta característica são chamada de partículas de spin 12 (prótons, neutrons, elétrons etc). Assim, no que se refere ao spin na direção z, partículas de spin 12 podem apresentar apenas dois valores possíveis deste observável. Sendo o spin um observável, e pelos postulados colocados anteriormente, sabemos que estes valores são os autovalores do operador de spin. Chamemos seus auto-vetores de S^z j i = ~ j i : 2 Sabemos também que estes autovetores formam uma base do nosso espaço. Assim, se queremos estudar apenas o spin de um partícula de spin 12 (e.g., um elétron), podemos trabalhar com um espaço de Hilbert de duas dimensões. Como vimos, neste espaço vetores são matrizes coluna de dois elementos e operadores matrizes 2 2. Observe que se estamos estudando um elétron, estamos ignorando completamente qualquer outra característica desta partículas, como posição e momento. Queremos saber apenas como o spin deste elétron se comporta num campo magnético. Uma vez escolhida a base fj+i ; j ig, temos também uma forma matricial para os nossos operadores. Lembre-se que, dada uma base fjei ig nosso operador nesta base atua como X S^z = Szmn jem i hen j ; mn ou seja Szmn é a representação matricial do nosso operador na base jei i. Multiplicando a expressão acima por jei i e hej j temos X hej j S^z jei i = Szmn hej jem i hen jei i mn = = X Szmn jm ni mn Szji Ou seja, as componentes matriciais do nosso operador pode ser cálculado como Szji = hej j S^z jei i ; Para o nosso caso, onde je1 i = j+i e je2 i = j i temos Sz11 Sz12 Sz21 Sz22 = = ~ 2 h+j S^z j+i h j S^z j+i h+j S^z j i h j S^z j i 1 0 0 1 115 = ~ 2 ~ 2 h+ j+i h+ j i ~ 2 h ~ 2 h j+i j i Ou seja ~ S^z = 2 1 0 0 1 : Podemos ver explicitamente que, como supúnhamos, ~ S^z+ = 2 1 0 0 1 = S^z : Algumas características gerais podem ser tiradas deste exemplo: Sempre que escolhemos trabalhar na base de autovetores de um operador, a forma matricial deste operador (nesta base) é diagonal. Com a diagonal formada pelos seus autovalores. Uma vez de posse da forma matricial do nosso operador, podemos determinar a forma dos nossos autovetores ~ ~ S^z j+i = j+i ) 2 2 b= 1 0 0 1 a b = ~ 2 a b a 0 b ) b = 0 ) j+i = Normalizando nosso vetor e …xando (arbitrariamente) a fase global, temos: j+i = 1 0 : 0 1 : Da mesma forma, podemos determinar: j i= Onde, por serem autovetores de um operador hermitiano com autovalores distintos h+ j i = 0 : Exercise 39 Use os resultados acima para veri…car a resolução da identidade. Ou seja, usando as formas matriciais acima mostre que: X n jen i hen j = j+i h+j + j i h j = 1 0 0 1 : Outra forma de escrever o operador S^z é ~ S^z = (j+i h+j 2 j i h j) Pois, com isso: ~ S^z j+i = (j+i h+j 2 ~ ^ Sz j i = (j+i h+j 2 ~ (j+i h+ j+i 2 ~ j i h j) j i = (j+i h+ j i 2 j i h j) j+i = 116 j ih j ih ~ j+i ; 2 ~ j i) = j+i : 2 j+i) = Classicamente o momento magnético é um vetor (i.e., tem 3 componentes). No nosso caso também devemos ter 3 operadores para o spin da nossa partícula. Os dois outros operadores, que podemos chamar de S^x e S^y são obtidos, obviamente, medindo o momento magnético nas demais direções. Ou seja, girando nosso SG nas direções x e y. Vamos tentar determinar a forma destes operadores. Mas nós queremos fazer isso trabalhando ainda mesma base de antes. Ou seja, sabemos que uma medida do spin na direção x deve fornecer também 2 valores (a…nal não há nada especial com a direção z). Assim devemos ter ~ jx i S^x jx i = 2 onde + jx+ i = a+ (70) 1 j+i + a2 j i : Uma vez escolhida a forma matricial de j i temos a forma matricial de jx+ i. Tudo que precisamos então e achar os coe…cientes a+ i da expressão acima. Para isso usamos mais um dos nossos postulados. Sabemos que a+ 1 2 2 = jh+ jx+ ij é a probabilidade de estando a partícula na posição jx+ i, numa medida de Sz encontrarmos o valor +~=2. Além disso, pelo que vimos anteriormente, sabemos que 2 2 2 a+ = jh+ jx+ ij = jhx+ j+ij : 1 Ou seja, está também é a probabilidade do sistema estar no estado j+i e, numa medida de S^x , encontramos o valor jx+ i. Remark 40 Neste caso, a igualdade acima re‡ete a isotropia do espaço. Problem 41 Como podemos medir experimentalmente esta probabilidade? Tudo que precisamos fazer é preparar uma in…nidade de partículas, todas no estado j+i, realizamos uma medida de S^x e veri…car qual a proporção de partículas apresenta o valor +~=2. Ou seja, precisamos estudar um problema de espalhamento. (Não podemos conhecer o estado, mas podemos preparar) Como dissemos antes, é impossível determinar o estado quântico de um sistemas. Entretanto, é possível conhecer este estado se nós mesmos o preparamos. Problem 42 Como preparamos uma in…nidade de sistemas no esta j+i? Para isso basta passarmos o feixe, inicialmente contendo todos os estados possíveis, num aparato na direção z. Todas as partículas que sobem possuem o valor de spin +~=2 e, pelos postulados da MQ, estarão no estado j+i. Assim, 117 se pegarmos este feixe e passarmos por um segundo SG orientado na direção x, 2 tudo que precisamos fazer para determinar a+ e medir a intensidade deste 1 feixe. Realizado o experimento, veri…ca-se que o feixe se divide, novamente, em dois feixes de igual intensidade. Ou seja, metade das partículas possuem Sx = +~=2 e metade Sx = ~=2. Com este resultado, podemos a…rmar que a+ 1 2 = 1 = a+ 2 2 2 ei 2 ei 1 ; a+ ; ) a+ 2 = p 1 = p 2 2 1;2 2R: Assim, lembrando que uma fase global é irrelevante (primeiro postulado), sabemos que o estado (70) possui a forma: 1 ei x jx+ i = p j+i + p j i ; 2 2 + 2R: (71) Lembre agora que a fase x acima não é uma fase global e, conseqüentemente, possui signi…cado físico. Ou seja, não podemos escolher arbitrariamente esta fase. Este resultado, completamente inesperado, mostra a característica mencionada anteriormente que, em MQ, a probabilidade não é uma ignorância do sistema, mas uma característica intrínseca ao sistema. Observe que o estado acima é uma superposição de dois estados com spins na direção oposta. Mas, ao mesmo tempo, é um sistema bem determinado. Ou seja, todas as partículas que saíram do SG na direção +^ x estão no estado jx+ i. Estes estados são todos iguais, pois foram preparados exatamente da mesma maneira. Entretanto, uma medida do spin na direção z deste estado fornece hora o valor +~=2 e hora o valor +~=2. Dizemos que o sistema no estado jx+ i acima não possui o valor de sz bem de…nido e, apenas após a nossa medida, quando o sistema estará no estado j+i ou j i, este valor foi …xado. Uma medida subseqüente do spin na mesma direção fornecerá o mesmo valor, mas numa direção ortogonal voltará a apresentar o resultado estatístico. Esta estatística é inerente ao sistema (é o elétron que está neste estado) não uma ignorância nossa sobre os efeitos do aparelho de medida no sistema. Com argumentos análogos aos anteriores podemos escrever 0 1 ei x jx i = p j+i + p j i ; 2 2 0 x 2R: (72) Entretanto, temos também que respeitar a condição de ortogonalidade dos ve- 118 tores, hx jx+ i = ! 0 1 e ix p h+j + p h j 2 2 ei x 1 p j+i + p j i 2 2 = 1 ei x e i h+ j+i + h+ j i + 2 2 2 = 1 1 ix + e e 2 2 com isso, ei x e i 0 x = i 0 x 0 x h 1 j+i + ei x e 2 i 0 x h ! j i =0 1)e i 0 x = e i x ) ei 0 x = ei x De sorte que 1 ei x jx i = p j+i p j i ; + 2 R : (73) 2 2 Da mesma forma que …zemos no caso de Sz , o operador Sx pode ser escrito como ~ S^x = (jx+ i hx+ j jx i hx j) (74) 2 pois, novamente, ~ S^x jx+ i = (jx+ i hx+ j 2 ~ S^x jx i = (jx+ i hx+ j 2 ~ jx+ i 2 ~ jx i hx j) jx i = jx i 2 jx i hx j) jx+ i = Além disso, como no caso anterior, a forma matricial do operador S^x na base fj+i ; j ig é dada por: Sx11 Sx21 Sx12 Sx22 = h+j S^x j+i h+j S^x j i h j S^x j+i h j S^x j i Calculando explicitamente estes termos, usando (74), temos ~ h+j S^x j+i = h+j (jx+ i hx+ j 2 jx i hx j) j+i : Usando (71) e (73) temos 1 ei x p j+i + p j 2 2 1 e ix = j+i h+j + 2 2 1 ei x jx i hx j = p j+i p j 2 2 1 e ix = j+i h+j 2 2 jx+ i hx+ j = 1 p h+j + 2 ei x j+i h j + j 2 1 p h+j i 2 ei x j+i h j j 2 i 119 e ix p h j 2 1 i h+j + j i h j 2 e ix p h j 2 1 i h+j + j i h j 2 Com isso Sx11 = h+j S^x j+i = ~ h+j (jx+ i hx+ j 2 jx i hx j) j+i ~ h+j j+i h+j + e i x j+i h j + ei x j i h+j + j i h j 4 j+i h+j + e i x j+i h j + ei x j i h+j j i h j j+i ~ = (1 1) = 0 4 = Da mesma forma ~ i Sx21 = h j S^x j+i = e 4 Sx22 = h j S^x j i = 0 ; x + ei Sx12 = h+j S^x j i = h j S^x j+i = ~ i e 2 = x ~ e 2 i x x ; : Ou seja ~ S^x = 2 0 i e e i x : 0 x Um procedimento completamente análogo pode ser desenvolvido para S^y . Ou seja: 1. Estudando o problema de espalhamento com o aparelho de SG orientado na direção y temos: 1 ei y jy+ i = p j+i + p j i ; 2 2 2R; y 2. Pela ortogonalidade dos estados ei y p j i 2 1 jy i = p j+i 2 3. Escrevendo temos ~ S^y = (jy+ i hy+ j 2 ~ S^y = 2 0 i e jy i hy j) e y i 0 y : Obviamente a forma explicita de todas estas quantidades depende da determinação das fases x e y . Para isso existe ainda um experimento de espalhamento a nossa disposição. Suponha que você orientou o SG na direção x ^, selecionou o feixe que foi na direção +^ x e passou este feixe por um segundo SG na direção y^. Pelo que foi dito antes, e pela homogeneidade do espaço, você deve 120 imaginar que, mais uma vez, o feixe se dividiu em duas partes de intensidades iguais nas direções +^ y e y^. Isso signi…ca que, estado a partícula no estado jx+ i a probabilidade de encontrar esta partícula no estado jy+ i ou jy i vale 1 : 2 2 jhy jx+ ij = Usando os resultados anteriores temos = e iy p h j 2 1 p h+j 2 hy jx+ i = 1 1 2 ei( y) x 1 ei x p j+i + p j i 2 2 : Com isso 1 ei( Lembrando que y) x 1 2 = =2 2 ij = 11 + 12 = 2 ; j1 temos ei( 2 y) x 2 1 1 2 2 jhy+ jx+ ij = : 2 Isso é tudo que podemos …xar com nossos experimentos de espalhamento. Obviamente nosso problema apresenta uma fase que pode ser …xada arbitrariamente, sem in‡uenciar nos resultados experimentais. Assim, fazendo x x y = = 0 =) y = 2 Temos a forma explicita de nossos vetores 1 0 jz+ i = j+i = 1 jx i = p [j+i 2 1 jy i = p [j+i 2 0 1 ; jz i = j i = 1 j i] = p 2 1 i j i] = p 2 1 1 1 i ; ; ; e dos nossos operadores ~ S^z = 2 1 0 0 1 ; S^x = ~ 2 0 1 1 0 ~ ; S^y = 2 0 i i 0 : A notação acima pode ser escrita de forma mais compacta se introduzirmos a notação 1 0 1 1 0 ; 2 0 i 121 i 0 ; 3 1 0 0 1 com isso ~ ^ S^i = i ; S1 2 ou, numa notação vetorial, com Pauli. S^x ; S^2 S^y ; S^3 S^z ^=~ S 2 = ( 1 ; 2 ; 3 ). As três matrizes s acima são chamadas como matrizes de Exercise 43 Veri…que as seguintes propriedades das matrizes de Pauli: 2 ( i) = 1 ; i = + i ; [ i; j] = 2i 3 X "ijk k ; k=1 onde "ijk é o símbolo de Levi-Civita. Um ponto a se observar nos resultados acima é a diferença de fase x y = =2. Ou seja, mesmo o sistema mais simples (2 níveis) não pode ser descrito usando apenas coe…cientes reais. Neste exemplo …ca patente a necessidade de estendermos o corpo do nosso espaço vetorial para os complexos. Este ponto já havia sido observado por Schroedinger na sua formulação usando funções de onda. A utilização de quantidades complexas já era utilizada como um artifício matemático para tratar problemas de ondas (mecânicas ou eletromagnéticas). Mas esta técnica (fasores) apenas facilitava as manipulações algébricas e as quantidades físicas eram obtidas simplesmente ignorando a parte complexa dos resultados. Na MQ, porém, esta parte não pode ser ignorada e possui in‡uência direta no comportamento das quantidades físicas. Assim, o operador associado ao momento magnético clássico das nossas partículas de spin meio vale: ^ ; ~ = gs : ^ = ~S 2m Como vimos, a energia potencial de uma partícula de momento magnético m sujeita a um campo magnético B vale: U= B Se ignorarmos completamente o movimento da partícula (i.e., ignorarmos a sua energia cinética), podemos escrever E=U = B=H : Onde H é o hamiltoniano clássico do sistema. Pelos resultados anteriores, sabemos que o operador associado a este hamiltoniano vale ^ = H ^= ^ B ; ^ = ~S 122 ~ ~ 2 com isso ^ = H B; = = e~ 2me Para o caso do elétron = B ~ ~: 2 é o magneton de Bohr. Exemplo 1. Suponha então um elétron num campo magnético B constante na direção z^ (não é mais um SG). Este elétron tem dois estados possíveis de energia ^ = H E+ = ^j i= ( ) )H BB ; E = + BB BB 3 BB j i= BB j i Suponha que o sistema é inicialmente preparado no estado jx+ i, i.e., antes de iniciar o experimento, passamos o feixe por um SG e coletamos o feixe que foi na direção +^ x. Com isso j 0i 1 = jx+ i = p (j+i + j i) : 2 Problem 44 Qual a probabilidade de, após um tempo t, o spin deste elétron estar na direção x ^? A resposta para o nosso problema vale jhx j 2 t ij : Para isso precisamos primeiro determinar o estado j ti = U (t) j 0i ; U (t) = exp i B ~ B 3t Como vimos, a aplicação deste operador é simpli…cada pelo fato do nosso estado inicial estar escrito na base de autovetores do hamiltoniano, j ti = U (t) j 0i = exp i B ~ B 3t 1 p (j+i + j i) 2 1 B B = p exp i B 3 t j+i + exp i B 3t j i ~ ~ 2 1 B B = p exp i Bt j+i + exp i Bt j i ~ ~ 2 1 = p (exp (i!t) j+i + exp ( i!t) j i) 2 com != B ~ 123 B Podemos então cálcular hx j ti = = 1 p (h+j 2 (exp (i!t) 1 p (exp (i!t) j+i + exp ( i!t) j i) 2 exp (i!t)) h j) 2 = i sin !t Com isso 2 t ij jhx j B = sin2 !t ; ! = B: ~ Em especial, em t = 0, temos que a probabilidade é nula, pois sabemos que a partícula está no estado jx+ i. Problem 45 Suponha que você quer inverter o spin do elétron, por quanto tempo você deve aplicar o campo? Inverter o spin do elétron, inicialmente no estado jx+ i, signi…ca que, se você pegar o elétron após a aplicação do campo e passar por um SG na direção x, você tem certeza que este elétron irá para a direção x ^. Assim jhx j 2 t ij = 1 ) sin2 !t = 1 ) !t = com isso 2 ~ t= 2B (1 + 2n) ) t = 2! (1 + 2n) ; n 2 N ; (1 + 2n) : B Desta forma, dada um estado inicial qualquer, podemos manipular o spin do elétron e deixá-lo no estado que desejamos através da aplicação de campos magnéticos. No caso geral, a forma mais conveniente de se aplicar o operador de evolução é expandindo o estado inicial na base de autovetores da hamiltoniana. Entretanto, em alguns casos especí…cos, é possível encontrar uma forma matricial também para este operador. Por exemplo, no caso tratado acima temos U (t) = exp i =1+ i B ~ B ~ B 3t = 1 X i n=0 Bt 3 + i B ~ B ~ n Bt 2 Bt 2 3 n 3 + i B ~ 3 Bt Note, entretanto, que 2 3 = 1 0 0 1 1 0 0 1 = Além disso 3 3 = 2 3 3 124 = 3I 1 0 0 1 =I 3 3 + ::: assim ( 2n 3) 2n+1 3) =I ; ( = 3 Podemos então dividir a nossa somatória em termos pares e impares U (t) = = = 1 X n=0 1 X n=0 1 X i i i n=0 = cos B ~ cos = B ~ B ~ B ~ 2n Bt B 1 X + Bt + 1 X i n=0 2n Bt + 3 1 X B ~ 3 sin Bt + i sin 0 exp i ~ Bt 0 B ~ B ~ B ~ 2n+1 Bt 2n+1 3 2n+1 Bt B i ~ n=0 3 2n+1 Bt Bt Bt B = i n=0 2n Bt + i ~ 2n 3 exp 0 cos 0 i B ~ Bt B ~ Bt i sin B ~ Bt : Assim, se quisermos aplicar este operador no estado inicial 1 jx+ i = p 2 1 1 temos 1 exp i ~B Bt 0 1 U (t) jx+ i = p 1 0 exp i ~B Bt 2 B 1 exp i ~ Bt =p exp i ~B Bt 2 1 1 0 B B Bt + exp i Bt = p exp i 0 1 ~ ~ 2 i 1 h B B = p exp i Bt j+i + exp i Bt j i ~ ~ 2 Que é o mesmo resultado obtido anteriormente. O resultado acima pode ser generalizado para qualquer operador A^ num espaço de dimensão …nita A^2 = I ) exp i! A^ = cos ! + iA^ sin ! : Assim, dado um estado inicial qualquer, podemos decompor este estado em auto-estados do hamiltoniano e usar a expressão j ti = c+ exp (i!t) j+i + c exp ( i!t) j i o que implica em encontrar os coe…cientes c , ou usar diretamente este estado, sem fazer nenhuma decomposição, e multiplicar pela forma matricial de U acima. 125 Remark 46 Sempre que tivermos a sorte de encontrar esta forma matricial do operador de evolução não precisamos decompor o estado inicial. Ainda no mesmo campo ^ = H BB 3 ; qual a probabilidade de um estado inicialmente preparado em j+i ser encontrado em j i depois de um tempo t. Ou seja, 2 jh j U (t) j+ij : Lembrando de nosso hamiltoniano só depende de são autoestados deste operador temos h j+i = h j exp i B ~ B 3t j+i = exp i 3 B ~ e que os estados acima Bt h j+i = 0 : Remark 47 Isso é um caso geral. Sempre que nosso sistema estiver num auto estado do operador hamiltoniano ele permanecerá inde…nidamente neste estado. Por isso estes estados são chamados de estados estacionários. Exempo 2: Uma partícula de spin 12 está sujeita a superposição de dois campos, de mesma intensidade B, um na direção x ^ e outro na direção y^, B=x ^B + y^B Neste caso o Hamiltoniano do sistema tem a forma ^ = H B= B( + 1 2) : Ou seja, nosso operador de evolução tem a forma (68): i ^ Ht ~ Bt i ( ~ U (t) = exp = exp = exp [ i!t ( B != ~ 1 1 + + 2) 2 )] Problem 48 Será que podemos escrever exp [ i!t ( 1 + 2 )] ? = [ i!t 126 1] [ i!t 2] ? A resposta é não! A igualdade eA+B = eA eB é válida apenas quando [A; B] = 0 : Além disso, observe que ( 1 2 2) + = 1 1+ 1 =I+ 1 2 = 2I 6= I 2 + 2 1 1 2 +I + 2 2 De sorte que não podemos usar a nossa decomposição em senos e cossenos. Entretanto, apesar de não ser proporcional a identidade, o resultado é proporcional a identidade (i.e., se comporta como um número, não como um operador). Assim, podemos de…nir o seguinte operador 1 =p ( 2 1 + 2) 1 =p 2 0 1 i 1+i 0 que satisfez 1 1 2 ( 1 + 2 ) = 2I = I : 2 2 Em termos deste operador nosso operador de evolução se torna 2 U (t) = exp = h p ( 1 + 2) p i i!t 2 p = i!t 2 ; 2 E podemos escrever h p i p U (t) = i!t 2 = cos !t 2 p cos !t 2 p = p1 (1 i) sin !t 2 2 p i sin !t 2 p1 2 p ! (i + 1) sin !t 2 p cos !t 2 p Observe que a freqüência e oscilação do campo possui um fator 2. Como mencionado, nem sempre é possível encontrar uma forma matricial para o operador de evolução. Entretanto, o método de expansão dos estados em auto-estados do hamiltoniano sempre funciona. Vamos então aplicar este método para resolver o problema anterior, i.e., com hamiltoniano ^ = H B= B( 127 1 + 2) : Para isso precisamos realizar uma mudança de base no nosso sistema e não mais trabalhar na base fj+i ; j ig, mas sim na base fj + i ; j ig de autovetores de ^ H 0 1 i ^j i=E j i ; H ^ = B H : 1+i 0 Resolvendo o problema de autovalores temos: p p 1 2 (1 i) ; E+ = B 2 j +i = p 2 2 2 p p 1 2 (i 1) ; E = B 2 j i= p 2 2 2 Vamos calcular, por exemplo, a probabilidade de transição dos estados j+i ! j i Para isso temos de escrever estes vetores na nova base: j+i = c1 j +i + c2 j i p 1 j+i = p 2 (1 + i) 2 2 2 p 1 c2 = h j+i = p 2 ( i 1) 2 2 2 (1 + i) j+i = (j + i j i) 2 c1 = h 1 0 + = 1 0 1 (1 + i) 2 1 = (1 + i) 2 e j i = d1 j d1 = h d2 = h + +i + d2 j 1 j+i = p 2 2 1 j+i = p 2 2 1 j i = p (j 2 +i +j i p 2 (1 + i) p 2( i 1) 0 1 2 2 1 =p 2 1 0 =p 1 2 i) Problem 49 Por que as probabilidades de encontrar a partícula com spin pra cima é tão difernet da de encontrá-la com spin pra baixo? Note que, apesar de parecerem diferentes, os coe…cientes e 1 1 (1 + i) = 1 + ei 2 = ei 4 2 2 1 i4 = e cos = p ei 4 = d1 ei 4 4 2 c1 = 128 i4 + ei 4 2 diferem apenas por uma fase e, conseqüentemente, representam a mesma probabilidade. Ou seja, nos dois casos, a probabilidade de, estando a partícula no estado j i, encontrá-la no estado j i vale 21 . Concluindo as contas temos i ^ Ht (c1 j + i + c2 j i) ~ i d1 h + j + d2 h j c1 exp E+ t j + i + c2 exp ~ i i d1 c1 exp E+ t + d2 c2 exp E t ~ ~ ! p p !! B 2 B 2 1 p (1 + i) exp i exp i t t ~ ~ 2 2 p ! i B 2 p (1 + i) sin t ; ~ 2 h j U (t) j+i = d1 h = = = = +j + d2 h j exp i E t j ~ que representa a probabilidade 2 p ! B 2 t : ~ 2 jh j U (t) j+ij = sin Para estados no caso de estados genéricos dados cujas componentes são dadas na base fj+i ; j ig podemos obter suas componentes na base fj + i ; j ig através do procedimento de mudança de base estudado anteriormente. Pela expressão X vj0 = vi e0j ei i j he0i j sabemos que as quantidades ej i é a de matriz de mudança da base fjei ig para a base fje0i ig. Assim, a matriz de mudança da base fj+i ; j ig para a base fj + i ; j ig vale h j i= c1 c2 h h +j d1 d2 +i j +i h h +j 1 0 j i i = c1 c2 d1 d2 e um estado inicial qualquer dados na base fj+i ; j ig tem, na base fj a forma fj + i;j a0 b0 ig = c1 c2 d1 d2 +i ; j ig fj+i;j ig c0 v0 : Exemplo 3 Uma partícula de spin 21 está sujeita a um campo magnético que circula no plano x; y B (t) = x ^B cos !t + y^B sin !t : 129 i Neste caso o Hamiltoniano do sistema tem a forma ^ =H ^ (t) = H B= B( 1 cos !t + 2 sin !t) = B 2 ; Observe que, neste caso ^ (0) = B H com isso h ^ ; H 1 2! i ^ (0) ; H ^ H 2 = 2i ( B) 3 6= 0 : 2! Ou seja, estamos tratando um dos casos complicados onde o hamiltoniano não comuta para diferentes instantes do tempo. Felizmente, neste caso (e nem imagine que isso é comum) o problema pode ser tratado exatamente. Observe que Z tZ Z tZ 0 0 ^ ^ H ( )H ( ) d d = ( B ( 1 cos ! + 2 sin ! )) ( B ( 1 cos ! 0 + t0 t0 t0 t0 Z tZ 2 = ( B) t0 + + 1 2 Z tZ t0 Z tZ t0 cos ! cos ! 0 d 0 d t0 0 [cos ! sin ! sin ! cos ! 0 ] d 0 d t0 sin ! sin ! 0 d 0 d t0 Ou seja, mesmo que as matrizes de Pauli não cumutem, estas são fatoradas em todas as integrais. Assim, todas as integrais envolvidas na expansão em série do operador de evolução envolvem apenas funções reais (não operadores) e, conseqüentemente, comutativas. Com isso, neste caso (e, mais uma vez, este é um caso muito especial) não precisamos levar em conta a ordenação temporal. Conseqüentemente nossa exponencial toma a mesma forma para o caso comutativo. Ou seja, nosso operador de evolução tem a forma (68) Z n 1 n Z t X i t i U (t) = exp H( ) d = H( ) d : ~ 0 ~ 0 n=0 Mais explicitamente U (t) = exp = exp = exp i ~ Z t B ~ B i ( ~! i B( 0 1 1 Z cos ! + 2 sin ! ) d t cos ! d + 0 1 2 Z t sin ! d 0 sin !t 130 2 (cos !t 1)) : 2 sin ! 0 )) d 0 d Remark 50 Observe que o termo mos U (0) = exp 1 em (cos !t i B ( ~! 2 (1 1) é indispensável para ter1)) = I : Entretanto, neste caso, fazendo ^ = M 1 sin !t 2 (cos !t 1) temos h ^ 2 = I sin2 !t + (cos !t M = 2I [1 2 1) cos !t] 6= 1 : i Ou seja, novamente, não podemos usar a nossa expansão em senos e cossenos. Poderíamos então tentar um procedimento análogo ao anterior e de…nir ^ M ^=p G 2 (1 cos !t) com o que temos ^2 = G ^2 2I [1 cos !t] M = =I : 2 (1 cos !t) 2 (1 cos !t) ^ Então escreveríamos U em função de G U (t) = exp i Bp 2 (1 ~! ^ cos !t)G : e, depois, em termos de senos e cossenos Bp 2 (1 ~! ? U (t) = cos Bp 2 (1 ~! ^ sin iG cos !t) cos !t) : ^ Entretanto, este procedimento não é legítimo pelo fato deste novo operador G ^ (0) = I. Nem não estar de…nido em t = 0, ou seja, não podemos garantir que U para qualquer outro instante t = 2n =!. Ou seja, para continuar é necessário veri…car que G tem um valor …nito em t=0. Para isso expandimos ^= G = 1 1 sin !t p 2 (1 + 1 2 2 2 (cos !t cos !t) (!t) = 1 1) !t ' + r 2 1 : 131 2 (!t)2 2 (!t)2 2 !t = 1 + 2 !t (!t)2 2 ^ ^ 2 (0) = I. Com isso podemos continuar De onde temos, G(0) < I e ainda G usando Bp Bp ^ sin U (t) = cos 2 (1 cos !t) iG 2 (1 cos !t) : ~! ~! Usando a igualdade cos !t = 2 cos2 !t 2 1 podemos escrever p 2 (1 cos !t) = s 2 cos2 2 1 s cos2 1 =2 r !t 2 1 !t 2 !t 2 = 2 sin2 !t 2 = 2 sin com isso, B !t 2 sin ~! 2 !t B 2 sin ~! 2 U (t) = cos = cos B !t 2 sin ~! 2 1 sin !t 2 (cos !t i 2 sin !t 2 ^ sin iG 1) B !t 2 sin ~! 2 sin Temos ainda o inconveniente de um termo divergente. Mas isso pode ser resolvido observando que 1 sin !t (cos !t 1) 2 0 1 ei!t =i 1 0 ! t 2 = 2 sin i!t e 0 e i! 2t e i! 2t 0 com isso B ! 2 sin t ~! 2 U (t) = cos 0 i e i! 2t e i! 2t B !t 2 sin ~! 2 sin 0 Outra forma de resolver este problema e usando direto 1 sin !t ^ (t) = N (cos !t 0 i! 2t e e 1) i! 2t 0 2 = 2 sin ! t 2 ; 132 0 i! 2t e e i! 2t 0 = 2 sin ! ^ (t) ; t N 2 e escrever B ( 1 sin !t 2 (cos !t ~! B ! ^ (t) i2 sin t N ~! 2 U (t) = exp i = exp 1)) Observando agora que ^2 = I ; N temos B ! ^ (t) sin t N ~! 2 ! B ^ sin 2 B sin ! t sin t iN = cos 2 ~! 2 ~! 2 U (t) = exp i2 Que, obviamente, concorda com o resultado anterior. Nesse último caso não precisamos nos preocupar com divergências. Assim, ainda neste caso mais complicado, podemos encontrar uma forma matricial para o nosso operador de evolução. Podemos agora responder perguntas do tipo: neste novo campo qual a probabilidade de uma partícula inicialmente prepara no estado j+i ser encontrada no estado j i depois de um tempo t? 2 jh j U (t) j+ij =? ^ Ou seja estes estados Observe que agora j i não é mais auto estado de H. não são estacionários. Com o resultado acima calculamos: B ! ^ sin 2 B sin ! t sin t iG ~! 2 ~! 2 ^ j+i sin 2 B sin ! t h j iG : ~! 2 h j U j+i = h j cos 2 = Usando as formas matriciais ^ j+i = h j iG 0 0 1 i! 2t e e i! 2t 0 1 0 Temos h j U j+i = 2 1 B ! sin t ~! 2 B ! 2 sin t ~! 2 e 2 it! sin 2 jh j U j+ij = sin2 133 1 = e 2 it! j+i 8.4 Rotações Como vimos, a dinâmica dos sistemas em MQ pode ser descrita através do operador de evolução temporal, o qual respeita a equação diferencial i~ dU ^ : = HU dt Obviamente, ambos os lados desta equação representam operadores. O que implica que, para qualquer vetor j 0 i num instante inicial t = 0, temos i~ dU j dt 0i ^ j = HU 0i ) i~ d j dt ti ^j =H ti ; j ti = U (t) j 0i : ^ e tendo as Encontrar a dinâmica do sistema descrito pelo hamiltoniano H condições iniciais adequadas é encontrar uma coleção de vetores j t i, identi…cados pelo parâmetro t, que respeite a equação diferencial acima. No que segue chamaremos esta coleção de vetores de “um vetor dependente do tempo”. Suponha então que você encontrou um vetor j t i que respeita a equação acima. Isso implica que, dado um operador inversível (independente do ^ , o vetor tempo) M ^ j ti ; j ti = M respeitará a seguinte equação: ^ d j i~M dt ti ^H ^j =M ti ) i~ d ^ Mj dt ti ^H ^M ^ =M 1 Mj ti ) i~ d ^H ^M ^ j ti = M dt com isso d ^ 0 j ti ; H ^0 = M ^H ^M ^ 1: j ti = H dt Com isso, conhecida a solução de uma equação diferencial podemos construir soluções para outras equações diferenciais (diferentes). Esse é um procedimento matemático geral. No caso da MQ, gostaríamos que esta nova equação diferencial também descreva algum sistemas físico (diferente do inicial). Ou seja, gostaríamos que j t i fosse a evolução temporal de algum sistema físico ^ 0 . Para isso, obviamente, H ^ 0 deve ser também descrito pelo hamiltoniano H um hamiltoniano, ou seja, deve ser um operador hermitiano i~ ^0 = H ^ 0+ ) M ^H ^M ^ H 1 ^H ^M ^ = M 1 + ^ = M 1 + ^M ^+ H Assim, ^+ = M ^ M 1 ; ^ deve ser um operador unitário. ou seja, M Assim, dado um operador unitário qualquer, e a solução de um sistema físico qualquer, podemos construir soluções de um novo sistema físico. Neste processo temos a di…culdade em identi…car esta nova descrição quântica com algum sistema clássico (ou mesmo se este existe). Além, é claro, de saber se este sistema tem algum interesse. 134 1 j ti ; Além disso, usando U (t) = 1 X n=0 temos n i t ~ i ^+ t H ~ ^n = I + H i ^H ^M ^+ + t M ~ ^ U (t) M ^+ = M ^ IM ^+ + M =I+ i ^H ^M ^+ + t M ~ =I+ i ^0 + t H ~ = 1 X i t ~ n=0 n i t ~ 2 ^H ^ + ::: H 2 i t ~ ^H ^H ^M ^ + + ::: M 2 i t ~ ^H ^ M ^ +M H ^M ^ + + ::: M 2 i t ~ ^ 0H ^ 0 + ::: H ^ 0 n = U 0 (t) : H Ou seja, ^ U (t) M ^+ ; U 0 (t) = M ^ 0. é o operador de evolução temporal para o sistema com hamiltoniano H Exercise 51 O resultado acima continua válido para o caso geral em que o hamiltoniano não comuta em diferentes instantes do tempo? Por exemplo, suponha agora que você encontrou (como feito anteriormente) a solução do problema de uma partícula de spin 1=2 num campo magnético da direção z. Neste caso, ^ = H 3 :B = 1 0 B 0 1 : E deseje encontrar a solução para o mesmo problema, mas com um campo (de mesma intensidade) na direção x, ou seja, como o hamiltoniano ^0 = H 1 :B = 0 1 B 1 0 : Fisicamente isso signi…ca, obviamente, que você girou de 90o o aparelho que gera o campo. Agora, usando as propriedades das matrizes é fácil ver que "p # "p # 2 2 1 (1 i 2 ) 3 (1 + i 2 ) = ( 2i 2 3 ) = 1 : 2 2 2 Além disso, p 2 (1 i 2 ) = 2 p 2 2 p 2 i 2 2 ! = cos 4 135 i 2 sin 4 = exp i 4 2 ^ : =M Assim ^0 = H 1 :B ^ M = ^ + :B = M ^( ^+ = M ^H ^M ^+ 3M 3 :B) M onde ^ = exp M i : 2 4 ^ acima representa uma rotação (no sentido Assim, o operador (unitário) M anti-horário) na direção do eixo y de um ângulo de 90o ^y R 2 = exp i : 2 4 Isso se aplica a qualquer dispositivo do nosso experimento. Por exemplo, se temos um SG na direção x, i.e., estamos medindo o spin na direção x ~ S^x = 1 2 e fazemos ^y R ^y S^x R 2 2 = ~^ Ry 2 ^ 1 Ry 2 2 = ~ 2 3 = S^z ; teremos um SG na direção z e passaremos a medir o spin na direção z. Da mesma forma, é possível mostrar que uma rotação de um ângulo qualquer no sentido anti-horário na direção do eixo y vale ^ y ( ) = exp R i 2 2 : Exercise 52 Mostre que se temos um campo na direção z e rodamos de um ângulo , os hamiltonianos obtidos estarão ligados pelo operador acima. Mais ainda, repetindo todos estes argumentos para as direções x e z temos que ^ x ( ) = exp R i 2 1 ^ z ( ) = exp ; R i 2 3 ^ i ( ) = exp )R i 2 i : Ou seja, de forma geral, ^ n^ ( ) = exp R ^: i n 2 = cos 2 i^ n: sin 2 ; é o operador de rotação na direção do vetor normal n ^ de um ângulo anti-horário. Exercise 53 Mostre que 2 (^ n: ) = I : 136 no sentido Exemplo 1: Suponha que você resolveu o problema para um campo de intensidade na direção x, ! p p p 2B i ^ = H 2B 1 ) U (t) = exp 2B 1 t = cos t i 1 sin ~ ~ p 2B p 2B t ~ ! e quer resolver o problema para um campo de mesma intensidade fazendo um ângulo de 45o no plano x; y. Neste caso, ^0 = B ( H 1 + 2) : Primeiramente veri…camos que ^z R 4 ^R ^z H = exp 4 i = exp i 8 p = 2B Usando 3 1 4 ^R ^z H 8 sin2 8 8 i i 8 3 2 2 sin 2 sin cos 8 8 p p = 4 cos2 3 q temos ^z R h ^ exp i H 8 p 2B 1 exp q p 1 2 + 2 ; sin = 2 2 8 2 p p 2 2 sin2 = ; sin cos = 8 2 8 8 4 1 cos = 8 2 cos2 3 8 2B 1 p p h cos2 8 2 ( 1+ 2 = B ( 1 + 2) = B 2 sin2 8 i 2 cos 8 8 2) que é o hamiltoniano cuja solução gostaríamos de encontrar. Ou seja, como era de se esperar, uma rotação de 45o levou o campo que estava no eixo x no campo desejado. Assim, a solução do nosso problema vale ^z U 0 (t) = R = exp = cos = cos 4 i ^z U (t) R " 3 8 ! p 2B t ~ ! p 2B t ~ 4 2B t ~ cos i p h 1 cos p 2 i ( 2 ! 1 + i 1 p 2B t ~ sin 2 2 8 sin 2 ) sin 137 8 p +2 2B t ~ ! 2 : !# cos exp i 8 sin 8 8 3 i sin p 2B t ~ ! Que concorda com o resultado (??) obtido para o mesmo problema anteriormente. Exercise 54 Uma partícula de spin 1 2 está sujeita ao campo B = (0; By ; Bz ) : ^ que leva este campo para a direção z Encontre a rotação R B0 = (0; 0; Bz0 ) : Em seguida encontre U 0 para B0 e use o resultado para encontrar a solução para o campo B. Resolva diretamente o problema para B e compare os resultados. O procedimento do exercício acima pode ser usado para resolver o problema para um campo estático numa direção arbitrária. Vemos assim que qualquer problema de dois níveis independente do tempo possui solução exata. 8.5 Espinores Observe que o ângulo presente no operador de rotação é o ângulo (no espaço físico) que giramos nosso experimento. Além disso, como vimos anteriormente, é possível orientar o spin da partícula numa direção qualquer através da aplicação de campos magnéticos. Ou seja, se uma partícula é preparada no estado j+i e desejamos girar seu spin de 90o na direção y, de sorte que este …que na direção +x basta aplicar o campo ^ = B = B y^ ) H B 2 ) U (t) = exp para termos i B ~ 2t 2 jhx+ j U (t) j+ij = 1 : Calculando explicitamente hx+ j exp i B ~ 2t h i j+i = hx+ j cos Bt + i 2 sin Bt j+i ~ ~ i h = hx+ j cos Bt j+i + i 2 j+i sin Bt ~ ~ h i = cos Bt hx+ j+i + ii hx+ j i sin Bt ~ ~ 1 1 = p cos Bt p sin Bt ~ ~ 2 2 h i 1 = p cos Bt sin Bt ~ ~ 2 i 1 h = p cos Bt sin Bt ~ ~ 2 138 temos 2 jhx+ j U (t) j+ij = sin 2 Bt = ~ 1h 1 2 2 cos ~ i 1h i 1 sin 2 Bt = 1 Bt = ~ 2 ~ ~ )t= : 2 4B Bt sin 1 ) 2 Bt = ~ Assim, para levarmos o spin de +z para a direção +x basta aplicar o operador U (T ) = exp i B ~ 2T = exp i 2 4 = Ry 4 ; que nada mais é que uma rotação de 90o no eixo y. Ou seja, se o spin estava na direção +^ z (o que signi…ca que, numa medida de Sz obteremos +h=2 com certeza), depois de virado 90o ele foi pra direção +^ x (o que signi…ca que, numa medida de Sx obteremos +h=2 com certeza). O que concorda bastante com a visão clássica de momento angular. Remark 55 Aplicar o operador Rn^ ( ) num estado j i gira o spin deste estado de um ângulo na direção n ^. Problem 56 O que acontece quando você gira de 360o o spin de uma partícula? Pelo que foi dito acima, o resultado será o vetor ^ n^ (2 ) j i = exp j 0i = R = (cos = j i i 2 n ^: 2 j i = exp ( i n ^: ) j i i (^ n: ) sin ) j i Remark 57 Ou seja, você não vai obtermos o mesmo estado, mas sim com um sinal invertido! Lembre-se que, em problemas de mecânica, temos uma de…nição mais restrita para o conceito de vetores. Vetores são quantidades que, por uma rotação do sistema de coordenadas, se transformam como as componentes das coordenadas (veja, por exemplo, o livro do Marion de Mecânica). Em especial, por uma rotação de 360o todos os vetores voltam ao mesmo estado. Vemos então que os nossos estados para as partículas de spin 12 não se comportam como vetores (no sentido da lei de transformação). Quantidades que se transformam como os estados acima são chamados de espinores. Ou seja, para retornar ao seu estado original um espinor precisa sofrer uma rotação de 720o . Assim, o momento magnético estudado aqui possui uma natureza diferente do momento magnético estudado em mecânica (ou eletromagnetismo). Enquanto este último é um vetor, o primeiro é um espinor. 139 Como na mecânica clássica, este momento magnético pode ser associado ao momento angular do sistema C ^: = L ; ^Q = S ^ é um espinor. Ou seja, quando usamos as Entretanto, enquanto L é um vetor S notações ^ = B ^=~ ; H S B; 2 estamos fazendo um abuso da notação vetorial. Recapitulando, se j i é o estado da partícula num certo estado de spin, então, o estado j 0 i obtido por uma rotação do spin de um ângulo vale ^ n^ ( ) j i : j 0i = R Observe também que, 0 ^: i n 2 ^ n^ (0) = exp R =I : Além disso, para rotações na mesma direção ^ n^ ( 1 ) R ^ n^ ( 2 ) = exp R i 1 2 n ^: exp i 2 2 n ^: = exp i ( 1 + 2 2) n ^: ^ n^ ( =R Ou seja, o operador de rotação compartilha todas as características do operador de evolução. Tudo que precisamos fazer e achar um hamiltoniano que nos dê o operador de evolução desejado. Lembrando agora que ^ = H B B =) U (t) = exp i B t ~ B = exp i B ( ~ n ^) t ; onde n ^ é um vetor unitário na direção de B. Basta agora comparar U (t) = exp i B ( ~ n ^) t = exp i n ^: 2 ^ n^ ( ) : =R Ou seja, a aplicação de um campo B, por um tempo t é equivalente a girar o spin da partícula de um ângulo =2 B t; ~ na direção do campo (o sinal de indica que o giro é no sentido horário). Desta forma, através da aplicação de campos magnéticos, podemos manipular e produzir estados com qualquer valor desejado de spin. Como vimos acima, diferente de um vetor, por uma rotação de 360o um espinor se transforma como 360o j i ! j i : Entretanto, os dois estados acima diferem apenas por uma fase. 140 1 + 2) Problem 58 Será que esta fase tem algum signi…cado físico? Em outras palavras, será que é possível detectar alguma diferença quando um sistema físico é girado de 360o .? Como apresentado no primeiro postulado, uma fase global não possui nenhum signi…cado físico. Entretanto, a diferença de fase entre dois estados (que se comporta como uma fase local) pode ser medido. Pois, pelo comportamento ondulatório dos sistemas, a combinação de dois estados com uma defasagem de 180o é completamente destrutiva. Lembre-se que a probabilidade é o módulo quadrado da soma das amplitudes. O experimento da …gura abaixo (proposto por J. Bernstein, Yakir Aharonov e Leonard Susskind) utiliza um feixe de nêutrons que é dividido por um cristal A e, em seguida, por mais dois cristais B e C, e se recombinam num cristal D. Estes cristais (feitos com silício) dividem o feixe em dois feixes de intensidades iguais. Assim, este se comporta exatamente como um experimento de duas fendas para o elétron. Ou seja, se jABi é o estado do nêutron quando ele sobe após passar pelo cristal A e jACi o estado quando ele desce, ao passar pelo cristal o nêutron estará num estado 1 p (jABi + jACi) ; 2 onde a soma indica que estes dois estados estão em fase. Após passar pelo cristal o nêutron pode ter seguido qualquer um dos dois caminhos (com a mesma probabilidade), de sorte que no ponto D as suas funções de onda em todas as trajetórias possíveis se interferem (ou seja, assim como no experimento de duas fendas, ele interfere com ele mesmo). Mais ainda, podemos descrever o estado do nêutron quando chega em D como 1 p (jCDi + jBDi) 2 O feixe no caminho BD passa por um campo que, quando ligado, gira o spin do nêutron de 360o . Se o campo está desligado os dois feixe são idênticos e sua recombinação é construtiva no ponto D (o experimento é ajustado para que isso aconteça) 2 1 1 P = p (hCDj + hBDj) p (jCDi + jBDi) = 1 2 2 Observe que, se a partícula foi numa direção ela certamente não foi na outra, hCD jBDi = 0. Entretanto, quando o campo é ligado, o estado do nêutron que chega em D passa a ser 1 p (jCDi jBDi) 2 e a combinação em E é completamente destrutiva e nenhuma partícula é detectada 1 P = p (hCDj 2 1 hBDj) p (jCDi + jBDi) 2 141 2 = 1 (1 2 2 1) =0: Figure 11: Bernstein, Herbert J.; Phillips, Anthony V., Fiber Bundles and Quantum Theory, Scienti…c American, vol. 245, issue 1, pp. 122-137 (1981) 142 Assim, é possível detectar experimentalmente uma diferença num sistema girado de 360o . Nenhuma quantidade clássica apresenta esta característica. Este experimento foi realizado (entre outras vezes) em 1975 por Helmut Rauch e Ulrich Bonse no Instituto Laue-Langevin em Genebra. A descrição acima deixa claro que o spin é um momento angular de natureza completamente diferente do momento angular orbital. Assim, quando no futuro obtivermos um operador que represente o momento angular orbital clássico de um sistema, este terá um comportamento completamente diferente do descrito para o spin (em especial, ele se comportará com um vetor e não como um espinor). Com isso, o spin é uma característica (sem análogo clássico) que as partículas possuem. E não uma característica gerada por algum efeito, como rotação ou qualquer coisa do gênero. 9 Ressonância Vamos usar o resultado acima para resolver o seguinte problema (complicado!). Uma partícula de spin 1=2 está sujeita a um campo de intensidade Bz0 na direção z^ e um campo, de intensidade B 0 , que gira no plano x; y B0 = (B 0 cos !t; B 0 sin !t; Bz0 ) Com isso, o hamiltoniano do nosso sistema se torna ^0 = H ^ 0 (t) = H (B 0 cos !t + B 0 2 sin !t + Bz0 ) h i ^ (t) ; H ^ (t0 ) 6= 0, podemos escrever Pelas razões discutidas antes, mesmo H U (t) = exp 1 i ~ Z t H (t) d 0 entretanto, a presença do termo Bz t inviabiliza a aplicação da técnica anterior. Tudo que precisamos fazer é “mudar nosso sistema de coordenada”, i.e., vamos observar este campo de um sistema que gira junto com o campo. Ou seja, um sistema que gira na direção do eixo z com velocidade angular !t. Neste caso, temos apenas um campo estático no plano x; y de intensidade B e outro, também estático, na direção z de intensidade Bz . Este problema com campo independente do tempo pode ser resolvido sem muitos problemas. Seguindo a nomenclatura da seção anterior, vamos chamar de quantidades com linha aquelas que queremos resolver (o campo girante) e sem linha aquelas que sabemos ^ 0 se relaciona resolver (o campo estático). Sabemos que nosso hamiltoniano H ^ pela relação (??) com H ! ^ 1 d M ^0 = M ^H ^M ^ 1 i~M ^ : H dt ^ Problem 59 Mas qual o hamiltoniano H? 143 ^ representa um campo estático no plano x; y combinado com Sabemos que H um campo estático na direção z. Além disso, podemos começar a girar o nosso sistema no instante em que o campo girante aponta na direção do eixo x (isso signi…ca apenas escolher adequadamente a fase da nossa rotação). Com isso, podemos escrever ^ = (B 1 + Bz 3 ) : H Além disso, também pelo que foi apresentado antes, sabemos que o operador responsável pela rotação desejada é Rz (!t + ) = exp i (!t + ) 2 3 Onde é apenas uma fase indicando quando começamos a girar. Escolher esta fase signi…ca dizer em que direção do plano x; y estamos vendo o campo. Assim, se j 0 i é a solução do problema com o campo girante, a solução j i com o campo estático é dada por j i = Rz j 0 i =) j 0 i = Rz 1 j i : Comparando com (??) vemos que, neste caso, ^ (t) = R ^ 1 (!t + ) M z ^ 0 com o campo girante se relaciona com o Sabendo que o hamiltoniano H ^ hamiltoniano H com o campo estático pela relação (??) ! ! ^ 1 ^z d R d M 0 1 1 1 ^ =M ^H ^M ^ ^ ^z H ^R ^ z i~R ^z H i~M =R dt dt Com isso, temos dRz = dt i ! 2 3 exp 1 ^ 0 = Rz HR ^ H z (!t + ) ! = i 3 Rz 3 2 2 ! !~ 1 ^ i~Rz i 3 Rz 1 = Rz HR z + 2 2 i 3 calculando ^z H ^R ^z 1 = R ^z BR ^ 1 Rz 1 ^z + Bz R ^ 3 sin 2 sin (!t + ) 3 Rz 1 = ^z BR ^ 1 Rz 1 + Bz 3 onde ^z R ^ 1 Rz 1 (!t + ) i 2 (!t + ) cos2 2 = cos = 1 = 1 cos (!t + ) + (!t + ) (!t + ) (!t + ) + i 3 sin 1 cos 2 2 2 (!t + ) (!t + ) (!t + ) sin2 + 2 2 cos sin 2 2 2 144 Podemos agora acertar a nossa fase exigindo que em t = 0 o campo aponte apenas na direção x ^ z (0) R ^ 1 Rz 1 (0) = 1 cos ( ) + 2 sin ( ) = 1 =) =0; com isso temos ^z H ^R ^z 1 = R [B 1 cos (!t) + B 2 sin (!t) + Bz 3] ^ 0 temos Substituindo agora em H ^ 0 = Rz HR ^ z1+ ! H 2 = B 1 3 = [B cos (!t) + B 1 cos (!t) + B sin (!t) + Bz + 2 2 sin (!t) + Bz !~ 2 3] + !~ 2 3 3 Ou seja, o nosso problema girado representa a aplicação do seguinte campo dependente do tempo B= B cos (!t) ; B sin (!t) ; Bz + !~ 2 podemos identi…car com o campo desejado B0 = (B 0 cos !t; B 0 sin !t; Bz0 ) fazendo B 0 = B ; Bz0 = Bz + ! ) Bz = Bz0 2 !~ 2 onde lembramos que as quantidades conhecidas (i.e., os campos reais) são aquelas com linha. Tudo que precisamos fazer agora é encontrar a solução para ^ = H (B 1 + Bz 3) ) U (t) = exp Usando (B 1 + Bz 2 3) i (B ~ 1 + Bz 3) t = B 2 + Bz2 temos ! i p 2 (B + B ) 1 z 3 U (t) = exp B + Bz2 p t ~ B 2 + Bz2 p p (B 1 + Bz 3 ) = cos B 2 + Bz2 t i p B 2 + Bz2 t sin 2 2 ~ ~ B + Bz (B 1 + Bz 3 ) = cos ( t) i p sin ( t) B 2 + Bz2 p = B 2 + Bz2 ~ 145 Podemos agora responder qualquer pergunta sobre o comportamento do sistema. Suponha, por exemplo, que você preparou sistema inicialmente no estado j+i, ou seja, j 0 i = j+i observe que 0 0i j ^ z (0) j =R 0i =j 0i ; ou seja, a condição inicial vale tanto para o nosso sistema com e sem linha. Problem 60 Ao aplicarmos o campo girante, qual a probabilidade de, depois de um tempo T , o sistema ser encontrado no estado j i? Para isso basta calcular 0 f j 0 ti onde h 0 f = Rz 1 (!t) j " 1 0 f = Rz 1 (!t) U (t) j 1 Rz (!t) U (t) j+i = h Rz (!t) j+i cos ( t) i h j Rz 1 0i # (B 1 + Bz 3 ) (!t) p j+i sin ( t) B 2 + Bz2 # h j Rz 1 (!t) B j i + h j Rz 1 (!t) Bz j+i p cos ( t) i sin ( t) = h j+i e B 2 + Bz2 " # ! ! h j i ei 2 t B + h j+i e i 2 t Bz p = i sin ( t) B 2 + Bz2 " # B i! t = ie 2 p sin ( t) B 2 + Bz2 " com isso jh ti i! 2t 2 Rz (!t) U (t) j+ij = = B2 sin2 ( t) = B 2 + Bz2 ~ s B 02 + Bz0 ! 2 B 02 B 02 + Bz0 ! 2 2 sin2 ( t) 2 Do resultado acima vemos que a nossa probabilidade é máxima quando 2 Bz0 !~ =0)!= : 2 ~ Bz0 Esta é a freqüência de ressonância do sistema. Ou seja, apenas quando o campo na direção z respeita esta relação com a freqüência de giro do campo no plano x; y, temos a possibilidade de inversão de todos os spins do nosso sistema. Obviamente, para que esta inversão ocorra, o campo tem de ser aplicado exatamente por um tempos sin2 ( R t) =1) Rt = 2 mod ( ) = 146 ~ B0t ) t = ~ mod ( ) ; 2 B0 onde R é calculado na ressonância R = jB 0 j : ~ Observe que o nosso hamiltoniano tem a forma ^ = H = (B 0 1 cos !t + B 0 Bz0 B 0 ei!t 2 sin !t + Bz0 3) Bz0 B 0 (cos !t i sin !t) B (cos !t + i sin !t) Bz0 = 0 B 0 e i!t Bz0 que, na forma de operadores, na base fj+i ; j ig pode ser escrito como ^ = H Bz0 j+i h+j Bz0 j i h j + B 0 e i!t j+i h j + B 0 ei!t j i h+j ou seja, os elementos fora da diagonal são os responsáveis pela transição entre diferentes estados da nossa base. Quando B0 = 0 não existe transição e os estados j+i e j i são estacionários. A presença do campo B 0 promove esta transição e esta é máxima na freqüência de ressonância. Como dissemos, a descrição de uma partícula de spin 1=2 é apenas um caso particular do caso geral de um sistema de dois níveis. Para um sistema geral de dois níveis podemos escrever ^ = E1 j+i h+j + E2 j i h j + V12 j+i h j + V21 j i h+j ; H ou ainda, para o caso de um sistema de dois níveis sujeito a um potencial girante (que pode ser um campo elétrico, magnético ou qualquer outra coisa) ^ = E1 j+i h+j + E2 j i h j + V e H i!t j+i h j + V ei!t j i h+j : Quando o potencial é desligado V = 0 os estados com energia E1 e E2 são estacionários e quando este potencial é ligado, temos a transição entre os níveis. A transição é máxima na freqüência de ressonância. Para encontrar a freqüência de ressonância neste caso, basta observar que, no caso do campo magnético a diferença de energia entre os níveis diagonais valia E1 E2 = (Bz0 + Bz0 ) = 2 Bz0 então, no caso geral temos != 2 Bz0 E1 E2 = ) ~! = E1 ~ ~ E2 : Se usarmos o modelo de que o campo eletromagnético é formado por fótons com energia ~!, a ressonância ocorre quando a freqüência dos fótons do campo girante é igual a diferença de energia dos níveis do sistema. 147 = Exercise 61 Mostre que, ^ =M ^ H = 1 ^ dM dt ^ 0M ^ + i~ H B0 f 1 cos ( 1 )+ ! 2 ^ M sin ( )g + Bz0 + !~ 2 3 onde ^0 = H ^ 0 (t) = H ^ = Rz (!t M (B 0 1 cos !t + B 0 ) = exp i 2 (!t + ) 2 sin !t + Bz0 3) 3 Os resultados acima possuem uma in…nidade de aplicação em física. Por exemplo, uma molécula de amônia (NH3 ) num campo elétrico constante possui dois níveis de energia que dependem da orientação do átomo de nitrogênio. Através de um experimento tipo SG (mas usando campo elétrico variável no espaço e não campo magnético) é possível selecionar toras as moléculas no estado j2i, i.e., com energia no estado fundamental. Se estas moléculas entram num campo girante na freqüência de ressonância no tempo certo (calculado anteriormente) todas estarão no estado excitado. Ainda pela ação do campo estas moléculas vão decair emitindo fótons de mesma energia que os absorvidos anteriormente. Estes fótons irão se somar com o do campo aplicado e, durante algum tempo, teremos uma ampli…cação do campo. Desta forma podemos gerar pulsos de campo ampli…cado. Este processo se chama Ampli…cation by Stimulated Emission of Radiassion. No caso das moléculas de amônia, como a freqüência de ressonância esta no espectro de microondas: Microwave ASER, ou MASER. No caso de sistemas cuja freqüência de ressonância está no espectro do visível: Light ASER ou LASER. Para a próxima aplicação é importante analisar o comportamento da amplitude máxima com relação à freqüência. Plotando a função V2 f (!) = V2+ (E1 E2 ) ~! 2 2 temos algo como a …gura abaixo. Controlando o potencial (ou campo) constante é possível estreitar a largura do pico. Assim, sob condições experimentais adequadas este pico é tão estreito que, mesmo na presença de uma série de sistemas (átomos, moléculas etc) diferentes, é possível excitar apreciavelmente apenas um tipo de sistema especí…co. Com isso, outro exemplo de aplicação é quando você tem uma grande quantidade de um certo átomo que sabidamente estão no estado fundamental (e.g., por equilíbrio térmico). Neste caso, se você sabe a diferença de energia entre o estado fundamental e o primeiro estado excitado, é possível excitar o sistema com uma radiação na freqüência de ressonância e, quando o sistema decair, você 148 Figure 12: Figura retirada do Sakurai pode medir a intensidade da radiação emitida e saber quantos átomos daquele tipo existem no sistema. Além disso, se o sistema é composto por vários átomos diferentes, apenas o elemento que você deseja medir irá responder a este processo. Este é o mecanismo dos aparelhos médicos MRI (Magnetic resonance imaging). Além do mecanismo de qualquer tipo de análise com ressonância magnética (e.g., MRN). Este mesmo processo é usado para excitar certas moléculas, como a de água no forno de microondas e uma in…nidade de aplicações. Um detalhe na teoria desenvolvida acima é a di…culdade de se produzir campos girantes com freqüências altas o su…ciente. Por isso, no lugar de um campo girante é utilizado um campo linear do tipo B = (B cos (!t) ; 0; Bz ) : Este problema não pode ser resolvido pelo método anterior, mas deve ser atacado por métodos aproximativos. Entretanto, o fato de um campo linearmente polarizado ser a superposição de dois campos circulares em direções opostas, faz com que os resultados sejam idênticos aos obtidos acima. Voltaremos a este problema quando estudarmos métodos aproximativos. 10 Observáveis compatíveis Uma questão crucial em MQ é quando uma medida perturba o sistema, ou ainda, quando um observável tem um valor bem de…nido. Como vimos, para 149 que a medida de uma quantidade A^ não perturbe o sistema, este deve estar ^ Assim, A^ não irá perturbar um sistema que esteja num num auto-estado de A. auto-estado A^ j i = a j i : De outra forma, a medida do observável A^ num estado genérico X j i= cn j n i ; A^ j n i = an j n i ; fará com que, após a medida, o sistema colapse num dos auto-estados j n i de ^ A. Suponha agora que, depois de efetuada uma medida de A^ desejamos efetuar ^ Isso só será possível, sem perturbar o uma medida de outro observável B. sistema, se o vetor obtido após a aplicação de A^ em j a i também for um ^ ou seja, se autovetor de B, ^ A^ j i = b0 A^ j i = b0 a j i = b j i ; b = b0 a ; B ou seja, j ^ B, ai tem de ser simultaneamente autovetor dos dois operadores A^ e ^ j i = bj i : A^ j i = a j i ; B Mas, se isso é verdade, temos ^ j i = ab j i ; A^B ^ A^ j i = ba j i = ab j i ; B ou ainda, h ^ A^B i ^ A^ j i = 0 B ^ Para qualquer auto-vetor simultâneo de A^ e B. ^ A quantidade acima é o comutador entre os operadores A^ e B h i ^ B ^ = A^B ^ B ^ A^ : A; ^ temos Além disso, se todo o autovetor de A^ for também autovetor de B h i ^ B ^ j n i = 0 ; A^ j n i = n j n i A; e sabemos que qualquer vetor pode ser escrito como X j i= cn j n i n temos que h i h iX ^ B ^ j i = A; ^ B ^ A; cn j n ni 150 = X n h i ^ B ^ j cn A; ni =0 h i ^ B ^ = 0 para qualquer vetor j i do nosso espaço, então A^ e B ^ Ou seja, se A; tem uma base de auto-vetores em comum. Mais ainda, podemos efetuar medidas de um dos operadores sem alterar o valor do outro. Ou ainda, os dois observáveis podem ser medidos simultaneamente. Quando h i ^ B ^ =0 A; ^ comutam, ou ainda, que estes observáveis são compatíveis. dizemos que A^ e B Remark 62 Apenas observáveis compatíveis podem ser medidos simultaneamente em MQ. Os resultados acima nos dizem quando devemos esperar uma incerteza relacionada a medida de dois observáveis quaisquer. Por exemplo: Um exemplo é o caso do spin da partícula. Como vimos, os operadores de spin nas direções x; y; z são dados por: ~ S^i = 2 i ; 1 0 1 = 1 0 ; 2 0 i = i 0 ; 3 1 0 = 0 1 : Vamos então à descrição de uma série de medidas do spin de uma partícula. Suponha que você alinhou o aparato de SG na direção z, ou seja, efetuou uma medida de S^3 e obteve o valor +1 (a partícula subiu). Com isso, pelos postulados vistos, sabemos que a partícula, após a medida, está num auto-estado de S^3 com valor +1: 1 jz+ i = : 0 Suponha agora que, depois desta medida, você alinha o aparato da direção x efetua uma nova medida. Após esta segunda medida o sistema irá colapsar num dos autovetores de S^1 1 jx+ i = p 2 1 1 1 1 = p (j+i + j i) ; jx i = p 2 2 1 1 : Exercise 63 Veri…que que estes vetores são autovetores de S^1 com auto valor +1 e 1. A questão é a seguinte: você sabe que o seu sistema está no estado jz+ i (pois você mediu o spin na direção z) e que saber, por exemplo, a probabilidade de, numa medida do spin na direção x obter o valor +1. Pelos postulados vistos anteriormente, sabemos que a probabilidade P (x+ ) de encontrar o sistema no estado jx+ i, sabendo que ele está no estado jz+ i, vale 2 P (x+ ) = jhx+ jz+ ij = 1 1 p 2 0 Da mesma forma 2 P (x ) = jhx jz+ ij = 151 1 2 1 1 2 = 1 2 ou seja, você tem uma incerteza total na medida do spin na direção x. Agora, se você efetuou a medida na direção x (do estado jz+ i) e obteve o valor +1 (a partícula foi para a direita), você sabe que após a medida a partícula está no estado 1 1 1 jx+ i = p = p (j+i + j i) : 1 2 2 Se você …zer novamente uma medida do spin na direção z, a probabilidade de obter novamente +1 vale 1 2 P (z+ ) = jhz+ jx+ ij = p 2 1 1 0 1 2 = 1 2 Da mesma forma P (z ) = 1=2. Ou seja, após a medida na direção x você perdeu toda a informação do spin na direção z. O ponto aqui é que a medida de um dos observáveis perturbou o valor do outro. Ou seja, não podemos medir, simultaneamente, Sx e Sz . Isso já era de se esperar pelo resultado anterior, pois estes operadores não comutam: h i ~ S^x ; S^z = 2 2 ~ = 2 0 1 0 1 1 0 ; 1 0 ~ 2 1 0 = 0 1 i ~2 2 = 0 i ~ 2 2 i 0 0 2 = 2 0 i ~2 S2 6= 0 : 2 A caracterização de um certo sistema físico depende, em geral de uma série de características e medidas. Por exemplo, a partícula pode ter spin Sz e momento P e nomeamos seu estado como jSz ; P i ; ^ ou ainda, dois valores quaisquer dos observáveis A^ e B, jA; Bi : Quanto mais características damos a um estado físico melhor o especi…camos. Entretanto, dizer que o sistema possui as características A e B signi…ca que estas características possam ser determinadas simultaneamente. Ou seja, para rotular os estados devemos escolher apenas observáveis compatíveis. Assim, não podemos caracterizar o sistema num estado do tipo jSz ; Sx i : Diferente da MC onde podemos fazer cada vez mais medidas no nosso sistema e, destarte, melhor caracterizá-lo, na MQ a caracterização do sistema está restrito a compatibilidade dos observáveis. Quando temos um conjunto de observáveis compatíveis que são capazes de caracterizar completamente um sistema físico, dizemos que temos um conjunto completo de observáveis. 152 10.1 Relações de incerteza Uma quantidade clássica muito usada para caracterizar a incerteza de uma medida A é o desvio quadrado médio 2 A 2 = A2 hAi Pelos postulados da MQ sabemos que, o valor médio de um observável A^ num estado vale hAi = h j A^ j i ; e a versão quântica para o desvio padrão pode ser escrita como 2 A ( ) = h j A^2 j i 2 h j A^ j i se …zemos A^ = A^ h j A^ j i podemos escrever 2 A ( ) = h j A^2 j i Exercise 64 Veri…que a a…rmação acima. ^ Considere agora dois observáveis A^ e B. Um resultado conhecido como desigualdade de Schwarz h j ih j i 2 jh j ij ; nos diz que, para qualquer operador hermitiano A^ e qualquer vetor j i (não necessariamente normalizado), ^2 j i h j A^2 j i h j B ^ j i h j A^ B 2 com isso temos 2 A ( ) 2 B ^2 j i ( ) = h j A^2 j i h j B ^ j i h j A^ B 2 (75) ^ nem sempre o será. Além disso, apesar de serem hermitianos, o produto A^B Com isso a quantidade ^ j i h j A^ B será, em geral, complexa ^ j i h j A^ B 2 h i2 h i2 ^ j i ^ j i = Re h j A^ B + Im h j A^ B Podemos agora calcular ^ j i ^ j i = 1 h j A^ B Im h j A^ B 2i 153 ^ j i h j A^ B h ^ j i Im h j A^ B (76) i2 Mas, + ^ j i = h j A^ B ^ h j A^ B ^ + A^+ j i = h j B ^ A^ j i j i = h jB ^ Com isso onde, na última igualdade, usamos a hermiticidade de A^ e B. ^ j i = 1 h j A^ Im h j A^ B 2i 1 h j A^ = 2i h 1 h j A^ = 2i usando h temos ^ A^ ; B i h = A^ ^ j i B ^ B ^ A^ j i h jB ^ A^ B ^ ;B i j i j i i h i ^ j i = A; ^ B ^ h jB ^ h j A^ j i ; B i h ^ B ^ j i ^ j i = 1 h j A; Im h j A^ B 2i Usando (75), (76), (77) temos 2 A 2 B ( ) ( ) ^ j i h j A^ B h 2 ^ j i Im h j A^ B i2 (77) = i h 1 ^ B ^ j i h j A; 2i Com isso i h 1 ^ B ^ j i h j A; 2 ou seja, o produto da incerteza de qualquer medida é proporcional ao comutador dos operadores correspondentes. A 11 ( ) B ( ) Sistemas de várias partículas Em MQ a descrição de um sistema com mais de uma entidade se dá através do produto tensorial dos espaços de cada sistema. Então, usando a notação anterior, se j 1 i 2 H1 representa uma entidade do sistema (e.g., uma partícula) e j 2 i 2 H2 uma segunda entidade (e.g., uma segunda partícula), o estado quântico do sistema como um todo será: j i=j 1i j 2i j 1 2i ; j i 2 H = H1 Todos os operadores também serão escritos desta forma X ^i ; A^i 2 H1 ; B ^ i 2 H2 A^ = A^i B i A^ j i = X i A^i ^i j B 1i j 2i 154 = X i A^i j 1i H2 : ^i j B 2i 2 : Suponha, por exemplo, que você possui duas partículas de spin 12 . Primeiro, obviamente, precisamos escolher um observável para caracterizar as partículas. Podemos usar, por exemplo, o spin na direção z para caracterizar a primeira partícula e na direção x para caracterizar a segunda. Com isso, a forma geral de um vetor de estado do nosso sistema será j i = j 1 i j 2 i = (a+ j+i + a j i) (b+ jx+ i + b jx i) = a+ b+ j+; x+ i + a+ b j+; x i + a b+ j ; x+ i + b a j ; x i 2 Onde ja b j é a probabilidade de encontrar a primeira participa no estado j i e a segunda no estado jx i. Suponha que as duas partículas estão distantes e você passou a primeira por um SG na direção z e veri…cou que ela subiu (i.e., está no estado j+i) com isso o estado …nal do seu sistema será j fi = b+ j+; x+ i + b j+; x i : Vamos imaginar agora que as partículas estão juntas e vamos realizar experimento com ambas nos mesmos dispositivos. Neste caso, é interessante usarmos o mesmo observável para caracterizar ambas as partículas. Vamos então usar Sz para as duas partículas. Neste caso, um estado geral do nosso sistema vale j i = a+ b+ j+; +i + a+ b j+; i + a b+ j ; +i + b a j ; i 2 Onde agora ja b j é a probabilidade de encontrar a primeira participa no estado j i e a segunda no estado j i. O conjunto de vetores acima forma uma base para o nosso espaço. Observe que agora nossos vetores são matrizes coluna de 4 elementos. Na base canônica, usando o produto de Kronecker podemos escrever 0 1 1 B 0 C 1 1 C j+; +i = =B @ 0 A : 0 0 0 Suponha agora que estas duas partículas passam por um campo magnético B. Problem 65 Qual o hamiltoniano do sistema? Neste caso, nós precisamos saber se as partículas interagem entre si ou não. Ou seja, se o estado de spin de uma partícula in‡uencia no estado da outra. Supondo que as partículas não interagem, o hamiltoniano pode ser escrito como H= B I +I B: Para o caso em que os campos são diferentes em cada partícula, i.e., a partícula 1 está sujeita ao campo B1 e a 2 a um campo B2 temos: H= B1 I +I 155 B2 : Para o caso mais geral de partículas interagentes o hamiltoniano tem a forma H= I +I B1 B2 + 3 X Vij i j : ij=1 Exemplo: Duas partículas não interagente de spin 12 estão sujeitas a um campo de intensidade B na direção z. Se o sistema foi preparado inicialmente com ambas no estado j+i, qual a probabilidade de, depois de um tempo t, ambas serem encontradas no estado jx+ i? O operador de evolução do sistema será i Ht ~ U (t) = exp iB ( ~ iB ( ~ U (t) = exp = exp ; H= 3B 3 I +I 3 I) t exp I +I 3B iB (I ~ 3) t 3) t observe agora que ( 2 onde I é a identidade 4 exp I) = ( 3 iB ( ~ 3 3 I=I II) = I 4. Com isso 3 I) t = cos B t ~ i 3 I sin B t ~ Para responder nossa pergunta calculamos hx+ x+ j U (t) j++i = hx+ x+ j exp = exp = exp = exp iB ( ~ 3 I) t exp iB t hx+ x+ j++i ~ iB 2 t hx+ j+i hx+ j+i = exp ~ iB 1 2 t ~ 2 iB (I ~ 3) t j++i 2 2 iB t ~ 1 1 p p 2 2 ou seja 1 : 4 O que já era de se esperar, pois os estados j++i são estacionários e a probabilidade de cada um deles ser encontrado no estado jx+ i vale 1=2. 2 jhx+ x+ j U (t) j++ij = 156 Suponha que no exemplo acima a primeira partícula esteja sujeita ao campo B1 = B1 z^ e a segunda ao campo B2 = B2 x ^, H= lembrando que [ exp i (B1 ~ 3 1; 3] 3 B1 I +I 1 B2 6= 0 será que podemos escrever I +I B2 1) t iB1 ( ~ = exp 3 I) t exp iB2 (I ~ 1) t A resposta é sim, pois [ 3 I; I 1] =( =( 3 3 I) (I ( 1) 1) (I 1) ( 1) = 0 : 3 3 I) ^ 1 , o sistema 2 De forma geral, se o sistema 1 está sujeito ao hamiltoniano H ^ ao hamiltoniano H2 é os sistema não interagem: U (t) = exp i ^ H1 ~ I +I ^2 t H i ^ H1 ~ = exp It exp i I ~ ^ 2t H Remark 66 Como era de se esperar, sistemas sem interação evoluem independentemente, cada um com seu hamiltoniano. Como ocorre então na MQ a descrição da interação de duas partículas? Suponha agora que as partículas interajam entre si. Então esta interação será descrita por um operador na forma X A^i A^i A^ = i Ou seja, um operador que age, simultaneamente, nos dois espaços (e, conseqüentemente, nas duas partículas). O hamiltoniano total será X ^ =H ^1 I + I H ^2 + H A^i A^i i Onde os primeiro dois termos descrevem a interação de cada uma das partículas com o meio e o último termo a interação de uma partícula com a outra. 11.1 Interação de Heisenberg Vamos estudar com um pouco mais de detalhes o caso de duas partículas de spin 1 2 que interagem entre si. Em primeiro lugar este hamiloniano é um operador agindo no EH dos vetores de dimensão 4. Ou seja, é uma matriz 4 4. Uma base para este espaço pode ser construída com 16 matrizes LI. Lembrando que 157 : ? as matrizes i mais a identidade formam uma base para as matrizes 2 2, podemos formar com estas matrizes a seguinte base para o espaço das matrizes 4 4 I=I I ; i=I I ; ij = i i ; i = i j Ou seja, qualquer operador de interação (ou não) pode ser escrito na forma M= I+ 3 X iI i+ i=1 3 X i i I+ i=1 3 X !ij i j i;j=1 ^ 0 todos os demais termos, o Vamos olhar o primeiro termo. Chamando de H operador de evolução temporal para o sistema pode ser escrito como i ~ U (t) = exp = I exp ^0 t I +H i It exp ~ = exp i ^0 Ht ~ i ^0 Ht ~ i t exp ~ Ou seja, quando aplicado em qualquer vetor h j U j i = h j exp i t exp ~ i ^0 H t j i = exp ~ i t h j exp ~ i ^0 Ht j i ~ ou seja 2 jh j U j ij = h j exp i ^0 Ht j i ~ 2 Assim, este termo não in‡uência nas probabilidades e, conseqüentemente, na física do sistema. Fisicamente este termo está relacionado apenas com uma escolha no zero da energia do sistema, o que, em geral, é arbitrário. Com isso, podemos fazer = 0. Vamos agora analisar o segundo e o terceiro termo 3 X i=1 iI i ; 3 X i i I i=1 Como já vimos estes termos descrevem operações que agem em cada um dos sistemas separadamente e não representam uma interação. Ou seja, podemos, em geral incorporar estes termos na hamiltoniana de cada sistema independentemente: ^ 10 = H ^1 + H 3 X i i i=1 ^ 20 = H ^1 + H 3 X i=1 158 i i O tratamento matemático destes termos é o mesmo analisado anteriormente para sistemas sem interação. Por isso nós não vamos voltar nossa atenção para eles. Observe que não estamos fazendo i = i = 0. Pode ocorre que a presença de um sistema faça o outro “sentir” o campo aplicado de forma diferente. Mas, em muitos casos, isso pode ser descrito como um campo gerado pela própria partícula e descrito como um campo B0 efetivo. Por exemplo, no caso do momento elétrico e partículas carregadas este seria o campo elétrico que uma partícula cria na posição da outra. O importante é que, uma vez conhecido este campo ele pode ser tratado como um termo de campo externo e não como uma interação. Com tudo isso o termo que realmente importa para nossa interação é o produto tensorial das matrizes e nosso hamiltoniano pode ser escrito como: ^ = H B1 I +I B2 + 3 X !ij i j : ij=1 Os valores de !ij (no caso geral !ij = !ij (t)) devem ser determinadas experimentalmente analisando a in‡uência que um sistema tem sobre o outro. Neste aspecto o exemplo de duas partículas de spin 21 é o melhor e o pior exemplo possível. Ele é um exemplo ruim porque a interação que o spin de uma partícula exerce sobre a outra não é proveniente de nenhuma força conhecida na natureza (i.e., não de natureza gravitacional, eletrofraca, forte). Mesmo assim estas quantidades se in‡uenciam, no sentido que o fato do spin de uma partícula estar num certo valor pode diminuir a probabilidade do spin da outra partícula estar no mesmo valor. Este é o chamado princípio da exclusão e será visto quando estudarmos estatísticas quânticas. O ponto é que, por exemplo, quando uma partícula (e.g., um elétron num ponto quântico) é colocado no estado fundamental, necessariamente a outra irá para o estado excitado. Mesmo que nenhuma energia seja trocada entre as partículas. Por isso esta é chamada interação de troca. Mas o fato desta interação não ser de nenhuma natureza de forças conhecidas, faz com ela não possa ser medida diretamente por nenhum equipamento conhecido. Tudo que podemos fazer e estudar o comportamento de uma partícula na presença da outra e ver se houve alguma alteração em relação a partícula sozinha. Com tudo isso é fácil ver que é extremamente difícil determinar !ij e, em geral, esta quantidade depende não apenas das partículas em questão, mas das características do sistema como um tudo (se os elétrons estão num átomo ou num quantum dot). Ao mesmo tempo o caso de dois spins é um exemplo bom porque deixa explícito o fato que ao analisar a interação entre sistema não basta levar em conta os campos produzidos pelas partículas. Felizmente é possível fazer uma aproximação que funciona bem na maioria dos casos. Devido a simetria do espaço é de esperar que esta interação não dependa da orientação espacial do sistema (veja que isso não é verdade se um campo quebrar esta simetria, por isso dizemos que é uma aproximação). Assim, 159 ^ procurado deve comutar com as rotações o operador M h i ^n; M ^ =0: R É possível mostrar (exercício) que o seguinte operador possui esta característica ^ =V ( M =V 1 1 3 X i + i 2 2 + 3) 3 : i=1 Esta é a chama interação de Heisenberg e é usada para modelar grande parte dos sistemas onde a interação de spin é relevante. Assim a hamiltoniana para o sistema de dois spins que interagem pela interação de Heisenberg pode ser escrito como ^ = H B1 I +I B2 + V 3 X i i ij=1 E o operador de evolução do sistema (para o caso independente do tempo) 2 3 1 0 3 X i 4 B1 I + I 5 A B2 + V U (t) = exp @ i i t ~ ij=1 Observe que agora, no caso geral, nosso hamiltoniano não pode mais ser dividido em produtos. Por exemplo, supondo que a primeira partícula está sujeita a um campo na direção x a segunda esta livre temos: 0 3 1 2 3 X i4 5 A U (t) = exp @ I +V i i t 1B ~ ij=1 Podemos calcular [ 1 I; 1 1 + 2 2 + 3 3] = [ 1 I; = [ 1 I; = [ 1; 3] = i 2 6= 0 : + 3 3 3] + [ 1 3 + [ 1; 2] 3+i 3 2 2 2 3] I; 2 2] 2 Assim, mesmo para o caso mais simples de campos independentes do tempo não podemos, em geral, encontrar uma forma matricial para o operador de evolução. Assim, no caso geral, precisamos construir explicitamente a matriz ^ encontrar seus auto-vetores e expandir o estado inicial na base destes 4 4 H, auto-vetores. Vemos assim a grande di…culdade introduzida quando os sistemas interagem. Entretanto, para alguns casos especiais este problema pode ser resolvido exatamente (exercícios). 160 11.2 Dois spins acoplados Quando estudamos o caso de partículas de spin 12 , vimos que estas podem ser caracterizadas pelo valor da projeção, do spin numa certa direção (e.g., S^z ) e o valor do módulo do spin S^2 = S^x2 + S^y2 + S^z2 = S:S pois h i S^i ; S^2 = 0 : Naquele momento, como tínhamos apenas um valor para o módulo, este operador não mereceu muita atenção. Entretanto, quando temos sistemas acoplados isso muda bastante. Usando a forma explicita dos operadores temos ~2 S^2 = 4 2 1 + ~2 4 2 2 + ~2 4 2 3 = 3 2 3 ~ I = ~2 4 4 de onde vemos diretamente a comutação deste operador com todos os demais, uma vez que ele é proporcional a identidade. Além disso, um operador que será importante no que segue é o chamado operador de levantamento + (abaixamento ) que levanta (abaixa) de o spin da nossa partícula de spin 1=2, + = j+i h j ; = j i h+j ; onde j i = j+i h j i = j+i ; + j+i = j+i h j +i = 0 ; j+i = j i h+j +i = j i ; j i = j i h+j i = 0 : + Lembrando agora a forma explícita dos operador de spin ~ S^z = (j+i h+j j i h j) ; 2 ~ S^x = (jx+ i hx+ j jx i hx j) ; 2 ~ S^y = (jy+ i hy+ j jy i hy j) 2 usando 161 1 1 jx+ i = p [j+i + j i] ; jx i = p [j+i j i] 2 2 1 1 1 jx+ i hx+ j = p (j+i + j i) p (h+j + h j) = (j+i h+j + j+i h j + j i h+j + j i h j) 2 2 2 1 jx i hx j = (j+i h+j j+i h j j i h+j + j i h j) 2 1 jx+ i hx+ j jx i hx j = [2 j+i h j + 2 j i h+j] = j+i h j + j i h+j 2 temos ~ S^x = (j+i h j + j i h+j) : 2 Da mesma forma, usando 1 jy i = p [j+i 2 temos ~ S^y = i (j i h+j 2 i j i] ; j+i h j) : Com isso S^x + iS^y = ~ j+i h j = ~ S^x iS^y = ~ j i h+j = ~ Das expressões acima é fácil ver que h i S^z ; S^ = + + S^+ ; S^ : ~S^ Exercise 67 Veri…que. Para entender o signi…cado de S^ suponha que você tem um auto-estado jsi de S^z S^z jsi = s jsi (obviamente s = ~=2 e jsi = j i). Vamos ver o que acontece com o a projeção do momento ângular deste estado quando aplicamos o operador S^ S^z S^ jsi = S^ S^z ~S^ jsi = S^ s ~S^ jsi = (s ~) S^ jsi Ou seja, o estado S^ jsi é também um auto-vetor de S^z com o autovalor aumentado (diminuindo) de uma unidade de ~ (lembre que S^+ j+i = 0). Além disso, é fácil ver que h i S^2 ; S^ = 0 ; ou seja, este operador não muda o valor da norma do momento angular de spin. 162 Exercise 68 Usando a base canônica de S^z construa a forma matricial de S^ . Vamos agora estudar o momento angular total de um sistema de duas partículas de spin 12 . Como vimos, uma base para o espaço de Hilbert deste sistema é j++i ; j+ i ; j +i ; j i Esta base é formada pelos auto-vetores do operador de projeção de spin total J z = Sz I +I Sz = S1z + S2z ; que por sua vez é formada pela base de autovetores de S^1z e S^2z . Por exemplo Jz j+ i = (Sz I +I Sz ) j+ i = (I I I I) j+ i = 0 Ou seja, o estado j+ i tem projeção de momento angular igual a zero (o que era de se esperar uma vez que as partículas possuem spins opostos). Da mesma forma Jz j++i = ~ ~ + 2 2 Jz j ~j i= j++i = ~ j++i i Ou seja, este sistema pode ter valores de Sz igual a (~; 0; ~). Se o sistema é composto de duas partículas separadas isso signi…ca que a soma dps momentos angulares de cada uma terá estes valores.Por outro lado, se o sistema é formado por duas partículas ligadas (por exemplo, um núcleo de deutério) ao passar por um SG um feixe destas partículas se dividiriam em 3 feixes com estes valores de spin. Da mesma forma que antes podemos de…nir um operador de módulo do momento angular total: ^1 + S ^2 J2 = S 2 ^ 21 + S ^ 22 + 2S ^1 S ^2 =S Usando os operadores S^1 = S^1x S^2 = S^2x S^1y = S^x I S^2y = I S^x S^y I I ; S^y ; podemos escrever ^1 S ^ 2 = 2S^1z S^2z + S^1+ S2 + S^1 S^2+ 2S e, consequentemente, ^1 + S ^2 J^2 = S 2 ^ 21 + S ^ 22 + 2S^1z S^2z + S^1+ S^2 + S^1 S^2+ =S 163 observe que, apesar de S^1;2 Por exemplo não ser hermitiano, J^2 é. ^ 21 + S ^ 22 + 2S^1z S^2z + S^1+ S^2 + S^1 S^2+ j++i J^2 j++i = S ^ 21 + S ^ 22 j++i + 2S^1z S^2z j++i + S^1+ S^2 j++i + S^1 S^2+ j++i = S ^ 21 + S ^ 22 j++i + 2S^1z S^2z j++i = S = ~~ 3 2 3 2 ~ + ~ j++i + 2 j++i 4 4 22 = 2~2 j++i ou seja, o estado j++i é um autovetor do operador de módulo do momento angular com auto-valor 2~2 (o mesmo é válido para o estado j i). Vamos agora calcular J^2 j+ i = S21 + S22 + 2S1z S2z j+ i + S1+ S2 j+ i + S1 S2+ j+ i = ~2 (j+ i + j +i) Ou seja, o estado j+ i não é auto estado do operador J 2 . Sendo este operador hermitiano seus auto-vetores formam uma base. Temos então duas escolhas diferentes de base para o nosso espaço (ambas obviamente caracterizam completamente o sistema): podemos trabalhar na base original de autovetores de S^1z e S^2z (o que explicita a individualidade das partículas) ou podemos trabalhar numa base com autovetores de J^z e J^2 (que trata o sistema como uma única entidade de momento angular J). A utilização de uma, ou outra, base obviamente depende da conveniência. Vamos então montar a base de autovetoes de J^z e J^2 . Como vimos antes, dois destes autovetores nós já conhecemos J^z j++i = ~ j++i ; J^z j i = ~j i 2 2 2 2 ^ ^ J j++i = 2~ j++i ; J j i = 2~ j i ^ Podemos então renomear estes estados com os valores de J^z e J 2 . Para isso, por conveniência (…cará claro no futuro) vamos escrever estes autovetores e autovalores como J^z jjz ; ji = ~jz jjz ; ji J^2 jjz ; ji = ~j (j + 1) jjz ; ji com isso j++i = jjz = 1; j = 1i = j1; 1i j i = jjz = 1; j = 1i = j 1; 1i 164 Para construir os demais autovetores você pode construir a forma matricial destes operadores e usar o procedimento usual. Note, entretanto, que os operadores J = S1 + S2 = (S1x iS1y ) + (S1x = (Sx I iSy I) + (I Sx iI iS1y ) Sy ) respeitam a seguinte regra de comutação h i J^z ; J^ = ~J^ ; h i J^2 ; J^ = 0 Exercise 69 Veri…que. Assim, da mesma forma que antes, quando aplicado num auto estado de J^z com auto-valor jz J^z J^ jjz ; ji = J^ J^z ~J^ jjz ; ji = (jz ~) J^ jjz ; ji temos um autovetor com valor diminuído de uma unidade. Um ponto importante a se lembrar aqui é que os autovalores de um operador não mudam com a escolha da base. Assim, mesmo na nova base, nossos autovalores continuam sendo (~; 0; ~). Com isso, para obtermos o autovetor com autovalor de jz igua a zero jjz = 0; j = 1i = j0; 1i ; basta aplicarmos J^ no estado com autovalor igual a ~ (ou J^+ no estado com autovalor igual a ~) j0; 1i = J^ j1; 1i = J^ j++i = S^1 + S^2 j++i = j +i + j+ i Obviamente este estado deve ser normalizado 1 j0; 1i = p (j +i + j+ i) 2 Se aplicarmos S^ novamente neste vetor obteremos j 1; 1i = j i. Ou seja, este processo não nos dá mais nenhum resultado. Entretanto sabemos que nosso espaço tem dimensão 4 e, conseqüentemente, devemos ter 4 vetores de base. Para encontrar podemos construir o estado (na base antiga) jjz ; ji = a j++i + b j i + c j+ i + d j +i 165 e exigir que ele seja ortogonal a todos os outros três vetores obtidos h++ jjz ; ji = 0 ) a = 0 h jjz ; ji = 0 ) b = 0 1 h0; 1 jjz ; ji = 0 ) p (h +j + h+ j) (c j+ i + d j +i) = 2 1 p (c + d) = 0 ) c = d 2 1 jjz ; ji = p (j+ i 2 j +i) Problem 70 Quais os valores de jz e j? Para isso basta calcular 1 J^z jjz ; ji = p S^1z + S^2z (j+ i j +i) 2 1 ^ = p S1z j+ i + S^2z j+ i S^1z j +i S^2z j +i 2 1 ~ ~ ~ ~ =p j+ i j+ i + j +i j +i 2 2 2 2 2 =0 1 J^2 j0; ji = S21 + S22 + 2S1z S2z + S1+ S2 + S1 S2+ p (j+ i 2 1 S21 + S22 + 2S1z S2z p (j+ i 2 j +i) 1 j +i) = p S21 + S22 + 2S1z S2z j+ i S21 + S22 + 2S1z S2z j +i 2 3 2 3 2 1 ~2 3 2 3 2 ~2 =p ~ + ~ 2 j+ i ~ + ~ 2 j +i 4 4 4 4 4 4 2 1 1 = p ~2 (j+ i j +i) = ~2 p j0; ji 2 2 1 (S1+ S2 + S1 S2+ ) p (j+ i 2 j +i) = = 1 p ~2 (j+ i 2 1 ~2 p j0; ji 2 j +i) 1 1 J^2 j0; ji = ~2 p j0; ji ~2 p j0; ji = 0 2 2 Ou seja, nosso estado tem módulo do momento angular igual a zero: 1 jjz = 0; j = 0i = j0; 0i = p (j+ i 2 166 j +i) Estes quatro estados formam uma base do nosso espaço. A base J^z ,J^2 é muito conveniente quando queremos tratar o sistema como um único sistema. O que é especialmente útil quando as partículas tratadas formam um estado ligado, o que pode ser considerado como uma única partícula. Em especial, os resultados acima mostram que, apesar do feixe destas partículas se dividir em 3, no feixe não de‡etido existem dois tipos diferentes de estado (ou de partículas). j0; 1i ; j0; 0i : Estes estados, possuem características físicas completamente diferentes. Enquanto um feixe de partículas no primeiro estado, quando passadas por um SG orientado perpendicularmente se dividirão em outros 3 feixes, um feixe com partículas no segundo continuarão sempre passando direto pelo aparelho. Em outras palavras, partículas no segundo estado se comportam como partículas sem spin. Outra vantagem da base j, jz é que o momento angular total do sistema é uma quantidade conservada, enquanto o momento angular de cada constituinte não. Por isso é muito conveniente trabalhar nesta base. Isso exige, é claro, que escrevamos o hamiltoniano não na base que estamos usando até agora, mas nesta nova base. Fora a diferença da base o procedimento para o tratamento de problemas é o mesmo discutido anteriormente. Assim quando formamos uma nova partícula pela ligação de outras duas podemos formar dois conjuntos diferentes de estados. Os j1; 1i = j++i 1 j0; 1i = p (j+ i + j +i) 2 j 1; 1i = j i todos com módulo do momento angular iglau a 1. Por serem 3 estes são chamados estados tripleto. E o estado 1 j0; 0i = p (j+ i 2 j +i) que possui módulo de momento angular igual a zero. Por ser apenas um este é chamado estado singleto. Observe que por aplicação de campos (magnéticos ou elétricos) podemos mudar a projeção do spin das partículas, mas sem alterar o módulo desta quantidade (por isso falamos em “girar”). Assim se nosso sistema formar uma partícula de um tipo ele permanecerá com este mesmo tipo. Além disso, também por características relacionadas a estatística quântica (mais precisamente a resultados da TQC) combinações de partículas formam sempre novas partículas com o mesmo valor de j. Por exemplo, a combinação de um próton e um nêutron (deutério) tem spin 1, já uma partícula alfa (núcleo de hélio, formado por 4 partículas de spin 1/2) tem spin 0. Voltaremos à teoria geral da soma de momento angular quando estudarmos o momento angular orbital. 167 12 Realização de espaços de dimensão in…nita Como vimos, todo espaço de Hilbert de dimensão …nita pode ser representado por matrizes. Vejamos agora como tratar os casos de problemas que envolvam dimensões in…nitas. Neste caso, uma das opções é usar o espaço das funções de quadrado integrável L2 discutido na seção 6.4. Anteriormente estudamos sistemas físicos onde o valor dos observáveis (compatíveis) usados para rotular nossos estados, possui apenas um número …nito de possibilidade (e.g., o spin da partícula). Entretanto certos observáveis, como o momento de uma partícula que se move, não possui esta limitação. Obviamente, para tal sistema a representação (e a álgebra) matricial se torna inadequada. Entretanto, como vimos anteriormente na seção 6.4, neste caso podemos herdar os resultados do cálculo diferencial (assim como no caso de dimensão …nita herdamos a álgebra matricial) se realizarmos o nosso espaço de Hilbert como as funções de quadrado integrável L2 (a; b). Ou seja, dada uma função f : C ! C com um (ou mais) parâmetro real t 2 [a; b], podemos indicar o vetor correspondente como jf i cujas componentes são todos os valores de f (t). Esta função pertence ao nosso espaço de Hilbert se Z b 2 hf jf i = jf (t)j dt < 1 : a 12.1 O operador de multiplicação Dentre os operadores que agem no espaço L2 [a; b], um muito importante é o ^ Quando age num estado operador de multiplicação pelo parâmetro livre Q. ^ jf i = jgi Q este operador fornece o estado jgi que é o vetor em L2 com componentes g (t) tf (f ) : A norma deste novo vetor vale hg jgi = Z b a 2 t2 jf (t)j dt a qual, como t 2 [a; b], também possui um valor …nito e, conseqüentemente, pertence a L2 [a; b]. ^ que Um análogo deste operador no caso das seqüências seria o operador Q agindo no vetor jai com componentes ai daria a seqüência jbi com componentes iai . O operador de multiplicação acima é auto-adjunto (para intervalo [a; b] …nito). 168 ^ + tal que Exercise 71 Veri…que a a…rmação acima. Ou seja, encontre Q Z a b Z h i ^ (x) dx = f (x) Qg h b a i ^ + f (x) g (x) dx ; Q ^ é simétrico (Q ^=Q ^ + ) em seguida mostre que veri…que que Q ^ =D Q ^+ D Q : ^ ^ + ). Assim, para mostrar Lembre que, para todo operador simétrico, D(Q) D(Q + ^ ^ que os domínios são iguais, basta mostrar que D(Q ) D(Q). Agora, um ponto extremamente importante sobre o operador de multiplicação acima e: Remark 72 O operador de multiplicação pelo parâmetro livre não possui nenhum auto-vetor. ^ então Pela de…nição de auto-vetor, sabemos que se jf i é um auto-vetor de Q, ^ existe uma constante 2 R (pois Q é simétrico) tal que ^ jf i = Q ^ jf i =) Q jf i = 0 : ^ Multiplicando a expressão acima por Q conseqüentemente, 2 R temos: ^ hf j Q ^ Q jf i = 0 ) = Z b Z a b h ^ é simétrico e, jf i, usando que Q ^ (x) Qf [(xf (x) f (x) ih f (x))] [(xf (x) ^ (x) Qf f (x) i dx = f (x))] dx a = Z b [(x )] f (x) [(x )] f (x) dx (x ) jf (x)j dx = 0 a = Z a b 2 2 Lembrando que é uma constante, a única solução da equação acima é f (x) = 0. ^ não possui nenhum autovetor. Ou seja, Q Assim, o operador de multiplicação pelo parâmetro livre é auto-adjunto, mas não possui nenhum auto-vetor (conseqüentemente, nenhum auto-valor). Com isso, apesar deste operador poder ser associado a um observável clássico (já que é auto-adjunto) não devemos esperar que isso ocorra, porque nenhuma medida desta quantidade poderia ser feita. 169 12.2 O operador de posição Como vimos nos exemplos com espaço de dimensão …nita, todo processo de medida é (basicamente) um processo de …ltragem. Assim, se desejamos determinar a posição de uma partícula, tudo que precisamos fazer é colocar um colimador e, caso a partícula passe por ele, sabemos que ela está (pelo menos logo após a medida) dentro de um intervalo x. Mais ainda, se temos uma placa com vários furos, que podemos nomear de xi , onde esta é a coordenada do centro do furo e 2dx é a espessura, podemos dizer que: se numa medida da posição obtivemos o valor xi , sabemos que a partícula está no intervalo xi +dx e xi dx. Seguindo também o procedimento das seções anteriores, isso nos permite especi…car este estado com o valor medido. Ou seja, jxi i é o estado do nosso sistema quando sabemos que ele está na posição xi + dx e xi dx. Mais ainda, sedo esta quantidade um observável (uma medida) quanticamente a ela está associada um operador auto-adjunto x ^ jxi i = xi jxi i : Ademais, sabemos que a coleção de todos os vetores (contáveis) fjxi ig formam uma base do nosso espaço. Ou seja, todo vetor pode ser escrito como X jf i = ai jxi i i para vetores devidamente normalizados ai = hxi jf i 2 e jai j é a probabilidade de encontra a partícula no intervalo xi dx. O que queremos fazer agora é melhorar a precisão da nossa medida de posição, fazendo a espessura do colimado dx cada vez menor. Ou seja, queremos tomar o limite dx ! 0. A tomada direta deste limite possui (no mínimo) dois problemas tecno-conceituais: 1. Neste limite, como a partícula pode estar no estado x 2 [a; b], devemos ter um conjunto contínuo de autovetores jxi correspondente a estes autovalores. Entretanto, sabemos que nosso espaço de Hilbert possui uma base contável (vimos isso pela série de Fourier da seção 6.4) e toda base deve ter o mesmo tamanho (no caso in…nito, como vimos na seção 6.4,a mesma cardinalidade). Assim, este conjunto contínuo de vetores obrigatoriamente deve possuir mais elemento que qualquer base. Ou seja, não é uma base e não pode ser ortonormalizada. 2. Voltemos a decomposição de um vetor jf i na base fjxi ig e calculemos o produto deste vetor com um vetor jgi qualquer X X hg x ^ jf i = ai hg x ^ j ii = ai xi hg j i i i = X i i ai xi hg j i i = 170 X i xi bi ai onde bi = hxi jgi são as componentes de jgi na base fjxi ig. Podemos agora escolher uma representação matricial (in…nita) para os nossos vetores de base fjxi ig. Em especial, podemos escolher a representação canônica (33) para estas matrizes. Tomemos agora o limite dx ! 0, neste caso a nossa decomposição se torna jf i = X i ai jxi i ! Z b a (x) jxi dx ; a (x) = hx jf i a Com isso hg x ^ jf i = Z b xb (x) a (x) dx ; a onde b (x) = hx jgi são as componentes de jgi na base fjxig. Lembrando que f (x) são as componentes do vetor jf i e e que a(x) são as componentes deste mesmo vetor jf i na base fjxig. Se escolher a representação canônica sabemos que as componentes do vetor na base são iguais as componentes do vetor (veja a expressão (33)) a (x) = f (x) ; b (x) = g (x) ; (78) e a expressão acima se torna hg x ^ jf i = Z b xg (x) f (x) dx = a Z b g (x) [xf (x)] dx = a Z a b i h ^ (x) dx ; g (x) Qf ^ é o operador de multiplicação pelo parâmetro livre. Ou seja, onde Q no caso limite dx ! 0 o operador de posição é igual ao operador de multiplicação por uma constante. E, como vimos na seção anterior, o ^ não possui nenhum autovetor. Conseqüente, neste limite operador Q a posição não é um observável. Os dois pontos acima mostram o problema na tomada do limite acima. Suponha agora que façamos dx muito pequeno, mas de forma a garantir que ^ Ou seja, nossa somatória não se torna uma integral. Podemos agora x ^ 6= Q. nos perguntar: ^ no lugar de x Problem 73 Qual o erro que cometemos ao usar Q ^. Ou seja, para dois vetores quais que jf i e jgi do nosso espaço, quanto vale a diferença Z b X ^ hg x ^ jf i hg Q jf i = xi bi ai xg (x) f (x) dx a i onde, de (78), ai = f (xi ) ; bi = f (xi ) : 171 Para responder esta pergunta, observe que (para funções contínuas por partes), podemos quebrar a integral em cada uma das regiões xi , Z b X Z xi +dx xg (x) f (x) dx : xg (x) f (x) dx = a i xi dx Com isso, hg x ^ jf i ^ jf i = hg Q X i " xi g (xi ) f (xi ) Z xi +dx # xg (x) f (x) dx xi dx A determinação do erro acima depende apenas do comportamento das nossas funções no intervalo [xi dx; xi + dx]. Se as funções consideradas não forem todas as funções de H, mas apenas aquelas cuja variação no intervalo [xi dx; xi + dx] seja pequeno, podemos fazer Z xi +dx xg (x) f (x) dx = xi g (xi ) f (xi ) xi dx lembrando que xi é o ponto médio do intervalo. De outra forma, a aproximação acima se torna melhor quanto menor o intervalo dx (ou seja, quanto menor dx, mais funções podemos incluir no nosso espaço), esta é uma conseqüência do teorema do valor médio. Agora vale lembrar que em MQ nem sempre podemos tomar os limites dos observáveis. Este foi o ponto chave na hipótese de Planck. Ou seja, substituindo a integral pela somatória, Planck resolveu o problema da catástrofe do ultravioleta. O fato de não podermos usar a integral (i.e., não podemos tomar o limite) para calcular a radiação do corpo negro está no fato de termos uma precisão máxima que as nossas medidas estão sujeitas. O fato de, para a radiação do corpo negro, a média de energia hEi R1 P En E dE E exp n En exp KT KT 0 R hEi = P = 6 1 En E dE exp n exp KT 0 KT onde En = h n não está no fato não podemos fazer En En+1 ! 0. Pois não existe nenhuma restrição na freqüência do oscilados. Ou seja, devemos considerar o fato de En En+1 poder ser tão pequeno quanto se queira, mas não podemos tomar o limite desta quantidade tendendo a zero (pois, se pudéssemos, a integral acima seria igual a somatória). Este problema está diretamente ligado ao conceito de um conjunto denso em matemática. Qualquer número real pode ser aproximado, com a precisão que se queira, por um número racional. Mas um racional não é igual a um irracional. Como os reais são formados por todos estes números, dizemos que o conjunto dos racionais é denso nos reais. Observe que, apesar de podemos fazer a aproximação com a precisão que se queira, o conjunto dos 172 reais é completamente diferente do dos racionais, em especial a cardinalidade é maior. Assim, no exemplo acima da energia, nós podemos fazer a diferença de energia tão pequena quanto se desejar, isso signi…ca que este espectro discreto é tão próximo quanto se queira de um conjunto contínuo, mas ele nunca será igual a este conjunto. É sempre neste sentido que devemos entender o termo “espectro contínuo de energia” que aparece nos livros de MQ. Resumindo, no caso da energia nós não podemos substituir a somatória por uma integral. Mas e no caso do operador de posição? Podemos substituir ^ O fato de não podermos substituir a somatória por uma integral x ^ por Q? no caso da energia, está relacionado com o fato de que a energia do oscilador depende do conhecimento simultâneo de sua posição (energia potencial) e do seu momento (energia cinética). Como vimos na seção 1.7, existe um limite na área mínima do espaço de fase (o que está relacionado com a incerteza momentoposição). Isso nos impede de tomarmos o limite desta área como um ponto e, conseqüentemente, fazermos a somatória virar uma integral. E no caso do operador de posição, existe alguma relação de incerteza que nos impeça de tomar este limite? Neste caso, tudo que queremos medir é a posição. Entretanto, para medirmos a posição na direção x precisamos ter alguma informação da partícula na direção y e z. Pois, de outra forma, não saberemos se a partícula não passou pelo colimador porque foi bloqueada, ou simplesmente porque ainda não chegou ao furo. Assim, uma conjectura do autor destas notas, é que podermos ou não tomar o limite depende do fato da medida das coordenadas em direções diferentes comutarem, ou não. Segundo os prícipios da MQ esta comutação deve ser proporcional aos parênteses de Poisson (veja (59)) fx; yg = fx; zg = 0 ; e, conseqüentemente, comutam. Assim, o limite pode ser tomado. Entretanto, existem teoria atuais que especulam sobre a geometria do universo poder ser não comutativa. Se isso for verdade devemos ter [^ x; y^] = i ; com uma nova constante universal. Obviamente, o fato de nunca termos detectado esta não-comutação garante que este , se existir, é muito pequeno (muito menor mesmo, nas unidades adequadas, que a constante de Planck). Assim, se a geometria do universo for não-comutativa, a MQ não é mais uma teoria correta, 2 mas uma aproximação correta até, provavelmente, ordem de ( =h) (assim como 2 a mecânica clássica é correta até ordem de (v=c) em relação à relativística). Entretanto, como nosso objetivo aqui é fazer MQ (usual) vamos admitir que ^ no podemos substituir a somatória pela integral, ou, o que é equivalente, usar Q lugar de x ^. Mas é sempre bom lembrar que estes dois operadores são diferentes: um é um observável, o outro não. Esta aproximação signi…ca dizer que ^ jxi = x jxi ; x ^ jxi = Q mesmo para x 6= xi . Observe que estes dois operadores são iguais quando atuam nos auto-vetores de jxi i, mas, estes auto-vetores formam um conjunto discreto. 173 ^ é uma extensão contínua do operador x Desta forma Q ^ e o conjunto discreto xi é denso no intervalo [a; b]. Assim, no que segue, vamos de…nir x ^ jxi x jxi ; x 2 [a; b] : (79) E qualquer vetor do nosso espaço pode ser decomposto como Z b jf i = dx a (x) jxi ; a (x) = hx jf i a 2 e a quantidade ja (x)j é a probabilidade da partícula ser encontrada o intervalo x dx. Usando a igualdade (78), Z b a (x) = f (x) ) jf i = dx f (x) jxi ; f (x) = hx jf i a 2 e jf (x)j é a probabilidade da partícula ser encontrada o intervalo x Observe ainda que "Z Z Z b hg jf i = b dx g (x) f (x) = a ou seja, o operador a Z b dx hg jxi hx jf i = hgj a dx. # dx jxi hxj jf i b a dx jxi hxj = I ; é a resolução da identidade do nosso espaço. 12.3 O operador de momento Como sabemos da nossa experiência em mecânica clássica, o estado (clássico) de um sistema é completamente determinado pela sua posição e o seu momento. Assim, se quisermos estender a descrição clássica para quântica, precisamos encontrar um operador p^ que esteja relacionado com o observável de momento. Ou seja, os autovalores de p^ são os possíveis valores que o momento da partícula pode assumir. Para encontrar este operador, tudo que precisamos é a regra de quantização de Dirac (59) i f^ x; p^g ! [^ x; p^] ) [^ x; p^] = i~ ; (80) ~ ou seja, precisamos construir p tal que este respeite a álgebra acima. Para realizar a álgebra acima, precisamos …xar a forma de um dos operadores (^ x ou p^) e determinar a forma do outro. Fixando a forma do operador x ^ como em (79) (mas esta é apenas uma escolha possível), a álgebra (80) pode ser concretamente realizada escolhendo p^ p= 174 i~ d : dx (81) Onde usamos o chapéu invertido para lembrar que p não é mais um operador num espaço abstrato, mas sim a realização deste operador em algum espaço concreto. Ou seja, enquanto p^ é um operador qualquer que respeita (80), p é especi…camente um operador diferencial (81) agindo no espaço das funções de quadrado integrável. Para ver que (81) realiza a álgebra (80) basta calcular hxj x ^p^ p^x ^ j i = hxj x ^p^ j i = i~ x d d hxj j i + i~ [x hxj j i] dx dx d d d [x (x)] = i~ x (x) x dx dx dx hxj p^x ^j i = d (x) dx xi~ hxj [^ x; p^] j i = i~ (x) : Neste nosso espaço concreto, a equação (62) para o operador de evolução temporal pode ser escrita como dU i ^ dU i ^ j 0i = HU =) hxj j 0i = hxj HU dt ~ dt ~ d d i ^ j 0i hxj U j 0 i = hxj U j 0 i = hxj HU dt dt ~ i d hx j t i = H hx j t i dt ~ d i~ (x; t) = H (x; t) ; dt (x; t) = hxj U (t) j 0i ^ x ; H=H ^ x; p^ i~ d dx : Esta é a equação de Schrödinger. Para o caso de uma partícula de massa m sujeita a um potencial V (x) sabemos da mecânica clássica que H (x; p) = p2 + V (x) 2m Assim, o operador correspondente deste problema na MQ vale H= ~2 d 2 + V (x) : 2m dx2 Os estados estacionários desta partícula são os autovetores deste operador e, numa medida da energia desta partícula, podemos obter apenas um de seus auto-valores. 12.4 O problema do ordenamento Um dos problemas que surge no processo de quantização acima (e, de uma certa forma, em todos os processos de quantização), é o chamado problema do 175 ordenamento. Dado um observável clássico que envolva o produto (o momento angular é um exemplo) xp ; quanticamente podemos associar a este observável os operadores ^ =x ^ 0 = p^x M ^p^ ; M ^ onde ^0 M = p^x ^ = ^ =M d x = i~ dx ^ i~ i~ = M i~ i~x d dx = i~ + x ^p^ ou ainda ^0 = M ^ M i~ Ou seja, os dois operadores acima dizem respeito a mesma quantidade clássica xp. Assim, para um observável clássico pode estar relacionado mais de um operador quântico. Um ponto a se observar é que, assim como no exemplo acima, no problema de ordenamento os operadores sempre diferem por uma quantidade proporcional a ~n . Lembrando que uma das formas de tomarmos o limite clássico do nosso ^ eM ^ 0 possuem o mesmo sistema é fazer ~ ! 0, vemos que os dois operadores M limite clássico. Assim, teorias quânticas que di…ram por um problema de ordenamento possuem o mesmo limite clássico. Ou de outra forma, para o mesmo sistema clássico podemos ter várias teorias quânticas diferentes. Entretanto, apesar de todas terem o mesmo limite clássico, estas teorias podem gerar resultados puramente quânticos (e.g., supercondutividade) bastante diferentes. No caso especí…co acima, xp, o problemas do ordenamento pode ser resolvido usando os postulados da MQ. Observe que + (^ xp^) = p^+ x ^+ = p^x ^ 6= x ^p^ ; ou seja, apesar de x ^ e p^ serem hermitianos, o operador x ^p^ não é hermitiano. Assim, se existe o observável xp o operador a ele associado deve ser hermitiano ^ nem M ^ 0 ). Com isso, podemos construir um operador (não deve ser nem M hermitiano através de uma combinação simétrica dos operadores 1 + + + ^ = 1 (^ ^ + = 1 (^ M xp^ + p^x ^) ) M xp^ + p^x ^) = p^ x ^ +x ^+ p^+ 2 2 2 como x ^ e p^ são hermitianos 1 ^ + = 1 p^+ x ^ : M ^+ + x ^+ p^+ = (^ px ^+x ^p^) = M 2 2 Uma prescrição, chamado ordenamento de Weyl, é usar sempre a ordenação simétrica dos operadores. Entretanto, nem sempre esta opção é única possível. 176 Por exemplo, no caso p2 x temos ^ =x M ^p^x ^ 1 ^0 = M p^2 x ^+x ^p^2 2 ^ 00 = 1 p^2 x ^ + p^x ^p^ + x ^p^2 M 2 todos hermitianos. Usar a prescrição de Weyl é escolher o último operador. Entretanto, apenas uma medida extremamente precisa de efeitos puramente quânticos pode nos dizer quais destes é o operador correto. 12.5 Partícula na caixa Vamos usar as idéias da seção anterior para quantizar o sistema unidimensional de uma partícula de massa m num intervalo (uma partícula numa caixa). Uma vez que, dentro do intervalo (caixa), a partícula está livre, vamos começar analisando uma partícula livre, cuja energia é puramente cinética e o Hamiltoniano vale 1 2 H= p : 2m A descrição quântica, no H abstrato, se dá pelo operador Hamiltoniano ^ = 1 p^2 : H 2m E no nosso espaço concreto em L2 : H= ~2 d 2 : 2m dx2 Dizer que a partícula está na caixa signi…ca dizer que esta pode ser encontrado apenas dentro de um certo intervalo [a; b]. Ou, de outra forma, que ela não pode ser encontrada fora deste intervalo. Quanticamente isso signi…ca que (x) = 0 ; a > x > b : Pela continuidade da função devemos ter (lembre que H exige que as nossas funções sejam, pelo menos, duas vezes diferenciáveis) (a) = (b) = 0 : (Condições físicas impõe condições de fronteira) Desta forma as condições físicas do nosso sistema informam como devemos impor as condições de fronteira do problema. Na verdade, só agora temos realmente especi…cado o operador H, pois conhecemos, não só a sua forma, mas também seu domínio. Este é o espaço de Hilbert do nosso problema. 177 Exercise 74 Veri…que que o operador H acima é hermitiano. Qual o domínio do adjunto H + . Como em todo problema de MQ, estamos interessados em estudar a evolução do sistema. Isso, obviamente, é equivalente a encontrar o operador de evolução que, por sua vez, é equivalente a resolver a equação de Schroedinger (dependente do tempo) d (x; t) = H (x; t) : i~ dt Entretanto, para sistemas com graus …nitos, vimos que é possível evitar o trabalho (as vezes impossível) de obter uma forma explicita para o operador ^ e decompormos de evolução, se trabalharmos na base de auto vetores de H todos os nossos vetores nesta base. Da mesma forma, podemos agora evitar o trabalho (di…cílimo) de resolver a equação de Schroedinger dependente do ^ e decompormos nossos vetores tempo, se encontrarmos os autovetores de H nestes estados. Neste caso, para qualquer vetor j i temos X j i= an j n i ; n ou, multiplicando por jxi X hx j i = an hx j n ni ) (x) = X an n (x) n onde H n (x) = En n (x) : Observe que os estados j n i tem energia bem de…nida e tomamos o produto interno deste vetor com jxi. Não estamos falando de um estado que seja, si^ ou seja, que tenha posição e energia bem multaneamente, autovetor de x ^ e H, de…nida. Isso não é possível uma vez que estes observáveis não são compatíveis. Assim, nosso problema é encontrar soluções para a equação de Schroedinger independente do tempo H =E =) ~2 • = 2m E : Onde E (autovalores de H) são as possíveis energia que o sistema pode assumir. Problem 75 Quantas soluções a equação acima possui? Observe que, para um valor …xo de E, por ser uma equação de segunda ordem a equação acima possui apenas duas soluções linearmente independentes (sempre). A solução geral da equação dependerá de duas constantes que serão …xadas pelas condições iniciais do problema. Entretanto, não é neste sentido que queremos “encontrar as soluções da equação acima”. Queremos encontrar todos os valores de E para que a equação acima tenha solução e 178 respeite as condições de contorno. Ou seja, nosso problema não é apenas o problema de resolver uma equação diferencial. Na verdade, no tratamento de problemas quânticos, acreditamos que as soluções das equações diferenciais já são conhecidas. Como mencionado acima, para um valor …xo de E a equação acima possui duas soluções LI 2m eikx ; e ikx ; k 2 = 2 E ; ~ de sorte que uma solução geral pode ser escrita como uma combinação linear destas soluções (x) = Aeikx + Be ikx ; k2 = 2m E: ~2 Problem 76 Quais os valores possíveis de E? Observe que, por ser hermitiano, E 2 R. Entretanto, nada impede que este assuma qualquer valor real e, em especial, valores negativos. Neste caso (E < 0) temos H = jEj ~2 • = jEj 2m =) =) (x) = Aekx + Be kx ; k2 = 2m jEj ; ~2 Entretanto, para ser solução do nosso problema, a função não deve apenas ser solução da ES, mas pertencer ao nosso espaço de Hilbert, ou seja, pertencer ao domínio de H. Com isso: (b) = 0 ) Aeka + Be (a) = ka = Aekb + Be e k kb =0: Para o caso especial a = 0; b = 1 A+B =0)A= k Ae Ae k B; = 0 ) A ek =0)A=0: E, para o caso geral, é fácil ver que não existem A e B diferentes de zero que respeitem as condições de fronteira (para k = 0, = A A = 0). Assim, os estados com E < 0 são descartados por não pertencerem ao nosso espaço ^ ser hermitiano implica que o sistema de Hilbert. Ou ainda, o fato de H só pode ter energias positivas. Este resultado é completamente compatível com a física clássica. Porém, como veremos a seguir, os demais resultados são bastante distintos dos esperados classicamente. Problem 77 Como determinamos as constantes A,B e k da solução geral acima? 179 Como vimos nos exemplos anteriores, em geral, as constantes A e B (na verdade, apenas uma delas) serão …xadas pelo processo de normalização. Restanos então …xar k. Esta constante está relacionada com as condições de contorno do problema. Para facilitar as contas, no que segue façamos a = L e b = L, ^ = D H ; 0 2 L2 ( L; L) ; ( L) = (L) = 0; a:c: Assim, exigindo que a partícula esteja con…nada no intervalo de (L) = : L até L ( L) = 0 ; temos (L) = 0 =) AeikL + Be ikL = 0 =) AeikL = A (cos kL + i sin kL) = B (cos kL i sin kL) : Be ikL (82) Podemos satisfazer esta igualdade de duas formas, a primeira fazendo sin kL = 0 =) kL = n ; n 2 N observe que n = 0 não é um autovetor. Além disso, o caso n < 0 corresponde as mesma funções com sinal trocado e, consequentemente, são as mesmas funções (lembre que a normalização possui uma arbitrariedade na fase e os autovalores dependem de n2 ). Com a escolha acima, temos, A (cos kL) = B (cos kL) ) A = B: Podemos também satisfazer a igualdade (82) fazendo cos kL = 0 =) kL = n+ 1 2 ; n2N; (observe que agora n = 0 é um autovetor), com isso A (i sin kL) = B ( i sin kL) ) A = B : Assim, o nosso problema possui dois tipos (conjuntos) de soluções estacionárias n (x) = N sin kn x ; kn = + n (x) = N + cos kn+ x ; kn+ = L L n ) En = n+ 1 2 ~2 2m n L ) En+ = 2 ; ~2 2m L n+ 1 2 2 : (83) Exercise 78 Obtenha as constantes de normalização N + e N . Problem 79 Por que precisamos apenas de uma das condições de contorno? 180 Pela simetria do problema estes estados automaticamente satisfazem a condição ( L). Mas, no caso geral, precisamos aplicar ambas as condições de fronteira. Remark 80 Observe como a limitação da partícula no intervalo tornou os níveis de energia discretos. Este é o fenômeno por trás da maioria das peculiaridades do comportamento quântico dos sistemas, em especial, dos chamados pontos quânticos (QD). As soluções acima mostram que o con…namento da partícula num intervalo tornou os níveis de energia discretos. Ou seja, numa medida da energia da partícula con…nada numa caixa de tamanho 2L, podemos obter apenas os valores En e En+ . Isso é, obviamente, um comportamento completamente diferente do esperado classicamente, onde a partícula pode ter qualquer valor de energia. Além disso, o menor valor possível da energia para a partícula na caixa vale (observe que E0 = 0 implica 0 (x) = 0 e a partícula não está mais na caixa) ~ 2 h i2 : E0+ = 2m 2L Ou seja, este é o menor valor de energia cinética que a partícula pode ter. Mais ainda, se esta partícula interagir com alguma coisa (e.g., fótons) ela só poderá absorver e emitir energias que sejam proporcionais a diferença entre dois níveis En !n = En+ Em Esta é a chamada energia de transição de n para m. Suponha que você prendeu um elétron numa caixa e baixou a temperatura do sistema de forma a garantir que este elétron está no estado fundamental E0+ (é mais natural imaginarmos que temos vários elétrons não interagentes nesta caixa). Primeiramente veja que existe uma energia do sistema que você não pode retirar, ou seja, esta energia não se dissipa em forma de calor. Em segundo lugar, se você tentar aquecer o sistema, por exemplo o iluminando com um laser, se este laser tiver uma energia menor que E0 !1 o sistema não irá interagir com seu laser (ou seja, ele será transparente). Se você for aumentando a freqüência deste laser, quando a sua energia chegar a E1 E0+ o sistema passa a absorver o laser (se torna opaco) e os elétrons passam para um nível de energia mais alto. Na prática, se a temperatura for baixa o su…ciente, o sistema irá emitir estes fótons tornando-se reluzente na cor do laser. Este “salto”de um nível de energia para o outro, sem que o sistema possa existir em níveis intermediários (o que classicamente é um contínuo) é chamado de salto quântico. Este efeito de absorção de apenas alguns comprimentos de onda pode ser observado em pontos quânticos. Este é também o mecanismo porque os elétrons em torno do núcleo só absorvem e emitem radiações com determinada freqüência (e.g., a série de Balmer). O fato de nosso operador ser auto-adjunto signi…ca que suas autofunções formam uma base (agora ortonormal) do espaço. Assim, qualquer função do nosso espaço pode ser escrita como 1 1 h i 1 X + 1 1 X (x) = p cn cos n+ x +p cn sin nx : L 2 L L n=0 L n=1 181 Onde o módulo quadrado de cada coe…ciente cn = h n j i representa a probabilidade de, numa medida da energia, a partícula ser encontrada com energia En . Assim, o fato de qualquer estado poder ser expandido na decomposição acima, tem o signi…cado físico de que todo sistema pode ser encontrado (com uma certa probabilidade) em algum valor de energia. Usando a notação de Dirac temos a base composta pelos dois pares de funções fj^ e+ en ig com componentes n i ; j^ 1 e^+ n (x) = p cos L L n+ 1 2 h i 1 ; e^n (x) = p sin nx : L L x Exercise 81 Veri…que que esta base é ortonormal ^n e^m = ^+ ^+ e^n e^+ m = e m =0 ; e n e Com isso j i= 1 X c+ ^+ n e n + 1 X nm : cn e^n n=1 n=0 e as componentes cn são a projeção de na base fj^ e+ en ig n i ; j^ Z L 1 1 c+ ^+ i= p cos n+ x (x) dx n = e n L 2 L L Z L h i 1 sin nx (x) dx cn = e^n i = p L L L A decomposição acima é a conhecida série de Fourier da função (x). Agora, dada uma condição inicial j 0 i qualquer fazer a decomposição X + j 0i = c+ : n n + cn n n Lembrando que estes estados j n i têm energia bem de…nida (são auto-estados do operador Hamiltoniano), podemos determinar a evolução temporal de j 0 i fazendo X i i + j t i = U (t) j 0 i = exp Ht j 0 i = exp Ht c+ n n + cn n ~ ~ n X i + i + = c+ En t E t : n + cn exp n n exp ~ ~ n n Ou, projetando no espaço x, hx j ti = (x; t) = X c+ n exp i + E t hx ~ n c+ n exp i + E t ~ n n X n + n + n + cn exp (x) + cn exp 182 i E t hx ~ n i E t ~ n n n (x) : Aqui é interessante ver como a realização do nosso espaço depende muito de qual parte do sistema nos interessa. De forma geral, ~ L E 2 : Assim, se no exemplo acima a distância L for muito pequena, os níveis de energia vão estar tão espaçados que para sofrer uma transição de nível precisaríamos fornecer uma quantidade muito grande de energia. Podemos garantir assim que o sistema não sofra nenhuma transição indesejada (e.g., térmica) e as únicas transições possíveis são aquelas que nós provocamos. Neste caso, apenas alguns níveis de energia são relevantes e podemos tratar o sistema como um problema de n níveis. Ao fazemos isso nosso sistema passa a ter um número …nito de estados e passa a ser descrito por uma matriz. É por isso que um QD pode ser tratado como um sistema de dois níveis da mesma forma como no exemplo de uma partícula de spin 12 . Além disso, se o tamanho da caixa vai para in…nito (partícula livre) a diferença dos níveis de energia vão a zero e, conseqüentemente, a partícula pode assumir “qualquer” (mas sempre contável) valor de energia. 12.6 O momento da partícula Vamos agora estudar os possíveis valores que o momento de uma partícula numa caixa pode assumir. Neste caso, precisamos encontrar os autovalores do operador d d p^ = i~ ; p^ = ~k ) = ik dx dx Mais uma vez, para um valor …xo de k, esta equação possui apenas uma solução e a solução geral pode ser escrita como (x) = A exp ( ikx) : Entretanto, as nossas condições de fronteira exigem que (L) = A exp ( ikL) = A (cos (kL) + i sin (kL)) = 0 : Cuja única solução é A = 0. Ou seja, o operador de momento não tem auto-vetores. Problem 82 Mas se o operador p^ é hermitiano ele não deveria ser um observável? Apesar de ser hermitiano este operador não é autoadjunto. Assim, o momento de uma partícula numa caixa não é um observável. Exercise 83 Veri…que que o operador p^ = i~ d ; dx ^ = D H ; 0 2 L2 ( L; L) ; não é auto-adjunto. 183 ( L) = (L) = 0; a:c: ; Entretanto, podemos tornar nosso operador p^ auto-adjunto se mudarmos as nossas condições de fronteira. Como vimos anteriormente na seção ??, este operador se trona auto-adjunto se adotarmos condições periódicas de contorno ( L) = ei (L) : Exercise 84 Veri…que que o operador p^ = i~ d ; dx ^ = D H ; 0 2 L2 ( L; L) ; ( L) = ei (L) ; a:c: ; é auto-adjunto. Neste caso as nossas soluções se tornam exp (ikL) = ei exp ( ikL) = exp ( i (kL )) cos (kL) + i sin (kL) = cos (kL ) i sin (kL Para cada valor diferente de exemplo, pada = 0 temos um conjunto diferente de soluções. Por cos (kL) + i sin (kL) = cos (kL) i sin (kL) ; logo sin (kL) = 0 ) kL = n ) kn = Para ) n : L = cos (kL) + i sin (kL) = cos kL 2 i sin kL 2 = cos kL cos + sin kL sin 2 2 = sin kL + i cos kL i sin kL cos 2 sin 2 cos kL ou seja sin kL = cos (kL) ) kn = L 1 +n 4 : Ou seja, neste caso o momento da nossa partícula é um observável e pode assumir apenas os valores acima. E seus auto-estados são n ; L =0 (x) = A cos (kn x) ; kn = = (x) = A exp ( ikn x) ; kn = L 1 +n 4 ; onde A é determinado por normalização. O ponto é que a condição de fronteira (L) = ( L) = 0 signi…ca (…sicamente) que a partícula não pode penetrar na parede e, como esta partícula 184 não pode desaparecer, ela tem de ser re‡etida. Assim, para esta condição de fronteira temos a visão clássica de uma partícula indo e voltando na caixa. Tal partícula tem seu momento mudando constantemente e, certamente, não está num auto-estado do momento. Já para a condição periódica de fronteira =0 (L) = =0 ( L) é como se, ao chegar no ponto x = L a partícula reaparecesse no ponto x = L (ou vice-versa). O melhor modelo clássico para isso não seria uma partícula numa caixa, mas sim presa num anel. Neste caso, obviamente, a partícula pode “girar” sempre numa determinada direção e ter um momento bem de…nido. Assim, a escolha das condições de fronteira para um problema depende do sistema físico em consideração. Mas os resultados matemáticos nos dizem muita coisa. Por exemplo, as autofunções de p^ são da forma e^ (x) = N exp (ikx) ; e, para estas funções, não conseguimos …xar a condição de fronteira (L) = ( L) = 0 : O que nos diz que o momento não é uma quantidade bem de…nida da nossa partícula numa caixa. Neste caso a interpretação é óbvia, mas, em casos mais complicados, a incapacidade de …xar certas condições de fronteira, ou alguma outra peculiaridade matemática, pode nos dar uma in…nidade de informações físicas novas sobre o sistema. Problem 85 Será que outros valores de possíveis? representam outras condições físicas Os valores com = , por exemplo, estão relacionadas com outras características puramente quânticas que são resultados da estatística quântica. Mais precisamente, está relacionada com a descrição de férmions. A escolha de diferentes é chamado de escolha da extensão auto-adjunta da teoria. A relação geral entre as diferentes escolhas (diferente MQ) e os correspondentes análogos clássicos destas teorias são um objeto atual de estudo em MQ. Assim como o problema do ordenamento, todas as extensões auto-adjuntas possuem o mesmo limite clássico. Vemos apenas alguns exemplos (presentes em todos os processos de quantização) de que a uma teoria clássica temos uma in…nidade de teorias quânticas associadas. A determinação de qual destas teorias é a correta, depende de uma interpretação correta das imposições matemáticas (e.g., partícula na caixa ou no anel), medidas de fenômenos quânticos (e.g., níveis de energia), estudo das simetrias do problema (e.g., férmions e bósons) ect. Na análise do problema de uma partícula numa caixa pudemos acentuar: 1. Entender como as características quânticas da discretização dos níveis de energia estão relacionadas com o con…namento espacial dos sistemas. 185 2. Veri…car que o espectro pontual de energia tende a um contínuo para sistemas livres (estados não ligados). 3. A relação entre o problema com in…nitos graus de liberdade e com um número …nito de graus de liberdade para con…namentos em regiões muito estreita (e.g., QD), 4. Veri…car algumas minudências matemáticas referente a sistemas com in…nitos graus de liberdade (continuidade, extensões auto-adjuntas etc.) 5. Veri…car como as imposições matemáticas (e.g., condições de fronteira) estão relacionadas com as características físicas do sistema. 12.6.1 Sistemas com vários graus de liberdade A descrição quântica de dois observáveis compatíveis pode ser feita exatamente como no caso do sistema de várias partículas, ou seja, através do produto tensorial dos autoestado de cada um destes operadores. Seria como se tivéssemos duas cópias do sistema e, em uma olhamos para um observável e, na outra, para o segundo. Remark 86 Usualmente um observável escolhido para caracterizar o sistema ^ Assim, os demais obé a energia, associada ao operador Hamiltoniano, H. ^ serváveis escolhidos devem ser compatíveis com H, o que signi…ca que também que estas quantidades não variam com o tempo (lembrando que o operador de evolução temporal é a exponencial do Hamiltoniano). Por exemplo, imagine um sistema bidimensional. Este sistema possui momento em duas direções. Pelas regras de comutação canônica sabemos que [^ px ; p^y ] = 0. Então, se o sistema se encontrar num estado com momento bem de…nido nas duas direções, i.e., num estado j i que seja simultaneamente autovetor de p^x e p^y , (^ px + p^y ) j i = (kx + ky ) j i, este estado é descrito pelo vetor j i = jkx ky i = jkx i jky i ; p^x jkx i = kx jkx i ; p^y jky i = ky jky i : Destarte, podemos resolver separadamente cada parte do problema e construir o estado …nal pelas regras de produto tensorial que já conhecemos. Para obtermos a representação de funções do estado acima fazemos hx; y j i = (x; y) = hx; y jkx ky i = hx jkx i hy jky i = kx (x) ky (y) : Os estados acima sempre serão auto-estados de p^x e p^y , mas se estes estados terão energia bem de…nida, depende apenas do operador Hamiltoniano. Para o caso em que este depende de x ou de y os estados acima não serão soluções da ES independente do tempo. Neste caso, devemos decompor estes estados nestas soluções. Para o caso em que os operadores em questão comutam com o Hamiltoniano o processo acima é o conhecido procedimento de separação de variáveis usado em equações diferenciais parciais. 186 12.7 O oscilador harmônico São incontáveis os sistemas e aplicações em física que podem ser modelados pelo problema do oscilador harmônico (OH). Uma das razões para isso é que um potencial V (x) qualquer (dado por uma função analítica) sempre pode ser expandido em sua série de Taylor V (x) = V0 + dV dx 1 d2 V 2 dx2 x+ x0 x2 + x0 1 d3 V 3! dx3 x3 + :::: x0 Além disso, em muitos problemas em física estamos interessados no comportamento do sistema perto da condição de equilíbrio. Nesta condição dV dx =0 x0 e nosso potencial se torna 1 2 kx + O x3 2 d2 V k= dx2 x0 V (x) = onde usamos que uma constante no potencial não altera o comportamento do sistema. Assim, próximo do equilíbrio, qualquer potencial pode ser aproximado por um OH. A hamiltoniana clássica do OH é dada por p2 1 + m! 2 x : 2m 2 H= Assim, para tratar o problema atual, vamos introduzir os seguintes operadores diferenciais lineares L H= ~2 d 2 1 + m! 2 x ^2 ; 2m dx2 2 d dx D (p) = D H = p= i~ ; 0 ; 00 2 L2 ; ( 1) ! 0; a:c: ^ é o operador hamiltoniano de um oscilador harmônico. A solução do aqui H problema quântico se obtém pela solução da ES estacionária, i.e., através da ^ solução do problema de autovalores de H, H =E =) ~2 d 2 1 + m! 2 x ^2 2m dx2 2 Esta equação não é nada simples de se resolver. 187 =E Vamos então fazer uso de alguns artifícios. Lembrando a relação de comutação [x; p^] = i~ ; (84) ou seja, sempre que aparecer o comutador entre x e p^ podemos substituir por i~. Lembre que a quantidade acima é um operador enquanto a quantidade à direita da igualdade é um número. Remark 87 Assim, esta igualdade só faz sentido quando ambos os lados atuam numa função qualquer. Vamos agora de…nir os seguintes operadores diferenciais a ^= p x= 2 1 p x+ 2 r m! = ~ i^ p m! a ^+a ^+ ; a ^+ = p ; p^ = i~ p 2 2 x a ^+ i^ p m! a ^ (85) Com estes novos operadores o Hamiltoniano pode ser escrito como (veri…que): 2 1 ^ = p^ + 1 m! 2 x H ^2 = !~ a ^a+ + a+ a ^ : 2m 2 2 (86) Exercise 88 Veri…que a igualdade acima. As regras de comutação (84) implicam que (veri…que): 2 i^ p i^ p ; x 2 m! m! 2 i^ p i^ p = x+ ;x x+ 2 m! m! 2 i i = [^ p; x] [x; p^] 2 m! m! 2 2 = i [x; p^] 2 m! m! 1 2 = i (i~) ~ 2 m! =1; a ^; a ^+ = x+ ; i^ p m! ou seja, [x; p^] = i~ =) a ^; a ^+ = 1 : com isso 1 ^ = 1 !~ a H ^a+ + a+ a ^ = ~! a+ a ^+ 2 2 188 (87) : Além disso, é fácil ver que h i ^ a H; ^ = ~! a ^+ ; a ^ a ^ = ~!^ a h i ^ a H; ^+ = ~!a+ a ^; a ^+ = ~!a+ Suponha agora que n (88) (89) ^ ou seja, (x) é uma auto função qualquer de H, ^ H n = En n Agora uma característica muito mais do que importante dos operadores (85): Usando a regra de comutação (88) vemos que ^a H^ ^ ~!^ a+a ^H = n = ~! fazendo n =a ^ (En En ~! 1 a ^ n : n ^ =) H n = ~! En = ~! n ~!) n n temos ^a H^ n = ~! ( 1) a ^ n n : ^ com autovalor ~! n , então a Ou seja, se n é autovetor de H ^ n é outro ^ autovetor de H, mas com autovalor ~! ( n 1) diminuindo de uma unidade. Simbolicamente podemos chamar este vetor de n 1 ; a ^ n n 1 ^ ; H n 1 = ~! n 1 n 1 ; n 1 1: n Da mesma forma, usando (89) ^ a+ H^ n ^ = ~!^ a+ + a ^+ H =a ^+ ~! (1 + = ~! (1 + n n) + =a ^+ (~! + En ) n n ^ n) a n ^ com autovalor ~! n , então a Ou seja, se n é autovetor de H ^+ n é outro au^ tovetor de H, mas com autovalor ~! ( n + 1) acrescido de uma unidade. Simbolicamente podemos chamar este vetor de n+1 ; a ^+ n n+1 ^ ; H n+1 = ~! n+1 n+1 ; n+1 n +1 : (90) Por isso estes operadores são chamados de operadores de criação a+ e aniquilação a. 189 Vamos usar agora que a energia do sistema é uma quantidade positiva10 ^j i h jH num estado h n 0 qualquer ^j nj H ni =h n j ~! n j ni = ~! n h nj ni = ~! n 0: (91) (onde supusemos que n está normalizado). Se a energia é positiva deve haver um estado de energia fundamental, i.e., um estado cuja energia não possa ser reduzida. Podemos chamar este estado simbolicamente de 0 com energia 0 min ( n ). Mas a existência do operador a ^ garante que sempre podemos baixar a energia do sistema. Ou seja, o vetor = a ^ 0 teria uma energia 0 1 < 0 , a menos que (x) = 0, ou seja, a ^ 0=0: Voltando agora para os nossos operadores originais (x; p^) temos: a ^ 0 = 0 =) p x 0 + 2 k= d 0 = dx 1 x k i^ p m! 0 =0 ~ d 0 =0 m! dx fazendo temos x ^+ 0 ~ m! 1 d 0 d = ln dx dx 0 =) 0 x ; k = Fácil ver que a equação acima é bem mais fácil de resolver que a nossa equação original (??). Sua solução vale ln 0 = x2 + C =) 2k (x) = N exp 0 x2 2k : com N uma constante (normalização). 1 0 Isso pode ser visto observando que para qualquer autovetor normalizado Z b h nj a ^+ a ^ j ni = [ n (x)] a+ a n (x) dx = Z a b [a n (x)] [a a = h^ a n j^ a 190 ni 0: n (x)] dx n temos A exigência a ^ 0 = 0, nos permite ainda determinar a energia deste estado fundamental. Partido da eq. (86) ^ H = ~! n n n 1 ~! a ^+ a ^+ 2 ~! a ^+ (^ a ~! 0 1 2 = 0 0) = ~! 0 + 1 2 0 0 = ~! 0 0 = ~! 0 0 0 1 2 Então já temos o estado fundamentas e a sua energia (auto-valor). Observe que a descrição quântica do OH implica na existência de uma energia mínima (o oscilador nunca para de oscilar). Problem 89 Como construir os outros estados n? Para isso, basta usar a propriedade (90) a ^+ n = n+1 E1 = ~! ( 0 =) a ^+ 0 = 1 =) p i^ p m! x ^ 2 0 = 1 1 +1 2 + 1) = ~! explicitamente p 2 x ~ d m! dx 0 1 (x) = p x 1 + 2 1 (x) = 2 p x 2 0 0 = ~ ~ m! m! 1 ! 0 x2 2k 2 = N1 p x exp 2 com uma nova constante de normalização N1 . Da mesma forma, podemos obter todos os outros estados (não-normalizados) n n = a ^+ n 0 n (x) = N p 2 x Com autovalor En = ~! n + 191 n ~ d m! dx 1 2 0 : (x) 12.7.1 Normalização As funções n (x) não estão normalizadas, i.e., após a aplicação do operador a ^+ n vezes, precisamos calcular Nn . Isso pode ser simpli…cado supondo que, se n é um vetor normalizado, queremos obter N e N + para que a ^ + a ^ a ^ n ea ^+ n n N n N+ n 1 n+1 também já estejam normalizados. ^j H ni = En j j ni = ~! n + a ^+ a ^j ni = nj ~! a ^+ a ^+ multiplicando pelo dual de j h 1 2 ni ni 1 2 j ni ni temos ^+ a ^ j ni nj a = nh n j ni =n: (92) Agora observe que, pela de…nição de adjunto h j A^ j i = h j A^+ j i temos Z A^ dx = Z (A+ ) dx = Z (A+ ) dx ou seja, podemos calcular h j A^ j i como o produto do dual de j i com A^ j i, ou como o produto de j i com o dual de A^+ j i. Com isso Z Z + h nj a ^+ a ^ j ni = a (a ) dx = (^ a n ) (^ a n ) dx n n se …zemos j ni a expressão acima se torna Z ( n ) ( n ) dx = h =a ^j n j ni ni =j 2 nj = j^ a 2 nj usando (92) j^ a a ^ n 2 nj = n ) p n 2 =1 ou seja, se quisermos um vetor normalizado não devemos de…nir a ^ mas sim p a ^ n p ^ n= n n 1: n 1 )a n 192 n = n 1, Da mesma forma h ^a ^+ nj a j a ^+ ni n = h nj 1 + a ^+ a ^j p = n + 1 n+1 ni =1+h Ou, fazendo m = n + 1, a ^+ m 1 = p m ^+ a ^ j ni nj a = 1 + n = N+ 2 m com isso m a ^+ m 1 a ^+ a ^+ a ^+ p p =p p m m m 1 m 2 a ^+ a ^+ a ^+ a ^+ p ::: p =p p m m 1 m 2 m m + m (^ a ) = p 0 : m! = m 3 m m Assim, a formula para a n-ésima autofunção do hamiltoniano do OH se torna n N0 p (x) = p 2 n! ~ d m! dx x n 0 (x) onde N0 é a normalização do estado 0 . As funções n assim construídas são chamadas de funções de Hermite. Exercise 90 Use a integral gaussiana Z 1 p 2 e x dx = 1 e ache a normalização N0 . Exercise 91 Construa a função de Hermite 4 (x). O fato do nosso operador ser auto-adjunto implica que a base formada pelas funções de Hermite também são completas e qualquer função pode ser decomposta como 1 X (x) = cn n (x) ; cn = h n j i : n=0 Além disso, estas funções respeitam a seguinte relação de ortogonalidade h n j mi = nm : Da mesma forma, a o conjunto de autofunções de outros operadores lineares (queaparecem muito em física) geram outros conjuntos de funções ortogonais: 193 1. O operador de momento d dx com condições periódicas de contorno, fornece as funções ortogonais p^ = i~ n 1 e (x) = p exp (ikn x) ; kn = L 2L presentes na decomposição da série de Fourie. Este operador está relacionado com vários problemas em física, em especial com o problema quântico de uma partícula numa caixa. 2. O operador ^ = H 1 ~2 d 2 + m! 2 x ^2 2m dx2 2 no espaço das funções L2 ( 1; 1) cujas autofunções são n N0 p (x) = p 2 n! n ~ d m! dx x 0 (x) conhecidas como funções de Hermite. Este problema está relacionado, em especial, com a equação do oscilador harmônico. Outros casos muito encontrados são: 1. Equação diferencial de Legendre ^= 1 L x2 d2 dx2 2x d + n (n + 1) dx Cujas soluções são os polinômios de Legendre Pn (x) = N 1 2n n! dn x2 dxn 1 n : Esta equação esta relacionada, por exemplo, com o problema quântico do átomo de hidrogênio. 2. Equação diferencial generalizada de Legendre ^= 1 L x2 d2 dx2 2x d + l (l + 1) dx m2 1 x2 Cujas soluções são os polinômios generalizados de Legendre m Plm (x) = N ( 1) 194 1 x2 m=2 dm (Pj ) : dxm 3. A equação de Laplace em coordenadas esféricas 2 1 ^=2 @ + @ + L 2 2 r @r @r r sin @ @2 + sin @ @ 2 cos + r2 1 @2 2 @'2 sin cujas autofunções são os harmônicos esféricos Ylm ( ; ') = N eim' Plm (cos ) Esta equação esta relacionada, por exemplo, também com o problema quântico do átomo de hidrogênio. Estas soluções são chamadas, de forma geral, como funções especiais. 13 Potenciais centrais Até aqui tratamos praticamente todos os exemplo em 1D e argumentamos que a extensão destes resultados para 3D não envolvia nenhuma di…culdade conceitual mais profunda. Vamos agora considerar o momento angular orbital de um sistema, ou seja, uma característica que exige que nosso sistema tenha mais de 1D. O momento angular que vamos tratar aqui é chamado de momento angular orbital. Este representa a quantização, nos moldes introduzidos anteriormente, do observável clássico momento angular L=x ^= p!L i~x r: Obviamente esta é apena a forma do operador e para realmente especi…cá-lo, precisamos do seu domínio. Exercise 92 Se x ^ep ^ são hermitianos, o operador acima é hermitiano? Esta distinção é necessária porque em MQ temos ainda um outro tipo de momento angular, chamado spin, que representa uma característica interna das partículas (a seguir veremos a diferença). Este último não representa a quantização de nenhum observável clássico e, mais ainda, não possui nenhum análogo em MC. O operador de momento angular respeita a seguinte regra de comutação h 3 i X ^ ^ ^i Lj ; Lk = i~ "ijk L i=1 e, conseqüentemente, não podemos esperar medir suas três componentes simultaneamente (não são compatíveis). Portanto escolhemos uma destas ^z. componentes para caracterizar o sistema,usualmente L Exercise 93 Veri…que a regra de comutação acima. 195 Entretanto, apesar de não podemos medir simultaneamente as 3 componentes do momento angular, podemos de…nir um operador relacionado com o módulo (ou o valor total do momento angular) ^2 = L ^2 + L ^2 + L ^ 23 ; L 1 2 (na verdade, a raiz quadrada do autovalor do operador acima). Este operador comuta com todas as componentes do momento angular h i ^2; L ^i = 0 : L h i ^3; L ^ 2 = 0. Exercise 94 Veri…que explicitamente que L Assim, podemos caracterizar (medir simultaneamente) tanto o momento an^ 3 ), quanto o seu módulo. Ou seja, podemos gular numa dada direção (e.g., L procurar por autofunções simultâneas destes dois operadores. Vamos chamar estas autofunções de Km e, por conveniência, vamos escrever seus autovalores como ^2 L ^3 L Km = ~2 K 2 Km = ~m Km Km ; : Os índices K; m caracterizam nosso estado físico. Índices que caracterizam um estado físico em MQ são chamados de números quânticos. Ou seja, dizer que nosso sistema esta no estado K;m signi…ca dizer que ele tem momento angular na direção z igual a ~m e o módulo do vetor momento angular vale ~K. Remark 95 Qualquer outra tentativa para especi…car melhor o valor do vetor L irá destruir as informações obtidas anteriormente. Uma visão clássica para o nosso sistema (que ajuda a desenvolver alguns raciocínios) é que, após uma medida de L3 e L2 o vetor momento angular está precessionando em torno do eixo z. Mas este imagem não deve ser levada tão à sério. O resultado mais preciso, mas que é difícil de visualizar, é que, após a medida de L3 , nosso sistema está numa superposição de todos os valores possíveis de Lx e Ly , compatíveis com o valor de L2 . 13.1 Autovalores e autovetores do momento angular Vamos agora discutir os possíveis valores dos autovalores e a forma dos autove^3 e L ^ 2 . Estes operadores são, obviamente, operadores diferenciais e tores de L a obtenção destas quantidades representa a resolução do problema de autovalores para estas equações.Entretanto, no lugar de resolvermos diretamente estas equações, podemos usar um método completamente análogo ao desenvolvido 196 para resolver o problema do oscilador harmônico. Neste caso, introduzamos os operadores ^+ = L ^ 1 + iL ^2 ; L ^ =L ^1 L + ^2 = L ^+ iL : Estes operadores fazem às vezes de a ^ e a ^+ neste problema e obedecem as seguintes regras de comutação h i ^3; L ^ + = ~L ^+ L h i ^3; L ^ = ~L ^ L [L+ ; L ] = 2~L3 h i ^2; L ^ =0 L Exercise 96 Veri…que as leis de comutação acima. h i ^3; L ^ ^ são exatamente as Observe que as leis de comutação L = ~L mesmas que as leis de comutação (88) e (89) h i ^ OH ; a a ^ a ^ ; a ^+ a ^+ ) H ^ = ~!a ; ^ aja em L ^ 3 de calculadas no caso do osculador harmônico. Isso faz com que L ^ forma semelhante a a ^ em H do OH. Assim como …zemos no caso do OH, imagine que você encontrou um autove^3 tor K;m do operador L ^3 L = ~m i ^3; L ^ = Usando as regras de comutação L K;m h K;m : ^ ~L é possível mostrar que ^3 L ^+ L K;m ^+ = ~ (m + 1) L ^3 L ^ L K;m = ~ (m ^ 1) L K;m K;m ^ + (L ^ ) permite construir um novo autovetor com o autoOu seja, o operador L valor aumentado (diminuído) de uma unidade. Por isso este operador é chamado de operador de levantamento (abaixamento). Exercise 97 Veri…que as igualdades acima. ^ 2 comuta com L ^ 3 , podemos esperar que o autovetor Uma vez que L ^ acima seja também autovetor de L2 ^2 L K;m = ~2 K 2 197 K;m : K;m (93) h i ^ ;L ^ 2 = 0 temos Além disso, como L ^ 2 (L L K;m ) ^2 =L L K;m = L ~2 K 2 K;m = ~2 K 2 (L K;m ) ; ^ 2 como Ou seja, os autovetores construídos acima são também autovetores de L ^ o mesmo autovalor. Assim, os operadores L abaixam e levantam a projeção do momento angular no eixo z sem mudar o valor do módulo do vetor. Fazer desenho ^ do OH, o operador (quadrático) L ^ 2 é positivo de…nido, com Assim como H isso, D E ^2 L 0 ) K2 0 : K;m ^ é hermitiano e K 2 R). (isso é obviamente verdade porque L Além disso, temos D E D E D E D E D E D E ^2 ^ 21 ^ 22 ^ 23 ^ 21 ^ 22 L = L + L + L = L + L K;m K;m K;m K;m K;m +~2 m2 ; K;m ou seja K 2 = m2 + C ; C > 0 ou ainda jKj jmj ) jKj < m < jKj : Que obviamente signi…ca apenas que o módulo de um vetor é maior ou igual qualquer uma de suas componentes. Entretanto, o fato de podermos sempre aumentar o valor da projeção com ^ + (ou diminuir com L ^ ) leva a uma contradição com a igualdade o operador L acima (assim como no caso da energia mínima do OH). Por isso, se mmax jKj é o maior valor possível para a projeção do momento angular na direção z, devemos exigir que ^ + K;m L =0: (94) max Pela mesma razão ^ L K;mmin =0: ^ 2 pode ser escrito como O operador L ^2 = L ^ 21 + L ^ 22 + L ^ 23 L ^ L ^+ + L ^ 2 + ~L ^3 =L 3 ^+L ^ +L ^ 23 =L Exercise 98 Veri…que as igualdades acima. 198 ^3 ~L (95) Usando a relação acima e (94) podemos escrever (93) como ^2 L K;mmax = ~2 K 2 mmax ^ 23 + ~L ^3 = L ^ L ^+ + L ^ 23 + ~L ^3 = L mmax mmax = ~2 m2max + ~2 mmax mmax ou seja K 2 = mmax (mmax + 1) Da mesma forma K 2 = mmin (mmin 1) Com isso mmax (mmax + 1) = mmin (mmin m2max + mmax = m2min 1) mmin que implica mmax = mmin Ou seja, os valores possíveis de m variam de uma em uma unidade ^ os faz varia de uma unidade) e se distribuem simetricamente (porque L em torno de 0. A simetria da distribuição acima, nos mostra que temos apenas duas possibilidades para os valores de mmax mmax = inteiro ) m = f mmax ; mmax + 1; ::; 0; ::; mmax g mmax = semi-inteiro ) m = f mmax ; mmax + 1; ::; mmax g no segundo caso m 6= 0. Qualquer outro valor de mmax não teria a simetria necessária para que mmax = mmin . Por exemplo, para mmax = 5=3 teríamos 5 2 ; ; 3 3 1 ; 3 4 ; 3 7 ) mmin = 3 4 6= mmax : 3 Os dois tipos de valores para mmax caracterizam os dois tipos diferentes de ^ momento angular mencionados anteriormente. Para mmax um semi-inteiro, L é um momento angular intrínseco, i.e., um spin (e.g., férmions tem spin 1=2). Como veremos mais pra frente, para o caso do momento angular orbital, necessariamente devemos ter mmax inteiro11 . Vamos chamar l mmax = mmin Ou seja, os valores de m variam de uma em uma unidade desde a de…nição acima temos l até l. Com K 2 = mmax (mmax + 1) = l (l + 1) 1 1 Não estamos a…rmando que m max inteiro não pode ser um valor de spin, mas apenas que o momento angular orbital tem, obrigatoriamente, um valor inteiro de mmax . 199 ^ 2 são Ou seja, os autovalores de L3 e L ^2 L l;m = ~2 l (l + 1) ^3 L l;m = ~m l;m l;m ; m= ; l= 0; 1; 3::: 1 3 2 ; 2 ; ::: l; l + 1; :::; 0; :::; l Para cada valor de m temos 2l + 1 valores de m. Para l inteiro, por razões que se tornarão claras futuramente, l é chamado de número quântico orbital, enquanto m é chamado de número quântico azimutal (ou número quântico magnético). Vemos que o valor máximo da projeção l é sempre menor que o módulo do vetor l (l + 1), ou seja, o vetor nunca está projetado inteiramente no eixo z. Se isso fosse possível, teríamos um estado com L3 bem de…nido e com L1 = L2 = 0, ou seja, haveria um estado em que conheceríamos as 3 componentes do momento angular. Observe que a MQ nos diz que as partículas podem ter apenas valores inteiros e semi-inteiros de l. Desta forma, temos 3 casos distintos: 1. o momento angular orbital, com l inteiro; 2. o momento angular intrínseco (spin) com l inteiro (e.g, o estado ligado de duas partículas de spin 1=2) e semi-inteiro. No que se refere ao spin, (a) partículas com spin inteiro são chamados de bósons e (b) partículas com spin semi-inteiro são chamados de férmions. Da mesma forma como no caso do OH, temos agora uma equação diferencial mais simples pra resolver ^ + l;l = 0 : L Uma vez obtida esta solução, podemos construir as demais soluções baixando o auto-valor de m ^ l;l l;l 1 = L ^ l; l = 0 :Esta construção é válida tanto e assim até l; l onde, obviamenteL no caso do spin quanto do momento angular orbital. Entretanto, no primeiro caso os operadores são matrizes e no segundo operadores diferenciais. O caso com matrizes foi tratado quando estudamos sistemas com graus …nitos de liberdade (usando os operadores J^ ). Vamos agora nos ater no caso do momento angular orbital. Para resolver explicitamente este problema, ou seja, encontrar a forma explicita das autofunções, o ideal é trabalhamos em coordenadas esféricas x = r sin cos ; y = r sin sin ; z = r cos ; e suas inversas r2 = x2 + y 2 + z 2 ; cos = 200 z ; tan r = y : x Nestas coordenadas temos ^ =L ^1 L ^2 = L ^ 2 = ~e iL i @ @ @ @ 2 @ : @ 2 i cot 1 @ @ 1 sin + sin @ @ sin2 ; (96) ^ 3 assume uma forma bem simples Em especial, o operador L ^3 = L i~ @ : @ Observe que a coordenada r não participa dos nossos operadores. Assim, as funções procuradas obedecem a equação (fazendo Ylm l;m ) ^ 3 Y m = imY m ; L l l Ylm = Ylm ( ; ) fazendo uma separação de variáveis Ylm ( ; ) = m ( ) m l ( ) temos ^ 3 Ylm = imYlm ) L m ( ) = N exp (im ) : Onde N é, obviamente, a normalização (no parâmetro livre ). Lembrando que a o produto interno das nossas funções originais são dadas por Z Z Z Z Z Z hgj f i = g (x; y; z) f (x; y; z) dxdydz = g (x; y; z) f (x; y; z) dV e que, em coordenadas esféricas, o elemento de volume de uma casca com raio r é dado por12 dV = r2 sin d d dr ; temos que a área devido a variação das variáveis angulares ( ; ) vale d = sin d d ; Chamado de elemento de ângulo sólido. Assim, o produto interno das nossas funções (e, conseqüentemente, a normalização) devem ser calculados como Z 2 Z hY j Y 0 i = Y ( ; ) Y 0 ( ; ) sin d d : 0 Para a coordenada podemos escrever 1 N =p 2 12 A 0 ) m 1 ( ) = p exp (im ) : 2 quantidade que multiplica d d dr é o jacobiano da transformação. 201 No caso do momento angular orbital estamos (diferente do spin) efetivamente quantizando um sistema clássico que descreve um movimento circular. As características físicas (clássicas) deste sistema exigem que o estado da partícula no ponto (r; ; ) sejam os mesmos que nos pontos (r; + 2 ; + 2 ) (pois são os mesmos pontos do espaço). Assim, a condição de unicidade da solução (que usamos em problemas de mecânica clássica) exige que ( )= m m ( + 2 ) ) eim2 = 1 ) m = 0; 1; 2; :: Ou seja, m deve ser inteiro. Como a…rmamos para o caso do momento angular orbital. Assim, nossas soluções têm a forma 1 Ylm ( ; ) = p 2 m l ( ) exp (im ) ; m 2 N : Voltando agora para a nossa equação ^ + Yll = 0 ) ~ei L @ @ + @ @ i cot 1 p 2 l l ( ) exp (il ) = 0 ; ou seja @ @ l l l l ( ) = l cot ( ) observando que d sinl = l sinl d 1 cos = l sinl cos sin = l cot sinl temos a solução l l Nl ( ) = Nl sinl ) Yll ( ; ) = p exp (il ) sinl 2 onde Nl é uma normalização. Exercise 99 Obtenha a constante de normalização Nl (lembre que 2 [0; ]). ^ As demais soluções são obtidas pela aplicação do operador L Yll m ^ ( ; )= L m Yll ( ; ) = Nl m ~e i i cot @ @ @ @ m sinl eil ; m As funções Yll m assim construídas, e devidamente normalizadas, são chamadas de harmônicos esféricos. Com isso ^ 2 Ylm = ~2 l (l + 1) Ylm ; l 2 N::: L ^ 3 Y m = ~mY m ; m = l; l + 1; :::; 0; :::; l L l l Z 2 Z hYlm j Ylm0 i = Ylm ( ; ) Ylm0 ( ; ) sin d d = 0 0 0 0 202 mm0 ll0 2l : ^2, Se usarmos ainda a primeira expressão acima e forma diferencial de L temos que as nossas soluções obedecem também a equação: m2 sin2 1 d sin d sin d d m l = ~2 l (l + 1) m l fazendo cos ; 1 1 2 ~ l (l + 1) 1 d d = sin d d 2 = cos2 = 1 2 1 temos d d d d 2 1 sin2 = sin2 m l m2 2) (1 m l m l + =0 Para m = 0 esta é a equação de Legendre, cujas soluções são os polinômios de Legendre 1 dl l cos2 1 Pl (cos ) = l l 2 l! d (cos ) para o caso geral, as soluções são dadas pela formula de Rodrigues Ylm ( ; ) = Nl m m Pl (cos ) eim ondePlm são os polinômios associados de Legendre m 1 cos2 m=2 m 1 cos2 m=2 Plm (cos ) = ( 1) = ( 1) dm m Pl (cos ) d (cos ) 1 dl+m cos2 l 2 l! d (cos )l+m 1 l Usando as propriedades dos polinômios de Legendre a forma acima permite determinar as constantes de normalização Nl m = 2l + 1 (l m)! 4 (l + m)! 1=2 : A vantagem da expressão acima é que as propriedades dos polinômios associados de Legendre permitem resolver uma série de problemas envolvendo os harmônicos esféricos. 203 13.2 O átomo de hidrogênio Recapitular principais resultados do átomo de Bohr-Sommerfeld. Como vimos, o modelo de Bohr-Sommerfeld do átomo de hidrogênio consiste na quantização de duas variáveis clássicas: X E cada estado do elétron é determinado pelos números n e NT. I I p d = n h ; pr dr = nr h : com nr 2 N ; n 2 N : A energia de cada um destes estados é dado por Enr ;n = RH ; n = n + nr : n2 Assim, para cada valor de n temos vários diferentes de n e nr que resultam na mesma energia. Esta degenerescência explica a estrutura …na observada nas linhas espectrais do átomo de hidrogênio. Na notação usada em química um nível é nomeado pelo valor de n e nr , onde os níveis com nr = 0 (maior n ) é chamado de s, o nível nr = 1 é chamado de p etc. n = 1 ) n = 0; n = 1 1s n = 2 ) nr = 0; n = 2 2s; nr = 1; n = 1 2p n = 3 ) nr = 0; n = 3 3s; nr = 1; n = 2 3p ; nr = 2; n = 1 .. . 3d Vejamos agora como estes resultados podem ser obtidos na teoria de Schroedinger. Veremos, além disso, que esta teoria não só fornece os resultados anteriores como permite uma descrição mais …na dos níveis acima (e.g., a degenerescência do nível 2p). Além disso, e o que é mais importante, a teoria de Schroedinger permite re…nar a descrição do átomo de hidrogênio acrescentando outras características além da atração coulombiana. Por exemplo, o spin do elétron e do núcleo. Uma vez que a teoria de Schroedinger parte da quantização do hamiltoniano clássico, precisamos primeiro montar este hamiltoniano. Partindo do hamiltoniano da partícula livre H= ~2 2 r 2m e escrevendo o laplaciano em coordenadas esféricas temos H= ^2 p^2r L + 2m 2mr2 204 com 1 @ r r @r 2 ^ 2 = 1 @ sin @ + 1 @ L 2 sin @ @ sin @ 2 p^r = ^ 2 é o operador de momento angular introduzido anteriormente (96) e p^r é onde L chamado de momento radial. Assim, para o caso de um potencial que dependa apenas da coordenada radial, i.e., um potencial central, temos que o operador hamiltoniano se torna 2 ^2 ^ = p^r + L + V (r) H 2m 2mr2 Para o caso de um sistema ligado de um próton e um elétron (i.e., um átomo de hidrogênio) temos que o potencial do elétron devido ao próton vale V (r) = e2 r com o que nosso hamiltoniano …ca 2 ^2 ^ = p^r + L H 2m 2mr2 e2 r Remark 100 Lembre que, na verdade, sendo um sistema de dois corpos, devemos usar a massa reduzida me mp = ' me ; me + mp reveja o capítulo sobre o átomo de Bohr. Assim, na teoria de Schroedinger, o problema dos estados estacionário (estados com energia de…nida) do átomo de hidrogênio, consiste em encontrar os autoestados do operador acima ^ H = jEj : Além disso, como estamos interessados em estados ligados, estamos interessados no caso E < 0 (pois, como no problema usual do potencial acima, estamos colocando o zero de energia no in…nito). O problema acima pode ser facilitado usando, novamente, uma separação de variáveis. Entretanto, observe que h i h i ^ L ^ 2 = H; ^ L ^3 = 0 ; H; ^ 3 (ou ainda, ^ L ^2 e L ou seja, podemos procurar por autofunções simultâneas de H; 2 ^ ^ ^ podemos medir simultaneamente H; L e L3 ). Com isso, vamos procurar as nossas soluções na forma = R (r) Ylm ( ; ) : 205 Substituindo a solução ~2 2m na forma acima na ES temos: ~2 l (l + 1) 1 d2 r + 2 r dr 2mr2 e2 + jEj R (r) = 0 r Esta equação pode ser simpli…cada fazendo u rR com o que 2me2 2m jEj u (r) = 0 + 2 ~ r ~2 l (l + 1) d2 r + 2 dr r2 que pode ser colocada numa forma ainda mais simples através das variáveis ~2 2 = jEj ; 2m ~2 ~2 = ; a0 = 2 2ma0 me2 2 r; RH = RH jEj onde RH é a constante de Rydberg e a0 o raio de Bohr introduzidos na seção sobre o átomo de Bohr. Nestas novas variáveis temos d2 u d 2 l (l + 1) 2 1 4 u+ u=0 Nosso trabalho se resume, obviamente, em resolver a equação diferencial acima. Assim como nos casos anterior existem técnicas especí…cas para encontrar a solução desta equação. Após a aplicação destas técnicas, as soluções do problema acima podem ser escritos como: un;l ( ) = onde Fnl ( ) = nX l 1 i=0 l+1 exp 2 2 i Fnl ( ) 2 ( 1) [(n + l)!] i ; n2N i! (n l 1 i)! (2l + 1 + i)! são os polinômios associados de Laguerre. Para que estas funções sejam de quadrado integrável, devemos ter13 n l 1 0)l n 1)l<n Assim, a solução do problema do átomo de hidrogênio pode ser escrito como (r; ; ) = Rn;l (r) Ylm ( ; ) ; 1 2 r Rn;l (r) = un;l ( ) ; r n;l;m un;l ( ) = exp l+1 2 Fnl ( ) : 1 3 Podemos de…nir os polinômios acima para valores negativos do fatorial usando a função . Entretanto, ( m)) = 1 para m inteiro positivo. 206 com os autovalores RH n2 que são exatamente os mesmos obtidos pela quantização de Bohr. A solução da parte radial do problema (como era de se esperar) introduziu o novo número quântico n nas nossas soluções. Chamado de número quântico principal. En = Remark 101 A energia depende apenas do número quântico principal. As restrições acima impõem l<n: e as restrições obtidas anteriormente jmj < l : Assim, para um dado valor de l temos 2l + 1 estados com o mesmo valor de l e, para um dado valor de n temos n2 estados com a mesma energia. Na notação usada em química, os valores de n rotulam os chamados orbitais. Os valores de l são chamados, em seqüência, s; p; d etc. E para cada um destes valores, temos m = 2l + 1 estados distintos. 1s1 2s1 2p3 3s1 3p3 3d5 .. . A descrição completa dos orbitais atômicos depende ainda de uma característica negligenciada até aqui: o spin do elétron. Esta quantidade faz com que cada estado possa existir em dois estados distintos de spin. Ou seja, o número de estados de cada orbital é dobrado. 1s2 2s2 2p6 3s2 3p6 3d10 .. . Além disso, a estrutura da distribuição eletrônica, bem como a estabilidade de toda a matéria conhecida, depende diretamente da in‡uência do spin nestes níveis eletrônicos. Ou seja, é impossível compreender a distribuição eletrônica (em especial a tabela periódica) sem tomar em conta o spin do elétron. 207 13.2.1 Acoplamento spin-órbita Podemos melhorar um pouco o nosso modelo se tomarmos em conta os efeitos causados pelo spin dos elétron. Como sabemos, além de carga e massa o elétron possui ainda outra característica intrínseca chamada spin. Esta quantidade interage apenas com campos magnéticos. Assim, se colocarmos nosso átomo ^o imerso num campo magnético B, teremos de acrescentar ao hamiltoniano H um termo da forma ~ ^ =H ^o + ^ H s:B ; ^ s= 2 ^ s é o operador de spin. Este operados comuta com os introduzidos anteriormente i h i h i h ^z = 0 : ^ ^ ^2 = ^ s; L H; s = ^ s; L Assim, como vimos, nosso sistema adquire mais um grau de liberdade e, escolhendo nossa base de spin nossas j i na direção z, soluções passam a ter a forma ~ 2 ~ j i 2 1 jn; l; m; ms i = jn; l; mi jms i ; ms = 2 s^z jn; l; m; ms i = ~ms jn; l; m; ms i jn; l; mi j i ; s^z j i = 3 j i= (97) Assim, além dos números quânticos introduzidos anteriormente, temos agora o novo número quântico ms . O problema aqui é que uma carga em movimento num campo elétrico (devido as transformações de Lorentz) enxerga um campo magnético (mais termos da ordem de 2 ), p Bef f = E mc Escrevendo E = r' surge no nosso Hamiltoniano um termo na forma 1 ^ ^ s:Bef f = f (r) ^ s L 2 ; f (r) = 1 1 1 d' 2 m2e c2 r dr (o fator 1=2, chamado fator de Thomas, surge quando mudamos do referencial do elétron, onde Bef f foi calculado, para o referencial do centro de massa) e o hamiltoniano para o átomo de hidrogênio, tomando agora em conta o spin, tem a forma ^ =H ^ o + f (r) ^ ^ H s L Obviamente, uma vez que o Hamiltoniano e, conseqüentemente, as equações diferenciais envolvidas são diferentes, as soluções anteriores não servem mais. Este novo problema é in…nitamente mais difícil de resolver. Entretanto, é possível mostrar que este novo termo envolve energias muito menores que 208 as energias envolvidas em Ho . Assim, o que efetivamente é feito, é se tratar este novo temo do Hamiltoniano como uma perturbação. Ou seja, utiliza-se as mesmas soluções obtidas para Ho e se estima as alterações destas quantidades na presença do novo termo. Um problema ainda é que este novo termo no Hamiltoniano não mais comuta nem Lz nem com s^z . Portanto, estas quantidades não podem mais ser usadas ^ L ^ z ; s^z ). para rotular nossos soluções (existe agora relações de incerteza entre H; Mais especi…camente, não podemos mais usar o número quântico m nem a projeção do spin ms . Contudo, o Hamiltoniano acima pode ser escrito como ^ =H ^ o + f (r) ^ |2 H 2 onde ^2 L ^ s2 (98) h i ^ ^ ^ +^ ^ |=L s ; H; | =0 é o momento angular total do sistema. Além disso, é fácil ver que jz comuta ^ Assim, no lugar de m (autovalores de L ^ z ) usamos jz , os autovalores do com H. operador |^z . Lembre-se que tínhamos dois números (m; ms ) e agora só temos um (jz ). Pela forma do Hamiltoniano (98) é fácil ver que h i ^ ^ H; |2 = |^z ; ^ |2 = 0 podemos então usar os autovalores de ^ |2 para rotular nossos estados quânticos. ^ não podemos usar outra componente Observe que apesar de ^ | comutar com H, de ^ |, porque estas não comutam com |^z . Assim, no lugar dos vetores (97) os estados quânticos para o átomo de hidrogênio são rotulados como jn; l; j; jz i onde ^ jn; l; j; jz i = En;? jn; l; j; jz i ; H ^ 2 jn; l; j; jz i = ~l (l + 1) jn; l; j; jz i ; L J^2 jn; l; j; jz i = ~j (j + 1) jn; l; j; jz i ; |^z jn; l; j; jz i = ~jz jn; l; j; jz i : (99) Observe que, para o novo Hamiltoniano, não existe nenhuma razão para se ^ não dependam dos demais números quânticos. supor que os auto-valores de H Mais uma vez: para construir efetivamente as funções de onda n;l;j;jz (r; ; ) = hr; ; j jn; l; j; jz i precisamos resolver a equação de Schroedinger. Mas o que fazemos é continuar usando as funções R (r) e Ylm ( ; ), obtidas anteriormente, e tratamos o novo Hamiltoniano como uma perturbação do anterior. 209 14 Teoria das perturbações Como vimos, o problema do átomo de hidrogênio (mesmo com um único elétron) tomando em conta os efeitos do spin, não pode ser resolvido exatamente (isso acontece com a maioria dos problemas em MQ). Vamos então ver como este tipo de problema pode ser atacado. A idéia é queremos encontrar os estados estacionários (auto-funções) j n i para um Hamiltoniano na forma ^ =H ^ 0 + V^ ; H ^j H ni = "n j ni ; 2R; << 1 : (100) ^ 0 , i.e., nós conhecemos onde sabemos resolver o problema exatamente para H todas as soluções ^ 0 j m i = Em j m i : H ^ 0 , i.e., as enA suposição que fazemos aqui é que V^ é uma perturbação em H ^ ergias (auto-valores) do hamiltoniano H, apesar de ser diferente dos autovalores ^ 0 , não são muito diferentes j"n En j << 1. Isso pode ser garantido se de H ^ =H ^ 0 . Este parâmetro …zemos o parâmetro muito pequeno. Para = 0, H surge naturalmente em cada problema especí…co. A idéia aqui (que é muito ^ apemais fácil de entender no espaço abstrato) é que o auto-vetor j n i de H, ^ 0 , que sar de desconhecido, não é um vetor muito diferente de algum vetor de H chamaremos de j n i. Com isso, fazemos a seguinte aproximação para a projeção de j n i em j n i h n j ni = 1 : (101) É conveniente escrever esta expressão usando o seguinte operador de projeção P^n = j ni h nj ou seja, quando opera em um vetor qualquer j i, P^n j i = h n j j i j n i nos da a projeção de j i em j n i. Com isso, nossa aproximação (??) se torna P^n j ni =j ni h nj j ni =j ni (102) ou ainda j ni =j ni + I P^n j =j ni ^n j +Q ni ni ^n = I ; Q P^n : (103) Se você não se sentir tão confortável no espaço abstrato, lembre-se que tudo isso pode ser traduzindo num espaço concreto. Por exemplo, usando funções de onda, Z hxj P^n j n i = hxj j n i h n j j i = hxj j n i h n j jxi hxj j n i dx Z = n (x) n (x) n (x) dx 210 ^ 0 . Obonde n (x) é a solução da equação de Schrödinger com hamiltoniano H viamente, para efetuarmos o cálculo acima, precisamos antes encontrar n (x), que é o nosso objetivo adora. Voltando agora para a nossa notação abstrata em (100) temos ^0 j H n j ni ni = Vj ni V^ j ni 1 = ^0 H "n =) V^ j ni ^0 j H = "n ni 1 ^0 onde, até aqui, "n H a seguinte propriedade é apenas um símbolo para um operador que com 1 ^0 H "n "n ^0 = I H =j ni mas que nós ainda não conhecemos. Voltando agora para (103) temos j ni =j ni ^n j +Q j ni =j ni ^n j + M ni =) j ni ni 1 ^n + Q "n 1 ^n = Q ^n ; M ^0 H "n ^0 H V^ j ni V^ O grande truque agora é aplicar este processo recursivamente, ou seja, na expressão acima (que possui j n i dos dois lados da igualdade) substituímos toda a igualdade no j n i do lado direito. Com isso j ni =j ni ^n j + M =j ni ^n j + M ni ni ^n j + M ni ^ n2 j M ni + 2 (104) Observe agora que o terceiro termo depende de 2 e sendo muito pequeno, é obrigatoriamente muito menor que o segundo. Assim, uma primeira aproximação para j n i, i.e., ignorando os termos da ordem de 2 , vale E 1 (1) ^n = j ni + Q V^ j n i n ^ "n H0 onde, mais uma vez, lembramos que conhecemos o vetor j Para efetuarmos 1 ^0 a conta acima, precisamos ainda saber como age o operador E H . Para isso, basta usarmos a propriedade E X X 1 ^n j k i h k j = I =) n(1) = j n i + Q j k i h k j V^ j n i ^ "n H0 k k =j ni + X k ^n Q 1 ("n Ek ) 211 j k i Vkn n i. onde sabemos calcular cada elemento da matriz Vkn Z Vkn = h k j V^ j n i = h k j jxi hxj V^ jx0 i hx0 j j Z 0 0 0 = k (x) V (x; x ) n (x ) dx dx ni dx dx0 Em particular, se V^ só depender de x, como é o vaso mais comum, V (x; x0 ) = hxj V^ jx0 i = V (x) (x Z Vkn = k (x) V (x) n (x) dx x0 ) É importante notar que ^n j Q ki =j ki = (j Com isso (1) n E P^n j = I ki nk =j ni j n i) ki j 1 ("n k6=n n i h n j) j k i 0; n=k j k i ; n 6= k = X + = (I Ek ) j k i Vkn Ou, projetando no espaço das funções de onda (1) n (x) = n X (x) + k k6=n ("n (x) Vkn Ek ) (105) Mas ainda resta um problema: quanto vale "n ? Para resolver este problema, voltamos a nossa equação original (100) e fazemos o produto interno com j n i, ^ 0 + V^ j H h nj h n j H0 ^ j ni e usamos novamente (101), h n + h j ni ni =h n j "n ^j nj V ni En ni = "n h nj j ni = 1, ^ j ni h n j V^ j n i " n = En + h "n j n = nj V (106) onde n é a diferença entre a energia perturbada e não perturbada, que estamos supondo pequena (observe que é proporcional a ). Precisamos então calcular 1 "n Ek = = 1 En ) 1 (Ek 1 !nk 1 = n 1 !nk ; !nk = Ek n !nk 212 n En : Se supusermos que n << !nk podemos expandir (1 Taylor em torno da origem 1 1 = n 1 X n 1 em série de 2 n =1+ !nk n=0 !nk n =!nk ) n !nk n + + ::: !nk usando agora (106) 1 1 =1+ ^j !nk nj V n !nk 1 "n h Ek = ni + 2 1 4 h n j V^ j 1+ !nk !nk 2 ^j !nk h ni nj V + 2 ni !2 3 +O h n j V^ j !nk ni !2 +O (1) 3 3 5 (107) Precisamos agora lembrar que na nossa primeira aproximação n (x) estamos interessados apenas em termos da ordem de , i.e., se mantivermos o segundo da expressão acima em (75) teremos um termo da ordem de 2 . Então, para obtermos a aproximação de ordem 1 (ignorar termos de 2 ) na função de onda, usamos a aproximação de ordem zero (ignorar temos de ) na energia. Assim, em primeira ordem em , temos E X Vkn (1) = j ni j ki n Ek En k6=n (1) (x) = 1 (x) X k6=n Vkn E k En k (x) (108) O que signi…ca a expressão acima? Ela nos diz que o vetor perturbado j n i é quase igual ao vetor não perturbado j n i, mas com uma pequena componente (pois << 1) na direção ortogonal. Além disso, a suposição n << !nk nos diz que a perturbação tem de ser muito menor que a diferença nos níveis de energia do hamiltoniano não perturbado. Para se saber o valor da primeira aproximação na energia, quanto V^ alterou a energia do sistema, basta usar o resultado acima em (106) E (1) ^ = h j V = h n j V^ j n i + O 2 ; (109) n n n ou seja, a primeira ordem de perturbação na energia é apenas a média de V^ . O poder do processo descrito acima é que ele pode ser repetido inde…nidamente para se obter as outras ordens de aproximação em . Por exemplo, para a segunda ordem de aproximação, voltamos para (104) j ni =j = ^ n j ni + 2M ^2j + M n E (1) 2 ^2 + Mn j n i n ni 213 ni usamos nossa primeira aproximação E ^ n2 j n i = n(1) + 2 M (1) n ignorando termos de ordem mais alta que E E (2) = n(1) + n (1) n onde ^ n2 M (1) n E E E 4 + 2 , 2 ^ n2 M ^ n4 M ^ n2 j M (1) n ni E foi obtido no passo anterior. Explicitamente 1 ^n =Q = X "n ^0 H ^n Q 1 k;j = X ("n k6=n;j6=n "n Ek ) Ek ) ^0 H ^j j 1 ("n 1 ^n V^ Q ki h kj V j ^j ki h kj V V^ (1) n E 1 ^ j i Qn ji ("n Ej ) 1 ("n h Ej ) h ^ jj V ^ jj V (1) n E : Mas agora, para "n precisamos manter termos até a primeira ordem em em 1 "n Ek = = = " # 1 h n j V^ j n i 1+ +O !nk !nk " h n j V^ j n i 1 1+ + h !nk !nk " # 1 h n j V^ j n i 1+ +O !nk !nk 2 ^ j n j Mn !# ni +O 2 2 Então, para obtermos a aproximação de ordem 2 (ignorar termos de 3 ) na função de onda, usamos a aproximação de ordem 1 (ignorar termos de 2 ) na energia. Isso é válido para qualquer ordem. Com isso E E (2) = n(1) + n " #" # X ^ j ni ^ j ni 1 h j V h j V 1 n n h k j V^ j j i 1 + 1+ h (En Ek ) (En Ej ) (En Ek ) (En Ej ) k6=n;j6=n Este procedimento pode ser aplicado inde…nidamente. Usualmente, em problemas práticos, a convergência deste método é bem rápida, sendo necessário o cálculo apenas da primeira e segunda ordem de perturbação. O procedimento descrito acima é utilizado em praticamente todos os modelos de QFT. Em especial, o primeiro destes modelos a fornecer uma in…nidade de resultados consistentes com as experiências, a QED, é, basicamente, uma teoria 214 ^ jj V (1) n E j ki perturbativa. O procedimento é aplicado com tanta freqüência que um método sistemático foi desenvolvido para se somar os termos das séries em QFT chamado de diagramas de Feynman. Obviamente, se a perturbação não é pequena, o método não pode ser usado. Por exemplo, várias interações (e.g., quark-gluon) da QCD a baixas energias não podem ser tratadas com este procedimento. Esta é uma das razões destas teorias não fornecerem tantos resultados experimentáveis quanto a QED. Processos de transição de fase (e.g., supercondutividade e condensados) não podem ser descritos por este método, pois os novos vetores no espaço de Hilbert são muito distintos dos originas (a imposição (102) não pode ser feita). Para todos estes sistemas existem outros métodos aproximativos, como, por exemplo, os métodos variacionais e a aproximação WKB e ainda métodos puramente numéricos como density functional theory. O procedimento descrito acima se torna consideravelmente mais complicado quando a perturbação depende do tempo e quando o sistema possui degenerescências (neste caso, veja a divergência em (108)). 14.1 Acoplamento spin-órbita (continuação) Voltando agora ao nosso átomo de hidrogênio com spin. Como vimos, a primeira ordem de correção para a energia é simplesmente a média do novo operador Hamiltoniano calculado nas funções não perturbadas (109). Com isso ^ j i = h jH ^o + E = h jH ^o j i + = h jH f (r) 2 ^ | 2 1 hf (r)i h j ^ |2 2 ^2 L ^2 L ^ s2 j i ^ s2 j i ^ o com autovalor En (soluções (??)) e Lembrando que j i são autovetores de H que usando as regras (99) temos En;l;j = En + j (j + 1) l (l + 1) 3 ~2 hf (r)inlm 4 2 (110) Mais uma vez: este resultado é só uma aproximação que somente será válida se o segundo termo for muito menor primeiro . Mas já em primeira ordem de aproximação vemos que os níveis de energia do novo Hamiltoniano dependem, não só de n, mas de n; l e j. Ou seja, o termo spin-órbita quebra uma parte da degenerescência do sistema. Além disso, como estamos usando ainda as funções originais, as seguintes regras continuam válidas n 2 N ; l; m 2 N l < n ; jmj 6 l =) jz 1 6l: 2 Para avaliar o valor de hf (r)i basta usar também os estados não perturbados 215 (??) e calcular as integrais, com isso Z ~ hf (r)inlm = 2 En 2 l (2l + 1) (l + 1) n hf (r)inl onde = e2 =~c = 1=137 é a chamada constante de estrutura …na (este é o nosso parâmetro de perturbação neste caso). Observe agora que ~2 hf (r)inl / En 2 = 5; 33 10 5 : O que mostra que, efetivamente, o segundo termo de (110) é muito menor que o primeiro termo (se isso não fosse verdade teríamos de abandonar a nossa teoria14 ). Com isso nossa expressão de energia se torna ) ( 2 (Z ) 1 3 l (l + 1) En;l;j = jEn j 1 j (j + 1) 4 l (2l + 1) (l + 1) n Para l = 0 temos j = 0 + 1 2 e a expressão acima se torna j =0+ 1 (0) =) En;l = 2 jEn j ou seja, não há acoplamento spin-órbita neste caso (os orbitais s são esfericamente simétricos). Para o caso de um único elétron (esta conta deve ser refeita para mais elétrons, pois para n elétrons temos n contribuições do spin), lembrando que j = l 1=2, para um dado l > 0 temos ! 2 1 1 (Z ) (+) j = l + =) En;l = jEn j 1 2 (2l + 1) (l + 1) n ! 2 1 1 (Z ) ( ) j=l =) En;l = jEn j 1 + 2 l (2l + 1) n Por exemplo, para n = 2, temos 1. Para l = 0 =) j = 1=2 (0) E2;0; 12 = E2;0 = 2. Para l = 1 =) j = 1 jE2 j (1 0) = jE2 j 1=2 1 4 Nem sempre temos esta sorte. Teorias onde os termos de aproximação sucessivas não necessariamente diminuem são chamadas de "teorias não perturbativas". 216 E2;1; 12 = + E21 " = jE2 j 1 2 1 (Z ) 6 n " 2 1 (Z ) jE2 j 1 + 3 n En1 32 = E21 = # # As relações acima descrevem com grande precisão o espectro de emissão dos átomos hidrigenoides. Vamos então voltar para a nossa tabela periódica e tentar descrever a con…guração do átomo de lítio. Neste caso, temos 3 elétrons, os dois primeiros completam o orbital 2s. O terceiro certamente ocupará a Shell n = 2, mas com que valor de l? De acordo com as expressões acima nosso terceiro elétron tem a sua disposição os estados: (0) E2;0 = jE2 j 1 2 (Z ) 12 1 2 jE2 j (Z ) 6 + E21 = jE2 j + jE2 j E21 = jE2 j Vemos então que o estado de menor energia é o E21 . Mas este estado tem l = 1? Ou seja, a nossa teoria, apesar de descrever muito bem o espectro de vários átomos e, inclusive várias de suas propriedades químicas, ainda não é su…ciente para nos dar a regra n + l de Madelung. 217