1 A Equação de Schrödinger Como vimos no caso da quantização de Sommerfeld, a descrição da Mecânica Clássica (MC) adequada para se introduzir um processo de quantização não é a formulação de Newton. Isso é verdade em geral. Tanto para os processos da velha mecânica quântica, quanto da nova até a sua evolução relativística (a Teoria Quântica de Campos). Um primeiro ponto que podemos salientar é que, tendo como base uma descrição ondulatória, as equações envolvidas no processo de descrição quântica devem, assim como a equação de onda, envolver derivadas parciais. Enquanto a mecânica de Newton envolve derivadas totais. Além disso, como veremos a seguir, existe uma semelhança muito grande (notada bem antes do advento da MQ) entre estas outras descrições da MC (Hamilton, Lagrange etc) e a descrição das características da luz na óptica geométrica. De uma forma geral, não só nesta parte do curso como na segunda parte (Moderna II) é impossível apreciar o processo de surgimento e evolução da MQ sem um conhecimento (ainda que enciclopédico) da descrição clássica da Mecânica Analítica. Destarte, dedicaremos algum tempo para ganharmos uma certa familiaridade com os termos e expressões envolvidos na Mecânica Analítica. 1.1 Preliminar Se f = f (a; b) é uma função de duas variáveis a; b então df = @f @f da + db @a @b e, da mesma forma, se df = g:da + h:db =) f = f (a; b) não importando de quais variáveis depende g e h. Pois, independente desta variáveis, a função f só varia quando alteramos a e b. 1.2 Equações de Euler-Lagrange Partindo da equação de Newton temos d2 xi dt2 (1) @V d = m x_ i @xi dt (2) Fi = m Para forças conservativas Fi = A energia cinética em coordenadas cartesianas é dada por (onde, assim como na notação da relatividade, estamos admitindo que sempre existe uma somatória implícita quando dois índices se repetem) X 1 2 2 x_ 2k T = (x_ k ) ; (x_ k ) = 2 i 1 com isso temos @T m @ 1 @ x_ k = (x_ k ) (x_ k ) = @ x_ i 2 @xi 2 @ x_ i m = [( ik ) x_ k + x_ k ik ] = mx_ i 2 x_ k + x_ k @ x_ k @ x_ i Voltando em (2) @U d d @T d @T @U = mx_ i = =) + = 0 ; i = 1; 2; 3: @xi dt dt @ x_ i dt @ x_ i @xi (3) Para siatema conservativos a energia potencial depende apenas das coordenadas U = U (xi ; t). Enquanto a energia cinética é, em coordenadas cartesianas1 , uma função apenas das velocidades, T = T (x_ i ). Podemos com isso de…nir uma função que depende de x e x_ L (xi ; x_ i ; t) = T (x_ i ) com isso U (xi ; t) @T @L @L = ; = @ x_ i @ x_ i @xi @U @xi Substituindo em (3) temos d @L dt @ x_ i @L =0 @xi A função L é chamada de lagrangiana do sistema e as (3) equações acima as equações de Lagrange. 1.2.1 Coordenadas generalizadas Pela construção acima vemos que as equações diferenciais parciais de Lagrange são equivalente a equações de Newton. A princípio equações diferenciais parciais são mais complicadas que EDO. Entretanto, existe uma grande vantagem nas equações de Lagrange. Suponha que você queira resolver o problema de pêndulo sob a ação da gravidade. O ideal, neste caso, é usar a coordenada polar . Para obter as equações do movimento na mecânica de Newton você deve escrever x = R cos ; y = R sin ; calcular x • e y•, substituir na equação de Newton e usar o vínculo x2 + y 2 = R2 : 1 Em coordenadas polares, por exemplo, a energia cinética T = 1 r_ 2 + r_ 2 _2 m depende da coordenada 6 r. 2 ; Vamos ver como obter as equações do movimento na mecânica de Lagrange. Primeiro nos obtemos a energia cinética 1 1 T = mv 2 ; v = R _ =) T = mR2 _2 2 2 enquanto a energia potencial é dada por V ( ) = mgR (1 cos ) Com isso temos 1 mR2 _2 mgR (1 cos ) 2 Se esquecermos por um instante que estamos usando coodenadas polares e usarmos as equações de Lagrange (trocando x por ) temos L=T @L = @ @L = @_ com isso, @ @ @ @_ 1 mR2 _2 2 1 mR2 _2 2 d @L dt @ _ V = @ (cos ) = @ mgR (1 cos ) = mgR mgR (1 cos ) = mR2 _ mgR sin @L d = mR2 _ + mgR sin @ dt = mR2 • + mgR sin = 0 ou ainda • + g sin = 0 : R Que é precisamente a equação que seria obtida a partir da equação de Newton e o laborioso processo descrito acima. Este resultado pode ser provado de forma geral usando uma transformação geral de coordenadas. Assim, utilizando as equações de Lagrange temos uma liberdade completa na escolha das coordenadas do sistema, o que pode ser utilizado explorando as simetrias do problema. Ou seja, a principal vantagem das equações de Lagrange é que elas independem do sistema de coordenadas usados. Com isso, se qi é um conjunto qualquer de coordenadas que descrevem um sistema mecânico, este sistema deve obedecer as equações de Lagrange d @L dt @ q_i @L =0: @qi (4) As coordenadas qi são chamadas de coordenadas generalizadas. Remark 1 Mais uma vez, enquanto a equação de Newton (1) só tem esta forma em coordenadas cartesianas, as equações de Lagrange (4) têm esta forma em qualquer sistema de coordenadas. Exercise 2 Uma conta (miçanguinha) de massa m pode se mover livremente numa barra rígida e reta que gira com velocidade constante !. Escreva a equação do movimento da conta. 3 2 Transformada de Legendre Em uma série de problemas em física é importante mudarmos as variáveis que usamos num problema. Por exemplo, na termodinâmica uma quantidade muito importante é a energia interna de um sistema U (S; V ). Um inconveniente desta quantidade é que ela depende da entropia S, uma quantidade que não pode ser medida diretamente com nenhum instrumento. Entretanto, pelas leis da termodinâmica, sabemos que a temperatura T de um corpo é a variação da sua energia interna com a entropia @U : @S T = (5) Vamos então de…nir uma nova quantidade F como F = T:S U (6) Diferenciando esta quantidade temos dF = T dS + SdT dU ; Sabendo que U = U (S; V ) temos dU = @U @U dS + dV ; @S @V (7) com isso @U dS @S dF = T dS + SdT = @U @S T dS + SdT @U dT @T @U dV @V O fato importante na de…nição de F é que, usando (5), temos @U dV ; @V dF = SdT (8) ou seja, a função (6) assim de…nida não depende da entropia F = F (T; V ) Com isso dF = @F @F dT + dV ; @T @V comparando com (8) temos S= @F @F ; = @T @V @U : @V O importante da quantidade F , chamada energia livre de Helmholtz, é que ela depende da temperatura e do volume, ambas quantidades que, diferente da entropia, podem ser medidas com instrumentos usuais. 4 Ou seja, podemos determinar F estudando as variações das característica do sistema com respeito ao seu volume e a sua temperatura. O procedimento acima é um exemplo de um procedimento mais geral chamado de transformada de Legendre. De forma geral, se f = f (x1 ; x2 ; :::; y1 ; y2 ; :::) podemos de…nir uma nova função g = pi y i f (somatória em i) onde pi = @f @yi com isso dg = (dpi :yi + pi :dyi ) df @f @f dxi + dyi @xi @yi @f dyi + dpi :yi dxi @xi = (dpi :yi + pi :dyi ) = pi @f @yi que, pela de…nição de pi , @f dxi @xi dg = yi :dpi Ou seja a função g não depende mais de yi , mas sim de um novo conjunto de variáveis pi . 3 Equações de Hamilton Nosso objetivo agora é usar a transformada de Legendre nas equações de Lagrange. Primeiramente lembramos que, pela de…nição acima L = L (qi ; q_i ) ; ou seja, a Lagrangiana depende das posições e das velocidades. Agora vamos de…nir a quantidade H = pi q_i onde pi = L (9) @L @ q_i é chamado momento conjugado da variável qi (i.e., para q = x temos um momento linear, para q = um momento angular e, no caso geral, um momento 5 conjugado). Das equações de Lagrange temos que, se uma determinada coordenada qm não aparece na Lagrangiana (chamada de coordenada cíclica) d @L @L = 0 =) = p_i = 0 =) pi = const: @qm dt @ q_i então o momento associado a esta coordenada se conserva (e.g., para uma partícula livre L = T o momento linear em qualquer direção se conserva). Seguindo o procedimento da seção anterior temos dH = dpi :q_i + pi :dq_i dL : Lembrando que L = L (q; q) _ temos dL = @L @L dqi + dq_i ; @qi @ q_i com isso @L @L dqi + dq_i @qi @ q_i @L @L dq_i + q_i :dpi dqi ; @ q_i @qi dH = dpi :q_i + pi :dq_i = pi e pela de…nição de pi dH = q_i :dpi @L dqi @qi ; (10) e, como esperávamos, a função H assim obtida é uma função de q e p e não mais de q, _ H = H (q; p). A quantidade H assim de…nida é chamada de Hamiltoniana. Sabendo que H = H (q; p) temos dH = @H @H dqi + dpi : @qi @pi Lembrando agora que q e p são coordenadas independentes em H (assim como q e q_ eram em L, i.e, obviamente q_ depende de q, mas é exatamente está relação que queremos encontrar ao resolver a equações de Lagrange) e comparando com (10) temos @H @L @H = q_i ; = @pi @qi @qi Se usarmos agora as equações de Lagrange temos @L d @L = @qi dt @ q_i Lembrando a de…nição de p pi = @L @L d =) = pi = p_i @ q_i @qi dt 6 Com o que @H @H = q_i ; = @pi @qi p_i : (11) Estas são as chamadas equações de Hamilton (EH). Qual a vantagem destas equações? Uma vantagem prática destas equações é que elas possuem apenas derivadas de primeira ordem. Como a equação de Newton, a equação de Lagrange possui derivadas das velocidades o que resulta em derivadas de segunda ordem na posição. Obviamente perdemos algo ao ganharmos esta facilidade. O ponto é que temos dois pares de EH, ou seja, usando a transformada de Legendre conseguimos transformar um sistema de n equações diferenciais de segunda ordem num sistema de 2n equações diferenciais de primeira ordem2 . 3.0.2 Signi…cado físico da Hamiltoniana No caso geral, a energia cinética de um sistema é uma função quadrática das velocidades generalizadas T = aij q_i q_j ; aij = aij (q) (somatória em i e j) no caso de coordenadas cartesianas aij = ciando a expressão acima temos 1 ij 2 m. Diferen- X @T @ q_i @ q_j = aij q_j + aij q_i @ q_k @ q_k @ q_k X = (aij ik q_j + aij q_i jk ) X X = aij ik q_j + aij q_i jk ij = X akj q_j + j = X X ij aik q_i i aki q_i + i X aik q_i i Multiplicando por q_k e efetuando uma somatória em k temos X @T X X q_k = aki q_i q_k + aik q_i q_k @ q_k k i;k i;k = T + T = 2T 2 Na verdade, esta não é a maior vantagem da EH, mas sim que, além de todo o conjunto de transformações de coordenadas disponíveis na formulação de Lagrange, tempos agora um conjunto muito maior de transformações a nossa disposição. Voltaremos a isso quando falarmos em transformações canônicas. 7 Este resultado é conhecido como teorema de Euler. Se usarmos agora este resultado na de…nição de H temos X H= pi q_i L i X @L q_i = @ q_i i X @T = q_i @ q_i i (T U) (T U) = 2T T + U =T +U : Ou seja, a hamiltoniana é a energia total do sistema. Observe que, diferente da Lagrangiana (T U ) a energia total do sistema é uma quantidade que pode ser medida e, além disso, é uma quantidade conservada para um sistema isolado. Esta é outra vantagem da teoria de Hamilton. Assim, utilizando a mecânica de Hamilton podemos, a partir da energia total do sistema e de um sistema de 2n equações de primeira ordem, estudar a dinâmica dos corpos. 3.1 Princípio variacional Um problema importante e comumente encontrado é o seguinte: dada uma função y = f (x) para quais valores de x a função f , e conseqüente y, possui valores máximos e mínimos (estes valores são chamados de extremos da função). A resposta, obviamente, são os pontos onde a derivada de f se anula. Um problema bem mais complicado, e interessante, é o seguinte: considere a integral Z b I= F (y (x) ; y 0 (x) ; x) dx a onde F é uma dada função de y (x), y 0 = dy=dx e x. Assim, para cada função y (x) diferente I assume um valor diferente. Para quais funções y(x) a integral I é um extremos? Antes um pouco de nomenclaturas. Dada uma certa função y(x) podemos calcular o valor de I. A quantidade I, que depende de uma função, e não apenas de um número, é chamada de funcional. Outro ponto importante é que dado dos valores y(x0 ) = a1 e y0(x0 ) = a2 é sempre possível encontrar uma função y(x) que satisfaça esta condição. Neste sentido, as variáveis y e y0 são tratadas em F como sendo independentes. Agora, para calcular I nós não podemos dar apenas o valor de y(x) num dado ponto x0 , mas sim o valor desta função em todo o intervalo x 2 [a; b], ou seja, precisamos dar toda uma curva y(x). Dada uma curva o valor da derivada desta curva está completamente determinada. Assim, em I não é possível se especi…car separadamente o valor de y e y0. Resumindo enquanto F é uma função de y, y0 e x F = F (y; y 0 ; x) 8 Figure 1: Figura retirada do Marion. enquanto I é um funcional apenas de y I = I [y] : Nosso problema de encontrar a função y para a qual I é um extremo é um problema do chamado cálculo variacional. Por que a derivada de uma função é nula nos extremos? Isso ocorre porque a variações do parâmetro (x) em torno deste ponto não geram variações na função y(x) (pelo menos até primeira ordem em dx). O mesmo acontece com uma função de duas variáveis (o que pode ser visualizado facilmente) ou com funções com um número qualquer de variáveis (o que não é tão simples de visualizar). Ou seja, se estivermos num ponto extremo da função, ao deslocarmos o argumento uma quantidade in…nitesimal não haverá variação da nossa função. A idéia por detrás do cálculo variacional é exatamente a mesma. Se tivermos encontrado a função y(x) para a qual nosso funcional I [y] é um extremos, esperamos que ao variamos um pouco esta função (ou seja, pegarmos uma curva y(x) muito próxima a y (x)) o valor do nosso funcional não irá variar (Figura). Suponha que y (x) é a função que resolve este problema (obviamente esta é a função que queremos encontra). O fato de y (x) ser um extremo de I signi…ca então que com pequenas variações em torno de y (x) o valor do integrando não varia apreciavelmente (de forma análoga ao cálculo ordinário). Vamos então analisar como I varia se substituímos y pela função (Figura) y (x) = y (x) + " (x) 9 para uma função (x) que, apesar de arbitrária, vamos supor dada, i.e., vamos variar apenas o valor de ". Como queremos estudar todas as funções que passam pelo mesmo ponto inicial e …nal devemos ter y (a) = y (a) ; y (b) = y (b) =) y (a) = y (b) = 0 : Para a variação acima (onde y e são funções conhecidas) nosso integrando I passa a ser uma função (pois " é um número) de " Z b I [y] ! I (") = F (y + " ; y 0 + " 0 ; x) dx : a O ponto é que agora, como é uma função, podemos usar o resultado do cálculo usual é dizer que para " = 0 a nossa função I é um extremo e, consequentemente, sua derivada é nula, ou seja, dI =0: (12) d" "=0 Tudo que precisamos agora é de…nir a diferencial dI=d". Fazemos isso da forma usual "Z # Z b b I [y + "] I [y] 1 dI 0 0 0 = lim = lim F (y + " ; y + " ; x) dx F (y; y ; x) dx "!0 " d" "!0 " a a Z 1 b [F (y + " ; y 0 + " 0 ; x) F (y; y 0 ; x)] dx = lim "!0 " a Z b [F (y + " ; y 0 + " 0 ; x) F (y; y 0 ; x)] = dx : lim " a "!0 Agora F (y + " ; y 0 + " 0 ; x) = F (y; y 0 ; x) + ou seja F (y + " ; y 0 + " 0 ; x) "!0 " lim com isso dI = d" Z a b @F @F " + 0 " 0 + O "2 @y @y F (y; y 0 ; x) @F @F + 0 @y @y 0 = @F @F + 0 @y @y dx : 0 (13) Lembrando que 0 = d =dx podemos integrar o segundo membro da expressão acima por partes Z b Z b b @F d @F d @F dx = dx : (14) 0 dx 0 @y @y dx @y 0 a a a Agora usamos o fato de que a função (x) (apesar de arbitrária) deve se anular nos extremos (a) = (b) = 0 Z b Z b @F d d @F dx = dx : 0 dx @y dx @y 0 a a 10 Substituindo em (13) temos dI = d" = Z b a Z b a @F @y d @F dx @y 0 @F @y d @F dx @y 0 dx dx : (15) Voltando agora para (12) temos dI d" =0= Z b a "=0 @F @y d @F dx @y 0 dx Para qualquer função (x). Isso só é possível se o integrando for zero @F @y d @F dx @y 0 =0: Para F uma função de várias variáveis este resultado tem de ser válido independentemente para cada variação @F @yi d @F dx @yi0 =0 (16) Esta é a chamada equação de Euler. Observe que, no …nal, a nossa expressão (15) não depende de ". Além disso, para lembrar que não estamos falando do cálculo usual, as pessoas inventam um novo símbolo para a derivada (mas é apenas um símbolo) Z b dI I [y] = F (y; y 0 ; x) dx : d" a E lesse a variação funcional de I. Ou ainda, se mudarmos a notação para e usarmos a notação acima, (15) pode ser escrita como Z b d @F dI @F I [y] = y dx d" @y dx @y 0 a y (17) e, em analogia com o cálculo ordinário de uma função f (x), costuma-se escrever Z b Z b I @F d @F df dx ! I [y] y dx = y dx ; df = dx y @y dx @y 0 a a ou seja, I @F = y @y d @F dx @y 0 e lesse, a derivada funcional de I [y] em relação a função y (x). Mais uma vez, isso é apenas uma notação3 , mas é importante que você a conheça porque ela é muito usada em livros e artigos. 3 Obviamente existe muito mais por trás do cálculo variacional. Mas se trabalharmos apenas com funções bem comportadas (e.g., diferenciáveis em todos os pontos), na grande maioria dos casos podemos encarar apenas como uma notação. 11 Figure 2: Figura retirada do Marion de Mecânica. Com isso, nesta simbologia, a nossa expressão …ca I [y] = Z b F (y; y 0 ; x) dx = 0 =) a I = y d @F dx @yi0 @F =0: @yi e lesse que, o fato da derivada funcional de I ser um extremo implica na equação de Euler. 3.1.1 Exemplo: a braquistocrôna. Um problema variacional bastante famoso, proposto em numa revista ciêntí…ca por Bernoulli em 1696, é o chamado problema da braquistocrôna (do grego, o tempo mais curto). Imagine dois pontos num plano, (x1 ; y1 ) e (x2 ; y2 ), se uma força constante for aplicada na direção x e uma partícula de massa m se mover do primeiro ponto ao segundo sob ação desta força, qual o caminho que esta partícula deve percorrer para efetua o trajeto no menor tempo possível? Imagine que você quer colocar um cano para guiar o movimento de uma bolinha e quer saber a forma do cano para minimizar o tempo de percurso. A resposta do problema acima é exatamente a trajetória que a sua pedra terá de fazer. Ou ainda, imagine que você pendure uma corrente entre os dois pontos acima (onde a força é, novamente, a gravidade), que curva esta corrente irá desenhar (esta curva se chama catenária)? Todos estes exemplos se referem ao mesmo problema. Vamos então a sua solução. Para fazer uma referência mais natural a força gravitacional, colocamos os eixos como na …gura abaixo Sabemos que a energia total do sistema T + U se conserva. Colocando o zero do potencial no ponto de início (x1 ; y1 ) e considerando que a partícula foi lançada do repouso na direção x (podemos ignorar qualquer velocidade na direção y pois, como não há forças nesta direção, ela se conserva) temos que no 12 ponto inicial Ei = T + U = 0 Seguindo a analogia da força gravitacional temos F = mg = T = @U )U = @x mgx 1 mv 2 2 A conservação de energia nos dá T + U = 0 =) v = Com isso 1 ds = v ) dt = ds ) t = dt v onde 2 2 p 2gx Z (x2 ;y2 ) (x1 ;y1 ) 1 ds v 2 (ds) = (dx) + (dy) Finalmente, o tempo vale Z (x2 ;y2 ) q 1 2 2 p t= (dx) + (dy) 2gx (x1 ;y1 ) Z (x2 ;y2 ) s Z (x2 ;y2 ) r 1 1 + y 02 1 + y 02 = dx = p dx 2gx x 2g (x1 ;y1 ) (x1 ;y1 ) y0 = dy dx Ou seja, o nosso problema se reduz a minimizar a integral (como (2g) uma constante) s Z (x2 ;y2 ) 1 + y 02 I= F (y 0 ; x) dx ; F (y 0 ; x) = 2gx (x1 ;y1 ) 1=2 é Onde, neste caso, a função F não depende explicitamente de y. A solução do nosso problema é, então, a função y que obedece a equação de Euler (16) @F @y d @F dx @y 0 =0 Como, neste caso, F não depende explicitamente de y @F d @F @F =0) =0) =C @y dx @y 0 @y 0 r @F @ 1 + y 02 y0 p = = =C @y 0 @y 0 x x (1 + y 02 ) 13 Assim, a curva que a partícula deve seguir y (x) deve ser solução da equação s y0 xC 2 02 2 02 2 0 p = C ) y = xC + xy C ) y = ; (1 xC 2 ) x (1 + y 02 ) ou ainda, dy = dx s xC 2 )y= (1 xC 2 ) 2a = 1=C 2 Z x2 x1 x p (2ax x2 ) dx ; Fazendo x = a (1 cos ) ) dx = a sin d temos Z y= ou seja, a curva procurada é y = a( a (1 cos ) d = sin ) + const. Com isso, a nossa curva obedece x = a (1 cos ) ; y = a ( sin ) que são as equações paramétricas de uma curva chamada ciclóide. Se a sua partícula for uma conta guiada por um …o (com massa) e você prender o …o nos pontos acima o …o assumirá exatamente esta a forma que levará a partícula entre os dois pontos no menor tempo, i.e., o …o formará uma catenária. A parte da curva entre o ponto (x1 ; y1 ) até o seu mínimo é chamada de curva tautocrônica (como muito bem observado pela senhorita Palma), i.e., é a curva na qual o tempo gasto por um objeto para deslizar sem fricção em gravidade uniforme até seu ponto de mínimo é independente de seu ponto de partida (este problema foi resolvido por Christiaan Huygens em 1659). 3.1.2 Equações de Euler-Lagrange O ponto importante para nós no desenvolvimento acima é o seguinte: suponha que a nossa variável é o tempo (x ! t) e que a função que procuramos seja a trajetória de uma partícula com coordenada generalizada q(t) (y (x) ! q (t)). Alem disso, suponha que a função F que estamos integrando seja exatamente a lagrangiana L do sistema. Com isso Z a b 0 F (y; y ; x) dx ! 14 Z a b L (q; q; _ t) dt Figure 3: Figura retirada do Marion de Mecânica. e a expressão (15) toma a forma: Z b L (q; q; _ t) dt = 0 =) a d @L dt @ q_i @L =0: @qi Que é exatamente a equação de Lagrange obtida anteriormente. Por isso estas equações são chamadas de equações de Euler-Lagrange (EL). A integral Z L (q; q; _ t) dt S [q] é chamada de ação. Usando a linguagem do cálculo funcional, podemos obter as equações de EL se impusermos que a derivada funcional da ação seja um extremo. Esta exigência recebe o nome de princípio da mínima ação (ou princípio de Hamilton). Neste sentido as equações de Lagrange e, consequentemente, toda a mecânica, podem ser construídas a partir do princípio da mínima ação e esta construção é equivalente a mecânica de Newton (perceba que este é um caminho diferente do seguido no início deste texto). O fato da mecânica de Lagrange ser uma conseqüência do princípio da mínima ação tem uma conseqüência crucial na questão do comportamento ondulatório ou corpuscular da luz. Porque todos os resultados da óptica geométrica podem ser obtidos a partir de um princípio muito semelhante chamado princípio de Fermat do tempo mínimo. Este princípio estabelece que ao atravessar meios diferentes, dentre todos os caminhos possíveis o feixe luminoso escolhe aquele que minimiza o tempo da sua trajetória. Este princípio determina todos 15 os efeitos de refração e re‡exão. Como analogia, imagine que você está de bicicleta na praia e quer atravessar a avenida da orla para chegar num ponto a 45o da normal à avenida. Qual caminho você deve seguir para chegar mais rápido? O menor caminho é, obviamente, uma linha reta. Mas, como a bicicleta se move com maior facilidade no asfalto é conveniente que você passe menos tempo na areia. Porém, se você se mover na direção normal na praia a distância percorrida será muito maior. Encontrar o caminho que minimize este tempo é um problema de cálculo variacional. Assim, a trajetória tanto da luz como das partículas pode ser obtida por um princípio de mínimo de um funcional. Falar sobre Variáveis de ângulo-ação. 3.2 Equação de Hamilton-Jacob Considere novamente o problema variacional da ação S da seção anterior, mas de um ponto de vista diferente. Primeiro considere que, na variação do caminho, você não exige mais que os trajetos variados comecem e terminem no mesmo ponto. Lembre que isso foi necessário para eliminar o termo de fronteira na integral por partes em (14). Assim, se os extremos do caminho puderem variar, teremos novamente a expressão (17), mas agora com o termo de fronteira: Z t2 t2 d @L @L @L qi + qi dt S= @ q_i @q dt @ q_i i t t1 1 onde nossa partícula saiu do ponto q(t1 ) e chegou no ponto q(t2 ). Suponha agora que, por um outro método (e.g., a mecânica de Newton), você resolveu o problema mecânico em questão, ou seja, você conhece a trajetória qi (t) das partículas. Uma vez que estas trajetórias são reais, elas devem respeitar as equações de Lagrange (que são equivalentes as equações que você resolveu). Com isso, podemos a…rmar que o último termo da expressão acima se anula. Ao variamos os pontos iniciais e …nais certamente estaremos variando o percurso das partículas. Assim, se calcularmos a variação da ação de uma partícula com relação a sua posição inicial e …nal teremos usando apenas as trajetórias legítimas S= @L qi @ q_i t2 t1 t = [pi qi ]t21 Uma vez que conhecemos as trajetórias, neste caso S não é mais um funcional de q (t), mas apenas uma função ordinária de q(t), ou seja, dado um valor de t podemos calcular q,q_ e L (q (t) ; q_ (t)) calcular a derivada parcial acima e multiplicar pela distância entre os dois pontos escolhido q. Com isso, a variação funcional descrita acima se torna apenas a variação usual de uma função. Assim, podemos escrever @S = pi @qi 16 (18) Agora, pela de…nição de S e pelo teorema fundamental do cálculo, sabemos que a derivada total de S com relação ao tempo vale Z dS S = L dt =) =L (19) dt Além disso, como S = S (q; t) (agora S depende não só da curva q, mas também nos limites do tempo da integral acima) podemos escrever dS @S @S dqi @S @S = + = + q_i dt @t @qi dt @t @qi Usando (18) @S dS = + pi q_i : dt @t Substituindo (19) em (20) temos @S =L @t (20) pi q_i : Lembrando agora a de…nição do hamiltoniano (9) H = pi q_i L =) L = pi q_i H temos @S @S = pi q_i H pi q_i = H =) +H =0 : @t @t Explicitando a dependência de H = H (qi ; pi ; t) @S + H (qi ; pi ; t) = 0 @t e usando novamente (18) @S @S + H qi ; ;t @t @qi =0 (21) Ou seja, se pegarmos H (qi ; pi ; t), substituirmos todos os momentos por @S=@qi e depois subrtituirmos na expressão acima, o que obtemos é uma equação diferencial parcial para a função (agora desconhecida) S (q; t). Resolver esta equação é equivalente a encontrar as trajetórias reais, ou físicas (chamado de setor físico) do problema em questão. Isto é, resolvendo esta equação encontramos S em função de q(t) e, conseqüentemente, q(t). A equação diferencial acima se chama equação de Hamilton-Jacob. Este é mais um método que pode ser usado para resolver problemas em mecânica clássica. Infelizmente, da forma que foi apresentado, …ca parecendo que não ganhamos nada nesta nova formulação. Isso não é verdade, mas o desenvolvimento completo do método de Hamilton-Jacob foge ao escopo da nossa discussão. Tudo que precisaremos é da forma explicita da equação diferencial acima. 17 3.3 Óptica geométrica A equação da óptica que descreve a propagação de uma onda num meio é dada por n2 @ 2 =0 (22) r2 c2 @t2 onde é uma função escalar, c a velocidade da luz no vácuo e n o índice de refração do meio. Em geral n = n (x) depende do meio onde a luz se propaga. Para n constante uma solução da equação acima pode ser escrita como (x; t) = 0 exp [i (k:x !t)] onde o número de onda k = jkj e a freqüência angular estão relacionadas por k= 2 = n! : c Exercise 3 Veri…que que a função acima é solução da equação de onda. Por simplicidade, tomemos uma onda plana que se propaga na direção z = 0 exp [i (kz !t)] de…nindo k = k0 n ; onde k0 é número de onda no vácuo, temos = 0 exp [i (kz !t)] = 0 exp [ik0 (nz ct)] : Estamos aqui interessados no caso da chamada óptica geométrica. Isto é, no caso em que o comprimento de onda da luz é muito menor que as dimensões espaciais envolvidas no sistema. Em especial, as características do meio não variam apreciavelmente com distância da ordem de alguns comprimentos de onda. Neste caso, apesar de n não ser constante, podemos a…rmar que ele varia lentamente no espaço. Neste caso, obviamente, a onda plana não é mais uma solução da equação de onda, uma vez que as variações do meio destorcem a onda. Vamos procurar por uma solução da equação de onda na forma = (xi ) exp [ik0 (L (xi ) ct)] ; com (xi ) = exp (A (xi )) =) = exp [A (xi ) + ik0 (L (xi ) ct)] : As quantidades A e L funções reais a serem determinadas. Vemos que A controla a amplitude da onda. Como para n constante L ! nz esta quantidade 18 é chamada de comprimento de onda óptico, ou ainda a eikonal. Calculando o laplaciano de temos r = r exp [A (xi ) + ik0 (L (xi ) ct)] = r [A + ik0 L] ; n o 2 r2 = r2 [A + ik0 L] + [r (A + ik0 L)] ; e a derivada temporal @ @ = exp [A (xi ) + ik0 (L (xi ) @t @t @2 2 = (k0 c) : @t2 ct)] = ik0 c ; Substituindo na equação de onda (22) e isolando parte real e imaginária temos 2 r2 A + (rA) + k02 n2 2 (rL) =0; r2 L + 2L (rA rL) = 0 : Usando agora a aproximação da óptica geométrica, de que o comprimento de onda é muito menor que a variação do meio, temos que o termo proporcional a k02 = 4 2 = 20 é o mais signi…cativo da expressão acima. Em especial, a variação espacial de A (xi ) é, por hipótese, pequena. Sendo todos os termos quadráticos (positivos), então todos os termos da primeira igualdade acima devem se anular. Assim, sendo o último termo da primeira igualdade o mais signi…cativo (na nossa aproximação), para garantir que este termo se anule o temos que exigir que 2 (rL) = n2 =) jrLj = n : (23) Esta equação é conhecida como equação de eikonal da óptica geométrica. A superfície onde L (xi ) possui o mesmo valor é uma frente de onda e esta onda se desloca na direção da normal desta superfície. 3.4 Mecânica e a óptica geométrica Considere um sistema conservativo onde o hamiltoniano não depende do tempo. Neste caso podemos escrever: H (qi ; pi ) = 1 2 p + V (qi ) = E 2m i Usando agora (18) pi = @S @qi (24) podemos escrever 1 2m @S @qi 2 + V (qi ) = E =) 19 @S @qi 2 = 2m (E V) Assim, a equação de HJ para este sistema pode ser escrita como 2 @S @qi = 2m (E V) Para coordenadas cartesianas (qi = xi ) podemos ainda escrever 2 (rS) = 2m (E V) : (25) Esta equação é formalmente igual a equação eikonal (23) para um meio com índice de refração p n = 2m (E V ) Esta semelhança foi percebida muito antes do surgimento da MQ. Vamos explorar um pouco mais esta semelhança associando o nosso sistema mecânico (uma partícula) com uma onda. Mas que onda é esta? Bem, comparando diretamente a equação acima com a equação eikonal da óptica, vemos que a analogia seria tratar uma superfície com um dado valor de S como a frente de uma onda. Seguindo esta analogia, associamos então a partícula de massa m num potencial V uma “onda” cuja frente de onda são os pontos onde S(x; t0 ) possui os mesmos valores num dado instante t0 . Como S depende do tempo esta frente de onda se deforma e se propaga com uma certa velocidade u ds u= dt onde ds é o deslocamento in…nitesimal normal a superfície de valor constante. Estamos interessados em determinar esta velocidade u. Voltando na expressão de HJ (21) e usando o fato do nosso hamiltoniano não depender do tempo temos @S @S + H qi ; ;t @t @qi = 0 =) @S = @t E de onde podemos escrever @S = @t E =) S (x; t) = W (x) Et : (26) onde W (x) é a solução da nossa equação (25) 2 (rS) = 2m (E 2 V ) =) (rW ) = 2m (E V) A função W não depende do tempo. Assim, os valores de x que de…nem um certo valor de W (x) = a representam uma superfície constante do espaço. Podemos então dividir o nosso espaço em superfícies com valores …xo de W . Queremos seguir uma superfície com um valor constante S = a (i.e., seguir a nossa frente de onda). A expressão (26) nos diz que em cada instante …xo do tempo a superfície S constante coincide com alguma superfície 20 Figure 4: Figura retirada do Goldstein W constante (se S = a num instante t1 então, neste instante, S coincide com a superfície W = a+Et1 ). Assim, suponde que em t = 0 temos S = W = a depois de um tempo dt a expressão (26) nos diz que S irá coincidir com a superfície t = 0 : S (0) = W = a =) S (dt) = W Edt =) S + Edt = W = a + Edt Assim, se em t = 0 a superfície S coincide com W = a, depois de um intervalo dt, S irá coincidir com uma outra superfície W = a + Edt de onde temos que a variação de S num intervalo dt corresponde a diferençã entre duas superfícies W onde dW = (a + Edt a) = Edt : Por outro lado, sendo W uma função apenas das posições temos dW = @W dxi = rW ds = jrW j :ds @xi onde, pela de…nição do gradiente, ds é o deslocamento normal a superfície W e, consequentemente, a S. Igualando as duas expressões acima temos Edt = jrW j :ds =) E ds = =u dt jrW j (27) ou seja, num instante de tempo dt a frente de onda se desloca uma quantidade ds. Em outras palavras, u é a velocidade da nossa onda. Usando agora a relação (25) e (26) podemos escrever p 2 2 (rS) = (rW ) = 2m (E V ) =) jrW j = 2m (E V ) : com o que temos E u= p 2m (E 21 V) (28) Ou seja, a nossa partícula, ou uma coleção de partículas não interagentes de mesma massa, pode ser descrita por uma onda que se propaga num potencial V com a velocidade u acima. A região de valor constante de uma onda é exatamente a de…nição da fase da onda. Assim, se estamos seguindo uma onda onde a frente de onda tem valor constante S (q; t) isso signi…ca que estamos seguindo a onda cuja fase é proporcional a iS i S ~ = exp = exp i (W (qi ) ~ Et) (29) onde h é apenas uma constante de proporcionalidade. Isso signi…ca que a nossa onda tem uma frequencia !t = E t =) 2 ~ = 1 E =) E = 2 ~ =) E = h : ~ (30) Além disso, lembrando da relação clássica (24) temos pi = @S =) p = OS = OW @qi (31) Com o que a relação (27) se torna u= E E = jrW j p (32) com p o módulo do momento linear da partícula. O seguinte resultado da óptica nos permite relacionar a frequência da onda e seu comprimento com a sua velocidade de propagação u = u =) = u usando (30) e (32) = u = E=p =) E=h = h p (33) As relações (32) e (33) relacionam a energia e o momento da partícula com a sua frequência e o seu comprimento de onda. Esta analogia tem a sua origem em trabalhos de Hamilton de 1825, para tratar problemas de óptica. Porém, nesta época, não havia nenhum resultado experimental que pudesse dar uma indicação do valor da constante h e, especialmente, nenhuma razão para crer que esta constante não era zero para uma partícula (uma quantidade cujo comportamento corpuscular fosse indubitável). Mesmo assim, Hamilton teve sucesso em usar este desenvolvimento para a luz, num tipo de tratamento corpuscular, e obter todos os resultados de refração e re‡exão obtidos por outros métodos da ótpica geométrica. Isso mostrava que, pelo menos em certos limites, a descrição corpuscular de Newton era complemente equivalente a descrição ondulatória de Huygens. Entretanto, como este método não trazia facilidades práticas para o 22 tratamento de problemas (em relação aos demais métodos da óptica geométrica) ele foi praticamente esquecido por décadas. Porém, com o surgimento de hipóteses de um caráter dual (onda-partícula), não apenas da luz, mas também das partículas massivas, estes resultados foram redescobertos por Erwin Schroedinger em 1925. 3.5 A equação de Schroedinger independente do tempo Primeiramente é necessário lembrar que os resultados acima mostram uma compatibilidade entre a mecânica e a óptica apenas para o limite de curtos comprimentos de onda (onde a equação da onda se torna a equação de eikonal que é idêntica a equação de HJ). Desta igualdade Schrödinger supôs que a equação de HJ pudesse ser o limite para curtos comprimentos de onda de uma equação mais geral que descrevesse o comportamento ondulatório das partículas massivas. Para tentar encontrar esta equação mais geral, ele voltou a equação de onda 1 @2 r2 = 0 u2 @t2 em seguida ele supôs que, pelo menos para comprimentos de onda curtas, a velocidade da onda associada a partícula deveria ser a velocidade (28) obtida na seção anterior E2 u2 = 2m (E V ) Assim, nossa equação de onda se torna 2m (E V ) @ 2 = r2 (34) E2 @t2 Seguindo o procedimento usual para a solução de equações parciais, podemos separar as variáveis da nossa função de onda (xi ; t) = (xi ) exp ( i!t) Vamos agora supor que a nossa onda tem uma energia bem de…nida. Se usarmos agora a hipótese de De Broglie (ou a equação (30)) temos E = h ) E = ~! ) (xi ; t) = (xi ) exp i E t : ~ (35) =E : (36) Substituindo na equação de onda r2 + 2m (E ~2 V) = 0 =) ~2 2 r +V 2m Esta é a celebrada equação de Schroedinger independente do tempo. Ela descreve as funções de onda (os estados) das partículas quando a sua energia está bem de…nida, i.e., ela descreve os estados estacionários. Com ela podemos obter a maioria dos resultados da mecânica quântica não-relativística, como o espectro de energia do átomo de hidrogênio. A maior (e talvez mais importante) parte deste curso será o estudo das soluções da equação acima. 23 Se o sistema é conservativo, a sua energia pode variar com o tempo? O que signi…ca dizer que o sistema tem uma energia bem de…nida? Lembre-se que a descrição quântica do sistema é uma descrição probabilística. Assim, ao calcularmos uma quantidade qualquer (e.g., a energia), o que obtemos, em geral, é a probabilidade de numa medida desta quantidade obtermos o valor calculado. Ou seja, em geral o sistema não possui o valor bem determinado de nenhuma quantidade física. Mas se o sistema é um só, como uma quantidade pode não estar determinada, será que a quantidade está bem determinada, mas nós apenas não a conhecemos? Seria tudo isso como, por exemplo, colocar um dado numa caixa fechada e sacolejá-la? Antes de abrir a caixa e ver o resultado, cada número tem a chance de 1=6 de ser sorteado. Mas o número já está lá dentro, só que você não sabe. Pelas interpretações da MQ as coisas não são assim. A idéia é que, antes de abrir a caixa, o dado efetivamente não possui nenhum valor de…nido. Apenas a sua observação fará com que ele adquira efetivamente este valor. A diferença entre você não saber e o sistema não ter é que este sistema (A) pode in‡uenciar outro (B) através do valor deste observável e, como veremos, se o valor de um observável não está determinado (ou seja, você não fez nenhuma medida) todos os valores possíveis desta medida in‡uenciam B (com uma in‡uência maior ou menor dependendo da probabilidade). Este é um fenômeno de interferência comum na teoria ondulatória, mas que desa…a o senso comum numa teoria corpuscular. Assim, a…rmar que o sistema tem um valor bem de…nido E de um observável signi…ca que, se …zemos uma medida desta quantidade, obteremos sempre (independente de quando), o valor E. Como é possível a…rmar que um observável tem seu valor bem de…nido, antes de fazemos a medida? O ponto é que se …zemos uma medida de um certo observável (futuramente de…niremos melhor este termo) e não perturbamos mais o sistema (i.e., deixamos ele isolado) o valor deste observável não murará. Podemos garantir assim que, se alguém …zer uma medida futura, obterá o valor que nós medimos. Chamamos a isso de preparar o sistema num certo estado conhecido. Mas e o dado na caixa, está numa superposição de todos os valores? O ponto é que o dado é um sistema grande o su…ciente para o seu comportamento ser completamente determinado pelas leis da mecânica clássica. Assim, mesmo que não tenhamos aberto a caixa, é possível, num ambiente controlado o su…ciente, saber o valor do resultado. Num certo sentido, sistemas clássicos são sempre sistemas quânticos preparados. Remark 4 Se um sistema está num valor indeterminado de uma grandeza. É completamente impossível saber qual o valor desta grandeza antes da medida ser feita. 24 3.6 A partícula numa caixa Vamos ilustrar a aplicação da ES tratando o caso de uma partícula livre numa caixa. Ou seja, fora o fato de ser con…nada dentro da caixa, nenhuma outra força age sobre esta partícula. Assim, vamos usar as idéias da seção anterior para quantizar o sistema unidimensional de uma partícula de massa m num intervalo. Um ponto importante é que este sistema em duas ou três dimensões representa, grosso modo, apenas a aplicação do tratamento a ser desenvolvido para cada dimensão separadamente. Ou seja, nosso sistema não é arti…cial. Inicialmente estamos interessados em estudar os níveis de energia que esta partícula pode ter. Estado livre, a energia desta partícula é puramente cinética. Classicamente, uma ver que a partícula pode ter qualquer velocidade dentro da caixa, ela também pode assumir qualquer valor de energia. Além disso, a partícula pode estar em qualquer lugar dentro da caixa. Na descrição quântica, entretanto, veremos que as coisas são um pouco diferentes. Como estamos interessados em estados de energia bem de…nidos, o problema que devemos resolver é a ES independente do tempo: ~2 2 r +V 2m =E Uma vez que, dentro do intervalo (caixa), a partícula está livre, V = 0, e estamos trabalhando em uma dimensão, temos: ~2 d 2 =E 2m dx2 onde E é a energia da partícula. Podemos escrever esta equação como d2 = dx2 k2 ; k2 = 2m E ~2 (37) Esta é uma equação de segunda ordem, logo ela deve ter duas soluções LI e duas constantes de integração. Estas soluções podem ser escritas como 1 (x) = A exp (ikx) ; 2 (x) = B exp ( ikx) com A e B constantes. Assim, a solução geral do nosso problema é (x) = Aeikx + Be ikx Como determinamos as constantes A e B? Estas constantes estão relacionadas com a chamada condição de contorno do problema. Ou seja, precisamos especi…car o comportamento da nossa função nos extremos. Até agora, além de fazer V = 0 (uma condição física), tudo que …zemos foi resolver um problema matemático, mas agora, na …xação destas condições, entram as características físicas do problema. 25 Para isso precisamos lembrar o signi…cado da função de onda. A quantidade 2 j (x)j signi…ca a probabilidade de encontrar a nossa partícula na posição x. Sabendo que a nossa partícula está presa na caixa temos 2 j (x)j = 0 para x fora da caixa. Primeiro precisamos colocar um eixo cartesiano no nosso problema e dizer onde está a nossa caixa. Por exemplo, podemos dizer que as paredes da caixa estão em L e L (obviamente isso não in‡uencia no resultado). Exigindo que a partícula esteja con…nada no intervalo de L até L e que a função seja contínua temos (por (37) vemos que descontinuidades da função estariam relacionadas com energias in…nitas e não queremos tais casos.) (L) = ( L) = 0 temos (L) = 0 =) AeikL + Be ikL = 0 =) AeikL = A (cos kL + i sin kL) = B (cos kL i sin kL) : Be ikL Podemos satisfazer esta igualdade de duas formas sin kL = 0 =) kL = n ) A (cos kL) = cos kL = 0 =) kL = n+ 1 2 B (cos kL) ) A = ) A (i sin kL) = B; B ( i sin kL) ) A = B : Ou seja, o nosso problema possui dois tipos de soluções estacionárias n (x) = N sin kn x ; kn = + n (x) = N + cos kn+ x ; kn+ = L L n ) En = n+ 1 2 ~2 2m n L ) En+ = 2 ~2 2m L n+ 1 2 2 (38) O resultado acima nos mostra que, dentro da caixa, a partícula só pode assumir os níveis de energia En e En+ . Exercise 5 Obtenha as constantes de normalização N + e N . Além disso, existe um nível mínimo de energia que o sistema pode assumir que é E0+ . A partícula nunca pode ter energia cinética nula (observe que E0 = 0 implica 0 (x) = 0 e a partícula não está mais na caixa). 26 Mais ainda, se esta partícula interagir com alguma coisa (e.g., fótons) ela só poderá absorver e emitir energias que sejam proporcionais a diferença entre dois níveis En !n = En+ Em Esta é a chamada energia de transição de n para m. Por exemplo, imagine que a partícula está no estado fundamental e você o ilumina com uma luz de freqüência , se h < E0+ E1 = 3 ~2 4 2m 2 L ; os fótons simplesmente irão passar pelo sistema (o sistema será transparente). Já se 2 3 ~2 = [ E0+ E1 = 4 2m L o sistema irá absorver este fotos e mudar de nível (ele será opaco para esta freqüência). Observe também que, de forma geral, ~ L E 2 : Ou seja, se o tamanho da caixa vai para in…nito (partícula livre) a diferença dos níveis de energia vão a zero e, conseqüentemente, a partícula pode assumir qualquer valor de energia. Da mesma forma, se tomamos o limite clássico ~ ! 0 o sistema passa a adotar o comportamento clássico de poder assumir qualquer valor de energia. Remark 6 Observe como a limitação da partícula no intervalo tornou os níveis de energia discretos. Este é o fenômeno por trás do comportamento dos chamados pontos quânticos (QD). Aqui é interessante ver como a realização do nosso espaço depende muito de qual parte do sistema nos interessa. Se no exemplo acima a distância L for muito pequena, os níveis de energia vão estar tão espaçados que para sofrer uma transição de nível precisaríamos fornecer uma quantidade muito grande de energia. Podemos garantir assim que o sistema não sofra nenhuma transição indesejada (e.g., térmica) e as únicas transições possíveis são aquelas que nós provocamos. Neste caso, apenas alguns níveis de energia são relevantes e podemos tratar o sistema como um problema de n níveis. Ao fazemos isso nosso sistema passa a ter um número …nito de estados e passa a ser descrito por uma matriz. Esta descrição matricial é a chamada mecânica quântica de Heisenberg, que veremos no futuro. 27 3.6.1 Números quânticos Ainda sobre o problema da partícula numa caixa, todas as quantidades associadas ao sistema, exceto a energia, estão indeterminadas, ou possuem a sua determinação associada a uma probabilidade. Ademais, uma vez especi…cada a energia da partícula, sabemos construir a sua função de onda, da qual retiramos todas as informações que a MQ pode nos dar sobre o sistema (e acreditamos que este seja a teoria que mais informações pode nos dar). Dizemos assim que a energia especi…ca o estado do sistema. Dentro da notação utilizada, chamamos de En a energia associada ao sistema. Ou seja, dado o valor de n podemos determinar a energia do sistema e, conseqüentemente, o seu estado. A quantidade n, que especi…ca completamente o estado do sistema é chamada de número quântico. Se tivéssemos trabalhado com uma caixa bidimensional, teríamos uma energia associada ao movimento na direção x, com uma energia En , e outra associada com o movimento na direção y, que poderíamos chamar de Em . Assim, neste caso, o sistema possui dois números quânticos. O mesmo acontecia com a descrição das órbitas elípticas de Sommerfeld, onde precisávamos de 2 números para conhecer o estado do sistema. Remark 7 Assim, números quânticos são quantidades (discretas) que precisam ser especi…cadas para se estabelecer o estado do sistema. 3.6.2 Valores médios 2 Sendo j (x)j a probabilidade de encontrar o sistema numa certa posição, podemos também calcular o valor médio da posição do sistema. Basta para isso usarmos a de…nição usual de média multiplicarmos o valor da variável (no caso, a posição) pela probabilidade do sistema possuir aquele valor desta variável. Assim, a posição média do sistema dentro da caixa vale Z Z 2 hxi = x j (x)j dx = (x) x (x) dx Onde, por razões que se tornarão claras no futuro, usamos a última forma para a expressão. De forma geral, se f (r) é uma função qualquer da posição da partícula (considerada agora em 3D), o valor médio de f pode ser calculado como Z hf i = (r) f (r) (r) d3 V (39) V onde V é o volume onde o se deseja calcular a média. Como veremos em detalhes no futuro, um dos postulados da MQ é que as quantidades clássicas observadas nada mais são do que valores médios das quantidades quânticas do sistema. 3.6.3 Preparação de sistemas e superposição Vamos preparar um sistema com um valor especí…co de energia. Imagine para isso um espectrômetro de massa onde atiramos partículas de massa m e carga 28 q conhecidas. Dependendo da velocidade, ou do momento da partícula, ela sofrerá uma certa in‡uência do campo e se chocará com a parede do dispositivo. Conhecendo a energia cinética da partícula, sambemos exatamente onde ela se chocará. Podemos então fazer um furo que seria alcançado apenas pelas partículas que tivessem uma determinada energia, digamos, E2 , ~2 2m E2 = n L 2 ; n=2: Em frente ao furo temos uma caixa para capturar a partícula. As paredes do dispositivo podem ter sensores que detectem a partícula no caso de um choque. Neste experimento vamos jogando partículas com energia desconhecida dentro do dispositivo e, sempre que esta partícula colide com a parede, ouvimos um clique. Quando, não ouvimos este clique é porque a partícula passou pelo buraco. Neste caso sabemos que temos aprisionado em nossa caixa uma partícula no estado : 2 (x) = N sin k2 x ; kn = 2 L Desta forma podemos preparar o sistema num determinado estado. Imagine agora que fazemos dois furos na parede, uma na posição de energia E1+ e outra na posição de energia E2 . Suponha ainda que, pelas dimensões dos componentes do sistema, estes dois furos estão bem próximos, de sorte que podemos colocar uma única caixa para capturar uma partícula que passe por qualquer buraco. Qual o estado do sistema na caixa neste caso? Neste caso, a partícula entrará na caixa num estado descrito pela função: (x) = c1 + 1 (x) + c2 2 (x) ; c1 ; c2 2 C : (40) Ou seja, ela não terá mais uma energia bem de…nida. Além disso, pelos princípios da MQ o módulo quadrado dos coe…cientes c1 e c2 acima são dados pela probabilidade do sistema ser detectado com energia E1+ e E2 , respectivamente. Além disso, como estes módulos são probabilidade e sabemos que o sistema estará (com certeza) num estado ou no outro 2 2 jc1 j + jc2 j = 1 Por exemplo, se o experimento foi desenvolvido (depende basicamente de quão aleatório é a velocidade das partículas lançadas) para que a partícula tenha exatamente a mesma probabilidade de estar no estado E1+ ou E2 , podemos então a…rmar que 1 2 2 jc1 j = jc2 j = 2 Obviamente, isso não …xa o valor destes coe…cientes, pois 2 jc1 j = 1 exp (i ) =) c1 = p ; Re = 0 2 2 29 (41) A quantidade é chamada de fase do coe…ciente. Futuramente trataremos da determinação destes coe…cientes. Observe que estamos frisando que a partícula entra na caixa no estado acima. Isso porque, como a energia da partícula não é mais bem determinada ela não está mais num estado estacionário. Na obtenção da ES independente do tempo, usamos a seguinte separação de variáveis (35) E (x; t) = (x) exp i t ~ e, com isso, obtivemos a ES. Ou seja, o que estamos chamando de é, na verdade, apenas a função (x) acima. Isso signi…ca que a função de onda completa do nosso sistema com uma energia E2 conhecida é (x; t) = 2 (x) exp i E2 t ~ : Agora, a probabilidade desta partícula ser encontrar numa posição x num instante t vale 2 j (x; t)j = 2 (x) 2 exp i E2 t ~ 2 = (x) 2 2 : E não depende do tempo. Por isso, estados com energia bem de…nida são chamados de estados estacionários. Agora, para uma partícula no estado (40) acima, temos a seguinte evolução temporal (x) = c1 + 1 (x)+c2 2 (x) =) (x; t) = c1 + 1 (x) exp i E1+ t +c2 ~ 2 (x) exp i E2 t ~ Usando que a probabilidade inicial do sistema ter uma ou outra energia é a mesma (41) temos 1 (x; t) = p 2 + 1 1 = p exp 2 (x) exp i i E1+ t+ ~ E1+ t+ ~ " 1 1 + 1 + c2 (x) + c2 2 2 (x) exp (x) exp i " i E2 t+ ~ 2 E1+ E2 ~ t+( A probabilidade de encontrar este sistema na posição x num instante t vale " !# 2 E2 E1+ 1 + 2 j (x; t)j = (x) + c2 2 (x) exp i t+( 2 : 1) 2 1 ~ (42) onde a dependência temporal não mais desaparece. Assim, esta probabilidade varia com o tempo e o sistema não está mais num estado estacionário. Observe 30 2 !## 1) também que esta probabilidade depende da diferença de fase ( 2 1 ). Esta quantidade não possui um análogo clássico e, na verdade, não pode ser medida por nenhum instrumento. Mesmo assim, como veremos, ela pode produzir efeitos mensuráveis. Por causa desta fase, esta descrição difere da probabilidade clássica (que seria apenas a soma das probabilidades). Veja novamente a discussão no capítulo Ondas e Partículas. O que acontece se …zemos um furo numa região que não corresponde a nenhum dos valores de En , por exemplo, entre os valores de E2 e E1+ ? A princípio pode-se imaginar que nunca capturaremos uma partícula. Ou seja, sempre ouviremos o clique da partícula se chocando com a parede do dispositivo. Mas isso não é verdade. Observe que, se não colocamos a caixa (ou seja, apenas o espectrômetro) detectaríamos o choque de partículas em todas as posições da parede, inclusive na posição correspondente a energia E. Assim, o fato de termos ou não colocado a caixa naquele ponto não deve alterar o comportamento das partículas dentro do espectrômetro. Por isso deveríamos realmente esperar que alguma partícula entrasse na caixa. Entretanto, nosso problema e entender como uma partícula que classicamente tem energia E será detectada na caixa apenas com energia E1+ e E2 . Quando não ouvirmos o clique saberemos que capturamos uma partícula na caixa e, mais ainda, esta partícula estará num estado inicial aproximadamente da forma (40). Onde o módulo quadrado dos coe…cientes será tão maior quão mais próximo o furo estiver do estado de energia de…nido. Por exemplo, 2 conforme o furo se aproxima de E1+ , o jc1 j cresce até que, quando o furo estiver + exatamente em E1 temos 2 jc1 j = 1 ; jc2 j = 0 : Além disso, o sistema (que não está num estado estacionário, pois sua energia não está bem determinada), evoluirá no tempo com a forma aproximadamente (42). Isso signi…ca que mesmo que, classicamente, a partícula só possa passar entrar na caixa se ela tiver uma energia entre E1 e E2, quanticamente ela tem uma probabilidade de entrar (e, ocasionalmente, entrará) se a sua energia não for bem determina, mas compatível com o fato dela entrar na caixa. Neste experimento, sempre que abrirmos a caixa e medirmos a energia da partícula obteremos (sempre) os valores E1+ ou E2 e nunca entre estes valores. Mas se detectamos o valor E2 e para passar pelo furo ela teria de ter uma energia E < E2 , para onde foi a diferença de energia? Não foi para lugar nenhum! Pense no pior: ela foi detectada na caixa com uma energia E1+ < E. Como a partícula conseguiu passar pelo furo se ela não tinha energia pra isso? O que acontece com a conservação de energia? O ponto aqui é a descrição quântica jamais a…rma que a partícula passou pelo furo, mas apenas que ela está dentro da caixa. Ou seja, a única forma de saber se ela passou pelo furo é colocando um detector lá dentro. Sem fazer isso, tudo que sabemos é que uma partícula entrou na caixa. O problema está em que toda a nossa descrição anterior se 31 baseia na idéia da trajetória seguida pela partícula e, quanticamente, tal idéia dependeria de colocarmos detectores em todos os pontos do espaço e medirmos (e, conseqüentemente, interferirmos) na partícula em cada instante de tempo. Ou seja, na MQ não existe a idéia de trajetória de uma partícula. Além disso, o fato da partícula ter entrado na caixa com uma energia E1+ menor que a energia clássica necessária para passar pelo furo, não viola nenhuma lei de conservação, pois, em nem um momento, a partícula teve a energia bem de…nida E (nunca demos esta energia para ela). O fato de sistemas quânticos fazerem coisas que são classicamente proibidas devido a sua energia é bem comum em MQ. Este fenômeno é observado corriqueiramente em laboratório e recebe o nome de tunelamento. Voltaremos a este fenômeno no futuro. Exercise 8 Mas então, como uma partícula que classicamente tem energia E pode ser detectada com energia E1+ ou E2 ? O ponto aqui é que, na verdade, como o estado inicial da partícula é desconhecido, a MQ nos diz que esta partícula está no estado X + = c+ n n + cn n n De sorte que ela terá uma maior probabilidade de entrar na caixa quanto maior 2 2 e c2 . Além disso, ao entrar na caixa, o estado da partícula não foi for c+ 1 alterado. Assim, se ela inicialmente, além de um coe…ciente c+ 1 e c2 auto tiver também um coe…ciente c+ (obviamente pequeno) haverá também a probabili8 + 2 + dade c8 de se detectar esta partícula com uma energia E8 bem maior que E2 . Exercise 9 Mas e se colocarmos uma caixa com tamanho diferente? Neste caso a decomposição acima não irá mais corresponder ao estado das partículas permitidas dentro da caixa e, para fazer a descrição acima, teremos de uma outra decomposição X = cn n ; n com n 6= + n; n . Exercise 10 Mas qual das decomposições acima descreve a partícula? Ambas! Na verdade, observando explicitamente as funções n+ ; n (38) vemos que as decomposições acima nada mais são que a série de Fourie da função e existem in…nitas formas de se decompor a mesma função em séries diferentes. Exercise 11 Mas como a energia clássica E se relaciona com todas estas decomposições? 32 Como veremos mais tarde, as partículas capturadas tem uma energia média igual a E X 2 2 : + En cn E = hEi = En+ c+ n n Além disso, mesmo no caso dos dois furos nas posições correspondentes as energias E1+ e E2 , a MQ não apóia a idéia de que a partícula passou por um ou pelo outro furo. Remark 12 Observe que a fase d em (41) não interfere nos valores médios (39). Gato de Schroedinger Superposição Decomposição e série de Fourie. 3.7 A equação de Schroedinger dependente do tempo Nosso objetivo agora é encontrar uma equação que descreva não apenas a parte espacial , mas a função completa , ou seja, nós queremos a versão dependente do tempo da expressão acima. A equação (36) só funciona (só é compatível com a equação de onda) para ondas com uma só freqüência (monocromáticas), mas gostaríamos de ter uma maior liberdade na dependência temporal do nosso problema. Para isso precisamos eliminar E (E = h ) da nossa equação. Para isso, primeiro multiplicamos a equação (36) ~2 2 r +V 2m =E : por exp ( iEt=~) e voltamos para a função de onda completa ~2 2 r +V 2m =E ; (mas esta equação só é válida para as nossas ondas monocromáticas). Se operarmos em ambos os lados desta equação com o operador ~2 =2m r2 + V temos ~2 2 r +V 2m ~2 2 r +V 2m = ~2 2 r +V E 2m = E2 ; ou seja, ~2 2 r +V 2m 2 Agora derivamos duas vezes a equação (35) 33 = E2 : (43) (xi ; t) = (xi ) exp i E t ~ ; em relação ao tempo •= E2 exp ~2 i E t ~ E2 ~2 = =) E 2 = ~2 • : Substituindo na equação (43) 2 ~2 2 r +V 2m ~2 • : = (44) Esta equação fornece a equação correta para o caso monocromático, mas, por não depender de E, possui também outras soluções. Entretanto, esta equação possui o terrível inconveniente de ser uma equação de quarta ordem nas coordenadas espaciais. Isso signi…ca que as soluções desta equação exigem uma quantidade enorme de condições iniciais e condições de contorno que di…cilmente poderiam ser associadas com parâmetros físicos do sistema. Vamos então reescrever a equação anterior na forma ^2 H ~2 = @2 ; @t2 onde introduzimos o operador ^ = H ~2 2 r +V : 2m (45) Nossa equação pode ainda ser escrita como ^H ^ H = i~ @ @t i~ @ @t : Soluções desta equação pode ser construídas com funções que respeitem ^ H = i~ @ ) @t ~2 2 r +V 2m = i~ @ @t (46) Esta é a equação de Schrödinger dependente do tempo. Esta equação, diferente da equação de onda usual, é de primeira ordem no tempo e de segunda ordem nas derivadas espaciais. Ao trabalhar com ondas (equações de ondas) é comum usarmos uma função complexa e, no …nal, atribuirmos uma realidade física apenas a parte real. Entretanto o caso aqui é um pouco diferente, pois a nossa equação é, na verdade, (44). Se dividirmos em sua parte real e imaginária = P + iQ ; 34 e substituirmos em (46) temos i~ @P @t ~ ~2 2 r +V 2m @Q = @t ~2 2 r +V 2m P +i Q comparando as partes reais e imaginárias desta equação temos ~2 2 r +V 2m ~2 2 r +V 2m @P = @t @Q ~ = @t ~ Q P Podemos agora eliminar P ou Q diferenciando uma das equações acima com relação ao tempo e substituindo na segunda. O que obteremos com isso é que tanto Q como P respeitam a equação (44). Ou seja, temos uma equação de quarta ordem para funções reais, ou uma equação de segunda ordem para uma função complexa, cujas partes não podem ser separadas. Mas, neste último caso, precisamos das relações acima, o que mostra que, neste formalismo, nós precisamos da função completa = P + iQ, i.e., não podemos atribuir um signi…cado físico separadamente para a parte real ou a imaginária. Voltemos agora na relação com a óptica geométrica. Lembre que obtivemos os resultados da seção anterior seguindo uma frente de onda de…nida pela função S. Além disso, como vimos anteriormente, a nossa onda se relaciona com S por (29) i S (47) = exp ~ com isso temos @ i @S @ i @S = ; = @t ~ @t @xi ~ @xi Substituindo na equação de Schrödinger (46) 1 2 (rS) 2m ~2 i 2 r S+V 2m ~ = @S @t ou seja, S respeita a equação 1 @S i~ 2 2 (rS) + V + = r S 2m @t 2m (48) Vamos comparar este resultado com a equação de HJ (??) @S @S + H qi ; ;t @t @qi =0 Lembrando que H é o Hamiltoniano da partícula podemos escrever H= p2 +V 2m 35 (49) usando (18) 2 rS = p =) H = (rS) 1 @S 2 + V =) (rS) + V + =0 2m 2m @t (50) As equações (48) e (50) são idênticas a menos do último termo em (48). Lembrando que h = 2 ~ é a constante de proporcionalidade que introduzimos em (29). Mais uma vez, a semelhança acima já havia sido percebida por Hamilton. Mas a inexistência de qualquer evidência experimental do comportamento ondulatório das partículas o levou (talvez) a pensar que h fosse zero para partículas massivas. Além disso, ao se tratar sistemas mecânicos usuais, o fato de h ser muito pequeno, em relação às demais quantidades do sistema, faz com que a presença do termo a direita em (47) não in‡uencie apreciavelmente a dinâmica do sistema. Podemos ainda dizer que a equação de HJ representa um limite da equação de Schrödinger quando todas as quantidades envolvidas são muito grandes em relação à h. Isso normalmente é chamado de tomar o limite quando h tende a zero. Obviamente, como h é uma constante, isso deve ser entendido no contexto acima de comparações de grandezas. Além disso, tomar o limite h ! 0 é chamado de tomar o limite clássico do sistema quântico. Como, neste caso, a equação que descreve o sistema (ES) se torna a equação HJ, todas as quantidades calculadas através da ES (e.g., energia) deve se tornar os resultados calculados pela mecânica clássica. Falar sobre o operador Hamiltoniano. 3.7.1 A quantização de Schrödinger e de Sommerfeld Dado um sistema mecânico (clássico) sujeito a um potencial V , a ES nos permite construir a descrição quântica deste sistema, i.e., construir a equação de onda que rege o comportamento quântico do sistema clássico em questão. Assim, este é um processo de quantização que podemos considerar como o primeiro processo de quantização geral. Este processo é mais geral de o que Sommerfeld por prescindir da existência de uma variável periódica no sistema. Além disso, este novo processo nos permite construir não apenas certas quantidades clássicas (e.g., energia), mas sim a própria função de onda que descreve o sistema (de onde podemos tirar muito mais informações). Lembrando agora que a quantização de Sommerfeld pode ser considerada como uma generalização dos processos de quantização anteriores (de Bohr e de Planck), será que a quantização de Schroedinger estaria relacionada com a quantização de Sommerfeld? A resposta é sim. Dado um sistema com uma coordenada periódica, por exemplo, um ângulo , pontos no espaço com coordenada e + 2 representam o mesmo ponto. Com isso, seria de se esperar que qualquer função f ( ) que represente uma característica de um sistema físico tenha um único valor de…nido neste ponto, i.e., f ( ) = f ( + 2 ). Neste caso dizemos que a função f tem valor único, ou que ela respeita uma condição de unicidade. 36 Por exemplo, a função f ( ) = exp (in ), n 2 N, respeita esta condição no intervalo de 0 a 2 , pois f ( + 2 ) = exp [in ( + 2 )] = exp i (n ) exp i (2 n) = exp i (n ) = f ( ) : Entretanto, isso não ocorre com a função f ( ) = exp (i =2), neste mesmo intervalo, f ( + 2 ) = exp i +2 2 = exp i 2 exp i ( ) = exp i 2 = f( ) : De forma geral, se q é uma variável periódica, podemos testar se uma função f (q) = exp [ig (q)] é de valor único calculando a variação da fase num período completo I dg e exigindo que este valor seja proporcional a 2 , I dg = 2 n ; n 2 N : (51) Por exemplo, in f( )=e f ( ) = ei =2 =) g = g ( ) = n =) =) g = g ( ) = 2 =) I I dg = dg = Z Z 2 nd = 2n ; 0 0 2 1 d = 2 6= 2n : Lembre-se agora que a ES foi obtida tomando que a partícula obedece a uma equação de onda na forma (47) temos = exp i S ~ Para um sistema conservativo temos = exp i (W (qi ) ~ Et) = exp i W (qi ) exp ~ i Et ~ Como estamos interessados só na variação da parte espacial, temos I I 1 1 g (qi ) = W (qi ) =) dg = dW ~ ~ Lembrando que W = W (qi ) temos dW = @W dqi @qi 37 : usando (31) pi = com o que I X @W =) dW = pi dqi @qi i dg = I 1X 1 dW = ~ ~ i I pi dqi Usando agora a condição de unicidade (51) temos I XI XI 1X pi dqi = hn : pi dqi = 2 ~n =) pi dqi = 2 n =) ~ i i i como as variáveis são independentes, podemos respeitar a igualdade acima se, para cada variável I pi dqi = hn : Que é a regra de quantização de Sommerfeld. Resumindo: Remark 13 A regra de quantização de Sommerfeld é uma conseqüência da unicidade da função de onda. Na teoria de Schrödinger esta unicidade é introduzida à mão, através do estabelecimento das condições de contorno do problema. Ou seja, impor a quantização de Sommerfeld é equivalente a impor condições de contorno que garantam a unicidade da função de onda na teoria de Schrödinger. Como vimos na seção anterior, a discretização nos níveis de energia de uma partícula são uma conseqüência do con…namento da posição da partícula, i.e., das condições de contorno do problema. Além disso, assim como a quantização de Sommerfeld permitiu generalizar as orbitas circulares para elípticas. A ES permite impor novas condições de contorno. Condições de contorno são cruciais para se determinar as características quânticas do sistema. Efeitos curiosíssimos, como o surgimento de forças (mensuráveis) como a possibilidade de se detectar efeitos provenientes da energia do vácuo, uma conseqüência do chamado efeito Casimir, são resultados do estudo das condições de fronteira do sistema. Características gerais da matéria, como o número de prótons do elemento mais pesado, podem estar ligadas aos problemas de condições de contorno. 4 Limite clássico Voltemos, mais uma vez, ao problema da partícula numa caixa de tamanho L. Vamos inicialmente analisar este problema do ponto de vista da física clássica. Neste caso, a partícula sempre teria uma velocidade constante e sua posição será dada por x = x0 + vt : 38 Figure 5: Figura retirada do Libof Suponha agora que você não conhece a posição inicial x0 da partícula. Qual a chance de encontrar a particular numa certa posição da caixa? Ou seja, classicamente quanto vale P (x) dx? Se a velocidade da partícula variasse, poderíamos esperar que, onde ela …ca mais lenta (ou seja, a região onde ela gasta mais tempo para atravessar) teria um valor maior de P (x). Como a nossa partícula tem uma velocidade constante, a probabilidade de encontrá-la em qualquer intervalo dx é simplesmente o valor deste intervalo dividido pelo tamanho da caixa (o valor da variável, dividira pelo total de valores que ela pode ter) P dx = 1 dx L Ou seja, a probabilidade é uma constante. Isso signi…ca que, se …zermos uma série de cópias da nossa caixa e as abrirmos encontraremos as partículas distribuídas igualmente por toda a caixa. Como vimos anteriormente, a descrição quântica é bem diferente. Existindo pontos onde a partícula pode estar com maior probabilidade e pontos onde ela não pode estar. Entretanto, na descrição quântica, conforme o valor da energia aumenta, surgem mais picos de probabilidade de onde a partícula pode estar. Num caso de energia muito alta para qualquer intervalo dx que tomarmos teremos sempre o mesmo número de picos dentro deste intervalo. Assim, neste caso, a probabilidade de encontrar a partícula em qualquer região dx é, assim como no caso clássico, uma constante. Assim, para o caso em que n ! 1, a descrição quântica concorda com a descrição clássica. Mais ainda, para sistemas cuja energia seja muito maior que a ordem de grandeza de h, esperamos um comportamento clássico. Em todo sistema quântico, existe um limite para o qual o comportamento do sistema tende àquela prevista pela teoria clássica. Usualmente este limite está associado ao regime de altas energias. Mas, de forma geral, basta que as grandezas envolvidas sejam muito grandes, em comparação a h. A existência deste limite clássico é chamada de princípio da correspondência de Bohr. 39 Outra característica importante para se analisar este limite é o comprimento de onda de De Broglie. Por exemplo, num gás com densidade a distância média das partículas vale aproximadamente 1=3 . Assim, para o regime 1=3 >> ; devemos esperar que o comportamento deste gás seja descrito pela mecânica estatística clássica. Mas, para o caso em que 1=3 ' , uma mecânica estatística quântica deve ser aplicada (este é um assunto da segunda parte do curso). As comparações acima nos mostrar que, se um certo resultado quântico não contem h, este resultado deve ser mesmo que o obtido por uma teoria clássica. O exemplo mais famoso é a seção de choque de espalhamento coulombiano. Um tratamento quântico detalhado fornece um resultado que não depende de h e é exatamente igual ao resultado obtido por Rutherford usando teorias clássicas. 5 A equação de continuidade Lembrando a lei da continuidade da carga para o eletromagnetismo temos r J= @ : @t onde é a densidade de carga e J a densidade de corrente. A leitura desta equação nos diz que toda a corrente que ‡ui para fora de uma região é igual a carga que esta região perdeu. Desde sua origem os testes e aplicações da MQ se referem ao problema do espalhamento de partículas. Ou seja, partículas vindas “livremente”do in…nito interagem momentaneamente com um certo potencial (e.g., outra partícula) e voltam a se propagar livremente. Lembre-se, por exemplo, dos experimentos de Rutherford. Todos os problemas estudados em aceleradores de partículas são desta forma. A interação momentânea da partícula teste com o potencial é chamada de espalhamento. Usualmente neste tipo de processo a forma exata do potencial de espalhamento não é conhecida. Mas este é modelado por certas características principais. Por exemplo, podemos modelar a interação de um elétron com um neutro supondo que o nêutron é uma esfera impenetrável de raio R e usando o potencial: V (r) = 0; r R 1; r<R ; chamado de potencial de caroço duro. A quantização deste potencial fornece bons resultados desde que a energia do elétron não seja muito grande. Na maioria dos processos observamos uma partícula, ou um feixe de partículas, e queremos saber o comportamento deste feixe. Assim, como veremos mais adiante, neste tipo de problema o conceito de conservação da partícula é muito importante (obviamente para os casos onde ela não se desintegra). Por isso é importante buscar por uma lei de conservação semelhante a do eletromagnetismo. 40 A dinâmica de uma partícula é descrita pela ES dependente do tempo ^ H = i~ @ @ =) = @t @t i ^ H ~ Usando o mesmo desenvolvimento feito para obter a equação acima, mas partindo do complexo conjugado da função de onda = exp é fácil mostrar que i S ~ ! i S ~ = exp obedece a equação ^ H = i~ @ i ^ @ =) = H @t @t ~ Observe agora que 2 @j j @ = @t @t = @ + @t @ @t usando as duas ES acima temos 2 i ^ H ~ @j j = @t i ^ H ~ + Para um problema unidimensional ~2 @ 2 + V (x) 2m @x2 ^ = H temos 2 @j j = @t = = i ~2 @ 2 + V (x) ~ 2m @x2 ~ @2 @2 i 2m @x2 @x2 ~ @ @ @ i 2m @x @x @x ou ainda 2 @j j @ ~ + i @t @x 2m + i ~ @ @x @ @x ~2 @ 2 + V (x) 2m @x2 =0 Em 3 dimensões temos 2 @j j +r @t i ~ ( r 2m r ) =0 Se de…nirmos as quantidades J=i ~ ( r 2m r ) ; 41 2 =j j (52) temos a equação exatamente uma equação de continuidade. De…nimos assim o conceito quântico de densidade e corrente de partículas. Além do fato da densidade das partículas estar relacionada com a probabilidade de onde a partícula está, existe também uma corrente associada a ela. Pelos princípios da MQ esta corrente não pode ser associada diretamente ao movimento da partícula. Por exemplo, uma partícula numa caixa, com energia bem de…nida E é descrita por uma função na forma (x) = N sin (kx) exp i E t ~ e possui uma densidade 2 2 (x; t) = j j = jN j sin2 (kx) e uma corrente J=i ~ 2m @ @x @ @x =0= @ @t Ou seja, mesmo que classicamente pensemos numa partícula andando de um lado para o outro da caixa (consequentemente um ‡uxo na forma Jc = v (x)), quanticamente não há ‡uxo algum. Além disso, classicamente a nossa densidade seria diferente de zero apenas num ponto ( c = (x)), mas quanticamente, ela se espalha por toda a caixa. Por exemplo, um elétron de um átomo de hidrogênio in‡uencia a sua viz2 inhança como se fosse uma distribuição de carga dada por = j (r)j e não como uma distribuição de carga clássica de uma única partícula c = q (r). Obviamente, como sempre acontece em MQ, existem regimes onde os conceitos clássicos e quânticos concordam. 6 Barreira de potencial …nita Vamos agora analisar o problema de uma barreira de potencial …nita. Imagine, por exemplo, um circuito como o da …gura abaixo: 42 Onde as grades estão ligadas a uma bateria. Na região I temos um potencial constante, que podemos chamar de U = 0. E na Região II temos, novamente um potencial constante U = V > 0. Uma carga se movendo em qualquer uma destas regiões não sofrerá a in‡uência de nenhuma força. Agora, se uma carga (positiva) tentar se mover na Região III entre as placas, sofrerá uma força constante F = qE, dada por um potencial U = Ex. O grá…co deste potencial seria algo como: Classicamente uma carga na Região I só poderia penetrar na Região II se ela tiver energia su…ciente para vencer a barreira de potencial, ou seja, apenas se ela possui uma energia E > V . Se uma carga com E < V viaja pela Região I, ao chegar na Região III ela seria desacelerada até ser re‡etida de volta. Além disso, toda a carga com E > V passaria pelo potencial. Vejamos agora o que nos diz a descrição quântica deste problema. Para simpli…car bastante o nosso problema, nós jogamos as duas placas externas para o in…nito e fazemos D ! 0 ou, o que dá no mesmo, fazemos V >> D. Com isso, o potencial tem a forma da …gura abaixo 43 Então agora temos apenas duas regiões. A Região I será aquela onde o potencial vale zero, U = 0, enquanto na Região II , temos U (x) = V . Assim, nesta descrição, temos também duas ES, uma para cada região. Assim como no caso da partícula livre, imaginemos que a partícula possui uma energia bem de…nida, i.e., vamos estudar a ES independente do tempo para este problema. Na Região I: ~2 d 2 +U 2m dx2 2m k12 = 2 E : ~ =E ! ~2 2m 00 I =E I =) 00 I = k12 I ; (53) A solução deste problema é o mesmo da partícula livre, ou seja, podemos escrever a solução como: I e = A exp (ikI x) + B exp ( ikI x) : As duas soluções acima representam ondas viajando na direção x (kI = x ^) x ( kI = x ^). 44 Já para a Região II temos: ~2 d 2 +U 2m dx2 =E ! ~2 d 2 +V 2m dx2 II =E II 2m (E V ) : (54) ~2 Note que, apesar de ambos serem constante, kI 6= kII . Assim, a solução da equação diferencial acima é a mesma da anterior, mas, como veremos, o comportamento destas soluções é bem diferente. Ou seja, 00 II = k22 ; k22 = II (x) = C exp (ik2 x) + D exp ( ik2 x) : Nosso objetivo é saber o que acontece com uma partícula que vem da região I, viajando para a direita, quando esta encontra a barreira de potencial. Assim, podemos simpli…car ainda mais o nosso problema fazendo D = 0. Observe que a partícula pode vir pela direita, ser re‡etida pela barreira e voltar viajando para a esquerda, por isso não fazemos B = 0. Com isso, as soluções procuradas têm a forma (x) = A exp (ik1 x) + B exp ( ik1 x) II (x) = C exp (ik2 x) I As soluções acima representam a composição de 3 onde distintas: 1. i = A exp (ik1 x) descreve uma onda plana que vem do in…nito ( 1) em direção a barreira (nossa partícula inicial). 2. t = C exp (ik2 x) descreve uma onda que atravessou a barreira e se move para a direita. 3. r = B exp ( ik1 x) descreve uma onda para a esquerda. Como inicialmente só temos partículas vindas da direita, esta onda só pode descrever uma onda (ou uma partícula) que foi re‡etida pela barreira. 45 2 Da descrição acima vemos que jCj é a probabilidade da nossa partícula 2 atravessar a barreira (pois se jCj = 0 ) j II j = 0 e não há partícula na 2 região II), enquanto jBj é a probabilidade da nossa partícula ser re‡etida pela barreira. Se a partícula foi re‡etida ela volta com a mesma energia E e se ela atravessou ela agora terá uma energia E V . Podemos associar ao sistema então uma corrente Ji da partícula (ou das partículas) incidentes. Usando (52) Ji = i ~ 2m i @ i @x i @ i @x =i ~ 2m 2 2ik1 jAj = ~ 2 k1 jAj m Lembrando que, pela relação de De Broglie (ou pela de…nição de k) p= h = h k = ~k 2 a quantidade ~k1 é o momento da nossa partícula incidente. Assim, se associamos a partícula uma velocidade (clássica), v = p=m, a quantidade Ji pode ser escrita como Ji = p1 ~k1 2 2 2 jAj (^ x) = jAj (^ x) = v1 jAj (^ x) : m m Além disso, lembrando a nossa de…nição quântica para a densidade de partículas 2 =j j ) 2 i = jAj temos Ji = v1 i Que é exatamente a expressão clássica para a corrente de uma distribuição com densidade e velocidade v. É necessário ter em mente que, apesar das descrições baterem, a interpretação por detrás destas equações é bem diferente. Enquanto classicamente esperamos ter uma in…nidade de partículas distribuídas uniformemente no eixo x (pois i é constante), e cada uma com velocidade v. Quanticamente podemos ter apenas uma partícula com momento ~k que possui a mesma probabilidade de ser encontrada em qualquer lugar do eixo x. Lembre-se que a solução com energia de…nida é uma onda estacionária que ocupa (sempre) todo o espaço. Entretanto, levando adiante esta analogia, podemos ainda de…nir uma corrente para as partículas re‡etidas Jr Jr = ~ 2 k1 jBj ( x ^) m O coe…ciente de re‡exão R de um meio mede exatamente a fração da corrente incidente (ou da intensidade da onda incidente) que este meio é capaz de re‡etir. Assim: 2 jJr j jAj R= = 2 jJi j jBj 46 Se pensarmos apenas em termos de ondas (como eletromagnéticas) a expressão acima simplesmente nos diz que o coe…ciente de re‡exão de um meio é a razão entre a intensidade da onda re‡etida e da onda incidente. Da mesma forma, podemos de…nir uma corrente transmitida Jt Jt = ~k2 2 jCj (^ x) m e determinar o coe…ciente de transmissão do nosso potencial 2 T = k2 jCj jJt j = jJi j k1 jBj2 Se o nosso sistema consiste numa in…nidade de partículas, emitidas uma após a outras, os coe…cientes acima nos dizem a proporção destas partículas que irá atravessa ou será re‡etida pela barreira. Estes efeitos são facilmente observados com a luz em meios translúcidos. Mas veja que agora, a expressões acima são válidas para uma única partícula (massiva, ou um fóton). Esta descrição é completamente diferente da clássica que a…rma: se partícula tem energia maior que a barreira ela passa, caso contrário ela não passa. Falando novamente sobre fótons, vemos que o comportamento clássico (observado em meios translúcidos) é esperado para um sistema constituído com um grande número de partículas. Neste sentido a teoria clássica da luz funciona perfeitamente bem para intensidades altas, mas, para baixas intensidades, precisamos da teoria quântica. Baixas intensidade (apenas alguns, ou mesmo um único fóton) só foram alcançados em equipamentos mais modernos. Vemos que, no caso da luz, o limite clássico está relacionado com altas intensidades. Bem, voltemos agora a nossa descrição quântica. Para determinarmos os coe…cientes R e T da nossa barreira, precisamos obter as razões entre as intensidades da nossa função de onda, ou seja, determinar a razão entre as constantes da nossa equação diferencial. Assim como no caso da partícula na caixa, para determinar as constantes acima precisamos impor condições de contorno no problema. Mais uma vez, não queremos descontinuidades na função de onda (pois isso estaria associado com uma energia in…nita). Além disso, como ES independente do tempo envolve uma derivada segunda, pela mesma razão não queremos uma descontinuidade na primeira derivada da função de onda. Matematicamente estas exigências são necessárias para que as equações diferenciais façam sentido. Assim, devemos impor as condições I (0) = II (0) ; 0 I (0) = 0 II (0) ; Com isso A+B =C ik1 (A B) = ik2 C =) A 47 B= k2 C k1 Resolvendo para C=A e B=A temos 1 C B 2 i ; =h = k2 A A 1+ 1 + k1 k2 k1 k2 k1 Com isso, nossos coe…cientes se tornam T = 4k2 =k1 1+ 2 k2 k1 1 k2 =k1 1 + k2 =k1 ; R= Usando (53) e (54) k2 = k1 r V E 1 Vamos primeiro analisar o caso em que E E V ) V E 2 1)0 V k2 k1 1 Primeiramente note que, como era de se esperar h i 1 2 2k =k + 1 + (k =k ) =1 T +R= 2 1 2 1 2 1 + kk21 Para o caso especial E = V T =0; R=1 temos uma re‡exão total da partícula. Conforme E cresce o coe…ciente de transmissão vai aumentando enquanto o de re‡exão vai diminuindo. Observe que, apesar do coe…ciente de transmissão aumenta com a energia (o que é natural), o comportamento é completamente diferente do esperado classicamente. Pois, mesmo que a partícula tenha uma energia E > V ela tem uma probabilidade de ser re‡etida pela barreira. Ou seja, se jogarmos várias partículas com uma energia E > V detectaremos algumas sendo re‡etidas pela barreira. No nosso exemplo da carga atravessando o campo, a nossa partícula tem energia cinética su…ciente para vencer o campo, mas, mesmo assim, ela é re‡etida. Vejamos agora o que ocorre quando E < V . Neste caso, a ES na região II se torna d2 dx2 II = 00 II 2m (E ~2 = 2 II V) ; 2 II = = d2 dx2 2m (V ~2 Cuja solução vale 48 II = 2m (V ~2 E) > 0 E) II Figure 6: Libo¤ II (x) = C exp ( x) + C 0 exp (+ x) Qual dos sinais acima usar? A resposta para esta pergunta permite analisar uma série de características (físicas e formais) da MQ. Vamos considerar que a solução geral seja uma combinação linear dos dois sinais. o sinal positivo (+). Neste caso, conforme nossa onda se aproxima do in…nito teremos: II (x ! 1) ' C exp ( x) ! 1 (A partícula sempre estaria no in…nito) Fisicamente isso signi…ca que a partícula sempre seria encontrada no in…nito, ou seja, a probabilidade dela estar no in…nito (e conseqüentemente ser transmitida seria sempre maior que qualquer outra probabilidade …nita). Obviamente isso não acontece, o que nos permite (com argumentos físicos) escolher o sinal de menos na exponencial. Matematicamente o mesmo argumento a…rma que uma função de onda este fato está relacionado com não podermos normalizar a função de onda acima. Assim, entre os postulados da MQ, temos que os estados físicos do sistema são dados por funções de onda que respeitam Z 1 2 j (x)j dx < 1 1 Ou seja, cuja probabilidade de serem encontrada em todo o espaço seja …nita. Dizemos que as funções permitidas são de quadrado integrável, ou, mais tecnicamente, que elas pertencem ao espaço de Hilbert. 49 Podemos continuar usando todos os resultados anteriores fazendo 00 II 2 = = 2 (i ) II e substituindo k2 por i . Com isso 1 B = A 1+ i k1 i k1 Se de…nirmos z =1+i k1 lembrando que =k1 2 R, temos B B z = =) R = A z A 2 2 z z = =1 Para obter o coe…ciente R vamos usar, T +R=1)T =0 : Entretanto, precisamos ver que este resultado continua válido para E < V (lembre-se que, para obter o resultado acima, usamos explicitamente E V ). Neste caso é necessário notar que no processo de espalhamento que estamos estudando todas as correntes são constantes. O que, pela equação de continuidade, signi…ca que @ @ r J= ) =0: @t @t Para o caso de uma partícula, este resultado não é nada intuitivo com a nossa visão clássica. Pois não podemos imaginar a partícula entrando nem saindo de nenhuma região. Mas lembres-se que, enquanto você não detectar a partícula ela é uma onda no espaço todo. O resultado acima nos diz que @J =0; @x @Jx @x com isso Z 1 1 @J dx = J1 @x J 1 =0: Mas sabemos que J 1 J1 com isso Jt Ji + Jr = 0 =) = Ji = Jt Jr Jr Jt + = 1 =) T + R = 1 : Ji Ji Assim este resultado é válido para qualquer corrente estacionária. 50 Com isso, para E < V , temos R = 1 =) T = 0 Ou seja, para energias menores que a barreira todas as partículas são re‡etidas. Este último resultado concorda plenamente com o esperado classicamente. Podemos obter este resultado também diretamente da solução II (x) = C exp ( x) =) II (1) = 0 Ou seja, não podemos encontrar nossa partícula muito longe da barreira e, consequentemente, não há corrente Jt nesta região. Além disso, como a corrente é estacionária, Jt 0. 6.1 Comportamento dentro da barreira Uma atenção especial deve ser dada para o comportamento da função de onda na região dentro da barreira II (x) = C exp ( x) Onde o valor de C está relacionado com as demais constantes pelas condições de contorno e pela normalização. Observe que agora a probabilidade de encontrar a partícula no interior da barreira (apesar de não ser nula) cai exponencialmente II (x ! 1) ' Ce x !0 Mas, a previsão da MQ, é que existe uma probabilidade não nula da partícula ser encontrada numa região classicamente proibida. Observe, entretanto, que nesta região a partícula teria uma energia total negativa (E V < 0). Um tal estado não é considerável …sicamente possível, porque não saberíamos que tipo de dispositivo físico poderia medir esta energia (não há um análogo clássico para isso). Entretanto, o ponto importante é que, se a barreira tiver uma largura …nita, de sorte que a função não seja zero no …nal da barreira, uma partícula com uma energia E < V poderia atravessar esta barreira. 7 Barreira quadrada Vamos analisar agora um problema um pouco mais complicado, mas muito mais interessante. Imagine agora que o nosso potencial não continua constante até o in…nito, mas volta a cair num certo ponto. Ou seja, a nossa partícula vem livre até x < a (U (x < a) = 0), sofre a ação de um potencial em x = a (U = V ), mas a in‡uência deste potencial torna a desaparecer numa certa distância a (U (x > a) = 0). 51 Figure 7: Libo¤ Temos agora 3 regiões de interesse e, para cada região, temos a seguinte ES independente do tempo I (x) = Aeik1 x + Be ik1 x II (x) = Ceik2 x + De ik2 x III (x) = F eik1 x ; x > a 2mE ; x< a ~2 2m ; k22 = 2 (E V ) ; a < x < a ~ ; k12 = Onde, na última função de onda, usamos novamente que estamos interessados apenas no espalhamento de uma partícula vinda da esquerda. Mais uma vez, estamos interessados no estudo dos coe…cientes de transmissão T e re‡exão R deste potencial T = F A 2 ; R= B A 2 Mais uma vez, os coe…cientes estão relacionados pela continuidade da função e sua derivada nos pontos a e k1 e ik1 a ik1 a + B C eik1 a = e A A B C eik1 a = k2 A A 52 ik2 a e + ik2 a D A eik2 a D A eik2 a e a, C D F eik2 a + e ik2 a = eik1 a A A A C D F eik2 a e ik2 a = k1 eik1 a A A A k2 Resolvendo estas equações para F=A, B=A temos: 1 F i k12 + k22 = e2ik1 a cos (2k2 a) A 2 k1 k2 B i F k22 k12 = sin (2k2 a) A 2 A k1 k2 sin (2k2 a) Exercise 14 Obtenha as expressões acima. Usando a segunda das relações acima podemos escrever B A 2 F A = 2 k22 k12 k1 k2 1 4 2 sin2 (2k2 a) e suando a relação F A 2 A 1 = T F 2 T +R= temos 7.1 + = B A 2 = 1 =) 1 k22 k12 4 k1 k2 B A 2 =1 F A 2 2 sin2 (2k2 a) + 1 Primeiro caso E > V Para E > V temos k12 = k12 2mE 2m ; k22 = 2 (E V ) 2 ~ ~ 2 2 2 k k k12 k22 1 k22 =) 2 = k1 k2 k1 k2 2 = E (E V ) V2 com isso 4E (E V ) p V 2 sin2 g E V + 4E (E r 2m g = 2a ~2 T = V) ; E>V (55) Onde agrupamos todas as características da partícula e da espessura da barreira na constante g. 53 Além disso, a transmissão é total (T = 1) sempre que a diferença entre a energia e o potencial valer: E V = ~2 n 2m 2a 2 =) T = 4E (E 4E (E V) =1 V) Ou seja, quando a barreira respeita a relação acima ela se torna transparente para as partículas. Usando a relação de De Bloglie 2ak2 = n =) 2a = n 2 quando o comprimento de onda da partícula é metade do tamanho da barreira. Esta relação pode ser usada para medir a espessura da barreira. Para energias muito altas T =1; E!1: Mais uma vez temos o comportamento descrito anteriormente de que, mesmo para energias mais altas que V , a partícula pode ser re‡etida pelo potencial. Quando E ! V temos p E ! V ; sin g E V + T ! 1 g 2 2 p !g E V ; <1: V +1 Agora temos que para energias próximas ao valor do potencial o coe…ciente de transmissão não mais se anula. Além disso, para uma barrira in…nita (V ! 1), ou uma barreira muito longa (g ! 1, que é o caso analisado anteriormente), temos (como esperado) T = 0. 7.2 Segundo caso E < V Analisemos agora o caso para E < V . Novamente podemos aproveitar toda a álgebra desenvolvida anteriormente fazendo a substituição 2m (E ~2 2m = 2 (V ~ k22 = 2 V) E) = k22 ) i = k2 com isso II (x) = Ce x Observe então que antes e depois da barreira temos ondas (oscilantes) enquanto dentro da barreira a função de onda decai exponencialmente. Assim, devemos esperar um comportamento como o da …gura abaixo. Onde a amplitude da onda depois da barreira e tão menor quanto mais longa a barreira. 54 Libo¤ Com isso temos: 2 2 1 (i ) k12 1 = T 4 k1 i = 1 4 = 1 4 usando 2 k12 sin2 (2i a) + 1 2 sinh2 (2 a) + 1 k1 i 2 + k12 k1 2 sinh2 (2 a) + 1 2 V + k12 =p k1 E (V temos T = 2 2 V sinh 4E (V E) p g V E + 4E (V E) E) ; E<V O principal ponto deste resultado é que, mesmo para E < V (classicamente nossa partícula não tem energia para atravessar o potencial), temos T 6= 0. Este fenômeno é chamado de tunelamento quântico, ou simplesmente, tunelamento. Este processo esta por trás do Scanning tunneling microscope. De acordo com este efeito, sistemas quânticos fazem coisas que eles não teriam energia pra fazer (mas isso, de forma alguma, viola a conservação de energia). Uma das primeiras aplicações do tunelamento, foi para explicar o decaimento radioativo de certos átomos. No núcleo atômico a forca de repulsão coulombiana entre os prótons e compensada pela atração nuclear entre os nucleons. Entretanto, como a força nuclear é de curto alcance, enquanto a força de Coulomb é de longo alcance, conforma aumentamos o tamanho do átomo, prótons mais distantes continuam 55 se repelindo pela força eletromagnética, mas são atraídos apenas pelos nucleons a sua volta. Vamos tendo assim um aumento gradual da repulsão, enquanto a atração permanece a mesma. Se tentarmos montar um átomo muito grande a repulsão colombiana simplesmente despedaçará o nosso átomo. Mas, para átomos não tão grandes (e.g., urânio-238), a força de atração ainda é maior (mas pouco maior) que a repulsão. Assim, classicamente este átomo seria estável. Entretanto, devido ao processo de tunelamento, pedaços do núcleo que não teriam energia (devido a repulsão) para escaparem da atração, conseguem fazêlo. Assim, alguns pedaços do núcleo (e.g., dois prótons e dois nêutrons, chamado de partícula alfa) escapam do átomo de urânio. Este problema foi tratado com esta abordagem de tunelamento por Gamow, Condon e Gurney em 1928. Atualmente uma série de dispositivos eletrônicos (junção de Josephson e diodos de tunelamento) funciona através deste processo de tunelamento, neste caso, envolvendo elétrons. Vemos que para E < V temos T < 1. E para E ! 0 T !h 0 2 2 V sinh p i =0; g V O comportamento geral do sistema pode ser visto na …gura abaixo O coe…ciente (e, conseqüentemente, a probabilidade) de transmissão vai aumentando com a energia E, até atingir um valor máximo (T = 1) que depende das características da barreira (g). Depois este valor oscila próximo ao máximo, de sorte que num certo range, se aumentarmos a energia diminuímos a transmissão (um comportamento bastante inesperado). Depois, para energias muito altas, a transmissão passa a valer sempre 1. 8 Poço …nito O poço de potencial quadrado, apesar de mais complicado que os potenciais anteriores, fornece uma forma simples de entender alguns dos mais importantes problemas tratados pela MQ. Ente eles, a estrutura do átomo de hidrogênio e a condução eletrônica tanto em metais e em semicondutores. A con…guração deste problema pode ser descrita por um potencial na forma 56 Figure 8: Figura tirada do Libo¤, para g = 4. 57 Libo¤ Neste problema podemos continuar usando as mesmas equações do problema anterior I (x) = Aeik1 x + Be ik1 x II (x) = Ceik2 x + De ik2 x III (x) = F eik1 x ; x > a 2mE ; x< a ~2 2m ; k22 = 2 (E V ) ; a < x < a ~ ; k12 = (56) apenas com a modi…cação k22 = com isso, para E (55) T = 2 2m (E ~2 V ) ! k22 = 0 (que equivale ao caso E 2 V sin 4E (E V ) p g E V + 4E (E se torna T = V 2 sin2 V) 2m (E + jV j) ~2 V ) o coe…ciente de transmissão ; E > V ; g = 2a 4E (E + jV j) p g E + jV j + 4E (E + jV j) 58 r 2m ~2 Para este potencial temos T ! 1 para E ! 1 T = 0 para E = 0 Além disso, temos, novamente, um máximo de transmissão para p g E + jV j = 2ak2 = n O principal ponto a se notar agora que este potencial, diferente do anterior, é um potencial atrativo. Classicamente, é impossível para um potencial atrativo re‡etir uma partícula. Entretanto, no caso quântico, vemos que tal efeito pode acontecer. Nesta teoria, podemos imaginar um elétron sendo atirado contra um núcleo, temos que este elétron pode ser re‡etido pelo núcleo. Além disso, para valores de energia acima (2ak2 = n ), o núcleo é completamente transparente para o elétron (este é o efeito Ramsauer ). Neste caso, como nos anteriores, a partícula pode assumir qualquer valor de energia, i.e., o espectro de energia forma um contínuo. 8.0.1 Energia negativa. Vamos agora procurar por soluções da ES com E < 0. Neste caso temos (lembre que agora a região classicamente proibida é jxj > a) d2 I = dx2 d2 II = dx2 d2 III = dx2 2 I k22 2 ; 2 II ; III = 2 2 ; =) 2m jEj > 0 =) I (x) = A exp ( x) ~2 2m = 2 (jV j jEj) > 0 =) II (x) = B exp (ik2 x) + C exp ( ik2 x) ~ I (x) = D exp ( x) (57) Onde, pela condição de normalização, em I usamos apenas o sinal de + e em . E usamos novas letras para as constantes multiplicativas. II o sinal de Nesta escolha implicitamente estamos escolhendo a raiz positiva de r r 2m 2m 2 jEj =) = + jEj > 0 : = 2 ~ ~2 Novamente impomos as condições de continuidade da função e sua derivada nos pontos a A exp ( A exp ( a) = B exp ( ik2 a) + C exp (ik2 a) a) = ik2 [B exp ( ik2 a) C exp (ik2 a)] 59 ea B exp (ik2 a) + C exp ( ik2 a) = D exp ( a) ik2 [B exp (ik2 a) C exp ( ik2 a)] = D exp ( a) coletando estas equações temos Be ik2 a Ceik2 a = 0 ; Beik2 a + Ce ik2 a De Ae A e a a Bik2 e Bik2 eik2 a ik2 a Cik2 e a =0; + Cik2 eik2 a = 0 ; ik2 a a +D e =0: As equações acima podem ser escritas na seguinte forma matricial Mv = 0 onde 0 B M =B @ a e 0 a e 0 e ik2 a eik2 a ik2 e ik2 a ik2 eik2 a eik2 a e ik2 a ik2 eik2 a ik2 e ik2 a 0 e 0 e Se a matriz M for inversível, podemos escrever v=M 1 a a 1 0 1 A C C B C ; v=B B C A @ C A D 0)A=B=C=D=0: Assim, a única forma da equação acima ter uma solução não trivial, é a matriz M não ser inversível. Ou seja, det M = 0 ; (esta é a regra de Kramer para que um sistema de equações tenha solução nãotrivial). Manipulando a matriz temos 1. Multiplicando a primeira linha por e subtraindo com a terceira; multiplicando a segunda por e somando da quarta; multiplicar primeira linha por 1 0 10 1 0 G G 0 A CB B C B 0 G G 0 B CB C @ e a A@ C A ; ik2 e ik2 a ik2 eik2 a 0 D 0 ik2 eik2 a ik2 e ik2 a e a onde G ( + ik2 ) eik2 a : 60 2. Trocar primeira coluna com a segunda (observe que estamos reorganizando o sistema e precisamos rede…nir v) 1 10 0 G 0 G 0 B CB A C B G 0 G 0 C CB B a ik2 a A@ C A @ ik2 e ik2 a e ik2 e 0 D ik2 eik2 a 0 ik2 e ik2 a e a e depois segunda com a terceira 0 G G B G G B @ ik2 e ik2 a ik2 eik2 a ik2 a ik2 e ik2 a ik2 e 0 0 a e 10 0 0 0 0 a e 1 B CB C C C CB A@ A A D Se calcularmos agora o determinante da matriz acima temos 2 det M = k22 G2 (G )2 e2( a ) Exercise 15 Calcule o determinante da matriz acima. Com isso, a condição de Kronecker se torna det M = 0 ) G2 = (G )2 ) G = G (58) Lembrando que um número complexo pode ser escrito na forma polar q k2 z = + ik2 = jzj ei ; jzj = k22 + 2 ; tan = temos G = jGj exp (i [k2 a + ]) Assim, (58) se torna G= G ) exp (i [k2 a + ]) = exp ( i [k2 a + ]) Para as raízes positivas G = +G =) exp (i [k2 a + ]) = exp ( i [k2 a + ]) =) k2 a + =0 ou ainda k2 a + = 0 =) tan (k2 a) = ou ainda = tan cos (k2 a) k2 = sin (k2 a) = k2 =) k2 cot (k2 a) ; 61 tan (k2 a) = G =1 G k2 (59) Para a raiz negativa fornece G= G =) exp (i [k2 a + ]) = k2 a + = k2 a + =) k2 a + ou ainda tan exp ( i [k2 a + ]) = exp ( i [k2 a + = k2 = = tan ]) 2 k2 a = cot (k2 a) 2 que pode ser colocada na forma k2 tan k2 a = Retornando estas soluções em 0 G G B G G B @ e ik2 a eik2 a ik2 a e e ik2 a 0 0 ik2 e 0 ; G = G 0 0 0 ik2 e a temos 1 1 B CB C C C CB A@ A A = 0 D 10 a (60) B G = C G B G GB + G C = 0 =) = C G com isso, para cada uma das raízes (58) e (59) temos G B + GC = 0 =) B = C B = C 8.0.2 G G = 1 =) B = C ; k2 tan k2 a = ; = 1; G G G G = 1 =) B = C ; = k2 cot (k2 a) ; =1: G G Raiz negativa, primeira igualdade Substituindo a segunda igualdade B = C nas duas outras últimas equações em (60) temos e ik2 a Ceik2 a B eik2 a B + Ce ik2 ik2 a ik2 e a e a A = 0 =) A = 2 D = 0 =) D = 2 k2 k2 B sin (k2 a) e a B sin (k2 a) e a Substituindo nas funções de onda (57) temos I (x) = A exp ( x) =) I (x) = 2 k2 B sin (k2 a) exp [ (x + a)] ; (x) = B exp (ik2 x) + C exp ( ik2 x) =) II = 2B cos (k2 x) ; k2 x) =) III (x) = 2 B sin (k2 a) exp ( (x III (x) = D exp ( II k2 tan k2 a = : a)) ; (61) 62 Que, pela dependência na coordenada na forma do cosseno, são chamada de soluções pares. Para determinar a constante B em ambas as soluções acima, basta normalizar as função Z 1 2 1 j j dx = 1 temos assim a solução completa do nosso problema. A relação entre k2 e na equação (61) determinam os valores possíveis de energia do nosso problema. Entretanto, esta é uma equação transcendental e não podemos encontrar uma forma algébrica fechada para as soluções (i.e., não podemos encontrar uma relação simples entre estas quantidades). Vamos primeiro estudas as pares (61). Fazendo mudança de variáveis (para variáveis adimensionais) = k2 a ; = a =) tan = Lembrando que escolhemos a raiz positiva de (62) e que a > 0 temos >0: Pela de…nição de k2 e 2 = temos 2m 2m jEj ; k22 = 2 (jV j ~2 ~ jEj) =) 2 +k22 = 2m 2m jEj+ 2 (jV j ~2 ~ jEj) = 2m jV j ~2 ou ainda 2m 2 jV j ~2 ou seja, para dados valores de a,m e V a relação acima descreve um círulo de raio no plano . Ou seja, para um dado poço de tamanho a, profundidade V e uma partícula de massa m, a ES do nosso problema terá soluções não-triviais, apenas se as seguintes equações forem (simultaneamente) satisfeitas p 2 2 ; = tan ; = + ap (E) = a = 2m jEj > 0 (63) ~ 2 + 2 = a2 onde, novamente, escolhemos o sinal de + para porque já haviamos escolhido a raiz positiva de . Esta é uma restrição nas energias (para soluções estacionárias pares) permitidas para o nosso sistema. Para encontrar estes valores possíveis de energia, podemos usar métodos numéricos, ou simplesmente plotar num grá…co as duas equações (63) e procurarmos pelas intersecções destas …guras. Um exemplo, para um dado valor de < , é mostrado na …gura abaixo. 63 Libo¤ Ou seja, para 2 ~2 2m a estas curvas se encontrar apenas uma vez no ponto 1 da …gura. Assim, para este valor de potencial, temos apenas um possível valor de k2 e que respeita as condições de contorno do nosso problema. A energia deste estado é dada pelo valor de < =) jV j < 2 ~2 2 ~2 1 1 =) E1 = 2m 2m a Este é um estado estacionário (par) permitido para o sistema (como é a solução da ES independente do tempo, o estado deve ser estacionário). Lembrando que os estados estacionários são estados de energia determinada, nestas condições o sistema tem apenas um valor permitido de energia. Este é um estado estacionário em que a partícula está presa dentro do posso. Ou seja, a região permitida para a partícula é limitada no espaço. Um estado estacionário (de energia bem de…nida) limitado no espaço é chamado de um estado ligado (em contradição aos estados não ligados onde a partícula de energia bem de…nida pode ir para o in…nito). Observe que, se aumentarmos a profundidade do poço (i.e., aumentar a força de atração jV j), de forma que r 2m < < 2 =) < a2 2 jV j < 2 ~ 1 = 1a =) jE1 j = 64 teremos dois estados ligados para o sistema. Ou seja, dois estados de energia permitidos. Além disso, o número de estados ligados aumenta com a largura do poço a. Outro ponto a se observar é que para qualquer valor de energia E < 0 existe pelo menos um estado ligado par. Ou seja, assim como no caso clássico, um poço de potencial quântico sempre pode capturar uma partícula com E < 0. A diferença é que classicamente esta partícula é sempre capturada enquanto quanticamente ela tem uma probabilidade de ser capturada dada pelo coe…ciente de re‡exão. 8.0.3 Raiz positiva, segunda igualdade Substituindo a segunda igualdade B = B = C e ik2 a B 1 =) Ceik2 a eik2 a B + Ce ik2 ik2 a ik2 A = B e a e a C nas duas outras equações temos D = B 2i sin (k2 a) e A = 0 =) A = 2 ik2 D = 0 =) D = 2 a e a B cos (k2 a) ik2 Be a cos (k2 a) Substituindo nas funções de onda (57) temos I (x) = A exp ( x) =) I (x) = 2 ik2 B cos (k2 a) exp ( (x + a)) ; (x) = B exp (ik2 x) + C exp ( ik2 x) =) II (x) = 2B sin (k2 x) ik2 x) =) III (x) = 2 B cos (k2 a) exp ( (x III (x) = D exp ( II k2 cot (k2 a) = a)) ; : (64) Estas são as soluções impares do nosso problema. O desenvolvimento segue de forma completamente análoga ao caso da raiz negativa (ondas pares). Neste caso, novamente, temos a condição: 2 + 2 = a2 2m jV j ~2 2 ; = k2 a ; = a mas agora devemos procurar por intersecções deste circulo com a curva: = cot (k2 a) O grá…co desta curva tem a forma: Ou seja, para valores 3 2 2 temos apenas um estado ligado. Diferente das soluções pares, para 2 ~2 (i.e., jV j < 2m ) não temos nenhum estado ligado ímpar. a < < 65 < =2 Figure 9: Libo¤ Obviamente, os estados ligados disponíveis para a partícula no poço são a soma dos estados pares e impares. Entretanto, com o veremos na segunda parte deste curso, esta característica de paridades estão diretamente relacionadas com a natureza das partículas con…nadas dentro do poço. Os dois primeiros estados ligados do sistema têm a forma: Observe que, novamente, existe uma probabilidade da partícula ser detectada na região classicamente proibida fora do poço. Além disso, se o poço é muito profundo (jV j ! 1) teremos estados ligados com energia E << 0 (jEj >> 0) e conseqüentemente >> 0. Neste caso (o poço de profundidade in…nita) qualquer estado com energia …nita terá um decaimento muito rápido fora da barreira. Ou seja, a probabilidade de ser encontrada fora do poço é nula. Assim, quando a profundidade do poço tende a in…nito, voltamos a ter o problema da partícula na caixa, com as mesmas soluções e energias encontradas anteriormente. 8.0.4 Espectro contínuo e discreto O desenvolvimento matricial permite ver com mais facilidade a diferença entre o problema para o espectro contínuo E > 0 e o espectro discreto E < 0. Para o espectro contínuo do caso do espalhamento, as condições de fronteira do 66 Figure 10: Libo¤ problema nos dão B A B A eik1 a + C A k2 k1 eik1 a + C A k2 k1 C A eik2 a + eik2 a k2 k1 C A e D A D A e ik2 a ik2 a + k2 k1 e ik2 a e ik2 a D A D A F A F A eik2 a = e ik1 a eik2 a = e ik1 a eik1 a = 0 eik1 a = 0 onde, como temos agora cinco variáveis, podemos eliminar uma delas escrevendo todas as quantidades em relação a razão ?=A, uma vez que o número de condições de fronteira é o mesmo temos o mesmo número de equações. Além disso, como estamos interessados num problema de espalhamento de partículas lançadas de 1 (as funções de onda foram montadas com esta suposição), sabemos que sempre teremos A 6= 0. 67 Com isso podemos escrever o nosso sistema na forma B 0 eik1 a + C 0 e ik2 a + D0 eik2 a k2 k2 0 ik2 a B 0 eik1 a + C 0 e ik2 a De k1 k1 C 0 eik2 a + D0 e ik2 a D0 eik1 a k2 0 ik2 a k2 0 ik2 a Ce De F 0 eik1 a k1 k1 =e ik1 a =e ik1 a =0 =0 Onde as quantidades com linha são as originais divididas por A. Novamente, podemos colocar as equações acima na forma matricial Mv = u onde 0 eik1 a B eik1 a M =B @ 0 0 e ik2 a k2 ik2 a k1 e ik2 a e k2 ik2 a k1 e eik2 a k2 ik2 a k1 e e ik2 a k2 ik2 a k1 e 1 0 0 0 B C B C0 0 C ; v=B 0 @ D eik1 a A F0 eik1 a 1 1 C B C C ; u = e ik1 a B 1 C A @ 0 A 0 1 O que obtemos agora é uma equação não homogenia (u 6= 0) nas nossas incógnitas. Neste caso a solução geral do nosso problema não está restrita a condição de Kronecker (ou, seja, não impomos mais que M não seja inversível). Na verdade, tudo que temos de fazer agora e inverter a matriz M e podemos determinar (de forma unívoca) o vetor v v=M 1 u Se você …zer isso, irá obter exatamente as relações calculadas anteriormente. Ou seja, neste caso não precisamos impor nenhum vínculo no sistema para obter uma solução não trivial (i.e., para obter v 6= 0). A constante A que sobra pode agora ser determinada pelas condições de normalização. Este problema é importante porque mostra bem a diferença entre estados ligados e não-ligados, e para modelar a física da condução em metais de semicondutores. Entretanto, como veremos, ele é bastante arti…cial, especialmente porque matematicamente alguns observáveis não estão bem de…nidos. 9 Estrutura formal da MQ A fenomenologia da MQ surge nos trabalhos de Planck e Einstein (1895-1915). A estrutura formal da MQ nasce com o processo de quantização de BohrSommerfeld e dos postulados de De Broglie (1910-1923). Esta é a chamada velha MQ. Esta estrutura é modi…cada pela estrutura envolvendo variáveis intrinsecamente complexa, presente nos trabalhos de Schroedinger e a estrutura nãocomutativa (matricial) dos trabalhos Heisenberg, Born e Jordan (1925-1930). 68 0 Estas duas estruturas foram posteriormente uni…cadas por Schroedinger dentro dos conceitos da análise funcional. Nasce aqui a nova MQ. Este trabalho foi avançado numa estrutura formal ainda mais consistente pelos trabalhos de Von Neumann (análise complexa), Weyl (teoria de grupos) e Dirac (tudo!). Nos trabalhos iniciais de Bohr-Sommenrfelde e De Broglie, a MQ é pensada como uma “releitura”da física clássica. Ou seja, a interpretação de quantidades clássicas mensuráveis não como uma característica intrínseca dos sistemas, mas como probabilidades que o sistema assuma tais valores. Entretanto, como vimos, a teoria de Schroedinger a…rma que a descrição completa de um sistema físico envolve quantidades complexas que estão fora do alcance dos aparelhos de medida. Ou seja, a descrição anterior da mecânica, baseada em variáveis reais e no espaço de fase, não pode comportar a realidade dos sistemas físicos. Foi necessário então desenvolver uma nova estrutura matemática para descrever de forma satisfatória esta nova teoria quântica. Esta nova estrutura envolve conceitos da análise funcional como espaços de Hilbert e o espectro de operadores. E é em termos desta estrutura matemática que os postulados da MQ são estabelecidos. Ou seja, é impossível ter uma idéia da estrutura atual da MQ sem um conhecimento, ainda que (bem) super…cial, da estrutura matemática envolvida nesta teoria. Por isso vamos fazer um pequeno passeio por alguns conceitos da análise funcional complexa. 9.1 Espaços vetoriais e operadores Um espaço vetorial V é qualquer conjunto de elementos onde de…nimos uma regra de composição entre estes elementos, que simbolizamos geralmente pelo sinal de soma (+). Ou seja, dado dois elementos quaisquer v1 ; v2 2 V , sabemos realizar a composição: 8 v1 ; v2 2 V : v1 + v2 = v3 2 V ; Ademais estabelecesse uma outra regra, chamada de produto com um escalar ( ), da composição dos elementos deste conjunto sobre o corpo dos reais (ou dos complexos). Ou seja: 8 v1 2 V; a 2 R : a:v1 = av1 = v3 2 V ; Além disso, esta operação de soma deve respeitar (lembre-se que podemos de…nir diferentes somas, e.g., soma de setas, de matrizes.): 1. (a) Associativa: v1 + (v2 + v3 ) = (v1 + v2 ) + v3 . (b) Comutativa: v1 + v2 = v2 + v1 . (c) Elemento identidade: 9 0 2 V : v + 0 = v; 8 v 2 V . (d) Elemento inverso: 8 v 2 V; 9 v 2 V : v + ( v) = 0 : (e) Distributiva pelo produto com um escalar: a (v1 + v2 ) = av1 + av2 . 69 (f) Distributiva pela soma escalar: (a1 + a2 ) v = a1 v + a2 v (g) compatível com a multiplicação escalar dos campo: a1 (a2 v) = (a1 a2 ) v Um exemplo simples e bem conhecido de um espaço vetorial seria o conjunto de setas num plano. Ou seja, quantidades com um certo comprimento que apontam em determinada direção e sentido (mas que não estão …xas em nenhum ponto). Com isso, V é o conjunto de todas as setas. Para que este conjunto se torne um espaço vetorial precisamos primeiro de…nir como estas setas são multiplicadas por um número real. Fazemos isso de…nindo que ~v2 = a~v1 ; ~v1 ; 2 V ; a 2 R ; a 0 é uma nova seta ~v2 2 V (também no plano) que aponta na mesma direção de ~v1 , mas tem o comprimento a vezes maior. Da mesma forma, ~v3 = a~v1 ; ~v1 2 V ; a 2 R ; a < 0 tem o mesmo módulo e sentido de ~v2 , mas aponta na direção contrária (tem sentido contrário). Precisamos agora de…nir como se somam estas. Fazemos isso de…nindo ~v3 = ~v1 + ~v2 ; ~v1 ; ~v2 2 V como uma nova seta ~v3 2 V obtida levando a origem de ~v1 na ponta de ~v2 e ligamos a extremidade de ~v1 com a ponta de ~v2 (ou fazemos o mesmo invertendo ~v1 com ~v2 ). Com isso, é fácil ver que V é um espaço vetorial. 9.2 Produto interno Dentro do espaço vetorial, podemos ainda (mas não é uma condição necessária para a sua construção) de…nir uma operação de produto entre os elementos do espaço. Esta operação, no caso geral, associa a dois vetores quaisquer um número. Ou seja, esta operação é um mapa V V V2 !R ; O símbolo usual para esta operação é o seguinte: (~v1 ; ~v2 ) = v ; ~v1 ; ~v2 2 V ; v 2 R Esta operação é chamada de produto vetorial, ou, de forma mais geral, de produto interno. Ela pode ser de…nida de várias formas diferentes, precisando apenas respeitar as seguintes regras (no corpo dos reais): (~v1 ; ~v2 ) = (~v2 ; ~v1 ) (simétrico) (a~v1 + b~v2 ; ~v3 ) = (a~v1 ; ~v3 ) + (b~v2 ; ~v3 ) (linear) (~v ; ~v ) 0 ; (~v ; ~v ) = 0 =) ~v = ~0 (positivo de…nido) 70 onde ~0 é o vetor identidade do espaço vetorial, usualmente denotamos ~0 mas lembre-se que 0 2 V . Como exemplo, no nosso espaço de setas podemos de…nir: 0, (~v1 ; ~v2 ) = j~v1 j j~v2 j cos Onde jvj 2 R é o tamanho da nossa seta e é o menor ângulo entre as setas. Num espaço vetorial geral, este tamanho é chamado de norma do vetor e pode ser escrito como 2 (~v ; ~v ) = j~v j j~v j cos 0 = j~v j : Ou seja, uma vez de…nido o produto interno sabemos calcular a norma dos vetores. O produto interno fornece uma forma bastante conveniente de fazemos referências as nossas setas (sem termos de fazer desenhos ou guardamos a seta, cuidadosamente para não girar, numa gaveta). Imagine que todas as pessoas que irão trabalhar com estas setas concordam em usar duas setas especiais ~e1 e ~e2 , ou seja, duas setas que todos sabem o tamanho e a direção que apontam (apenas estas duas nós guardamos na gaveta). Feito isso, podemos associar a uma seta qualquer ~v os números: v1 = (~v ; ~e1 ) ; v2 = (~v ; ~e2 ) (65) Dado estes dois números, qualquer pessoa que conheça as setas ~e1 e ~e2 pode reconstruir ~v . Estes dois vetores formam uma base do nosso espaço de setas. A única exigência é que estes não sejam setas que apontem na mesma direção (co-lineares). Como reconstruímos o vetor ~v ? O que temos de fazer é procurar por um vetor cujo produto interno com ~e1 e ~e2 forneça os números acima. Feito isso, este vetor será único. Agora, seria muito conveniente se pudéssemos sistematizar a reconstrução de ~v numa álgebra simples. Por exemplo, seria bastante conveniente se púdessemos reconstruir ~v apenas fazendo ~v = v1~e1 + v2~e2 (66) Isso é válido para qualquer base (~e1 ; ~e2 )? A resposta é não. Quais as característica devemos impor para a nossa base para podermos usar a expressão (66)? Tomemos novamente o produto interno do nosso vetor (66) com ~e1 (~v ; ~e1 ) = (v1~e1 + v2~e2 ; ~e1 ) = v1 (~e1 ; ~e1 ) + v2 (~e2 ; ~e1 ) Usando agora (65) devemos ter v1 (~e1 ; ~e1 ) + v2 (~e2 ; ~e1 ) = v1 71 para um vetor ~v qualquer do nosso espaço. Esta igualdade só é válida para vetores ~e1 e ~e2 que respeitam (~e2 ; ~e1 ) = 0 (ortogonal) (~e1 ; ~e1 ) = 1 (normalizado) A primeira igualdade nos diz que os nossos vetores de base são ortogonais e a segunda que o vetor ~e1 está normalizado. Da mesma fora, se tivéssemos feito o produto com ~e2 teríamos (~e1 ; ~e2 ) = 0 ; (~e2 ; ~e2 ) = 1 : Ou seja, dada uma base e um vetor ~v estes só estarão relacionados pela expressão (66) se (~ei ; ~ej ) = ij : (67) Uma base que respeita a igualdade (67) é chamada de ortonormal. Remark 16 Observer que bases não-ortonormais também são legítimas para descrever o espaço. Entretanto, para bases ortonormais as expressões e manipulações dos vetores toma uma forma bastante simples. Como veremos a seguir, existe um procedimento geral para, dado um espaço, obtermos uma base ortogonal. Entretanto, esta base usualmente não é normalizada. Contudo, num espaço vetorial com o produto interno de…nido, dados dois vetores ~e1 e ~e2 que sejam ortogonais ((~e1 ; ~e2 ) = 0), mas não normalizados, podemos facilmente de…nir novos vetores e^i = que serão obviamente normais ~ei ~ei =p j~ei j (~ei ; ~ei ) (^ ei ; e^i ) = 1 Este processo é chamado de normalização dos vetores de base. Usamos o chapél para indicar que a base foi normalizada. A base ortonormal nos dá uma forma também muito conveniente de de…nirmos a soma dos nossos elementos (mais uma vez, sem precisarmos apelar para desenhos). Vimos que, dada uma base ortonormal, a representação dos nossos vetores nesta base assume a forma ~v = v1 e^1 + v2 e^2 ; vi = (~v ; e^i ) Podemos agora escolher uma representação matricial para os nossos vetores da base. Uma escolha possível é a seguinte: e^1 1 0 =^ e1 ; e^2 72 0 1 =^ e2 (68) Com isso, ~v = v1 e^1 + v2 e^2 v1^ e1 + v2^ e2 = v1 v2 : Feito isso, a soma e a multiplicação por escalar se resume a álgebra usual de matrizes v1 v1 + av10 v10 v + av0 = = +a 0 v2 + av20 v2 v2 No lugar de (68) poderíamos ter escolhido qualquer base ortonormal para o espaço das matrizes. Ou seja, qualquer par de matrizes que fossem ortogonais e normalizadas. Por exemplo: e^1 1 p 2 1 1 =^ e01 ; e^2 1 p 2 1 1 =^ e02 (69) Mas, neste caso, a forma matricial dos nossos vetores não seria tão simples 1 v1^ e01 + v2^ e02 = v1 p 2 1 1 1 + v2 p 2 1 =p 2 1 1 v1 + v2 v1 v2 A base (68) se chama base canônica. A igualdade acima é válida para qualquer base ortonormal. Ou seja, se escolhermos uma base diferente da canônica, ainda podemos encontrar as componentes dos vetores na base original através do produto interno vi = (v; ^ ei ) = (~v ; e^i ) : Por exemplo, dado o vetor 0 1 v= : As componentes vi deste vetor na base canônica é, obviamente, v1 = 0 ; v2 = 1. Entretanto, se tivéssemos escolhido a base (69), teríamos v1 = (v; ^ e01 ) = 0 1 v2 = (v; ^ e01 ) = 0 1 1 p 2 1 p 2 1 1 1 1 1 =p 2 = 1 p 2 Assim, sempre que temos um vetor na forma matricial, precisamos saber em que base este vetor foi escrito. Usualmente, e quando nada for especi…cado, estaremos falando da base canônica. Como veremos, algumas vezes é conveniente trabalhar numa base diferente da canônica. 73 9.2.1 Representação dual Poderíamos também ter escolhido representar nossos vetores (na base canônica) por matrizes linha ~v = v1 v2 : Observe que o próprio conjunto das matrizes n m (para qualquer valor de m e n) com a de…nição usual de soma e multiplicação por escalar já forma um espaço vetorial. Ou seja, no procedimento acima estamos identi…cando um espaço vetorial com outro. Para com isso aproveitarmos as características algébricas já conhecidas do outro espaço (das matrizes). Neste processo podemos identi…car, ou representar, o vetor ~v com a matriz n 0 ou com a matriz 0 n. A representação n 0 é chamada de dual da representação 0 n (e vice-versa). Dada uma base ortonormal f^ ei g e as componentes de dois vetores nesta base ~v = v1 e^1 + v2 e^2 ; ~g = g1 e^1 + g2 e^2 ; o produto interno entre eles pode ser calculado como (~v ; ~g ) = (v1 e^1 + v2 e^2 ; g1 e^1 + g2 e^2 ) = v1 g2 (^ e1 ; e^2 ) + v1 g1 (^ e1 ; e^1 ) + v2 g1 (^ e2 ; e^1 ) + v2 g2 (^ e2 ; e^2 ) = v1 g1 + v2 g2 = 2 X vi gi : i=1 Na representação matricial esta igualdade toma a forma (~v ; ~g ) = v1 g1 + v2 g2 = v1 v2 g1 g2 = vT g onde vT é a transposta de v. Ou seja, podemos realizar o produto interno convencionando que o elemento a direita em (:; :) representa o vetor, enquanto o elemento a esquerda, representa o dual do vetor. 74 Recapitulando: 1. Partimos de um conjunto de objetos (setas) e de…nimos neste conjunto uma operação de soma entre os elementos e a multiplicação destes elementos por um número real. De…nimos assim um espaço vetorial V sobre os reais. 2. Em seguida selecionamos dois elementos ortogonais deste conjunto (duas setas que formam um ângulo de 90o ) e normalizados (setas de comprimento unitário) e formamos uma base ortonormal f^ ei g. 3. Passamos então a identi…car as setas com as suas componentes nesta base ~v 2 V : ~v ! fv1 ; v2 g. 4. Em seguida organizamos estas componentes em matrizes. E passamos a não mais olhar para o espaço original das setas, mas sim para o espaço das matrizes associadas a cada elemento ~v 2 V : ~v ! fv1 ; v2 g ! v. Dizemos com isso que estamos escolhendo uma representação matricial para o nosso espaço vetorial. 9.3 Mudança de base Como vimos anteriormente, a forma explicita das componentes do vetor dependem de qual base escolhemos. Se numa certa base f^ e1 ; e^2 g um vetor ~v tem componentes ~v = v1 e^1 + v2 e^2 numa outra base f^ e01 ; e^02 g ele terá outras componentes ~v = v10 e^01 + v20 e^02 Se você escolher uma certa base ortonormal f^ e1 ; e^2 g, como comparar suas quantidades com os de alguém que ecolheu outra base f^ e01 ; e^02 g? Ou seja, como vi se relaciona com vi0 ? Para saber isso basta lembrar que todos estes vetores formam uma base do espaço. Assim, podemos escrever e^1 = a11 e^01 + a12 e^02 e^2 = a21 e^01 + a22 e^02 onde, pela de…nição dos nossos coe…cientes de expansão (65), temos a11 = (^ e1 ; e^01 ), ou, de forma geral aij = e^i ; e^0j e^i = 2 X : aij e^0j = j=1 2 X j=1 75 e^i ; e^0j e^0j (70) Assim, se você tem um vetor qualquer ~v = v1 e^1 + v2 e^2 = 2 X vi e^i i=1 podemos usar (70) e escrever ~v = 2 X i=1 vi e^i = 2 X 2 X vi e^i ; e^0j e^0j = i=1 j=1 2 X 2 X vi e^i ; e^0j e^0j j=1 i=1 Ou seja, se vi são as componentes de ~v na base f^ ei g as componentes vi0 deste 0 mesmo vetor na base fei g são vj0 = 2 X vi e^i ; e^0j i=1 As quantidades e^i ; e^0j também podem ser organizadas numa matriz quadrada com linha i e coluna j. Esta matriz é chamada de matriz de mudança da base f^ eg para a base fe0 g. Vemos assim como é conveniente identi…carmos nossos vetores com matrizes. De forma geral, todas as quantidades com um único índice podem ser vistos como uma matriz coluna de 2 elementos e qualquer quantidade com dois índices como uma matriz 2 2. 9.4 Notação de Dirac Observe que estamos trabalhando com duas quantidades, os elementos do conjunto que formam o espaço vetorial V e os elementos do conjunto dos reais R. Por isso usamos uma notação especial para diferenciar os elementos destes dois conjuntos. No caso, uma seta sobre os vetores para as setas, ou um negrito para as matrizes. Poderíamos também usar letras gregas para vetores e romanas para números. O importante é sabermos, numa expressão, diferenciar os vetores dos números. A seta usada anteriormente nos lembra que estamos trabalhando com um conjunto de setas. Como queremos trabalhar com diferentes espaços vetoriais, vamos apenas introduzir uma notação mais abstrata e geral. Para diferenciar o número a 2 R de um vetor a 2 V , usaremos o seguinte símbolo: V 3a jai : Ou seja, colocar a letra dentro do símbolo (j i) acima, chamado de ket, apenas indica que esta quantidade é um vetor. Dentro da nossa representação matricial devemos identi…car jai com uma matriz a. Nesta representação podemos também de…nir o símbolo para o dual do vetor aT haj : 76 chamado de bra. Esta é a notação de Dirac. A vantagem desta notação é que ela nos permite representar diretamente o produto escalar dos vetores (b; a) como o produto de um vetor jai pelo dual de hbj (b; a) hbj jai hbj ai onde o símbolo h:j :i é chamado de braket (parênteses). Ou seja, a notação de Dirac divide o símbolo (:; :) em paren j) e teses (j que juntos formam um parênteses (esta foi a notação original que posteriormente mudou para h:j e j:i) 9.5 Operadores Podemos também realizar operações nos nossos vetores. Por exemplo, se nosso vetor é uma seta que aponta numa certa direção, você pode querer saber o que acontece com esta seta se ela for girada de um certo ângulo. Ou seja, queremos de…nir a operação de rotação nos nossos vetores. Se nosso vetor tem componentes v1 jvi = v2 Quais as novas componentes, ou novo vetor jv 0 i, se este vetor for girado no sentido anti-horário, de um ângulo . Como vimos na primeira parte do curso, na representação matricial, estas novas componentes se relacionam com as anteriores por v10 cos sin v1 jv 0 i = = ; v20 sin cos v2 ou ainda simbolicamente cos sin ^ jvi ; R ^= jv 0 i = R sin cos : ^ que nosso caso é uma matriz 2 2, é um operador no nosso espaço de R, vetores de dimensão 2. Ou seja, no nosso espaço vetorial 2 0 um operador é uma matriz 2 2. As componentes de matriz n n podem ser identi…cadas através de dois índices Rij . Na notação de Dirac um operador pode ser representado como Rij jii hjj Se encararmos jii como um vetor (uma matriz 2 0), vemos que a quantidade acima representa um “produto” entre o vetor jii e o dual do vetor jii. Ou seja, para dois vetores jai ; jbi 2 V , podemos de…nir dois tipos de produtos entre um e o dual do outro haj jbi jbi haj haj bi (produto interno) jbi haj (produto externo) 77 o primeiro, como vimos, é o produto interno. O segundo é chamado de produto externo, ou produto tensorial. Ou seja o produto tensorial leva um par de vetores em V (matrizes 2 0) em um elemento do espaço V V = V 2 (matrizes 2 2). Ou de um ket 2 0 com um bra 0 2 leva a 2 2. Lembrando que o conjunto das matrizes m n formam um espaço vetorial, este é uma mapa (ou uma relação entre espaços vetoriais). Este é o mesmo produto tensorial estudado na primeira parte do curso. Como vimos, a sua realização no espaço das matrizes pode ser feito através do produto de Kronecker. jbi haj = b1 = b1 b2 a1 a2 a1 a2 a1 a2 b2 = a1 b1 a2 b1 a1 b2 a2 b2 que é igual a matriz jji hij = bj ai (compare com a equação (1.11) da primeira parte do curso). Remark 17 Lembre-se que haj bi é um número, mas jai hbj é uma matriz. Na notação de Dirac, a atuação do operador jai hbj 2 V 2 num vetor jvi 2 V é de…nida como (jai hbj) jvi = jai (hbj jvi) = jai hbj vi 2 V Ou seja, a atuação do operador jai hbj no vetor jvi gerou um novo vetor que é o produto do vetor jai com o número hbj vi. Escrevendo jbi = b1 j^ e1 i + b2 j^ e2 i jai = a1 j^ e1 i + a2 j^ e2 i temos jai hbj = b1 a1 j^ e1 i h^ e1 j + b2 a1 j^ e1 i h^ e2 j + b1 a2 j^ e2 i h^ e1 j + b2 a2 j^ e2 i h^ e2 j = 2 X i;j=1 bi aj j^ ei i h^ ej j ou seja, se ai e bi são as componentes de jai e jbi então as componentes do produto tensorial jai hbj são ai bj na base (de V 2 ) j^ ei i h^ ej j. Todo o operador (matriz), pode ser decomposto nesta base. Em especial, a nossa matriz de rotação tem a forma ^= R 2 X i;j=1 Rij j^ ei i h^ ej j 78 (o chapéu indica que R é um operador), com Rij números reais. Com isso 0 1 ! 2 2 X X ^ jvi ! jv0 i = @ jv0 i = R Rij j^ ei i h^ ej jA vk j^ ek i i;j=1 = 2 X 2 X i;j=1 k=1 = 2 X 2 X i;j=1 k=1 = 2 X i;j=1 k=1 Rij j^ ei i vk h^ ej j j^ ek i Rij j^ ei i vk jk Rij vj j^ ei i Da mesma forma, na representação matricial, num espaço de dimensão N um vetor é uma matriz linha de N elementos e operadores são matrizes N N . 79 9.6 Autovalores e autovetores Uma relação entre operadores e vetores que é de especial interesse é quando a aplicação de um operador sobre um vetor resulta num vetor na mesma direção (i.e., proporcional) ao vetor original. Isso é, quando: ^ jxi = a jxi ; a 2 R ; jxi = M 6 0: ^ e que a é o autovalor Neste caso, dizemos que jxi é um autovetor do operador M do autovetor jxi. Por exemplo, se aplicarmos o operador P^ (que troca o eixo x por x, ou seja, coloca um espelho no nosso sistema) no vetor 0 1 jp1 i = teremos 1 0 P^ jp1 i = 0 1 0 1 0 1 = = jp1 i : Ou seja, o vetor jp1 i é um autovetor de P^ com autovalor 1. Já o vetor jp2 i = 1 0 1 0 ) 0 1 1 0 1 0 = = Assim, jp2 i é outro autovetor de P^ , mas com auto valor jp3 i = 1 1 ) 1 0 0 1 1 1 = 1 1 1 0 = jp2 i : 1: Já o vetor 6= a jp3 i então, jp3 i não é auto vetor de P^ . Da mesma forma, qualquer vetor é autovetor ^ ( ) com autovalor 1, pois de R ^ ( ) jxi = R 1 0 0 1 x1 x2 = x1 x2 = jxi ^ ( =2) não possui nenhum autovetor. Além disso, o operador R 9.6.1 Espaço euclidiano de dimensão …nita RN Apesar dos exemplos explícitos dados anteriormente envolverem apenas espaços bidimensionais, toda as discussões e de…nições apresentadas são igualmente válidas para um espaço com uma dimensão N arbitrária. Neste caso, obviamente, as somatórias devem ir até N . Por exemplo, num espaço de dimensão N existe uma base fjei ig ; i = 1; 2; 3:::; N que podemos escolher ortonormal e, qualquer vetor do nosso espaço pode ser escrito como j i= N X i=1 80 ci jei i : Onde ci são as componentes do vetor j i na base fjei ig. Na representação matricial, os vetores serão matrizes N 1, os duais matrizes 1 N e os operadores matrizes N N . Obviamente, neste caso, as di…culdades algébricas crescem com o valor de N , mas nenhuma di…culdade conceitual está envolvida neste processo. 9.7 Espaço de Hilbert Nosso objetivo aqui é obter uma generalização dos resultados da seção anterior. O primeiro ponto é lembrar que nossos vetores, e os números que multiplicam estes vetores, são todos reais. Assim, a primeira generalização que podemos fazer é de…nir um vetor num espaço de dimensão n é qualquer seqüência de números complexos 1 ; 2 ; :::; n ( i 2 C) e que nossos vetores podem se multiplicados também por números complexo j i+ j i=j i ; ; 2C com i = i + : i Até aqui nada mudou. O ponto agora é que devemos lembrar que se número complexo, podemos ter 2 <0 é um (e.g., para = i). Isso implica que a somatória do quadrado de números complexo não é uma quantidade positiva de…nida e, consequentemente, a norma de…nida anteriormente pode nos dar valores negativos. Não queremos ter vetores de norma negativa (isso é, na verdade, contra a de…nição do que é uma norma). Podemos resolver este problema lembrando que : 0; 8 2 C onde, além disso : =0) =0: Assim, podemos recuperar a característica de positividade da nossa norma se, no lugar de (??) de…nirmos o produto interno como h j i= 1 1+ 2 2 + ::: + n n = n X i=0i com isso temos, novamente, 2 j j =h j i= com 2 n X i i i=0 j j = 0 =) j i = 0 : 81 0 i i ; (71) A única diferença neste produto interno é que, no lugar da simetria, temos agora uma simetria conjugada ! n n n X X X h j i= =h j i: ( i i) = i i = i i i=0i i=0 i=0 Já para o produto externo entre os vetores j i e j i, temos agora duas opções. Podemos de…nir o operador ^ = j ih j M com componentes Mij = i j Ou podemos formar também o transposto conjugado do operador ^T ^+ = j ih j = M M com + Mij = i j = j i = (Mji ) ou seja ^+ = M ^T M : Da mesma forma, no que se refere a representação matricial, continuamos representando nossos vetores por matrizes coluna 0 1 1 B 2 C B C j i=B . C @ .. A n mas, para ser compatível com o produto interno (71), devemos de…nir o dual de j i, não apenas como o transposto, mas como o transposto conjugado h j= 1 2 n A segunda generalização que vamos fazer é permitir que a dimensão do espaço assuma qualquer valor, incluindo o in…nito. Ou seja, vamos admitir espaços com n = 1. Esta é, na verdade, a motivação deste desenvolvimento. Neste caso, obviamente não podemos mais representar nossos vetores por matrizes. Mas podemos continuar usando todas as expressões anteriores (fazendo n = 1). A grande diferença é que antes, bastava que cada elemento do nosso vetor estivesse bem de…nido (não fosse in…nito) e, certamente, todas as expressões também estariam bem de…nidas. Agora, para n = 1, pode acontecer de cada elemento do nosso vetor estar bem de…nido e, mesmo assim, não conseguirmos calcular quantidades como, por exemplo, o produto interno. Ou seja, agora precisamos exigir que as somatórias de…nidas anteriormente convirjam. 82 Por exemplo, podemos de…nir as componentes do nosso “vetor” como xk = 1 ; k2N k 1=2 Cada componente está bem de…nida. Em especial, para n ! 1 x1 = 1 1=2 (1) =0 Entretanto, se desejarmos calcular a norma deste “vetor” teremos4 2 jxj = 1 1 X X 1 1 1 = 1=2 1=2 k k k k=1 k=1 !1: E não podemos utilizar para estas componentes a noção de norma que é indispensável em todas as nossas análises. Destarte, se quisermos de…nir um espaço vetorial tratável, devemos exigir que os vetores do nosso espaço respeitem a restrição 1 X j kj < 1 : k=1 Ou seja, para nós agora, vetores são toras as seqüência, …nitas e in…nitas, sobre o corpo dos complexos, tal que a soma do módulo quadrado convirja. Um espaço vetorial de dimensão arbitrária (incluindo in…nito) sobre o corpo dos complexos onde (para todo elemento) está de…nido um produto interno é chamado de espaço de Hilbert. Todos os conceitos desenvolvidos anteriormente, incluindo a noção de ortogonalidade e base, são válidos no EH. A diferença é que agora a nossa base pode conter in…nitos termos. Um caso especial de espaço de Hilbert com dimensão in…nita é o espaço das funções de quadrado integrável. Neste caso, nossos vetores representam funções nos reais dentro de um certo intervalo. Ou seja, à função f (x) ; x 2 [a; b] corresponde a um vetor jf i 2 H onde jf i indica a coleção de todos os valores possíveis da função f (x), assim como j i indicava todos os valores de uma sequência k . Neste caso o “índice” que identi…ca estes valores (x) é um índice contínuo, ao invés do índice xk anterior que era discreto. Podemos facilmente generalizar os resultados anteriores trocando as somatórias dos índices discretos por integrais sobre os índices contínuos. Assim, o produto interno se torna: Z b n X h j i= f (x) g (x) dx : i i ! hf j gi = a i=0i 4 Lembre que diverge para s 1. 1 X 1 ns n=1 83 Novamente, para que o produto interno acima esteja de…nido, devemos exigir que hf j f i < 1 : O conjunto de todas as funções que respeitam a restrição acima é um espaço de Hilbert chamado espaço das funções de quadrado integrável no intervalo [a; b], ou L2 (a; b). Assim, daqui pra frente, quando escrevermos um vetor j i 2 H podemos estar falando de uma matriz coluna de tamanho N , de uma seqüência in…nita (x) dentro de um intervalo. Para todas estas k , ou mesmo de uma função quantidades as expressões anteriores são idênticas (a menos do produto interno das funções que envolve integrais e não somatórias). Por exemplo, para o espaço L2 ( ; ), podemos de…nir uma base ortonormal fjek ig dada pelas funções 1 ek (x) = p exp (ikx) 2 Exercise 18 Veri…que que estas funções pertencem ao espaço de Hilbert L2 ( ; Exercise 19 Veri…que que estas funções são ortonormais. Assim, para qualquer função f (x) ; x 2 [ ; ] o vetor correspondente jf i 2 H pode ser escrito como 1 X jf i = ck jek i k= 1 onde, por ser uma base ortonormal, 1 ck = hek j f i = p 2 Z exp ( ikx) f (x) dx e jf i representa a coleção de todos os valores da função 1 f (x) = p 2 1 X ck exp (ikx) k= 1 A decomposição acima, nesta base fjek ig é chamada de série de Fourie da função f . Como veremos, existem várias outras decomposições (i.e., outras bases) possíveis. 9.8 Operadores hermitianos Como vimos anteriormente um operador pode ser visto como o produto externo ^ é de…nido como de dois vetores j i e j i5 . Se um operador M ^ = j ih j M 5 Isso não é válido para todo operador. 84 ). ^ + será então, seu hermitiano conjugado M ^+ = j ih j M Para o caso do espaço de dimensão …nita, este operador é apenas o transposto ^ , mas a nomenclatura continua para o caso de dimenconjugado da matriz M são in…nita. Neste caso podemos imaginar nossos operadores como matrizes quadradas in…nitas. ^ jxi com o vetor jyi vale O produto interno do vetor jzi = M ^ jxi hyj zi = hyj M podemos eliminar o parênteses acordando que o operador sempre age no vetor a direita (o que é equivalente a acordar que o conjugado do operador age no dual ^ + jyi, mas basta convencionar do vetor a esquerda, hyj zi = hwj xi com jwi = M que ele age a direita). Com isso, temos ^ + jyi ^ jxi = hyj i h j xi = h j yi hxj i = hxj i h j yi = hxj M hyj M (72) onde usamos hyj i = h j yi : Um operador é dito simétrico, ou hermitiano se ^ =M ^+ ) j ih j = j ih j M ou seja, para espaços de dimensão …nita são matrizes cuja transposto conjugado é igual a ela mesma. Por exemplo, qualquer matriz na forma 1 0 a11 a12 a13 C B a12 a22 a23 C B C ; aii 2 R ; i = 1; 2; 3:: B a13 a23 a33 A @ .. .. .. .. . . . . Para operadores hermitianos a propriedade (72) fornece ^ jxi = hxj M ^ jyi : hyj M (73) Propriedades dos operadores hermitianos: Imagine agora que você encontrou um autovetor j i de um operador her^ com autovalor , ou seja, mitiano M ^ j i= M j i observe que estamos usando a mesma letra apenas por conveniência, mas enquanto j i 2 H. 85 2C Com isso a propriedade (73) acima fornece ^ jxi = hxj M ^ jyi =) hyj M ^ j i = h j j i = h jj i = h jM j i = h j j i = h jj i h jM Mas h j i=h j i com isso h j i= h j i como h j i= 6 0 ; h j i < 1, temos = ) 2R: Ou seja, todos os autovalores de um operador hermitiano são reais. Exemplo: Num espaço de dimensão 2 o operador ^2 = 0 i i 0 : (em MQ este é um dos operadores associados ao spin das partículas). É hermitiano. Vamos encontrar seus autovalores. O processo geral é o seguinte: Encontrar um autovetor signi…ca resolver a equação ^ j i= M ^ j i) M I j i=0: ^ A quantidade M I é um novo operador. Para um espaço de dimensão …nita, este operador é uma nova matriz. Vamos chamar esta nova matriz de ^ T^ = M I Nossa equação …ca T^ j i = 0 Se T^ é uma matriz inversível, podemos calcular T^ lados da expressão acima T^ 1 T^ j i = T^ 1 1 e multiplicar pelos dois 0)j i=0 ^ não terá Ou seja, se T^ é inversível, o vetor j i é único e vale j i = 0. Assim, M ^ ter autovetor é que T^ = M ^ autovetor. Portanto: A única forma de M I não tenha inversa. Para que uma matriz não tenha inversa, basta que ^ det T^ = det M 86 I =0: Para o nosso caso ^ = ^2 M Logo devemos exigir que det (^2 I )= 0 i i 0 1 0 0 1 = i i =0; ou seja, 2 ( i:i) = 2 1 = 0 =) 2 = 1 =) = 1: Vemos então que ^2 tem dois autovaloes 1 = 1 e 2 = 1 e, como esperado, ambos são reais. Suponha agora que temos dois autovetores de um operador hermitiano ^ j i= M ^ j i= j i ; M j i com 6= : Para estes vetores podemos calcular ^ j i=h j j i= h jM ^ j i=h j j i= h jM h jj i ; h jj i além disso, usando (72) temos ^ j i = h jM ^ j i =) h jM onde usamos que ; h j i= h j i= h j i 2 R. Com isso [ Se usarmos agora h j i= 6= ]h j i = 0 a igualdade acima implica h j i=0 Ou seja, autovetores correspondentes a autovalores distintos são ortogonais. O resultado acima fornece uma forma prática e bastante útil de encontramos bases ortogonais para um espaço qualquer. Bastando para isso encontrarmos operadores hermitianos neste espaço. Exemplo: Voltemos a nossa matriz 2 = 0 i i 0 Sendo esta matriz hermitiana, devemos esperar que seus auto vetores sejam ortogonais. Encontremos então estes autovetores. Voltando a equação de autovalores, i 1 ( 2 I) j i = 0 ) =0 i 2 87 sabemos que = 1. Para 1 i = 1 temos i 1 1 2 i 1 =0) i 1 =0 =0 2 2 Primeiro note que, se multiplicarmos a primeira equação por i 1 2 i temos =0 que é idêntica a segunda equação. Assim, na verdade, temos apenas uma equação e duas incógnitas. Isso nada mais é do que uma conseqüência do fato da matriz 1 i i 1 não possuir inversa (ou ter determinante nulo). Lembre-se que construímos os valores de impondo esta exigência. Assim, usando a única equação que temos i 1 2 =0)i = 1 2 Ou seja, o nosso autovetor tem a forma j +i 1 = i = 1 i 1 1 para qualquer valor 1 2 C. Isso é uma característica geral destes problemas. Para um sistema qualquer ^ exigindo de dimensão N , construímos seus autovalores de um operador M ^ que a matriz M I não tenha inversa. Isso faz com que, para estes valores de , tenhamos um sistema de N 1 equações para N incógnitas. Com isso sempre teremos uma parâmetro livre nos nossos autovetores. É a existência deste parâmetro que nos permite normalizar nossos vetores. Ou seja, escolhemos este parâmetro de forma que nossos vetores tenham norma 1. Com isso, o autovetor associado ao autovalor 1 vale + = +1 ; j +i = 1 i 1 : Da mesma forma, encontramos o autovetor associado ao auto-valor 1 i i 1 1 2 =0) 1 i 1 i + 2 2 = 1 =0 : =0 Onde já sabemos que podemos usar apenas uma destas equações. Assim, usando a segunda equação, i 1+ 2=0) i 1= 2 Ou seja, o autovetor associado ao auto-valor = 1 ;j i= 88 1 = 1 i 1 vale : Como vimos, uma vez que sejam ortogonais. De fato h +j i= + 6= 1 1 devemos esperar que os vetores j i 1 i 1 2 1j =j (1 iej +i 1) = 0 : Assim, fj + i ; j ig formam uma base ortogonal do nosso espaço. Podemos ainda normalizar esta base fazendo je i = p h j 1 = p ei 2 j i i 1 i = 1 p j 1j 1 + 1 ; 1 i 1 1 =p 2j 1 1j 1 i 2 R: Ou seja, a nossa normalização também está de…nida a menos de uma constante. Como veremos, os princípios da MQ nos permitem …xar arbitrariamente esta constante. Escolhendo o caso mais simples = 0 temos 1 je i = p 2 1 i Da mesma forma, podemos de…nir o vetor normalizado 1 je+ i = p 2 1 i estes vetores respeitam he+ j e i = 0 ; he+ j e+ i = he j e i = 1 e, consequentemente, formam uma base ortonormal do nosso espaço. Este resultado é geral. Para um espaço de Hilbert H de dimensão N qual^ neste espaço, os autoquer, inclusive in…nito, dado um operador hermitiano M vetores deste operador formam uma base deste espaço. Assim, qualquer vetor j i 2 H pode ser escrito como j i= N X ck j = k k=1 ki onde ^j M 9.9 ki j ki : Postulados da Mecânica Quântica Os estados de um sistema físico podem ser (completamente) representados por vetores (normalizados) no espaço de Hilbert. Ou seja, uma vez identi…cado o vetor em H que representa o nosso sistema, sabemos tudo que é possível saber sobre este sistema. 89 Na teoria de Schroedinger o sistema quântico é representado por uma função, chamada de função de onda. Uma exigência da interpretação probabilística da MQ é que estas funções de onda sejam normalizáveis e, consequentemente, possuam norma …nita Z 2 j (x)j dx < 1 : Ou seja, as funções de onda devem pertencer ao espaço de Hilbert L2 . Da mesma forma, na teoria de Heisenberg, os estados do sistema são representados por matrizes coluna. Pela mesma razão, estas matrizes têm de ser de quadrado somável. Ou seja, nesta teoria os estados do sistema são vetores no espaço de Hilbert RN . O postulado acima nos diz que qualquer teoria quântica trabalhará com vetores em algum EH. Escolher o espaço signi…ca escolher como os estados do sistema físico serão representados. Nos exemplos acima temos então a representação de Schroedinger e a representação de Heisenberg. Além disso, vetores que di…ram apenas por uma fase (global) representam o mesmo estado físico. Ou seja, o estado do sistema é representado por vetores em H a menos de uma fase. Assim, os vetores j i ; j 0 i = ei j i representam o mesmo estado físico do sistema. Isto está relacionado com o fato das quantidades …sicamente mensuráveis do sistema estarem relacionados com as médias, ou com o produto interno, dos vetores e os dois vetores acima fornecem o mesmo valor. h 0j 0 i i = h je ei j i = h j i Remark 20 É por isso que, no processo de normalização, podemos escolher arbitrariamente a fase dos vetores. Um ponto importante é observar que a fase referida acima deve ser global. Como vimos, na descrição quântica um sistema pode estar numa superposição de dois estados j i = a j 1i + b j 2i o estado acima é equivalente ao estado j 0 i = ei [a j 1i + bj 2 i] ; mas não é equivalente ao estado j 00 i = ei a j 1i + bj 2i A fase não-global presente no estado j 00 i gera fenômenos de interferência que permitem (…sicamente) distinguir este estado de j i. Uma vez preparado um sistema no laboratório, este sistema “será”um vetor no espaço de Hilbert. Precisamos agora saber como descrever (dentro da teoria) 90 a manipulação, a evolução temporal e as possíveis medidas que fazemos neste sistema. Quando um sistema no estado j i sofre qualquer tipo de modi…cação ele passa a ser descrito por um novo vetor j 0 i. Ou seja modi…cações no sistema são transições j i ! j 0i Estas transições podem ser descritas por operadores agindo em H, ^j i j 0i = M Assim, tudo que acontece com o sistema pode ser representado por um operador agindo em H. Um tipo muito especial destes operadores são exatamente as medidas que podemos fazer no sistema (e.g., sua energia), ou seja, o que podemos observar do sistema. Estas quantidades são chamadas de observáveis. Outro postulado da MQ a…rma que todo o observável corresponde a um operador hermitiano no espaço de Hilbert. Assim, se um sistema possui uma certa característica observável, por exemplo spin, existe um operador S^ agindo em H correspondente a este observável. Para entendermos melhor este postulado, precisamos ainda de um terceiro ^ é um operador (hermitiano) relacionado com um observável postulado: Se M m (i.e., m é o valor que o aparelho que mede esta quantidade pode marcar), e se no laboratório efetuarmos uma medida deste observável os únicos valores ^ (ou seja, o valor possíveis de se obter são os auto-valores do operador M ^ ). m marcado no aparelho é um autovalor de M Um exemplo disso já nos é conhecido. Voltemos para a teoria de Schroedinger e tomemos o operador hamiltoniano (45) ~2 2 r + V (x) : 2m Pela teoria de Schroedinger (baseada na mecânica analítica) sabemos que este operador está relacionado com o hamiltoniano do sistema, que por sua vez está (classicamente) relacionado com a energia do sistema. ^ é hermitiano? A primeira pergunta que surge é: Será que H Primeiramente é necessário dizer em qual espaço de Hilbert estamos trabalhando. Vamos escolher, por exemplo, uma partícula presa numa caixa de tamanho a. Ou seja, nosso EH é H = L2 (0; a). Dos resultados anteriores, sabemos que, se um operador é hermitiano, ele respeita a igualdade (73) ^ = H ^ jxi = hxj M ^ jyi : hyj M (74) Lembrando que estamos no espaço das funções e, consequentemente, nosso pro- 91 duto interno se realiza por uma integral, temos Z a Z a h i ^j i= ^ (x) dx = h jH (x) H (x) 0 0 Z a Z a ~2 d2 = + V dx 2m 0 dx2 0 onde e ~2 d 2 + V (x) 2m dx2 (x) dx (75) são dois estados quaisquer do nosso sistema, ou seja j i; j i 2 H : Já para o segundo termo de (74) temos Z a ~2 d 2 ^ j i= (x) +V (x) h jM 2m dx2 0 Z a ~2 d 2 = (x) +V (x) 2m dx2 0 Z a 2 Z a ~2 d = + V dx 2m 0 dx2 0 dx dx (76) Ser ou não hermitiano depende de (76) ser, ou não, igual a (75). Analisemos primeiro o último membro de cada igualdade. Para (76) temos Z a Z a (x) V (x) dx = (x) V (x) (x) dx 0 0 que, obviamente, é igual ao último termo de (75). Vejamos agora o primeiro termo de (75). Fazendo uma integral por partes temos Z a Z a a d d d d2 dx = dx 2 dx dx 0 0 dx dx 0 Z a 2 a a d d d = dx 2 dx 0 dx 0 0 dx Z a 2 a a d d d = + dx dx 0 dx 0 dx2 0 que (multiplicado por ~2 =2m) seria exatamente igual ao primeiro termo de (76) se não fossem os dois primeiros termos de fronteira. Devemos lembrar agora que nem todos os vetores em L2 (0; a) descreve um estado físico do nosso sistema. Em especial, para resolvermos o problema da partícula na caixa, tivemos de impor as condições de fronteira (0) = (a) = 0 : Ou seja, os vetores do nosso espaço não são todos os vetores em L2 (0; a), mas apenas os vetores 2 L2 (a; b) ; (0) = 92 (a) = 0 : Com esta imposição temos a d dx = d (a) dx d (0) = 0 dx = d (a) dx d (0) = 0 dx 0 a d dx 0 e, com isso, ^j i ^ j i = h jH h jH ^ é hermitiano. e o operador H Remark 21 Vemos agora como a imposição física de que a partícula não penetre nas paredes da caixa, se traduz no formalismo matemática da MQ como ^ seja uma exigência de que a energia do sistema seja um observável (i.e., que H hermitiano). Para sistemas mais complicados nem sempre é possível estabelecer as condições de contorno do sistema através de argumento físicos (como …zemos com a partícula na caixa). Assim o resultado acima é bastante prático e geral: as condições de contorno do sistema devem ser impostas de forma que os observáveis de interesse (no geral a energia) sejam hermitianos. Em seguida, no desenvolvimento do nosso problema, encontramos os autove^ tores de H, ^ n = En n H (ou seja, resolvemos a ES independente do tempo) e encontramos n e En . O que o postulado acima sobre os autovalores nos diz é que, numa medida da energia do sistema, podemos obter apenas um dos valores En acima. Lembre ainda que uma característica peculiar a MQ é que o sistema pode estar numa superposição de estados. Ou seja, nossa partícula na caixa pode estar, por exemplo, num estado (x) na forma (x) = a0 0 (x) + a2 2 (x) : O que o postulado sobre autovalores nos diz é que, mesmo num caso como este, ao medirmos a energia da partícula encontraremos apenas ou E0 ou E2 . Uma extensão do postulado acima a…rma que, se …zermos uma medida da energia e obtivermos o resultado E2 , isso garante que, após a medida, o sistema tem energia E2 . Ou seja, o estado após a medida não é mais o estado (x) acima, mas o estado 0 (x) 0 (x) = 2 (x) Dizemos assim que o sistema que estava numa superposição de ondas (ou num pacote de ondas) colapsou para uma das ondas do pacote. Este efeito é chamado de colapso da função de onda. 93 O fato de um sistema poder existir numa superposição de vários estados possíveis, mas apresentar (colapsar para) apenas um destes estados quando uma medida é feita, dá origem a pergunta: se o sistema está num certo estado qual a probabilidade de, numa medida deste sistema, ele ser encontrado no estado . ^ representa o operador de momento angular do Por exemplo, suponha que L sistema. Num certo instante o sistema é preparado no estado j i = a1 j (com ai conhecidos) onde 1i ^j L + a2 j ni 2i = ln j + a3 j ni 3i ; : Se efetuamos uma medida do momento angular e obtivermos o valor l = 2 sabemos que, após esta medida, o sistema estará no estado j 2 i. Assim, a pergunta acima seria: qual a probabilidade do sistema no estado j i ser encontrado no estado j 2 i. A resposta para esta pergunta é mais um postulado da MQ. Se um sistema se encontra num determinado estado, dado por um vetor j i, a probabilidade de que este sistema seja encontrado num estado j i é dado por: PN R 1i=1 2 jh j ij = 1 i i (x) : (x) dx Por exemplo,voltemos ao estado que uma superposição dos estados de momento ângular j i = a1 j 1 i + a2 j 2 i + a3 j 3 i : Qual a probabilidade de numa medida deste sistema ele ser encontrado no estado de momento angular j 2 i? Este valor é dado por: jh 2j 2 ij = jh 2 j (a1 = j(a1 h 2 j 1i + a2 j 2i j 1i + a2 h 2 j + a3 j 2i 2 3 i)j + a3 h 2 j 2 3 i)j Entra aqui o fato (já visto) que os autovetores de um operador hermitiano são ortogonais, com isso (lembrando que nossas funções estão normalizadas) jh 2j 2 ij = jh 2 j (a1 = ja2 h 2 j j 1i 2 2 ij + a2 j 2i 2 + a3 j 2 3 i)j = ja2 j : Um outro fato, que vamos aceitar sem provar (isso não é um postulado), é que, além de ortogonais, os autovetores de um operador hermitiano forma uma ^ é um operador hermitiano, com autovetor j n i base do espaço. Ou seja, se M e autovalor mn , ^ j n i = mn j n i M 94 qualquer estado do nosso sistema pode ser escrito como: X j i= cn j n i ; n Além disso, sendo a nossa base ortonormal sabemos que cn = h n j i =) jh 2 n 2 j ij = jcn j 2 ^, e jcn j é, no caso geral, a probabilidade de, numa medida do observável M obermos o valor mn . Vemos assim que o signi…cado físico dos autovetores de um operador hermitiano serem ortogonais está relacionado com o fato de que, se …zemos uma medida obtemos apenas um valor. Ou seja, se após uma medida obtivermos o valor j 2 i a probabilidade de, após esta medida, o sistema ser encontrado no estado j 3 i deve ser nulo: h 3 j 2i = 0 : E o fato destes vetores j n i formarem uma base signi…ca que nosso sistema pode, em princípio assumir qualquer valor do observável, com uma certa probabilidade 2 jcn j . Além disso, o fato de operadores hermitianos terem apenas autovalores reais está relacionado com medidas nos darem apenas valores reais. Dada uma in…nidade de cópias idênticas do sistema, podemos nos perguntar sobre o valor médio de algum observável. Ou seja, pegamos uma in…nidade de exemplares desta coleção de sistema, efetuamos em cada um a medida de um certo observável M e tiramos a média deste valor para obter hM i. Esta quantidade é também chamada de valor esperado do observável. Classicamente, se cada exemplar do nosso sistema tem uma probabilidade Pi de que o observável M forneça o valor mi , esta média pode ser calculada como X hM i = P i mi i somado para todos os valore mi possíveis do observável M . No caso de m ser uma variável contínua, temos Z hM i = mP (m) dm onde P (m) é a probabilidade do sistema ter o valor medido entre m e m + dm. O próximo postulado da MQ a…rma que, se o sistema está no estado j i, o ^ é dado por: valor esperado de observável M Z 1 ^ ^ (x; t) dt : hM i = h j M j i = (x; t) M (77) 1 Esta expressão está diretamente relacionada a noção clássica de média. Sendo ^ um observável, podemos escrever: M X j i= ci j i i i 95 onde ^ j i i = mi j i i M Substituindo em (77) temos 2 3 " # X X XX ^ ^ 4 5 h jM j i = h j j cj M ci j i i = cj ci h j = XX j = X i i i cj ci h j j mi 2 jci j mi = X j ii = XX j j i mi cj ci ^ j ii jj M ij i Pi mi i 2 onde usamos que jci j é a probabilidade de se obter o valor mi numa medida de ^. M O ponto importante deste postulado está no fato de geralmente, em experiências, não estamos tratando apenas com uma entidade, mas sim uma coleção destas entidades. Por exemplo, uma corrente de elétrons, um feixe de laser (vários fótons), ou um feixe de partículas. Assim, o que nossos aparelhos registram pode não ser o valor possível do observável, mas sim uma média destes valores. Com isso, o valor esperado de um observável quântico está diretamente relacionado com o limite clássico no valor deste observável. Ou seja, se temos um feixe de partículas (e.g., elétron) no estado j i = c1 j 1i + c2 j 2i onde ^ j i i = Ei j i i H são autoestados da energia, se medirmos a energia do feixe (não de um único elétron) nosso aparelho clássico mostrará o valor ^ j i = E1 jc1 j2 + E2 jc2 j2 : E = hHi = h j H Nosso último postulado diz respeito a evolução temporal do sistema. E a…rma que: a evolução temporal de um sistema dado por uma função de onda (x; t) é dado pela equação de Schroedinger i~ @ ^ =H @t ^ = ; H ~2 2 r + V (x) 2m Este postulado pode ser convertido na linguagem de operadores agindo em H e, com isso, generalizado para qualquer descrição quântica (e.g., Heisenberg). ^6 Para isso basta introduzirmos o chamado operador de evolução temporal U ^ (t) = exp U 6 Este i ^ Ht ~ ^ não depende do tempo. é o caso especial em que H 96 ^ é o hamiltoniano do sistema e onde H i ^ Ht ~ exp = X 1 n! n i ^ Ht ~ i ^ tH ~ =1 1 2 ^2 t H + ::: 2~2 ^ n é a aplicação de n vezes o operador H. ^ Com esta ou seja, cada termo H ^ temos de…nição de U ^ (t) j 0 i j ti = U onde j 0 i é o vetor (estado) do sistema no instante inicial e j instante t posterior. Usando a ES temos i @ j @t ti =i @ ^ U (t) j @t 0i =i ^ (t) @U j @t 0i @ exp @t =i ti seu estado num i ^ Ht ~ j 0i j 0i usando @ exp @t @ X 1 i ^ Ht @t n! ~ @ i ^ 1 2 ^2 1 tH t H + ::: @t ~ 2~2 i ^ 1 ^2 H tH + ::: ~ ~2 i ^ 1 ^ H 1 tH + ::: ~ ~ i ^ i ^ H exp Ht ~ ~ n i ^ Ht ~ = = = = = temos i @ j @t ti =i @ exp @t 1 ^ H exp ~ 1 ^ j ti = H ~ = ou seja, o vetor j ti i ^ Ht ~ j i ^ Ht j ~ 0i 0i i ^ H exp ~ =i i ^ Ht ~ obedece a equação i~ @ j @t ti ^j =H ti : Por exemplo. Suponha que num instante inicial o sistema com hamiltoni^ está preparado estar no estado (x; 0) dado por ano H 1 (x; 0) = p [ 2 1 97 (x) + 2 (x)] ; onde ^ H i = Ei i : Qual o estado do sistema num instante t posterior? Neste caso, como temos ^ podemos apenas a condição inicial escrita em termos dos autovetores de H, aplicar o operador de evolução temporal ^ (t) (x; t) = U 1 (x; 0) = p 2 i ^ Ht ~ exp 1 (x) + exp i ^ Ht ~ 2 (x) o importante aqui é observar que exp n X 1 i ^ H i (x) = n! ~ i ^ 1 2 ^2 = 1 tH t H + ::: ~ 2~2 1 2 2 i tEi t Ei + ::: = 1 ~ 2~2 i = exp Ei t i (x) ~ i ^ Ht ~ i (x) = i (x) i (x) 2 (x) com isso 1 (x; t) = p 2 exp i E1 t ~ 1 (x) + exp i E2 t ~ : Com o exemplo acima podemos ver porque geralmente não precisamos resolver a equação de Schroedinger dependente do tempo, mas apenas a indepen^ Neste caso a dente (i.e., apenas encontrar os autovalores e autovetores de H). ^ Ou di…culdade se transfere em decompor o estado inicial nos autovetores de H. seja, se o sistema está num estado inicial (x; 0) precisamos escrever X (x; 0) = cn n (x) ; o que equivale a calcular cn = h nj i= Z n (x) (x) dx Temos assim a opção de resolver uma equação diferencial parcial (a ES dependente do tempo), ou calcular as in…nitas integrais acima. Resumindo nossos postulados temos: 1. O estado de um sistema físico é completamente descrito por um vetor (normalizado) no espaço de Hilbert. E vetores que di…ram apenas por uma fase representam o mesmo estado físico; 2. A todo o observável esta relacionado um operador hermitiano; 98 ^ pode fornecer apenas autovalores deste 3. Uma medida do observável M operador e, após uma medida em que se obteve o valor mn o sistema estará no estado n . 4. Se o sistema se encontra no estado j i, o valor médio de um observável ^ é dado por: M Z ^ ^ (x; t) dt : hM i = h j M j i = (x; t) M 5. A evolução temporal de um sistema no estado inicial j 0 i é dado por (no ^ (t)) caso geral de H Z i ^ dt ^ (t) = exp H j t i = U (t) j 0 i ; U ~ que é equivalente a ES i~ 9.10 @ ^ =H @t : O operador de momento Vejamos agora alguns operadores hermitianos e a que observáveis estes estão associados. Um caso já visto é o operador hamiltoniano, cujos autovalores correspondem a energia do sistema. Se introduzirmos agora o operador p ^= i~r podemos escrever ^ = H ~2 2 r + V (x) 2m como 2 ^ = p^ + V (x) H 2m Que, comparando com a forma clássica do hamiltoniano justi…ca chamar p^ de operador de momento. Ou seja, seus autovalores estão associados com o momento que a partícula pode assumir. Obviamente a semelhança com a forma clássica do hamiltoniano não é a única justi…cativa para isso. Uma partícula livre, que pode se mover em todo espaço, é descrita quanticamente pela onda plana (x) = N exp (ikx) Lembrando que, por de…nição, o comprimento de uma onda é a distância para a qual ela volta a assumir o mesmo valor, o comprimento de onda do estado acima pode ser calculado como (x) = (x + ) ) exp (ikx) = exp (ik (x + )) ) exp (ik ) = 1 99 com isso k =2 )k= 2 : A aplicação do operador de momento neste estado fornece p^ = i~ d N exp (ikx) = k~N exp ( ikx) = ~k dx Ou seja, o estado acima é autovetor de p^ com autovalor ~k. Se usarmos agora k = 2 e a relação de De Broglie p = h= temos p^ = k~ = k h 2 = 2 h 2 = h =p Ou seja, a relação de De Broglie nos permite associar os autovalores do operador d p^ = i~ dx com o valor do momento do sistema clássico. 100 Como era de se esperar por argumentos clássicos, apenas partículas livres tem um valor de momento bem que não se altera com o tempo. Mesmo a partícula numa caixa tem seu momento alternado e, conseqüentemente, os autovetores de energia da partícula na caixa não são autovetores do momento. O fato do sistema estar num estado que é autovetor de um operador qualquer ^ signi…ca que a aplicação de M ^ não altera o estado do sistema. Ou seja, assim M que efetuamos esta operação o sistema estará num estado ^ j i = mj i j 0i = M Mas para ser um estado legítimo j 0 i precisa ser normalizado e, uma vez que j i já estava normalizado, j 0i = j i : Se lembrarmos agora que a aplicação do operador é a descrição quântica da medida do observável, vemos que se o sistema está num auto-estado de um operador qualquer, podemos fazer a medida deste observável sem perturbar o sistema (ou seja, após a medida o sistema colapsa para o próprio estado). Dizemos com isso que o sistema possui esta quantidade bem de…nida. ^ Isso porque, se o sistema estiver num estado j i que não é autovetor de M ao aplicarmos o operador o sistema irá colapsar para um estado j 0 i = 6 j i e a aplicação do operador (ou a medida da quantidade) perturbou o sistema, de sorte que não temos mais acesso ao sistema original. Além disso, o valor obtido corresponde apenas a uma, dentre várias, probabilidade de se obter os valores deste observável. Agora, quando o sistema está num autovalor de um operador, podemos sempre medir o observável correspondente sem perturbar o sistema e, pelos postulados introduzidos, obteremos sempre o mesmo valor deste observável. 9.11 Quantização Com a introdução do operador de momento, podemos de…nir um outro processo de quantização completamente compatível com a quantização de Schroedinger (ou seja, o procedimento que nos permite identi…car o hamiltoniano clássico H ^ com o operador H). Dado um hamiltoniano clássico H (p; x) = p2 + V (x) 2m podemos quantizar este hamiltoniano fazendo p!p ^ = i~r ; x!x ^=x; onde a última igualdade indica que o operador x ^ é simplesmente a multiplicação por x, ou seja x ^ (x0 ) = x0 (x0 ) : 101 ou seja, para qualquer função f f (^ x) = f (x) : Com isso p^2 ^ (^ H (p; x) ! H p; x ^) = + V (^ x) = 2m ~2 2 r + V (x) : 2m que é o hamiltoniano quântico obtido na teoria de Schroedinger. Este procedimento de quantização permite quantizar qualquer quantidade clássica que dependa da posição e do momento, por exemplo, o operador de momento angular pode ser obtido através do momento angular clássico L = x p, fazendo ^=x L=x p!L ^ p ^: Em componentes, ^ i = "ijk x Li = "ijk xj pk ! L ^j p^k = "ijk xj i~ @ @xk = i~"ijk xj @ @xk ou ^= L i~x r Vamos, por exemplo, calcular o momento angular de uma partícula livre, ^ i N exp (iki xi ) = N L i~"ijk xj @ @xk exp (iki xi ) @ (ikj xj ) @xk @xj = N ( i~"ijk xj ) exp (iki xi ) ikj @xk = N ( i~"ijk xj ) exp (iki xi ) ikj jk = N ( i~"ijk xj ) exp (iki xi ) ikk = N ("ijk xj (~kk )) exp (iki xi ) = N ("ijk xj (pk )) exp (iki xi ) = N ( i~"ijk xj ) exp (iki xi ) ou seja, para a partícula livre, ^ =x L p (onde p não é mais um operador, mas o momento clássico). Assim, para uma partícula quântica livre o momento angular é uma quantidade bem de…nida é tem o mesmo valor esperado classicamente. É importante notar que nem todos os observáveis podem ser quantizados pelo procedimento acima. Existem quantidades, por exemplo, o spin, que não se relacionam com os operadores p^ e x ^. Quando isso ocorre dizemos que este observável só existe na MQ, ou ainda, que este observável não possui um análogo clássico. 102 9.12 O problema do ordenamento Um dos problemas que surge no processo de quantização acima (e, de uma certa forma, em todos os processos de quantização), é o chamado problema do ordenamento. Dado um observável clássico que envolva o produto (o momento angular é um exemplo) xp ; quanticamente podemos associar a este observável os operadores ^ =x ^ 0 = p^x M ^p^ ; M ^ onde ^0 M = p^x ^ = ^ =M d x = i~ dx ^ i~ i~ = M i~ i~x d dx = i~ + x ^p^ ou ainda ^0 = M ^ M i~ Ou seja, os dois operadores acima dizem respeito a mesma quantidade clássica xp. Isso ocorre porque, diferente da MC, na MQ os observáveis não são números, mas sim operadores. Assim, para um observável clássico pode estar relacionado mais de um operador quântico. Um ponto a se observar é que, assim como no exemplo acima, no problema de ordenamento os operadores sempre diferem por uma quantidade proporcional a ~n . Lembrando que uma das formas de tomarmos o limite clássico do nosso ^ eM ^ 0 possuem o mesmo sistema é fazer ~ ! 0, vemos que os dois operadores M limite clássico. Assim, teorias quânticas que di…ram por um problema de ordenamento possuem o mesmo limite clássico. Ou de outra forma, para o mesmo sistema clássico podemos ter várias teorias quânticas diferentes. Entretanto, apesar de todas terem o mesmo limite clássico, estas teorias podem gerar resultados puramente quânticos (e.g., supercondutividade) bastante diferentes. 9.13 Observáveis compatíveis Uma questão crucial em MQ é quando uma medida perturba o sistema, ou ainda, quando um observável tem um valor bem de…nido. Como vimos, para que a medida de uma quantidade A^ não perturbe o sistema, este deve estar ^ Assim, A^ não irá perturbar um sistema que esteja num num auto-estado de A. auto-estado A^ j i = a j i : Suponha agora que, depois de efetuada uma medida de A^ desejamos efetuar ^ Isso só será possível, sem perturbar o uma medida de outro observável B. 103 sistema, se o vetor obtido após a aplicação de A^ em j ^ ou seja, se autovetor de B, ai também for um ^ A^ j i = b0 A^ j i = b0 a j i = b j i ; b = b0 a B ou seja, j ai ^ tem de ser simultaneamente autovetor dos dois operadores A^ e B. A^ j i = a j i ^ j i = bj i B Mas, se isso é verdade, temos ^ j i = ab j i A^B ^ A^ j i = ba j i = ab j i B ou ainda h ^ A^B i ^ A^ j i = 0 B ^ Para qualquer auto-vetor simultâneo de A^ e B. ^ A quantidade acima é chamada de comutador entre os operadores A^ e B h i ^ B ^ = A^B ^ B ^ A^ : A; ^ temos Além disso, se todo o autovetor de A^ for também autovetor de B h i ^ B ^ j n i = 0 ; A^ j n i = n j n i A; e sabemos que qualquer vetor pode ser escrito como X j i= cn j n i n temos que h iX i h ^ B ^ j i = A; ^ B ^ cn j A; n ni = X n h i ^ B ^ j cn A; ni =0 h i ^ B ^ = 0 para qualquer vetor j i do nosso espaço, então A^ Ou seja, se A; ^ tem uma base de auto-vetores em comum. Mais ainda, podemos efetuar e B medidas de um dos operadores sem alterar o valor do outro. (Podem ser medidos simultaneamente) Ou ainda, os dois observáveis podem ser medidos simultaneamente. Quando h i ^ B ^ =0 A; ^ comutam, ou ainda, que estes observáveis são compatíveis. dizemos que A^ e B 104 Remark 22 Apenas observáveis compatíveis podem ser medidos simultaneamente em MQ. Por exemplo: Para uma partícula livre, os operadores de momento e energia são 2 ^ = p^ ; p^ = i~ d H 2m dx calculando os comutadores temos h i 2 2 ^ p^ = H ^ p^ p^H ^ = p^ p^ p^ p^ = 1 p^2 p^ p^p^2 = 1 p^3 p^3 = 0 H; 2m 2m 2m 2m Assim, para qualquer partícula livre (x) (não só para os autoestados de p^ e ^ H) h i ^ p^ (x) = 0 H; e o momento e a energia podem ser medidos simultaneamente. Além disso, todo ^ e também auto-vetor de p^. auto-vetor de H Exercise 23 Explique por que para o problema de uma partícula numa caixa ^ não são auto-vetores de p^. os auto-vetores de H Segundo exemplo: Como vimos, os operadores de momento e posição são dados por d ; x ^=x p^ = i~ dx calculando os comutadores temos [^ x; p^] (x) = x ^p^ (x) =x = = p^x ^ (x) d dx d i~ x dx d [x (x)] dx dx d (x) + x dx dx i~ i~ [ Ou seja, para qualquer função (x) i~ (x)] = i~ (x) (x) [^ x; p^] = i~ E, consequentemente, momento e posição não podem ser medidos simultaneamente. O que já sabíamos pelo princípio da incerteza de Heisenberg. Os resultados acima nos dizem quando devemos esperar uma incerteza relacionada a medida de dois observáveis quaisquer. Por exemplo, podemos efetuar uma medida da posição da partícula na direção x e medirmos o seu momento na direção y, pois [^ x; p^y ] = i~ x; @ @y = i~ x @ @y 105 @ x @y = i~x @ @y @ @y =0 logo [^ x; p^y ] = 0 ; ou ainda [^ xi ; p^j ] = i~ ij ; da mesma forma [^ xi ; x ^j ] = [^ pi ; p^j ] = 0 : 106 Um exemplo mais fácil de visualizar é o caso do spin da partícula. Classicamente U= B Força F = r( B) Para B = B z^ F = r( z B) = z @B @z O momento magnético sofre um torque = B O torque o faz precessionar (Einstein–de Haas). Assim, um feixe de partículas clássicas com todas as orientações de momento magnético seria espelhado continuamente. Se efetuarmos uma medida do spin de uma partícula de spin 12 em qualquer direção, obteremos sempre os valores +1 ou 1, ou seja, a partícula tem o spin na direção medida, ou contrária a esta direção. Esta medida pode ser realizada através de um experimento de Stern-Gerlach que consistem em passar a partícula por um campo magnético não uniforme e esta partícula se deslocará para cima se seu spin for +1 e para baixo se for 1. j+i ; j i j i = c1 j+i + c2 j i Lembre que j i é um vetor no espaço de Hilbert. Este espaço possui dois elementos na base e, consequentemente, tem dimensão 2. Mas para trabalhar precisamos de uma representação para esta quantidade. Neste caso temos uma total liberdade na escolha desta representação e, em especial, na base desta representação. Vamos então escolher uma direção, por exemplo z, é dizer que j+i é o spin nesta direção e j i na direção contrária. Para deixar isso mais explicito, vamos mudar a notação j i ! jz i Como nosso espaço tem dimensão 2 podemos escolher qualquer matriz (normalizada) para representar o nosso estado, a escolha mais simples é jz+ i = 1 0 e para jz i um vetor normalizado ortogonal a jz+ i jz i = 107 0 1 Sabemos que existe um operador, que é uma matriz 2x2 relacionada ao spin. Ou seja, seus autovalores são os possíveis valores do spin. Pela de…nição dos vetores acima temos: jz+ i = +1 jz+ i jz i = 1 jz i 3 3 Com isso, podemos escrever 3 1 0 = 0 1 O operador de spin na direção z é apenas de…nido proporcional a este operador com constantes que acerte as unidades ~ S^3 = 2 3 Por razões não podemos esclarecer agora (esta é a teoria de Pauli que veremos na segunda parte do curso), os operadores de spin nas direções x,y,z são dados por: ~ S^i = 2 i ; 1 = 0 1 1 0 ; 2 = 0 i i 0 ; 3 = 1 0 0 1 : Vamos então à descrição de uma série de medidas do spin de uma partícula. Suponha que você alinhou o aparato de SG na direção z, ou seja, efetuou uma medida de S^3 e obteve o valor +1 (a partícula subiu). Com isso, pelos postulados vistos, sabemos que a partícula, após a medida, está num auto-estado de S^3 com valor +1: 1 jz+ i = : 0 Exercise 24 Veri…que que este estado é auto-estado de S^3 com autovalor +1. Suponha agora que, depois desta medida, você alinha o aparato da direção x efetua uma nova medida. Qual a probabilidade de você obter o valor +1 novamente? Bem, após esta segunda medida o sistema irá colapsar num dos autovetores de S^1 1 1 1 1 ; jx i = p : jx+ i = p 1 1 2 2 Exercise 25 Veri…que que estes vetores são autovetores de S^1 com auto valor +1 e 1. 108 A questão é a seguinte: você sabe que o seu sistema está no estado jz+ i (pois você mediu o spin na direção z) e que saber, por exemplo, a probabilidade de, numa medida do spin na direção x obter o valor +1. Pelos postulados vistos anteriormente, sabemos que a probabilidade P (x+ ) encontrar o sistema no estado jx+ i sabendo que ele está no estado jz+ i vale 2 1 P (x+ ) = jhx+ jz+ ij = 1 p 2 0 2 1 1 = 1 2 Da mesma forma 1 2 ou seja, você tem uma incerteza total na medida do spin na direção x. (Depois da medida em x) Agora, se você efetuou a medida na direção x (do estado jz+ i) e obteve o valor +1 (a partícula foi para a direita), você sabe que após a medida a partícula está no estado 1 1 jx+ i = p 1 2 2 P (x ) = jhx jz+ ij = Se você …zer novamente uma medida do spin na direção z, a probabilidade de obter novamente +1 vale 1 2 P (z+ ) = jhz+ jx+ ij = p 2 1 2 1 0 1 1 2 = Da mesma forma P (z ) = 1=2. Ou seja, após a medida na direção x você perdeu toda a informação do spin na direção z. Uma forma clara de ver isso é notando que 1 jx+ i = p 2 1 =p 2 1 1 1 0 + 1 1 = p jz+ i + p jz i 2 2 0 1 E uma partícula no estado jx+ i tem 50% de chance de apresentar, numa medida do spin da direção z, o valor +1 e 1. O ponto aqui é que a medida de um dos observáveis perturbou o valor do outro. Ou seja, não podemos medir, simultaneamente, Sx e Sz . Isso já era de se esperar pelo resultado anterior, pois estes operadores não comutam: h i ~ S^x ; S^z = 2 2 ~ = 2 0 1 0 1 1 0 ; 1 0 ~ 2 1 0 = 0 1 i ~2 2 109 = 0 i ~ 2 i 0 2 0 2 = 2 0 i ~2 S2 6= 0 2 9.13.1 Relações de incerteza Uma quantidade clássica muito usada para caracterizar a incerteza de uma medida A é o desvio quadrado médio 2 A 2 = A2 hAi Pelos postulados da MQ sabemos que, o valor médio de um observável A^ num estado vale hAi = h j A^ j i e a versão quântica para o desvio padrão pode ser escrita como 2 A ( ) = h j A^2 j i 2 h j A^ j i se …zemos A^ = A^ h j A^ j i podemos escrever 2 A ( ) = h j A^2 j i Exercise 26 Veri…que a a…rmação acima. ^ Considere agora dois observáveis A^ e B. Um resultado conhecido como desigualdade de Schwarz nos diz que para qualquer operador A^ e qualquer vetor j i (não necessariamente normalizado) ^2 j i h j A^2 j i h j B ^ j i h j A^ B 2 com isso temos 2 A ( ) 2 B ^2 j i ( ) = h j A^2 j i h j B ^ j i h j A^ B 2 (78) ^ nem sempre o será. Além disso, apesar de serem hermitianos, o produto A^B Com isso a quantidade 2 2 A( ) B( ) será, em geral, complexa h i2 h i2 2 ^ j i = Re h j A^ B ^ j i ^ j i h j A^ B + Im h j A^ B h ^ j i Im h j A^ B (79) Podemos agora calcular ^ j i ^ j i = 1 h j A^ B Im h j A^ B 2i ^ j i h j A^ B Mas, ^ j i = h j A^ B ^ h j A^ B + ^ + A^+ j i = h j B ^ A^ j i j i = h jB 110 i2 ^ Com isso onde, na última igualdade, usamos a hermiticidade de de A^ e B. ^ j i = 1 h j A^ Im h j A^ B 2i 1 = h j A^ 2i h 1 h j A^ = 2i usando h temos ^ A^ ; B i h = A^ ^ j i B ^ B ^ A^ B ^ ;B ^ h j A^ j i ; B ^ A^ j i h jB i j i j i i h i ^ j i = A; ^ B ^ h jB h i ^ j i = 1 h j A; ^ B ^ j i Im h j A^ B 2i Usando (78), (79), (80) temos 2 A 2 B ( ) ( ) ^ j i h j A^ B 2 h ^ j i Im h j A^ B i2 (80) = h i 1 ^ B ^ j i h j A; 2i Com isso h i 1 ^ B ^ j i h j A; 2 ou seja, o produto da incerteza de qualquer medida é proporcional ao comutador dos operadores correspondentes. Para o caso especial de posição e momento temos A ( ) B ( ) [^ x; p^] = i~ ) x p( ) ~ 2 que é a relação de incerteza de Heisenberg. 9.14 O oscilador harmônico São incontáveis os sistemas e aplicações em física que podem ser modelados pelo problema do oscilador harmônico (OH). Uma das razões para isso é que um potencial V (x) qualquer (dado por uma função analítica) sempre pode ser expandido em sua série de Taylor V (x) = V0 + dV dx x+ x0 1 d2 V 2 dx2 x2 + x0 1 d3 V 3! dx3 x3 + :::: x0 Além disso, em muitos problemas em física estamos interessados no comportamento do sistema perto da condição de equilíbrio. Nesta condição dV dx =0 x0 111 2 : e nosso potencial se torna 1 2 kx + O x3 2 d2 V k= dx2 x0 V (x) = onde usamos que uma constante no potencial não altera o comportamento do sistema. Assim, próximo do equilíbrio, qualquer potencial pode ser aproximado por um OH. Vamos introduzir os seguintes operadores diferenciais lineares ^ L p^ = 1 ~2 d 2 + m! 2 x ^2 ; 2m dx2 2 ^ = H i~ d dx ^ = D (^ p) = D H ; 0 2 L2 ; a:c: ^ é o operador hamiltoniano de um oscilador harmônico. A solução do aqui H problema quântico se obtém pela solução da ES estacionária, i.e., através da ^ solução do problema de autovalores de H, ^ H =E =) ~2 d 2 1 ^2 + m! 2 x 2m dx2 2 =E Esta equação não é nada simples de se resolver. Vamos tentar então um método alternativo. Primeiro observe que, para qualquer função 2 D (^ p) temos x^ p p^ (x ) = x i~ d dx d dx d = i~x dx = i~ = i~x i~ + i~ d dx (x ) d (x ) dx + i~ ( ) + i~x d dx (81) Se usarmos a notação x^ p p^ (x ) = [x^ p p^x] [x; p^] ; onde [x; p^] [x^ p p^x] é chamado o comutador de x com p^, lembrando que o operador atua em tudo que estiver a sua direita e que (81) é válida para toda função , podemos escrever simbolicamente [x; p^] = i~ (82) 112 ou seja, sempre que aparecer o comutador entre x e p^ podemos substituir por i~. Lembre que a quantidade acima é um operador enquanto a quantidade à direita da igualdade é um número. Remark 27 Assim, esta igualdade só faz sentido quando ambos os lados atuam numa função qualquer. Vamos agora de…nir os seguintes operadores diferenciais a ^= p x= 2 1 p x+ i^ p m! + 2 r m! = ~ a ^+a ^ ; a ^+ = p ; p^ = i~ p 2 i^ p m! x a ^+ 2 a ^ (83) Com estes novos operadores o Hamiltoniano pode ser escrito como (veri…que): 2 (^ a+ a ^) 1 1 2 + m! 2 a ^+a ^+ 2 2m 2 22 i 1 h 2 2 ^+a ^+ a ^+ a ^ = !~ a 4 1 h 2 2 = !~ a ^ +a ^a+ + a+ a ^ + a+ a ^2 a ^a+ 4 1 ^a+ + a+ a ^ = !~ a 2 ^ = H 2 ~2 a+ a ^ a+ 2 i 2 1 ^ = p^ + 1 m! 2 x H ^2 = ~! a ^+ a ^+ 2m 2 2 (84) As regras de comutação (82) implicam que (veri…que): a ^; a ^+ = 2 i^ p m! i^ p x+ m! i^ p x+ m! x+ 2 2 = 2 2 = 2 2 = 2 " 2 x i^ p m! i^ p ; x m! i^ p x m! ; x i^ p i^ p x + x m! m! x i^ p m! i^ p m! 2 2 x x+ i^ p m! i^ p i^ p x + x+ m! m! i^ p m! 2 # 2 = i 2 [x; p^] 2 m! =1 [x; p^] = i~ =) a ^; a ^+ = 1 : 113 (85) a ^a ^+ = 1 + a ^+ a ^ 1 H = !~ a ^a+ + a+ a ^ 2 1 = !~ + a+ a ^ 2 Suponha agora que ^ ou seja, (x) é uma auto função qualquer de H, n ^ H = En n n Agora uma característica muito mais do que importante dos operadores (83): Usando a regra de comutação (85) vemos que ^a H^ n 1 2 = ~! a ^+ a ^+ a ^ 1 1 a ^+ a ^ 2 1 =a ^~! a ^+ a ^ 1+ n 2 1 1 =a ^~! a ^+ a ^+ 2 i h ^ ~! n =a ^ H a ^a ^+ = ~! =a ^ [En = ~! fazendo ~!] En ~! n n n n 1 a ^ En = ~! 1 ^ a ^+ a ^ a ^+ a 2 = ~! n n n : ^ =) H n = ~! n n temos ^a H^ n = ~! ( n 1) a ^ n : ^ com autovalor ~! n , então a Ou seja, se n é autovetor de H ^ n é outro ^ mas com autovalor ~! ( n 1) diminuindo de uma unidade. autovetor de H, Simbolicamente podemos chamar este vetor de n 1 ; a ^ n n 1 ^ ; H n 1 = ~! n 1 114 n 1 ; n 1 n 1: Da mesma forma ^ a+ H^ n 1 2 = ~! a ^+ a ^+ a ^+ n 1 2 = ~! a ^+ a ^a ^+ + a ^+ n = ~! a ^+ 1 + a ^+ a ^ +a ^+ =a ^+ ~! 1+a ^+ a ^ + ^ =a ^+ ~! 1 + H + =a ^ ~! (1 + = ~! (1 + n) + ^ n) a 1 2 1 2 n n n n n ^ com autovalor ~! n , então a Ou seja, se n é autovetor de H ^+ n é outro au^ tovetor de H, mas com autovalor ~! ( n + 1) acrescido de uma unidade. Simbolicamente podemos chamar este vetor de n+1 ; a ^+ n n+1 ^ ; H n+1 = ~! n+1 n+1 ; n+1 n +1 : (86) Por isso estes operadores são chamados de operadores de criação a+ e aniquilação a. Vamos usar agora que a energia do sistema é uma quantidade positiva7 ^j i h jH num estado h n 0 qualquer ^j nj H ni =h n j ~! n j ni = ~! n h nj ni = ~! n 0: (87) (onde supusemos que n está normalizado). Se a energia é positiva deve haver um estado de energia fundamental, i.e., um estado cuja energia não possa ser reduzida. Podemos chamar este estado simbolicamente de 0 com energia 0 min ( n ). Mas a existência do operador a ^ garante que sempre podemos baixar a energia do sistema. Ou seja, o vetor = a ^ 0 teria uma energia 0 1 < 0 , a menos que (x) = 0, ou seja, a ^ 0=0: 7 Isso pode ser visto observando que para qualquer autovetor normalizado Z b [ n (x)] a+ a n (x) dx h nj a ^+ a ^ j ni = = Z a b [a n (x)] [a a = h^ a a ni n j j^ 115 0: n (x)] dx n temos Voltando agora para os nossos operadores originais (x; p^) temos: a ^ 0 = 0 =) p x 0 + x ^+ 2 ~ m! k= d 0 = dx =0 0 ~ d 0 =0 m! dx fazendo temos i^ p m! 1 x k 1 d 0 d = ln dx dx 0 =) 0 0 x ; k = Fácil ver que a equação acima é bem mais fácil de resolver que a nossa equação original (??). Sua solução vale ln 0 x2 + C =) 2k = 0 x2 2k (x) = N exp : com N uma constante (normalização). A exigência a ^ 0 = 0, nos permite ainda determinar a energia deste estado fundamental. Partido da eq. (84) ^ H n = ~! n n 1 ~! a ^+ a ^+ 2 ~! a ^+ (^ a ~! 0 1 2 = 0 0) = ~! 0 + 1 2 0 0 = ~! 0 0 0 = ~! 0 0 1 2 Então já temos o estado fundamentas e a sua energia (auto-valor). Observe que a descrição quântica do OH implica na existência de uma energia mínima (o oscilador nunca para de oscilar). Como construir os outros estados n ? Para isso, basta usar a propriedade (86) a ^+ n = E1 = ~! ( n+1 0 =) a ^+ + 1) = ~! 0 = 1 =) p 1 +1 2 116 2 x ^ i^ p m! 0 = 1 explicitamente p x 2 ~ d m! dx 0 1 (x) = p x 1 + 2 1 (x) = 2 p x 2 0 = 0 1 ~ ~ m! m! ! 0 x2 2k 2 = N p x exp 2 Da mesma forma, podemos obter todos os outros estados (não-normalizados) n n n ^+ = a n (x) = N p 0 2 Com autovalor En = ~! n + 9.14.1 n ~ d m! dx x 0 (x) 1 2 Normalização As funções n (x) não estão normalizadas, i.e., após a aplicação do operador a ^+ n vezes, precisamos calcular N . Isso pode ser simpli…cado supondo que, se n é um vetor normalizado, queremos obter N e N + para que a ^ + a ^ a ^ n ea ^+ n n N n N+ n 1 n+1 também já estejam normalizados. ^j H ni = En j j ni = ~! n + a ^+ a ^j ni = nj ~! a ^+ a ^+ multiplicando pelo dual de j h 1 2 ni ni 1 2 j ni ni temos ^+ a ^ j ni nj a = nh nj j ni =n Agora observe que, pela de…nição de adjunto h j A^ j i = h j A^+ j i temos Z A^ dx = Z (A+ 117 ) dx = Z (A+ ) dx (88) ou seja, podemos calcular h j A^ j i como o produto do dual de j i com A^ j i, ou como o produto de j i com o dual de A^+ j i. Com isso Z Z + + h nj a ^ a ^ j ni = a ^ n (^ a n ) dx n a (a n ) dx = se …zemos j ni a expressão acima se torna Z ( n ) ( n ) dx = h =a ^j ni nj j ni =j 2 nj = j^ a 2 nj usando (88) j^ a a ^ n 2 nj = n ) p n 2 =1 ou seja, se quisermos um vetor normalizado não devemos de…nir a ^ mas sim p a ^ n p ^ n= n n 1 n 1 )a n n = n 1, Da mesma forma h ^a ^+ nj a j a ^+ ni n = h nj 1 + a ^+ a ^j p = n + 1 n+1 ni =1+h Ou, fazendo m = n + 1, a ^+ m 1 = p m ^+ a ^ j ni nj a = 1 + n = N+ 2 m com isso m a ^+ a ^+ a ^+ a ^+ m 1 p p =p p m m m 1 m 2 + + a ^ a ^+ a ^+ a ^ p ::: p =p p m m 1 m 2 m m + m (^ a ) = p 0 : m! = m 3 m m Assim, a formula para a n-ésima autofunção do hamiltoniano do OH se torna n N0 p (x) = p 2 n! x ~ d m! dx n 0 (x) onde N0 é a normalização do estado 0 . As funções n assim construídas são chamadas de funções de Hermite. 118 Exercise 28 Use a integral gaussiana Z 1 p 2 e x dx = 1 e ache a normalização N0 . Exercise 29 Construa a função de Hermite 10 4 (x). Potenciais centrais Até aqui tratamos praticamente todos os exemplo em 1D e argumentamos que a extensão destes resultados para 3D não envolvia nenhuma di…culdade conceitual mais profunda. Vamos agora considerar o momento angular orbital de um sistema, ou seja, uma característica que exige que nosso sistema tenha mais de 2D. O momento angular que vamos tratar aqui é chamado de momento angular orbital. Este representa a quantização, nos moldes introduzidos anteriormente, do observável clássico momento angular L=x ^= p!L i~x r: Esta distinção é necessária porque em MQ temos ainda um outro tipo de momento angular, chamado spin, que representa uma característica interna das partículas (a seguir veremos a diferença). Este último não representa a quantização de nenhum observável clássico e, mais ainda, não possui nenhum análogo em MC. O operador de momento angular respeita a seguinte regra de comutação h i ^j ; L ^ k = i~"ijk L ^i L e, conseqüentemente, não podemos esperar medir suas três componentes simultaneamente (não são compatíveis). Portanto escolhemos uma destas ^z. componentes para caracterizar o sistema,usualmente L Exercise 30 Veri…que a regra de comutação acima. Entretanto, apesar de não podemos medir simultaneamente as 3 componentes do momento angular, podemos de…nir um operador relacionado com o módulo (ou o valor total do momento angular) ^2 = L ^2 + L ^2 + L ^2 : L 1 2 3 (na verdade, a raiz quadrada do autovalor do operador acima). Este operador comuta com todas as componentes do momento angular h i ^2; L ^i = 0 L 119 h i ^3; L ^ 2 = 0. Exercise 31 Veri…que explicitamente que L Assim, podemos caracterizar (medir simultaneamente) tanto o momento an^ 3 ), quanto o seu módulo. Ou seja, podemos gular numa dada direção (e.g., L procurar por autofunções simultâneas destes dois operadores. Vamos chamar estas autofunções de Km e, por conveniência, vamos escrever seus autovalores como ^ 2 Km = ~2 K 2 Km L ^3 L Km = ~m Km Os índices K; m caracterizam nosso estado físico. Índices que caracterizam um estado físico em MQ são chamados de números quânticos. Ou seja, dizer que nosso sistema esta no estado l;m signi…ca dizer que ele tem momento angular na direção z igual a ~m e o módulo do vetor momento angular vale ~K. Remark 32 Qualquer outra tentativa para especi…car melhor o valor do vetor L irá destruir as informações obtidas anteriormente. Uma visão clássica para o nosso sistema (que ajuda a desenvolver alguns raciocínios) é que, após uma medida de L3 e L2 o vetor momento angular está precessionando em torno do eixo z. Mas este imagem não deve ser levada tão à sério. O resultado mais preciso, mas que é difícil de visualizar, é que, após a medida de L3 , nosso sistema está numa superposição de todos os valores possíveis de Lx e Ly , compatíveis com o valor de L2 . 10.1 Autovalores e autovetores do momento angular Vamos agora discutir os possíveis valores dos autovalores e a forma dos autove^3 e L ^ 2 . Estes operadores são, obviamente, operadores diferenciais e a tores de L obtenção destas quantidades representa a resolução do problema de autovalores para estas equações. Entretanto, no lugar de resolvermos diretamente estas equações, podemos usar um método completamente análogo ao desenvolvido para resolver o problema do oscilador harmônico. Neste caso, introduzamos os operadores ^+ = L ^ 1 + iL ^2 : L ^ =L ^1 L ^2 = L ^+ iL + : Estes operadores fazem às vezes de a ^ e a ^+ neste problema e obedecem as seguintes regras de comutação h i ^3; L ^ + = ~L ^+ L h i ^3; L ^ = ~L ^ L [L+ ; L ] = 2~L3 h i ^2; L ^ =0 L 120 Exercise 33 Veri…que as leis de comutação acima tor Assim como …zemos no caso do OH, imagine que você encontrou um autove^ m do operador L3 ^ 3 m = ~m m : L Usando as regras de comutação acima é possível mostrar que ^3 L ^+ L m ^+ = ~ (m + 1) L ^3 L ^ L m = ~ (m ^ 1) L m m ^ + (L ^ ) permite construir um novo autovetor com o autoOu seja, o operador L valor aumentado (diminuído) de uma unidade. Por isso este operador é chamado de operador de levantamento (abaixamento). Exercise 34 Veri…que as igualdades acima. ^ 2 comuta com L ^ 3 , podemos esperar que o autovetor Uma vez que L 2 ^ seja também autovetor de L ^2 L h m i = ~2 K 2 m m acima : ^ ;L ^ 2 temos Além disso, como L ^ 2 (L L m) ^2 =L L m = L ~2 K 2 m = ~2 K 2 (L m) ^ 2 como Ou seja, os autovetores construídos acima são também autovetores de L ^ o mesmo autovalor. Assim, os operadores L abaixam e levantam a projeção do momento angular no eixo z sem mudar o valor do módulo do vetor. Fazer desenho ^ do OH, o operador L ^ 2 é positivo de…nido, com isso, Assim como H D E ^2 L 0 ) K2 0 : m Além disso, temos D E D E D E ^2 ^ 21 ^ 22 L = L + L m m ou seja jKj m D E ^ 23 + L jmj ) m D E ^ 21 = L m D E ^ 22 + L + ~2 m2 ; m K<m<K Que obviamente signi…ca apenas que o módulo de um vetor é maior ou igual qualquer uma de suas componentes. Entretanto, o fato de podermos sempre aumentar o valor da projeção com ^ + leva a uma contradição com a igualdade acima (assim como no o operador L 121 caso da energia mínima do OH). Por isso, se mmax K é o maior valor possível para a projeção do momento angular na direção z, devemos exigir que ^+ L mmax =0: (89) ^ L mmin =0: (90) Pela mesma razão ^ 2 pode ser escrito como O operador L ^2 = L ^2 + L ^2 + L ^2 L 1 2 3 2 ^ ^ ^ ^3 = L L+ + L3 + ~L ^+L ^ +L ^2 =L 3 ^3 ~L Exercise 35 Veri…que as igualdades acima. Usando a relação acima, podemos escrever (89) como ^2 L mmax ^ L ^+ + L ^ 2 + ~L ^3 = ~2 K 2 = L 3 ^ 2 + ~L ^3 = L 3 mmax mmax = ~2 m2max + ~2 mmax mmax ou seja K 2 = mmax (mmax + 1) Da mesma forma K 2 = mmin (mmin 1) Com isso mmax (mmax + 1) = mmin (mmin m2max + mmax = m2min 1) mmin que implica mmax = mmin Ou seja, os valores possíveis de m variam de uma em uma unidade e se distribuem simetricamente em torno de 0. A simetria da distribuição acima, nos mostra que temos apenas duas possibilidades para os valores de mmax mmax = inteiro ) m = f mmax ; mmax + 1; ::; 0; ::; mmax g mmax = semi-inteiro ) m = f mmax ; mmax + 1; ::; mmax g no segundo caso m 6= 0. Qualquer outro valor de mmax não teria a simetria necessária para que mmax = mmin . Os dois tipos de valores para mmax caracterizam os dois tipos diferentes de ^ momento angular mencionados anteriormente. Para mmax um semi-inteiro, L é um momento angular intrínseco, i.e., um spin (e.g., férmions tem spin 1=2). 122 Como veremos mais pra frente, para o caso do momento angular orbital, necessariamente devemos ter mmax inteiro8 . Vamos chamar l mmax = mmin Ou seja, os valores de m variam de uma em uma unidade desde a de…nição acima temos l até l. Com K 2 = mmax (mmax + 1) = l (l + 1) ^ 2 são Ou seja, os autovalores deL3 e L ^2 L ^3 L m;l = ~2 l (l + 1) m;l = ~m m;l m;l ; m= ; l = 0; 1; 3::: l; l + 1; :::; 0; :::; l Para cada valor de m temos 2l + 1 valores de m. Por razões que se tornarão claras futuramente, l é chamado de número quântico orbital, enquanto m é chamado de número quântico azimutal (ou número quântico magnético). Vemos que o valor máximo da projeção é sempre menor que o módulo do vetor, ou seja, o vetor nunca está projetado inteiramente no eixo z. Se isso fosse possível, teríamos um estado com L3 bem de…nido e com L1 = L2 = 0, ou seja, haveria um estado em que conheceríamos as 3 componentes do momento angular. Observe que a MQ nos diz que as partículas podem ter apenas valores inteiros e semi-inteiros de l. Desta forma, temos 3 casos distintos: 1. o momento angular orbital, com l inteiro; 2. o momento angular intrínseco (spin) com l inteiro e semi-inteiro. No que se refere ao spin, (a) partículas com spin inteiro são chamados de bósons e (b) partículas com spin semi-inteiro são chamados de férmions. Esta característica pode ser observada num experimento de EG. Da mesma forma como no caso do OH, temos agora uma equação diferencial mais simples pra resolver ^ + l;l = 0 L Uma vez obtida esta solução, podemos construir as demais soluções baixando o auto-valor de m ^ l;l l;l 1 = L e assim até l; l onde, obviamente ^ L l; l =0: 8 Não estamos a…rmando que m max inteiro não pode ser um valor de spin, mas apenas que o momento angular orbital tem, obrigatoriamente, um valor inteiro de mmax . 123 Para resolver este problema o ideal é trabalhamos em coordenadas esféricas x = r sin cos y = r sin sin z = r cos Nestas coordenadas temos ^ =L ^ x + iL ^ y = ~e L ^2 = L i i cot 1 @ @ 1 sin + sin @ @ sin2 @ @ @2 @ 2 @ @ (91) ^ 3 assume uma forma bem simples Em especial, o operador L ^3 = L i~ @ : @ Assim, as funções procuradas obedecem a equação (fazendo l;m = Ylm ) ^ 3 Y m = imY m ; L l l Ylm = Ylm ( ; ) fazendo uma separação de variáveis Ylm ( ; ) = m temos ^ 3 Y m = imY m ) L l l m ( ) m l ( ) 1 ( ) = p exp (im ) : 2 p Onde o fator 1= 2 é, obviamente, a normalização. Observe que a condição de unicidade da solução exige que m ( )= m ( + 2 ) ) eim2 = 1 ) m = 0; 1; 2; :: Ou seja, m deve ser inteiro. Como a…rmamos para o caso do momento angular orbital. Assim, nossas soluções têm a forma 1 Ylm ( ; ) = p 2 m l ( ) exp (im ) ; m 2 Z : Voltando agora para a nossa equação ^ + Y l = 0 ) ~ei L l i cot @ @ + @ @ 1 p 2 ( ) = l cot l l ou seja @ @ l l 124 ( ) l l ( ) exp (il ) = 0 que possui a solução l l Nl ( ) = Nl sinl ) Yll ( ) = p exp (im ) sinl 2 onde Nl é uma normalização. As demais soluções são obtidas pela aplicação do ^ operador L Yll m ^ ( ; )= L m Yll ( ; ) = Nl ~e m i i cot @ @ @ @ m sinl ; m As funções Yll m assim construídas, e devidamente normalizadas, são chamadas de harmônicos esféricos. Com isso ^ 2 Ylm = ~2 l (l + 1) Ylm ; l 2 N::: L ^ 3 Y m = ~mY m ; m = l; l + 1; :::; 0; :::; l L l l Z m m0 hYl Yl0 i = Ylm ( ; ) Ylm0 ( ; ) d d = 0 mm0 ll0 Os harmônicos esféricos são funções tabeladas e também podem ser escritos como 1=2 2l + 1 (l m)! Plm (cos ) eim Ylm ( ; ) = 4 (l + m)! onde m Plm ( ) = ( 1) Pl ( ) = 2 m=2 1 1 dl 2l l! d l 2 1 dm Pl ( ) d m l onde Pl são conhecidos como os polinômios de Legendre e Plm os polinômios associados de Legendre. 10.2 O átomo de hidrogênio Partindo do hamiltoniano da partícula livre H= ~2 2 r 2m e escrevendo o laplaciano em coordenadas esféricas temos H= ^2 p^2r L + 2m 2mr2 com 1 @ r r @r 2 ^ 2 = 1 @ sin @ + 1 @ L 2 sin @ @ sin @ 2 p^r = 125 2l ^ 2 é o operador de momento angular introduzido anteriormente (91) e p^r é onde L chamado de momento radial. Assim, para o caso de um potencial que dependa apenas da coordenada radial, i.e., um potencial central, temos que o operador hamiltoniano se torna 2 ^2 ^ = p^r + L + V (r) H 2m 2mr2 Para o caso de um sistema ligado de um próton e um elétron (i.e., um átomo de hidrogênio) temos que o potencial do elétron devido ao próton vale V (r) = e2 r com o que nosso hamiltoniano …ca 2 ^2 ^ = p^r + L H 2m 2mr2 e2 r Remark 36 Lembre que, na verdade, sendo um sistema de dois corpos, devemos usar a massa reduzida me mp = ' me ; me + mp reveja o capítulo sobre o átomo de Bohr. Assim, na teoria de Schroedinger, o problema dos estados estacionário (estados com energia de…nida) do átomo de hidrogênio, consiste em encontrar os autoestados do operador acima ^ H = jEj : Além disso, como estamos interessados em estados ligados, estamos interessados no caso E < 0 (pois, como no problema usual do potencial acima, estamos colocando o zero de energia no in…nito). O problema acima pode ser facilitado usando, novamente, uma separação de variáveis. Entretanto, observe que h i h i ^ L ^ 2 = H; ^ L ^3 = 0 ; H; ^ L ^2 e L ^ 3 (ou ainda, ou seja, podemos procurar por autofunções simultâneas de H; 2 ^ ^ ^ podemos medir simultaneamente H; L e L3 ). Com isso, vamos procurar as nossas soluções na forma = R (r) Ylm ( ; ) : Substituindo a solução ~2 2m na forma acima na ES temos: 1 d2 ~2 l (l + 1) r + r dr2 2mr2 126 e2 + jEj R (r) = 0 r Esta equação pode ser simpli…cada fazendo u rR com o que d2 l (l + 1) r + 2 dr r2 2me2 2m jEj u (r) = 0 + 2 ~ r ~2 que pode ser colocada numa forma ainda mais simples através das variáveis ~2 2 = jEj ; 2m ~2 ~2 = ; a = 0 2ma20 me2 2 r; RH = RH jEj onde RH é a constante de Rydberg e a0 o raio de Bohr introduzidos na seção sobre o átomo de Bohr. Nestas novas variáveis temos d2 u d 2 l (l + 1) 2 1 4 u+ u=0 Nosso trabalho se resume, obviamente, em resolver a equação diferencial acima. Assim como nos casos anterior existem técnicas especí…cas para encontrar a solução desta equação. Após a aplicação destas técnicas, as soluções do problema acima podem ser escritos como: un;l ( ) = onde Fnl ( ) = nX l 1 i=0 l+1 exp 2 2 i Fnl ( ) 2 ( 1) [(n + l)!] i ; n2N i! (n l 1 i)! (2l + 1 + i)! são os polinômios associados de Laguerre. Para que estas funções sejam de quadrado integrável, devemos ter9 n l 1 0)l n 1)l<n Assim, a solução do problema do átomo de hidrogênio pode ser escrito como (r; ; ) = Rn;l (r) Ylm ( ; ) ; 1 Rn;l (r) = un;l ( ) ; 2 r r n;l;m un;l ( ) = exp l+1 2 Fnl ( ) : 9 Podemos de…nir os polinômios acima para valores negativos do fatorial usando a função . Entretanto, ( m)) = 1 para m inteiro positivo. 127 com os autovalores RH n2 que são exatamente os mesmos obtidos pela quantização de Bohr. A solução da parte radial do problema (como era de se esperar) introduziu o novo número quântico n nas nossas soluções. Chamado de número quântico principal. En = Remark 37 A energia depende apenas do número quântico principal. As restrições acima impõem l<n: e as restrições obtidas anteriormente jmj < l : Assim, para um dado valor de l temos 2l + 1 estados e, para um dado valor de n temos n2 estados com a mesma energia. Na notação usada em química, os valores de n rotulam os chamados orbitais. Os valores de l são chamados, em seqüência, s; p; d etc. E para cada um destes valores, temos m = 2l + 1 estados distintos. 1s1 2s1 2p3 3s1 3p3 3d5 .. . A descrição completa dos orbitais atômicos depende ainda de uma característica negligenciada até aqui: o spin do elétron. Esta quantidade faz com que cada estado possa existir em dois estados distintos de spin. Ou seja, o número de estados de cada orbital é dobrado. 1s2 2s2 2p6 3s2 3p6 3d10 .. . Além disso, a estrutura da distribuição eletrônica, bem como a estabilidade de toda a matéria conhecida, depende diretamente da in‡uência do spin nestes níveis eletrônicos. Ou seja, é impossível compreender a distribuição eletrônica (em especial a tabela periódica) sem tomar em conta o spin do elétron. Mas isso é uma outra história... 128