5. Elétrons em Sólidos 5.1- O Gás de Elétrons Livres: Estado Fundamental A maior parte das propriedades físicas dos sólidos é, de uma forma ou de outra, determinada pelos elétrons. O estudo dos elétrons em sólidos, que se inicia neste capítulo, representa portanto uma parte fundamental deste e qualquer outro curso de FMC. O comportamento de elétrons em sólidos dá origem aos mais diversos fenômenos: desde a variedade de formas de coesão cristalina que estudamos no Capítulo 1, passando por diferentes fenômenos de transporte e térmicos, até o comportamento coletivo responsável por fenômenos como magnetismo e supercondutividade. Obviamente, o estudo destes fenômenos deve obedecer a uma escala progressiva de complexidade. Deste modo, iniciaremos nosso estudo dos elétrons em sólidos com um modelo extremamente simples, mas que servirá de base para descrições mais elaboradas: o gás de elétrons livres. A expressão “gás de elétrons livres” já traduz as duas aproximações básicas do modelo. É “gás” porque os elétrons não interagem entre si, a situação ideal para que consideremos cada elétron como uma partícula independente, ou seja, que se “movimenta” de maneira não-correlacionada com as demais. São “livres” porque não estão sob a ação de nenhum potencial externo (como por exemplo o potencial devido aos íons do cristal). Ambas aproximações são bastante drásticas: em sólidos reais, um elétron interage fortemente tanto com a rede como com os demais elétrons. Ainda assim, o modelo de elétrons livres pode servir como uma aproximação razoável em alguns metais, especialmente os metais alcalinos, nos quais a influência dos íons é bastante enfraquecida devido ao fenômeno de blindagem e os elétrons de valência se distribuem de maneira quase uniforme pelo cristal. Nesta Seção, iremos descrever as propriedades do gás de elétrons livres a T = 0 K, ou seja, seu estado fundamental. Consideremos um gás de N elétrons em uma caixa de volume V. A Hamiltoniana para um elétron deste sistema contém apenas a energia cinética: p2 22 (5.1) , H 2m 2m 1 ikr 2 k 2 e com autovalores (k ) cujas autofunções são ondas planas k (r ) .O 2m V fator 1 V garante que a probabilidade de encontrarmos o elétron em qualquer ponto da caixa seja igual a 1: 1 dV caixa 56 2 Nos falta escolher o formato e as condições de contorno da caixa. Fisicamente, espera-se que os resultados obtidos a partir deste modelo não sejam dependentes destas escolhas, já que no limite macroscópico temos V . Desta forma, podemos escolher o formato e as condições de contorno que sejam mais simples do ponto de vista matemático. A convenção para o formato da caixa é um cubo de lado L, de modo que L V 1/ 3 . Quanto às condições de contorno, se poderia esperar que a escolha mais física seria impor que 0 nas extremidades da caixa, como mostra a Fig. 5.1(a). Porém, isto daria origem a ondas planas estacionárias, menos convenientes para descrever certos fenômenos (transporte eletrônico, por exemplo), do que ondas propagantes. Escolhem-se então as chamadas condições de contorno periódicas (ou de Born - von Karman): ( x L, y , z ) ( x , y , z ) ( x , y L, z ) ( x , y , z ) ( x , y , z L) ( x , y , z ) (5.3) Estas condições de contorno de contorno equivalem a conectar cada face do cubo com a face oposta1, como mostra a Fig. 5.1(b), simulando, desta forma, um cristal infinito. Aplicando-se a primeira condição de contorno à função de onda k (r) , obtém-se 1 i ( k x ( x L) k y y kz z ) 1 i ( k x x k y y kz z ) e e e ik x L 1. V V (5.4) Esta condição determina os valores possíveis para kx, e usando relações análogas para as direções y e z, temos: kx 2n y 2n x 2nz , ky e kz ; L L L (5.5) onde nx, ny e nz são inteiros. (a) 0 (b) =0 (x) (x + L) (x) = (x + L) L L Figura 5.1 – (a) Condições de contorno fixas, segundo as quais a função de onda eletrônica é zero fora da caixa cúbica de lado L. Isto dá origem a soluções correspondentes a ondas estacionárias dentro da caixa. (b) Condições de contorno periódicas, segundo as quais a caixa é repetida periodicamente nas três direções cartesianas, simulando um sistema infinito, e impõe-se que a função de onda deve ter a mesma periodicidade, determinando assim um conjunto discreto de vetores de onda permitidos. 1 Mesmo que isto seja topologicamente impossível em 3 dimensões. 57 Portanto, os possíveis valores do vetor de onda k ocupam pontos de uma rede cúbica simples no espaço recíproco. A Fig. 5.2 mostra estes pontos no plano k z 0 . Note que o volume ocupado (no espaço recíproco) por cada ponto k é (2 ) 3 V . Portanto, quanto maior o volume V do sólido mais densa será esta rede de pontos k permitidos, e no limite V teremos um conjunto contínuo destes vetores. A partir destes estados permitidos de 1 elétron, podemos construir o estado fundamental de um gás de N elétrons livres. Para isto, é necessário levar em consideração o princípio de exclusão de Pauli, segundo o qual dois elétrons não podem ocupar o mesmo estado quântico. Levando-se em conta o spin do elétron, cada estado quântico associado a um vetor de onda k permitido pode então conter 2 elétrons, um com ms = ½ e outro com ms = -½. Desta forma, constrói-se o estado fundamental de N elétrons ocupando-se progressivamente os níveis de mais baixa energia. Para um gás com um número macroscópico de elétrons no limite V , a densidade de pontos k permitidos é grande o suficiente de modo que os níveis preenchidos ocupam o interior de uma esfera no espaço dos vetores de onda, como mostra a Fig. 5.3. Esta esfera é conhecida como esfera de Fermi. Sua superfície, onde estão localizados os elétrons de maior energia é a superfície de Fermi, e os elétrons aí localizados têm a energia de Fermi (F) e vetor de onda com módulo igual a kF (vetor de onda de Fermi). ky kx 2 / L Figura 5.2 - Pontos k permitidos no plano kz = 0. kz Superfície de Fermi (kF) = F kF ky kx Esfera de Fermi Figura 5.3 - A região cinza (esfera de Fermi) representa os vetores de onda ocupados no gás de elétrons livres. Os elétrons mais energéticos, localizados na superfície de Fermi, têm energia F e vetor de onda de módulo kF. Pode-se relacionar estas quantidades à densidade n N V do gás de elétrons da seguinte forma. Sabendo que N = 2(No de k’s ocupados), onde o fator 2 é devido ao 58 spin, e calculando-se o número de k’s ocupados como o volume da esfera de Fermi dividido pelo volume ocupado por cada k, temos N 2 43 k F3 (2 ) 3 V Vk F3 , 3 2 (5.6) de modo que k F (3 2 n)1/ 3 . (5.7) Como se vê, o vetor de onda de Fermi depende apenas da densidade de elétrons, e não do número de elétrons ou do volume separadamente. O mesmo ocorre para a energia de Fermi: 2 k F2 2 F (3 2 n) 2 / 3 . 2m 2m (5.8) As funções de onda k são também auto-estados do operador momento linear p i , com autovalores k e, portanto, do operador velocidade v p m , com autovalores k m . Define-se então o momento de Fermi pF k F e a velocidade de Fermi v F k F m , respectivamente o momento e a velocidade daqueles elétrons de mais alta energia. Para as densidades típicas dos metais, v F 106 m/s, ou seja, mesmo à temperatura zero a velocidade dos elétrons em um metal pode chegar a um centésimo da velocidade da luz! Isto é um efeito essencialmente quântico, originário do princípio de exclusão, e contrasta frontalmente com o comportamento que partículas clássicas teriam a T = 0 K. Por fim, terminamos nossas definições da nomenclatura não muito original relacionada ao gás de elétrons livres com a temperatura de Fermi, TF F k B , onde kB é a constante de Boltzmann. Para densidades típicas, TF 104 K. Esta não é a temperatura termodinâmica do gás de elétrons, mas apenas um parâmetro que exerce um papel importante com relação às propriedades térmicas do gás de elétrons, como veremos na próxima seção. Em muitas situações, necessitamos calcular somas de quantidades diversas sobre todos os k’s ocupados. Exemplos dessas quantidades são o número total de elétrons, N, ou a energia total do gás de elétrons, E. De modo geral, dada uma quantidade qualquer F(k ) , queremos calcular a soma por todos os k’s ocupados: Ftot 2 F (k ) , k kF (5.9) onde o fator 2 é devido ao spin e a soma é sobre todos os k’s com módulo menor que kF. 59 Como dissemos, no limite macroscópico ( V ), a densidade de pontos k permitidos dentro da esfera de Fermi é grande o suficiente para substituirmos o somatório por uma integral: Ftot 2 V (2 ) 3 dk F (k ) , (5.10) k kF V é a densidade de pontos k permitidos. Comparando as Equações (5.9) (2 ) 3 e (5.10), chegamos à relação geral entre somatórios e integrais na esfera de Fermi: onde o fator lim V V F (k ) (2 ) dk F (k ) . 3 k kF k kF (5.11) Como exemplos, vamos aplicar a Eq. (5.11) para calcular o número total de elétrons, N, e a energia total, E. A expressão para N é N 2 1 2 k kF V (2 ) 3 V 4 3 k F , 3 3 dk 4 k kF (5.12) que dá n k F3 3 2 , o mesmo resultado obtido anteriormente (Eq. (5.7)). Para a energia total, temos V 2k 2 V E 2 (k ) 2 dk 3 3 (2 ) k k F 2m 4 k k F kF 2 k 2 2 k F5 V 0 dk(4k ) 2m 10 2 m . 2 (5.13) Usando V N n e n k F3 3 2 , obtemos a energia por elétron E 3 . N 5 F (5.14) Em muitas situações, a quantidade F(k) é mais facilmente expressa como função da energia (k), ou seja, como F((k)). Neste caso, gostaríamos de expressar Ftot como uma integral na energia, e não em k: Ftot d D( ) F ( ) . (5.15) A quantidade D() é a densidade de estados, definida de modo que D()d é o número de estados quânticos com energia entre e + d. Pode-se calcular D() a partir da expressão (5.8) que dá o número de elétrons com energia menor que F. Esta expressão 60 pode ser generalizada para qualquer valor de energia, de modo que podemos definir N() como o número de elétrons com energia menor que : V 2m N ( ) 3 2 2 3/ 2 . (5.16) Pode-se obter o número de elétrons com energia menor que +d usando-se a própria definição de D(): N ( d ) N ( ) D( )d . (5.17) Desta forma, a densidade de estados de um gás de elétrons livres pode ser calculada por dN ( ) V D( ) d 2 2 2m 2 3/ 2 1/ 2 . (5.18) Como se vê, a densidade de estados tem uma dependência com 1/2 (Fig. 5.4). Esta dependência é característica da dimensionalidade (e também da relação de dispersão quadrática): como veremos no Problema 1 da lista de problemas, a densidade de estados é independente da energia para um gás de elétrons livres bidimensional2. D() ~1/2 Figura 5.4 - Esboço da densidade de estados em 3 dimensões. 2 Em 1 dimensão, a dependência é com -1/2. 61 5.2 - Propriedades Térmicas do Gás de Elétrons Livres Se os elétrons fossem partículas clássicas, suas propriedades térmicas seriam bem descritas pela termodinâmica clássica. Pelo Teorema da Equipartição da Energia, um gás com N partículas clássicas livres tem energia interna U 23 Nk B T e, portanto, capacidade térmica (a volume constante): C dU 3 Nk B , dT 2 (5.19) independente da temperatura. Porém, já no início do século XX, se sabia que a contribuição eletrônica para a capacidade térmica dos metais é tipicamente 100 vezes menor que este valor a temperatura ambiente. Este enigma intrigou os físicos no início do século, já que os elétrons pareciam agir como um gás livre para efeitos de condução de eletricidade, mas pareciam não contribuir para a capacidade térmica. Este aparente paradoxo só foi resolvido com a física quântica, em especial com a descoberta de que as partículas quânticas se dividem em dois tipos, férmions e bósons, cada qual com sua distribuição estatística própria. Os elétrons são férmions, e por isso obedecem à distribuição de Fermi-Dirac3. A distribuição de Fermi-Dirac dá a probabilidade de que um estado eletrônico de energia esteja ocupado em equilíbrio térmico a temperatura T: f ( ) 1 e ( ) k BT 1 . (5.20) A quantidade é conhecida como potencial químico. Note que f ( ) 21 . Como veremos, o potencial químico depende da temperatura, ou seja, T . A temperatura zero, o potencial químico é simplesmente a energia de Fermi: (0) F , como vimos na Seção anterior. Veja na Fig. 5.5 a distribuição de Fermi-Dirac para T = 0 e T 0. Para um gás de elétrons livres em 3 dimensões com um número fixo N de elétrons, o potencial químico decresce com o aumento da temperatura, como mostrado na figura. Esta dependência é obtida, como veremos a seguir, pela condição de que o número total de partículas, N, seja constante e independente de T. A temperatura finita, a expressão para o número total de elétrons é N d D( ) f ( ) (5.21) 0 Podemos obter a dependência qualitativa de (T) analisando graficamente a integral (5.21), como na Fig. 5.6. O número de elétrons N é dado pela área sombreada no gráfico. 3 Aqui o curso de FMC faz uso de ter Física Estatística como pré-requisito. Iremos supor que a distribuição de Fermi-Dirac é conhecida. O estudante que quiser rever estes conceitos deve procurar algum livro de Física Estatística, como por exemplo o Fundamentals of Statistical and Thermal Physics, F. Reif, Cap. 9. 62 Na Fig. 5.6(a), temos a situação em T = 0, com F. Se fosse independente da temperatura, a T diferente de zero teríamos a situação mostrada na Fig. 5.6(b). Note, porém, que a área "ganha" para (N+ na figura) é maior que a área "perdida" para (N- na figura). Isto ocorre por dois motivos: (i) A função f() é "simétrica" com relação a 1 2 f ( ) f ( ) 1 2 (ii) A densidade de estados D() tem derivada positiva em . Assim, o número de elétrons ( N na figura) aumentaria. Como N deve permanecer constante, deve diminuir com a temperatura para contrabalançar este efeito. f () 1,0 T>0 T=0 0,5 0,0 (T) (0)= F Figura 5.5 - A distribuição de Fermi-Dirac a T = 0 e T>0. Note que o potencial químico, definido tal que f() = 1/2, diminui com o aumento da temperatura para um gás de elétrons livres em 3 dimensões. Quantitativamente, até segunda ordem em T, pode-se mostrar (Ashcroft, p. 46) que (T ) F 2 D ( F ) (k T ) 2 . 6 D( F ) B (5.22) Note a dependência com a derivada da densidade de estados no nível de Fermi, D( F ) , ou seja, se a densidade de estados for crescente, deve diminuir com a temperatura, e vice-versa. Podemos reescrever a expressão (5.22) da seguinte maneira (verifique!): 2 T 2 (T ) F 1 . (5.22a) 12 TF Desta forma fica claro que o potencial químico não difere muito da energia de Fermi se a temperatura for muito menor que a temperatura de Fermi, o que usualmente é o caso à temperatura ambiente. Vamos agora obter a capacidade térmica de um gás de elétrons livres. Como dissemos no início desta seção, ela deve ser tipicamente 100 vezes menor que o resultado clássico a temperatura ambiente. 63 3 (a) T=0 f () 2 f(ε)D(ε) 1 N 0 F 3 (b) T>0 f () 2 f(ε)D(ε) N1 N’ N+ 0 F Figura 5.6 - Ilustração gráfica do aumento do número de elétrons com a temperatura se fosse constante. Para compensar este efeito, deve de fato diminuir com a temperatura. O número de elétrons (N e N’) é dado pela área sombreada em cada caso. A escala de temperatura relevante em um gás de Fermi é a temperatura de Fermi, definida na seção anterior como TF F k B . Como vimos, a temperaturas muito menores que TF, a distribuição de Fermi-Dirac pouco se desvia do comportamento a T = 0 e podemos, com aproximação, supor que F , de modo que a distribuição de FermiDirac torna-se f ( ) 1 e ( F ) k BT 1 (T TF ) . (5.23) Uma análise da equação (5.23) sugere que, para T TF , a distribuição de FermiDirac é diferente de 0 ou 1 apenas para valores da energia tais que F k BT . Isto está ilustrado na Fig. 5.7. Assim, os elétrons excitados termicamente são apenas aqueles correspondentes a esta faixa de energias, tipicamente D( F ) k BT elétrons. Além disso, a 64 energia de excitação típica é também da ordem de k BT . Desta forma, a variação de energia U do gás de elétrons é dada aproximadamente por U (número de elétrons excitados) (energia de excitação média de um elétron) ( D( F ) k B T ) (k B T ) D( F ) (k B T ) 2 (5.24) f () 2 kBT kBT 1 0 F Figura 5.7 - Apenas os elétrons com energia próxima à energia de Fermi são excitados termicamente. Podemos agora calcular a capacidade térmica do gás de elétrons livres: Cele T dU 2 D( F )k B2T 3N k B dT TF . (5.25) Note que a capacidade térmica apresenta uma dependência linear com a temperatura (para temperaturas baixas), em contraste com o valor constante da previsão clássica. Tomando valores típicos para metais, TF = 5 104 K, temos, para T = 300 K, Cele 0,01 ( 32 N kB ) , ou seja, 100 vezes menor que a previsão clássica, como queríamos mostrar. A física por trás deste resultado é a seguinte: o Princípio de Exclusão de Pauli, manifestado através da distribuição de Fermi-Dirac, impede que todo e qualquer elétron seja excitado termicamente. Apenas serão excitados aqueles elétrons, em estados inicialmente ocupados, que puderem ser promovidos para estados desocupados com energias próximas, E ~ kBT, já que esta é a energia térmica disponível. Assim, apenas uma pequena fração dos elétrons é excitada (tipicamente uma fração T /TF), o que acarreta em uma redução na capacidade térmica. 65 Note que o resultado acima é válido apenas no limite de baixas temperaturas. Repare também que o cálculo acima é aproximado, foram feitas diversas hipóteses simplificadoras. O resultado exato é (veja Kittel): Cele 2 D( F ) k B2 T , (5.26) 3 ou seja, a dependência linear com T é preservada, apenas o pré-fator numérico é alterado. Experimentalmente mede-se, além da dependência linear, uma dependência com T3 que, como veremos no Capítulo 7, é devida às vibrações da rede: Cexp T AT 3 . (5.27) Como é proporcional à massa eletrônica através da densidade de estados D(F) (veja a equação (5.18)), a determinação experimental de permite determinar uma "massa efetiva térmica" dos elétrons no sólido. Como veremos nos próximos capítulos, esta massa efetiva não é, em geral, igual à massa de um elétron livre devido à influência da rede cristalina e dos demais elétrons. Portanto, a determinação experimental de é um instrumento importante no estudo dos elétrons em sólidos. Tipicamente, mede-se a capacidade térmica em diversas temperaturas e determina-se pelo coeficiente linear em um gráfico (C /T) vs. (T2), como o da figura abaixo. Figura 5.8 - Determinação experimental para o potássio do coeficiente , que está associado contribuição eletrônica para a capacidade térmica de um sólido. Fonte: Kittel, p. 155. 5.3 - Elétrons em um Potencial Cristalino: Teorema de Bloch Nas duas últimas Seções, analisamos as propriedades do estado fundamental e de excitações térmicas do gás de elétrons livres. Como dissemos, esta é uma abordagem simplificada para descrever elétrons em sólidos, mas que serve como ponto de partida para refinamentos adicionais. Nesta Seção, iniciaremos nosso estudo do gás de elétrons sob a ação do potencial cristalino. Seja U(r) a energia potencial que um elétron no cristal. Contribuem para U(r) não apenas os íons (núcleos + elétrons de caroço), mas também os demais elétrons de 66 valência. U(r) é portanto um potencial de uma partícula, ou seja, introduzimos a interação elétron-elétron sob a forma de um potencial efetivo que represente de alguma forma a interação média do elétron em questão com todos os demais elétrons. Isto é uma aproximação que, como veremos ao final deste capítulo, pode ser justificada em diversas situações. Apesar disto, o cálculo de U(r) em geral é não-trivial, e por hora vamos apenas assumir que U(r) é dado. Por mais complicado que seja o potencial U(r), sabemos que a periodicidade cristalina nos impõe que U (r) U (r R) , (5.28) onde R é um vetor da rede de Bravais. Queremos encontrar soluções para a equação de Schrödinger de um elétron na presença deste potencial periódico: 2 2 H U (r ) . 2m (5.29) Nesse sentido, enunciaremos agora um dos resultados mais importantes em FMC, que nos fornece a forma das soluções da Eq. (5.29), o Teorema de Bloch. Teorema de Bloch: Se o potencial é periódico, ou seja, se U (r) U (r R) , então as soluções da equação de Schrödinger correspondente podem ser escolhidas da forma nk (r) e ikr u nk (r) , (5.30) onde e ikr é uma onda plana com vetor de onda k e unk (r) é uma função com a mesma periodicidade da rede, ou seja, unk (r) unk (r R) . O índice n é o chamado índice de banda, e veremos seu significado físico em breve. Note que, em geral, a função de onda não é periódica, apesar do potencial ser periódico. Isto é facilmente verificável calculando-se nk (r R) diretamente: nk (r R) e ik(r R ) u nk (r R) e ikR e ikr u nk (r) e ikR nk (r) , (5.31) ou seja, ao transladarmos a função de onda por um vetor da rede R, obtemos a própria função de onda multiplicada por uma fase e ikR , nk (r R) e ikR nk (r) . Aliás, esta expressão é um enunciado alternativo do Teorema de Bloch. Vamos agora demonstrar o teorema. Seja TR um operador de translação tal que TR f (r) f (r R) , onde f(r) é uma função qualquer. Como a Hamiltoniana é invariante por translações de um vetor R, H (r R) H (r) , pode-se mostrar que o operador de translação comuta com a Hamiltoniana, TR , H 0 , da seguinte maneira: TR [ H (r) (r)] H (r R) (r R) H (r) TR (r) . 67 (5.32) Da mesma forma, é fácil mostrar que duas translações por vetores R e R’ comutam: TR TR (r) (r R R) (r R R ) TRTR (r) . (5.33) Assim, H, TR, TR’, TR’’, etc., formam um conjunto de operadores que comutam e portanto podem ser diagonalizados simultaneamente, ou seja, podemos encontrar autofunções simultâneas de H e de um operador de translação qualquer TR, com autovalores e c(R) respectivamente: H . TR c(R ) (5.34) Vamos agora determinar os autovalores c(R). Como vimos, diferentes operadores de translação comutam entre si. Similarmente, é fácil mostrar que TR TR TR R . Assim, TR TR c(R)c(R ) TR R c(R R ) . (5.35) Portanto, c(R)c(R) c(R R) . (5.36) A função matemática com esta propriedade é a exponencial. Assim, c(R) e ikR . Para completarmos a demonstração, falta mostrar que k é um vetor de onda real. Para isso, vamos utilizar novamente a idéia de condições de contorno periódicas, introduzida anteriormente. Vamos supor que temos um cristal com dimensões L1, L2 e L3 nas direções dos vetores unitários a1, a2 e a3, como mostra a figura abaixo, de modo que Li N i a i , onde Ni é inteiro. N3a3 L3 N2a2 a3 a2 L2 N1a1 L1 a1 Figura 5.9 – Esquema da super-célula com condições de contorno periódicas. Aplicamos então as condições de contorno periódicas: (5.37) 68 (r) (r N i a i ) e ik ( N a ) (r) , que implica em e ik ( N a ) 1 para todo i. Usamos agora o fato que os vetores unitários da rede recíproca, b1, b2 e b3, formam uma base no espaço recíproco, de modo que podemos escrever o vetor de onda k como uma combinação linear k x1b 1 x 2 b 2 x3 b 3 . Então, usando a própria definição dos vetores unitários da rede recíproca, b i a j 2 ij , temos i i i i x1 2 n1 ; N1 x2 2 n 2 ; N2 x3 2 n3 , N3 (5.38) onde n1, n2 e n3 são inteiros. Portanto, os coeficientes xi são reais, e desta forma k é um vetor real. Está provado então o Teorema de Bloch: nk (r R) e ik R nk (r) . (5.39) A importância do Teorema de Bloch para a FMC é melhor compreendida quando exploramos algumas de suas consequências : 1. Significado de k. Diferentemente do que ocorre com um elétron livre, para um elétron de Bloch não é um autoestado de p com autovalor k . Isto ocorre porque o potencial cristalino quebra a simetria de translação completa do espaço. Podemos verificar este resultado pela aplicação direta de p na função de onda de Bloch: p nk i e ik r u nk (r ) k nk i e ik r u nk (r ) . (5.40) Ainda assim, a quantidade k tem grande relevância e recebe o nome de momento cristalino. Veremos seu significado físico em maior detalhe quando estudarmos a dinâmica de elétrons em sólidos, assunto do próximo capítulo. 2. Multiplicidade na escolha de k. A função de onda de Bloch introduz o vetor de onda k como um bom número quântico associado à fase e ikR pela qual a função de onda é multiplicada quando fazemos um translação por um vetor da rede R. Porém, se lembrarmos que e iGR 1 , temos nk (r R) e iGR e ik R nk (r) e i (k G )R nk (r) , (5.41) ou seja, se k é um bom número quântico associado uma função de Bloch, (k+G) também é um bom número quântico associado à mesma função. Em muitas situações, é conveniente eliminar esta multiplicidade de números quânticos, e para isso é necessário restringir os vetores de onda k permitidos apenas àqueles contidos na 1a Zona de Brillouin. Note que, se k está dentro da 1a Zona de Brillouin, (k+G) estará fora dela. O número de vetores de onda k permitidos pode ser calculado da seguinte forma. Como vimos anteriormente, o volume no espaço recíproco ocupado por cada k é d 3 k (2 ) 3 V , onde V é o volume total do cristal. Portanto, como os k's permitidos estão restritos à 1a ZB, a quantidade deles é N k (VZBV ) (2 3 ) , onde VZB é o volume da 69 Zona de Brillouin. Podemos escrever o volume total do cristal como V N cel v cel , onde Ncel é o número de células unitárias primitivas contidas no cristal e vcel é o volume de cada célula. Desta maneira4, N k N cel v cel (2 ) 3 VZB N cel . (5.42) Este é um resultado importante, que será usado futuramente: o número de k's permitidos é igual ao número de células primitivas contidas no cristal. Assim, quando tomarmos o limite V (que é sempre um bom limite em se tratando de cristais macroscópios), podemos supor que o conjunto de k's permitidos torna-se cada vez mais denso na 1a ZB, aproximando-se de uma distribuição contínua. Bandas de energia Para cada k k Figura 5.10 – Diagrama esquemático do conjunto discreto de soluções da equação de autovalores para cada k (à esquerda). No limite de um cristal infinito, o conjunto de k’s permitidos (pontos no gráfico à direita) tornase contínuo e temos as bandas de energia (linhas o gráfico à direita). 3. Índice de banda. Para cada k na 1a ZB, há diversas soluções nk possíveis da equação de Schrödinger, cada qual indexada por um número inteiro n, conhecido como índice de banda. Isto pode ser entendido através da equação de autovalores para a parte periódica u k (r) da função de onda de Bloch. Partindo-se da equação de Schrödinger, 2 2 U (r ) e ik r u k (r ) k e ik r u k (r ) , 2m (5.42) e após alguma manipulação algébrica, chega-se à seguinte equação para u: 2 (ik ) 2 U (r ) u k (r ) k u k (r ) . 2m 4 3 Usamos aqui um resultado demonstrado na última lista de exercícios, V (2 ) . ZB v cel 70 (5.43) Como uk(r) é uma função periódica, a equação acima pode ser resolvida apenas na região contida em uma célula primitiva do cristal, com as condições de contorno u k (r ) u k (r R ) . Temos então, para cada k, um problema independente de autovalores com condições de contorno em uma região finita do espaço. Esperamos, portanto, que as soluções possíveis formem um conjunto discreto de autovalores, que indexamos então por um índice de banda n, nk como está mostrado na Fig. 5.10. Note que, no limite V , quando o conjunto de k's permitidos forma quase um contínuo, podemos interpolar entre k's vizinhos para o mesmo n, formando uma distribuição quase contínua de autovalores da energia, n (k ) , conhecida como banda de energia. 4. Velocidade de um elétron de Bloch. Pode-se mostrar5 que um elétron em um estado de Bloch com energia n (k ) tem associado a si uma velocidade média (mais precisamente, o valor esperado do operador velocidade p/m no estado de Bloch) igual a v n (k ) 1 k n (k ) . (5.44) Note que este resultado tem consequências até certo ponto surpreendentes. Segundo a expressão acima, um elétron no estado nk (r) tem uma velocidade média em geral nãonula mesmo na ausência de campos externos. Isto seria esperado para um elétron livre, mas não é imediatamente óbvio para um elétron sob a ação de um potencial devido aos íons e aos demais elétrons. Na verdade, a expectativa que se tinha a partir de modelos clássicos de condução eletrônica (que estudaremos em maior detalhe no próximo capítulo), é que o elétron seria repetidamente “espalhado” através de colisões aleatórias com os íons cristalinos, e este fenômeno seria responsável pela resistência elétrica dos materiais. A teoria de Bloch nos apresenta uma imagem física completamente distinta: na presença de um potencial periódico, os elétrons viajam pelo cristal sem colidir com os núcleos, como se “aprendessem” a periodicidade cristalina. Isto pode ser entendido de forma mais precisa invocando-se a natureza ondulatória do elétron e interpretando a função de Bloch como uma onda que participa de um processo de espalhamento coerente pelo potencial periódico. Um dos sucessos mais significativos da teoria quântica dos estados eletrônicos em um cristal, que delineamos nesta seção, foi a explicação da existência de diferentes tipos de sólidos (metais e isolantes) a partir do conhecimento de sua estrutura de bandas e do preenchimento das mesmas. Como vimos, o número de k’s permitidos é igual ao número de células primitivas, Ncel. Assim, o número de estados eletrônicos que cada banda pode comportar é 2 Ncel, onde o fator 2 aparece devido ao spin. Então, o número de elétrons por célula unitária e a topologia da estrutura de bandas pode determinar se as bandas estarão totalmente ou parcialmente preenchidas. Vamos analisar alguns exemplos: 1. Número ímpar de elétrons por célula primitiva. Se há um número ímpar de elétrons por célula primitiva, a última banda ocupada nunca poderá ficar totalmente ocupada, já que uma banda totalmente ocupada requer um número par de elétrons (2 5 Apêndice E do Ashcroft. Uma outra maneira de entender este resultado é pensando em um elétron como sendo descrito por um pacote de ondas com velocidade de grupo ( v g p. 203.) 71 d dk 1 d dk ) (Kittel, Ncel), como mostra a Fig. 5.11. Este é o caso, por exemplo, dos metais alcalinos, que possuem 1 elétron no nível mais energético. Este nível dará origem a uma banda semipreenchida. Como veremos no próximo capítulo, apenas as bandas semi-preenchidas contribuem para a condução de eletricidade, portanto esta análise simples pode ser usada para prever que todo cristal com um número ímpar de elétrons por célula primitiva será um metal. F k a 1 ZB Figura 5.11 – A última banda semi-preenchida de um cristal com um número ímpar de elétrons por célula primitiva. Apenas os níveis com energia menor que a energia de Fermi estão ocupados. 2. Número par de elétrons por célula primitiva. Neste caso, teremos dois casos possíveis: 2.a – Se as bandas próximas ao nível de Fermi não se superpõem em energia, a última banda preenchida (comumente chamada de banda de valência) estará totalmente preenchida e a banda seguinte (banda de condução) estará totalmente vazia, como mostra a Fig. 5.12. Banda de condução F gap Banda de valência k 1a ZB Figura 5.12 – Esquema de bandas de um cristal com número par de elétrons por célula primitiva e sem superposição entre as bandas. 72 Exemplos são o Si, Ge, NaCl, etc. Quando isto ocorre, o material será um isolante, e a região de energias entre as duas bandas onde não há estados eletrônicos permitidos é conhecida como gap de energia. Um tipo especial de isolante ocorre quando a energia do gap é pequena, e elétrons podem ser excitados termicamente da banda de valência para a de condução. Neste caso, o material é conhecido como semicondutor por ter propriedades de condução intermediárias entre um metal e um isolante. 2.b – Se as bandas se superpõem em energia, podemos ter a situação mostrada na Fig. 5.13 onde, apesar de haver um número par de elétrons por célula primitiva, o material é metálico pois há duas bandas semipreenchidas. Exemplos são alguns metais divalentes como o Ca e o Mg, e sistemas mais complicados como o As e o grafite, estes últimos conhecidos como semimetais por apresentarem uma superposição de bandas bem pequena. F 1a ZB k Figura 5.13 – Esquema de bandas de um cristal com número par de elétrons por célula primitiva e com superposição entre as bandas, dando origem a um metal divalente ou semimetal. Estes resultados revelam uma teoria simples porém poderosa. Apenas utilizando a Mecânica Quântica e considerações elementares de simetria, os físicos obtiveram, na primeira metade do século, resultados que explicavam diversas propriedades dos sólidos que eram conhecidas há muito tempo e de grande utilidade na vida prática. Isto deu grande impulso na pesquisa, tanto teórica como experimental, em FMC. 5.4 - A equação central O Teorema de Bloch nos fornece a forma geral das soluções da equação de Schrödinger de um elétron em um potencial periódico. Desenvolveremos agora um método prático para calcular estas funções de onda, a partir de um potencial dado. Partimos da função de onda de Bloch, nk (r) e ik r u nk (r) . Como u nk (r) é uma função com a mesma periodicidade da rede de Bravais, apenas os vetores G da rede recíproca participam em sua expansão de Fourier. Podemos então escrever 73 u nk (r ) c n ,k ,G e iGr . (5.45) G Será mais conveniente escrever cn,k ,G ck G . Isto é possível porque, para k dentro da primeira ZB, existe apenas um par de vetores k e G associados a um dado k G . Assim, u nk (r ) c(k G ) e iGr . (5.45a) G A função de onda de Bloch é então escrita da forma nk (r ) c(k G ) e i (k G )r . (5.46) G O problema de se encontrar soluções para a equação de Schrödinger se resume portanto à determinação dos coeficientes ck G . O potencial cristalino U(r) também é periódico, de modo que também podemos escrevê-lo como uma expansão de Fourier nos vetores G: U (r ) U G e iG r . G (5.47) Assim, introduzimos estas expressões na equação de Schrödinger, que se torna um sistema de equações para os coeficientes c(k - G): 2 2 U (r ) 2m 2 (k G ) 2 c(k G ) e i (k G )r U G c(k G ) e i (k G G )r 0 2m G G ,G (5.48) Como as ondas planas são funções linearmente independentes, o coeficiente multiplicativo de cada onda plana e i (k G)r deve ser zero separadamente. Obtemos assim, 2 (k G) 2 c(k G) U G c(k G ) G ,G G 0 2m G ,G (5.49) Devido à presença da delta de Kronecker no somatório duplo, este torna-se um somatório simples: 2 (k G ) 2 c(k G ) U G c(k G G ) 0 2m G 74 (5.49a) Por razões apenas estéticas, redefinimos os vetores de onda na equação acima: G G , G G G , e chegamos na expressão 2 (k G ) 2 c(k G ) U G G c(k G ) 0 2m G (5.50) Esta é a equação central. Ela nos permite, em princípio, obter os coeficientes de Fourier da função de onda ck G a partir de um potencial cristalino conhecido. Note que o potencial cristalino "acopla" os coeficientes ck G e ck G através do coeficiente de Fourier U GG . É portanto um sistema infinito de equações, uma para cada um dos infinitos G's. Para que haja solução, é necessário que o seguinte determinante seja nulo: k G U 0 1 U G1 G 2 U G1 G 3 U G 2 G 1 k G 2 U 0 U G 2 G 3 U G 3 G 1 U G 3 G 2 k G 3 U 0 0 , (5.51) onde k G 2 (k G) 2 2m . O método de solução da equação de Schrödinger em um potencial periódico está portanto formulado. Note que isto não quer dizer que a solução seja simples. Pelo contrário, no momento ela nos parece uma tarefa absurdamente difícil: temos que resolver um conjunto infinito de equações para cada um dos vetores de onda k (que são também virtualmente infinitos, já que Nk = Ncel), a partir de um potencial cristalino que ainda não sabemos determinar! Mas é importante não se desesperar, vamos resolver estes problemas um de cada vez… A questão do número infinito de pontos k é resolvida da seguinte maneira: observando-se o determinante (5.51), é fácil intuir que as soluções para um dado k não podem diferir muito das soluções para outros k's próximos a ele. É suficiente portanto resolver a equação central apenas para uma amostragem discreta de pontos k na 1a ZB e, a partir deles, se necessário, interpolar as soluções para os demais k's. Este procedimento é conhecido como amostragem de pontos k. O problema do número infinito de vetores G da rede recíproca também pode ser resolvido de maneira simples. Ondas planas com G grande são funções rapidamente oscilantes, com energia cinética alta. Porém, os estados eletrônicos de maior interesse são aqueles de mais baixa energia, ou seja, os estados ocupados e os primeiros níveis excitados. É razoável supor que as ondas planas que irão contribuir para a expansão de Fourier destes estados são aquelas de mais baixa energia cinética, que oscilam mais suavemente no espaço, ou seja, aquelas associadas a vetores G pequenos. Assim, sob o ponto de vista prático, é sempre possível "truncar" a expansão (5.46), de modo que nk (r ) e ik r c(k G) e |G | Gmax 75 iG r . (5.52) Deste modo, nossa tarefa se resume a resolver um determinante finito. Tipicamente, a expansão da função de onda pode ser truncada com algumas centenas de vetores G por átomo da célula unitária, e portanto o determinante correspondente pode ser resolvido numericamente sem grandes dificuldades. Além disso, como veremos no final desta Seção, o potencial cristalino UG também decresce rapidamente com o aumento de |G|. Nos resta agora o problema de determinar o potencial U(r) através de suas componentes de Fourier UG: UG 1 v cel dr U (r) e i G r . (5.53) vcel Podemos separar o potencial cristalino em diversas contribuições distintas. A contribuição mais simples é devida aos núcleos positivos, que é dada por U nuc (r) 1 4 0 i Zie2 , r Ri (5.54) onde o somatório é por todos os núcleos do cristal, cada qual com número atômico Zi e posição Ri. Outro termo do potencial é devido à interação Coulombiana repulsiva entre os elétrons, e pode ser aproximado como o potencial devido a uma distribuição contínua de carga: U H (r) 1 4 0 dr e 2 n(r ) . r r (5.55) Este termo, também conhecido como termo de Hartree, é um potencial de interação eletrostática puramente clássico. Nele aparece a densidade eletrônica n(r), que pode ser obtida a partir das funções de onda eletrônicas como n(r ) j (r ) , 2 (5.56) j onde o somatório é sobre todas as bandas ocupadas. Note portanto que UH é um potencial auto-consistente, ou seja, depende das soluções da equação de Schrödinger, e como tal deve ser obtido através de métodos iterativos. Poderíamos pensar que o potencial Coulombiano devido aos núcleos e aos demais elétrons seriam os únicos termos do potencial de um elétron. Porém, temos que lembrar que estamos trabalhando dentro da aproximação de partícula independente. Nosso ponto inicial, a equação de Schrödinger para uma partícula (5.43), já é uma aproximação. De forma mais rigorosa, teríamos que resolver a equação de para uma função de onda de muitos elétrons, o que é uma tarefa muito mais complicada. Isto dá origem aos efeitos quânticos de troca e correlação. A interação de troca tem origem no princípio de exclusão de Pauli, que impede que dois elétrons ocupem o mesmo estado quântico. Assim, dois elétrons de mesmo spin sofrem uma repulsão efetiva e de curto alcance. A 76 inclusão dos efeitos de interação de troca leva à chamada aproximação de HartreeFock, bastante popular em cálculos de átomos e moléculas, mas cuja implementação não é tão simples em sólidos cristalinos. Além da interação de troca, há os efeitos de correlação. Mesmo elétrons de spin oposto tendem a se "mover" de forma correlacionada, evitando as regiões próximas uns dos outros, de forma a minimizar a repulsão Coulombiana. No entanto, a boa notícia é que em muitos casos estes efeitos podem ser mapeados em potenciais efetivos de uma partícula. A inclusão dos efeitos quânticos de troca e correlação no potencial cristalino é ainda um problema em aberto em FMC. Apesar de não haver no momento uma metodologia simples que leve a resultados "exatos", muito tem sido feito nesta área nas últimas décadas, e excelentes aproximações para o potencial efetivo de troca e correlação já existem. Uma outra abordagem é a determinação empírica dos coeficientes de Fourier do potencial cristalino, a partir de medidas experimentais da estrutura de bandas n(k). Esta abordagem é bastante útil em cálculos envolvendo sistemas complexos, como ligas, defeitos, superfícies, interfaces, etc. Vamos estudar em mais detalhe algumas propriedades do potencial cristalino: (a) O coeficiente de Fourier para G = 0 é dado por U0 1 v cel dr U (r) , (5.57) v cel ou seja, é apenas o potencial médio do cristal. Como os resultados físicos não dependem da escolha da origem de energias, é uma escolha conveniente e usual tomar U 0 0 , que consiste simplesmente em subtrair-se U0 do potencial U(r). (b) O potencial U(r) é real. Como consequência, U G U G , como mostramos abaixo (o somatório agrupa os termos G e -G): U (r ) U G e iG r G (U G e iG r U G e iG r ) . ' (5.58) G (c) Se o cristal tem simetria de inversão, ou seja, se U (r) U (r) , então U (r) U G e iGr U G e iGr U (r) G G U G U G (5.59) Juntamente com o resultado do item (b), isto implica que UG é real. (d) As componentes de Fourier da contribuição dos núcleos para o potencial cristalino, U Gnuc , decaem com 1/G2. Para mostrarmos este resultado, partimos da expressão de Unuc(r) como uma soma de potenciais atômicos : U nuc (r) j (r R j ) , R j 77 (5.60) onde R são os vetores da rede de Bravais e j são os vetores da base. Calculando as componentes de Fourier, temos UG 1 vcel 1 vcel dr U (r) e iG r cel dr e iG r R cel 1 vcel e 1 vcel e iG j j j (r R j ) j dr e iG ( r j ) j (r j ) todo espaço iG j j (G ) (5.61) j onde mais uma vez utilizamos o fato de que a soma sobre todas as células unitárias da integral sobre uma célula é igual à integral sobre todo o espaço. Note a similaridade desta expressão com o fator de estrutura, que encontramos no contexto da teoria de difração iG ( r j ) j (r j ) como a de raios-X (veja Eq. (4.24)). Definimos j (G ) dr e todo espaço transformada de Fourier do potencial do átomo j. Falta agora mostrar que j (G ) decai com 1/G2 se o potencial nuclear é Coulombiano, e isto será feito na próxima lista de exercícios. 5.5 - Aproximação de elétron quase-livre Como vimos na Seção anterior, a solução da equação de Schrödinger de um elétron em um cristal é um problema bem formulado, porém sua implementação prática não é trivial, principalmente devido às dificuldades em se calcular o potencial cristalino de forma auto-consistente, a partir de primeiros princípios. Há, porém, métodos simples que permitem a obtenção de soluções aproximadas da equação de Schrödinger e que são bastante úteis em algumas situações. Iremos conhecer dois destes métodos nas próximas Seções. O primeiro tipo de aproximação que iremos descrever é a chamada aproximação de elétron quase-livre. Esta aproximação será boa se o potencial cristalino for suficientemente fraco de modo que possa ser considerado como uma perturbação. Na verdade, é útil iniciar este estudo relembrando uma aproximação ainda mais drástica que estudamos no início deste capítulo: a aproximação de elétron livre. Vamos reformular a aproximação de elétron livre usando todo o formalismo desenvolvido nas duas últimas seções para potenciais periódicos. Em outras palavras, iremos supor que existe uma rede (e portanto uma rede recíproca), mas vamos considerar o limite extremo 78 em que o potencial cristalino é nulo6, ou seja, U G 0 para todo G. Assim, a equação central torna-se simplesmente 2 (k G ) 2 c(k G ) 0 2m (5.62) Notamos que neste caso a equação central é de fácil solução: 2 (k G) 2 2m ou c(k G) 0 , ou seja, para cada banda apenas um termo da expansão (5.46) da função de onda sobrevive, correspondendo a um específico vetor da rede recíproca G. As autofunções (devidamente normalizadas) e autovalores são, portanto, nk (r) 1 V e i (k G n )r ; n (k ) 2 (k G n ) 2 . 2m (5.63) As bandas de energia n (k ) para um exemplo unidimensional estão mostradas na Fig. 5.14: são parábolas centradas nos diferentes G's. Lembre-se porém que podemos restringir o vetor de onda k àqueles contidos na 1a ZB. Portanto, as bandas de energia "suficientes" são aquelas mostradas em negrito na figura7. (k) -G2 -G1 0 1 ZB a G1 G2 k Figura 5.14 - Estrutura de bandas na aproximação de rede vazia. As bandas são parábolas centradas nos diferentes vetores da rede recíproca. A parte "não-redundante" da estrutura de bandas é aquela em negrito contida dentro da 1a Zona de Brillouin (indicada pelas linhas tracejadas). Também não podemos nos esquecer que, na aproximação de rede vazia, a periodicidade é totalmente artificial. Portanto, nossos resultados devem ser inteiramente 6 Por este motivo, esta aproximação é também conhecida como aproximação de rede vazia. A equação central (5.50) torna mais fácil entender porque podemos restringir k à 1a ZB. O conjunto de equações para um dado k é exatamente idêntico a um suposto conjunto de equações para um dado k – G fora da 1a ZB, já que há uma equação para cada um dos vetores G. 7 79 equivalentes aos que obtemos na aproximação de elétron livre, ou seja, 2 k 2 2m . Isto corresponde à parábola centrada na origem. Podemos notar que os dois resultados são equivalentes observando que as bandas na 1a ZB são pedaços de parábolas que podemos imaginar terem sido "recortados" da parábola centrada em G = 0 e deslocados para dentro da 1a ZB. Experimentos em alguns metais (tipicamente metais alcalinos), mostram que em muitas situações os elétrons se comportam de maneira semelhante a elétrons livres. Isto parece indicar que, de alguma maneira, o potencial cristalino efetivo para os elétrons de valência destes materiais é fraco. Isto ocorre por dois motivos básicos: (a) os elétrons de valência não penetram na região muito próxima aos núcleos (onde o potencial é necessariamente forte) devido à repulsão efetiva (Coulombiana + Princípio de Exclusão de Pauli) exercida pelos elétrons de caroço e (b) mesmo na região intersticial (longe dos núcleos), o potencial iônico é blindado pelos demais elétrons de valência. Estes fatos fornecem uma indicação de que podemos, para estes sistemas, tratar o potencial cristalino como uma perturbação. Esta é a aproximação de elétron quase-livre, que iremos descrever a seguir. Separamos a Hamiltoniana em duas partes, H H 0 U , onde H0 é apenas o termo de energia cinética e U é o potencial cristalino, que iremos tratar em teoria de perturbação. Os autovalores e autovetores da Hamiltoniana não-perturbada são aqueles da equação (5.63). Iremos denominar os kets correspondentes como k G n . Os autovalores da Hamiltoniana completa, até 2a ordem de perturbação, são n (k ) k G k G n U k G n n onde k G k Gn U k G j 2 , (5.64) U (r ) e i (k G n )r U 0 0 . (5.65) k G k G j n n j 2 (k G ) 2 . O termo de 1a ordem é: 2m k Gn U k Gn 1 vcel dr e i ( k G n )r vcel Já o elemento de matriz do termo de 2a ordem é não-nulo: k Gn U k G j 1 vcel dr U (r) e i ( G j G n ) r U G j G n (5.66) v cel Portanto, a expressão completa das energias de um elétron “quase-livre”, até 2a ordem de perturbação, é 2 n (k ) k G n jn 80 U G j G n k G k G n . j (5.67) Como se nota, o denominador no termo de 2a ordem faz com que, no caso de um potencial fraco, a correção devida ao potencial seja mais importante para vetores de onda k onde ocorra uma “quase-degenerescência” dos níveis de elétron livre: k G n k G j . Isso ocorre na vizinhança dos “planos de Bragg”8 assim chamados porque são exatamente os vetores k com extremidade nestes planos que satisfazem a condição de difração de von Laue que descrevemos na equação (4.15) e na Fig. 4.7. Veja um plano de Bragg na Fig. 5.15. (k – G1) 2 = (k – G2)2 k – G1 k – G2 G1 G2 G2 – G1 Figura 5.15 – Representação de um plano de Bragg entre os vetores da rede recíproca G1 e G2. Note que o plano define a mesma condição geométrica da condição de von Laue. Apenas na vizinhança destes planos de Bragg os autovalores da energia serão substancialmente perturbados com relação às parábolas que representam a situação de elétron livre. Isto está esquematizado na Fig. 5.16. A quebra de simetria devido ao potencial cristalino faz com que haja uma “repulsão” entre os níveis de elétron livre, abrindo-se um gap de magnitude 2 U G 2 G1 (como demonstraremos a seguir), no plano de Bragg. O potencial cristalino é portanto o responsável pela origem dos gaps de energia nos sólidos cristalinos. Iremos obter agora uma solução analítica para as bandas na vizinhança de um plano de Bragg. Considere um do plano de Bragg definido por k G 1 k G 2 . Na vizinhança deste plano, dentro da aproximação de elétron quase-livre, é razoável supor que apenas os coeficientes c(k - G1) e c(k – G2) irão contribuir para a expansão das funções de onda de Bloch: k (r) c(k G1 )e i (k G )r c(k G 2 )ei (k G 1 2 )r . (5.68) A equação central torna-se então: 8 Não confundir com os planos cristalinos no espaço real que descrevemos no Capítulo 4. Os planos de Bragg são planos no espaço recíproco. 81 (k G1 ) c(k G 1 ) U G 2 G1 c(k G 2 ) 0 (5.69) (k G 2 ) c(k G 2 ) U G1 G 2 c(k G 1 ) 0 Basta agora resolver um determinante (2x2). Deixamos isto a cargo do leitor, que usando ainda que U G1 G 2 U G 2 G1 , poderá obter as energias das bandas de elétron quase-livre: 1 1 (k ) (k G k G ) (k G k G ) 2 U G 2 4 1 2 2 1 2 2 G1 1/ 2 . (5.70) Plano de Bragg 2 U G 2 G1 G1 G2 k Figura 5.16 – Representação da estrutura de bandas na vizinhança de um plano de Bragg, indicado pela linha tracejada. As linhas pontilhadas são as energias de elétron livre. Está portanto demonstrado que o gap tem magnitude 2 U G 2 G1 . Pode-se também mostrar (verifique!), derivando a expressão (5.70), que quando o ponto k está no plano de Bragg, o gradiente da energia no espaço recíproco é (G G 1 ) 2 k k 2 , m 2 (5.70) que é um vetor contido no plano de Bragg, ou seja, as superfícies de energia constante são perpendiculares ao plano de Bragg, como veremos na lista de exercícios. 82 5.6 – Zonas de Brillouin e Superfícies de Fermi Figura 5.17 – Figura 9.4 do Ashcroft. Há diversos esquemas de visualização da estrutura de bandas. Como é suficiente considerar apenas os vetores k contidos na 1a Zona de Brillouin, o esquema de visualização mais usual é aquele conhecido como esquema de zona reduzida. Faz-se exatamente como fizemos para as bandas de elétron livre, ou seja, desloca-se todos os 83 pontos (k) fora da 1a ZB para dentro da mesma. Assim, todas as bandas ficam contidas na 1a ZB e a convenção k 1a ZB fica explícita (Fig. 5.17(f)). Este porém não é o único esquema de visualização possível. Há também o esquema de zona estendida (veja Fig. 5.17(e)), onde se abre mão da convenção k 1a ZB para se obter uma comparação mais clara com a situação de elétrons livres (apenas uma parábola centrada em k = 0). Um terceiro esquema possível é o de zona repetida ou zona periódica, esquematizado na Fig. 5.17(g). Esta descrição é obtida repetindo-se todos os níveis de zona reduzida n (k ) para fora da 1a ZB, fazendo-se n (k) n (k G) . É uma descrição redundante, mas enfatiza a periodicidade da estrutura de bandas, sendo muitas vezes útil para interpretar propriedades dinâmicas dos elétrons, como veremos no próximo capítulo. Definimos no Capítulo 4 a 1a Zona de Brillouin como a célula de Wigner-Seitz da rede recíproca. A própria expressão “primeira ZB” sugere que existem outras. Definiremos a seguir as demais Zonas de Brillouin de uma maneira formal. - A 1a ZB é o conjunto de pontos no espaço k que podem ser atingidos a partir da origem sem cruzar nenhum plano de Bragg. - A 2a ZB é o conjunto de pontos no espaço k que podem ser atingidos a partir da 1a ZB cruzando apenas 1 plano de Bragg. - Generalizando, a (n+1)-ésima ZB é o conjunto de pontos no espaço k que podem ser atingidos a partir da n-ésima ZB cruzando apenas 1 plano de Bragg, e que não estejam na (n-1)-ésima ZB. O espaço recíproco é portanto completamente retalhado em Zonas de Brillouin. Veja na Fig. 5.18 o exemplo da rede quadrada (bidimensional). Note que apenas a 1a ZB é conexa. Pode-se verificar também que todas as ZB’s têm o mesmo volume e são células primitivas da rede recíproca. 3 2 3 3 3 2 2 1 3 3 2 3 3 Figura 5.18 – As 3 primeiras Zonas de Brillouin da rede quadrada. Os círculos representam pontos da rede recíproca e as linhas são os planos de Bragg. 84 Um outro conceito importante, e que também será útil na discussão do próximo Capítulo sobre dinâmica de elétrons em sólidos, é a superfície de Fermi. Definimos a superfície de Fermi na Seção 5.1 como o subconjunto de pontos k tais que (k ) F . Vimos que, no caso de elétrons livres, a superfície de Fermi é a superfície de uma esfera, a esfera de Fermi. Vamos analisar com um pouco mais de detalhe como isso muda na presença do potencial cristalino. Inicialmente, consideremos a aproximação de rede vazia. Para fixar idéias, vamos tomar novamente o exemplo da rede quadrada bidimensional. Em 2D, a superfície de Fermi é uma curva, a curva de Fermi. Se o potencial cristalino for nulo, a curva de Fermi será uma circunferência, e se o número de elétrons for pequeno o suficiente, esta circunferência não irá tocar nenhum plano de Bragg e estará contida na 1a Zona de Brillouin, como mostra a Fig. 5.19. A figura mostra ainda as bandas de elétron livre nesta situação, indicando os estados ocupados e os desocupados. (a) ky (b) M X Γ kx F 1a ZB M Γ X M Figura 5.19 – (a) O círculo de Fermi na aproximação de rede vazia, para um número de elétrons pequeno o suficiente para que a círculo esteja contido na 1 a ZB. A região cinza corresponde a estados eletrônicos ocupados. (b) A estrutura de bandas correspondente, no esquema de banda estendida. A região em negrito corresponde aos estados ocupados, com energia menor que F. Os pontos Γ: (0,0); X: (π/a,0) e M: (π/a, π/a) indicam pontos de alta simetria da 1a ZB. A situação mostrada na figura acima é na verdade bastante similar ao que ocorre nos metais alcalinos. Os metais alcalinos têm 1 elétron por célula unitária e portanto a 1a ZB está preenchida exatamente pela metade (cabem 2 N cel elétrons na 1a ZB). Como a aproximação de elétron quase-livre é válida para estes materiais, a superfície de Fermi (que fica distante dos planos de Bragg) é praticamente esférica. Consideremos agora o que ocorre se tivermos mais elétrons no sistema, de modo que o círculo de Fermi cruze a 1a ZB. Esta situação está esquematizada na Fig. 5.20. As Figs. 5.20 (a) e (b) correspondem ao esquema de zona estendida, enquanto que as (c) e (d) correspondem ao esquema de zona reduzida. Note que, neste esquema, as porções do círculo de Fermi que estariam fora da 1a ZB são trazidas para dentro da mesma através de translações por vetores da rede recíproca. 85 ky (a) Γ (b) M F kx 1a ZB ky (c) M M X Γ kx 1a banda Γ X M (d) 1a ZB F ky M Γ 2a banda X kx M Γ X M 1a ZB Figura 5.20 – (a) O círculo de Fermi na aproximação de rede vazia, no esquema de zona estendida, para um número de elétrons grande o suficiente para que a círculo não esteja contido na 1a ZB. (b) A estrutura de bandas correspondente. (c) O mesmo que (a), no esquema de zona reduzida. Note que agora há duas bandas a serem consideradas. (d) A estrutura de bandas correspondente. Consideremos agora o efeito do potencial cristalino. Assumindo que a aproximação de elétron quase-livre seja válida, é razoável supor que a superfície de Fermi só irá se desviar de uma esfera na vizinhança dos planos de Bragg. Podemos entender qualitativamente a forma deste desvio lembrando o resultado da equação (5.70), que implica em que as superfícies de energia constante são perpendiculares aos planos de Bragg. Assim, a superfície de Fermi (que é uma superfície de energia constante) deve se deformar de modo a satisfazer esta condição. A Fig. 5.21 mostra um esquema qualitativo desta deformação no caso de uma rede quadrada bidimensional. Iremos investigar este efeito mais detalhadamente na lista de exercícios. 86 1a ZB Figura 5.21 – Efeito da deformação induzida pelo potencial cristalino no círculo de Fermi de uma rede quadrada. Note que a superfície de Fermi (em negrito) fica perpendicular aos planos de Bragg. 5.7 - O método tight-binding Na penúltima Seção, estudamos um método para obter soluções aproximadas da equação central quando o potencial cristalino é fraco e pode ser considerado uma perturbação, a aproximação de elétron quase-livre. Na ocasião, utilizamos ondas planas como funções de base para expandir a função de onda de Bloch e vimos que eram necessárias poucas ondas planas para descrever toda a estrutura de bandas, tipicamente 1 onda plana nas regiões interiores da 1a ZB e 2 ondas planas nas vizinhanças de um plano de Bragg. No entanto, há muitas situações em que o potencial cristalino não é suficientemente fraco para que possa ser considerado uma perturbação. Isto ocorre na maioria dos sistemas não-metálicos e mesmo para os elétrons mais localizados de alguns sistemas metálicos (por exemplo, os elétrons d dos metais de transição). Neste caso, apesar da expansão (5.46) em ondas planas ser em princípio exata e formalmente correta, não será conveniente, pois serão necessárias muitas ondas planas para descrever estados eletrônicos que são localizados espacialmente. Quando isto ocorre, é mais conveniente utilizar uma base de orbitais atômicos para descrever nosso estado de Bloch. Os orbitais atômicos são soluções da equação de Schrödinger no limite em que temos átomos isolados. Assim, imagina-se que eles possam fornecer uma boa descrição para estados eletrônicos que estão tão fortemente ligados aos seus átomos de origem que o potencial dos demais íons pode ser considerado uma perturbação. O método que iremos descrever a seguir é, portanto, uma boa aproximação para estes elétrons fortemente ligados, e por este motivo é conhecido como método tightbinding (TB). 87 Por simplicidade, vamos considerar o caso de um cristal monoatômico (apenas 1 átomo na base) com apenas 1 orbital s por átomo, como se tivéssemos um cristal de átomos de hidrogênio. O método pode ser facilmente generalizado para sistemas mais complicados. Escrevemos nossa função de Bloch como uma combinação linear de orbitais atômicos (LCAO), k (r ) c k (R ) (r R ) . (5.71) R Omitimos por simplicidade o índice de banda, mas está implícito que há uma combinação linear distinta para cada banda. O somatório é sobre todos os átomos, localizados nos pontos da rede R, e (r R) é um orbital atômico também centrado no sítio R. Se lembrarmos nossa discussão sobre a molécula de H 2 , notaremos que a equação (5.71) é apenas uma generalização daquela expansão para um sistema com N átomos. Na ocasião, tínhamos apenas 2 átomos, e os auto-estados resultantes eram combinações lineares ligante e anti-ligante. Portanto, devemos esperar aqui que os N níveis atômicos, degenerados quando os átomos estão infinitamente afastados, abram-se em N estados que irão formar uma banda de largura W, como mostra a Fig. 5.22. Sabemos também, a partir da nossa análise geral sobre potenciais periódicos, que cada um destes níveis deve estar associado a um vetor de onda k da 1a ZB, já que haverá N vetores k permitidos dentro da 1a ZB. Espera-se que, quanto menor a distância entre os átomos, maior será a superposição (overlap) entre as funções de onda e portanto maior será a largura da banda resultante. Mostraremos este resultado ao final desta Seção. N estados em uma banda de largura W N estados degenerados Distância interatômica Figura 5.22 - Os N estados degenerados de N átomos isolados "abrem-se" em uma banda de largura W. A função de onda (5.71) deve satisfazer ao Teorema de Bloch. Mostraremos que esta condição estará automaticamente satisfeita se 1 c k (R ) e ik R . (5.72) N O Teorema de Bloch nos diz que k (r R) e ikR k (r) . Calculando k (r R ) com a expressão (5.71) e utilizando ck (R) definido em (5.72), temos 88 k (r R ) 1 e N ik R (r R R ) R e ik R 1 N e ik ( R R ) , (r (R R )) e (5.73) ik R k (r ) R como queríamos demonstrar. Utilizando a função de onda (5.71), iremos calcular agora (k) : (k ) k H k . k k (5.74) O numerador desta expressão é dado por k H k 1 N e ik ( R R ) R ,R R H R , (5.75) onde adotamos a notação r R r R Usamos agora um argumento de simetria de translação: o elemento de matriz R H R deve depender apenas de R' - R, de modo que podemos simplificar o somatório duplo considerando R'=0: k H k e ik R R H 0 (5.76) R Se o overlap entre os orbitais atômicos é pequeno, podemos fazer a chamada aproximação de primeiros vizinhos, que consiste em supor que a integral R H 0 é não-nula apenas se R 0 ou se R R 1 , onde R 1 é o conjunto de vetores da rede que unem a origem aos sítios mais próximos (1os vizinhos). Temos que lidar com apenas dois elementos de matriz, exatamente análogos àqueles que consideramos no caso da molécula de H 2 : 0 H 0 (energia de sítio) e R1 H 0 (energia de hopping). Assim, a expressão para o numerador torna-se extremamente simples: k H k e ik R . R R1 (5.76) O cálculo do denominador da expressão (5.74) é realizado de maneira análoga: k k 1 N e R ,R ik ( R R ) R R e ik R R 0 . R 89 (5.77) Mais uma vez, toma-se a aproximação de primeiros vizinhos e, usando que 0 0 1 (normalização) e R 1 0 S (overlap), temos k k 1 S e ik R . (5.78) R R1 Assim, a relação de dispersão (k) para a banda tight-binding torna-se (k ) e ik R R R1 1 S e ikR . (5.79) RR1 Podemos simplificar ainda mais esta expressão invocando uma vez mais a condição de overlap pequeno, de modo que S 1 . Assim, (k ) e ik R R R1 1 S e ik R e ik R , RR1 RR1 (5.80) onde S . Vamos aplicar a expressão (5.80) a um exemplo simples, a rede quadrada. Para a rede quadrada, há 4 primeiros vizinhos, R 1 axˆ ou ayˆ . Supondo conhecidas as integrais e , temos (k ) e ik a e ik a e x x ik y a e ik y a 2 (cos k a cos k a) . x y (5.81) A Fig. 5.23 mostra a banda (k) ao longo de duas direções diferentes da 1a ZB. Note que a largura de banda é proporcional à energia de overlap, como argumentamos qualitativamente no início desta seção. ky - + 4 M - X kx - - 4 M X Figura 5.23 - Banda tight-binding para uma rede quadrada, entre os pontos = (0,0), X = (/a,0) e M = (/a,/a) da 1a ZB. Note que a largura de banda total é W = 8. 90 Note que, apesar da função de onda TB ser escrita como uma combinação linear de orbitais localizados, um elétron descrito por esta função de onda tem igual probabilidade de ser encontrado em qualquer sítio da rede, sendo portanto um elétron de Bloch, genuinamente deslocalizado. Lembrando a expressão para a velocidade média de um elétron de Bloch, Eq. (5.44), percebemos que, quanto maior for a largura de banda W, maior será a velocidade de um elétron no meio dela: bandas largas terão elétrons mais velozes (mais deslocalizados), enquanto que bandas estreitas terão elétrons mais lentos (menos deslocalizados). Como verificamos que a largura de banda é proporcional à superposição dos orbitais atômicos, este resultado fornece uma visão bastante intuitiva para o movimento eletrônico: podemos imaginar que o elétron tunela de um sítio da rede para o vizinho, e quanto maior a superposição dos orbitais atômicos (ou seja, quanto maior for ), maior será a taxa de tunelamento, e portanto a velocidade. 5.8 - Análise das aproximações Descrevemos neste Capítulo as propriedades dos estados eletrônicos em um cristal. Exceto na seção anterior, utilizamos a aproximação de elétron livre ou quaselivre, que consiste em considerar o potencial cristalino como sendo fraco, e argumentamos que ela seria uma boa descrição para alguns metais. Durante todo o capítulo, utilizamos ainda uma outra aproximação, a aproximação de partícula independente, que consiste em ignorar a interação elétron-elétron, ou pelo menos tratá-la como um potencial efetivo oriundo de uma distribuição média da carga eletrônica, ponderada pelas funções de onda, como por exemplo na aproximação de Hartree, descrita na Seção 5.4. Existem outros efeitos da interação elétron-elétron, como troca e correlação. Apesar disso, a aproximação de partícula independente funciona extremamente bem para a maioria dos sistemas. Nesta Seção, tentaremos justificar e analisar estas duas aproximações básicas. a) Aproximação de elétron quase-livre. À primeira vista, o potencial atuante nos elétrons de valência devido aos núcleos não poderia ser considerado fraco. É na verdade divergente, devido ao comportamento U nuc Z / r na origem. Porém, diversos fatores fazem com que o potencial efetivo sentido por um elétron de valência possa ser considerado fraco. O primeiro deles é a blindagem dos elétrons de caroço. Para sistemas contendo Zval elétrons de valência, os (Z-Zval) elétrons de caroço, localizados bem próximos do núcleo, fazem com que o potencial efetivo a longas distâncias se comporte não como -Z/r, mas como -Zval/r, o que representa uma redução importante em muitos casos. Ainda assim, o potencial parece divergir na origem. Entra em cena então a ortogonalidade entre os estados de valência e de caroço, que faz com que as funções de onda de valência sejam rapidamente oscilantes e na região do caroço. Assim, os elétrons de valência são excluídos daquela região. Esta exclusão pode ser mapeada em um potencial efetivo repulsivo, que não diverge na origem mas se comporta de maneira 91 suave, como mostrado na Fig. 5.24. A este potencial efetivo dá-se o nome de pseudopotencial. U rc r Pseudopotencial ~1/r Figura 5.24 - O efeito de ortogonalidade que repele os elétrons da região do caroço pode ser mapeado em um potencial efetivo repulsivo. A soma deste potencial com o potencial atrativo dos núcleos é conhecida como pseudopotencial. O caroço é a região r < rc. Além dos efeitos de blindagem dos elétrons de caroço e da repulsão efetiva de ortogonalidade, há também uma blindagem dos demais elétrons de valência. Se olharmos a distribuição de carga eletrônica em um metal alcalino, veremos que os elétrons, apesar de ocuparem toda a região intersticial, se "acumulam" com probabilidade maior na região próxima aos núcleos. Isto ocorre porque o pseudopotencial, apesar de fraco, é atrativo. Este efeito de blindagem dos elétrons de valência, está mostrado esquematicamente na Fig. 5.25, e contribui ainda mais para enfraquecer o potencial na região intersticial. Associado à esta distribuição ao redor do núcleo está um comprimento de blindagem (screening length), s. O potencial Coulombiano blindado deixa de ter o longo alcance q r 1/r, decaindo exponencialmente da forma U e s . Tipicamente, o comprimento de r blindagem dos metais é bastante é bastante curto, da ordem de 1Å. O gás de elétrons exerce portanto uma blindagem bastante efetiva das cargas positivas nucleares, e faz com que o potencial na região intersticial seja praticamente nulo, como no caso de elétrons livres. b) Aproximação de partícula independente. Em um metal típico, a densidade eletrônica é tal que os elétrons estão em média separados por uma distância da ordem de 2Å. Apesar disso, pode-se mostrar experimentalmente que, em cristais de alta pureza e a temperaturas baixas (tipicamente 1 K), um elétron percorre em média 10 cm sem “colidir” com outro elétron, como se não interagissem e se comportassem como partículas independentes! Na verdade, a interação elétron-elétron é forte, como não poderia deixar de ser a interação entre duas partículas 92 carregadas distantes apenas 2Å uma da outra. Porém, os elétrons parecem se mover de maneira extremamente organizada9 de modo que não colidem uns com os outros. + + + + + + + + + s Figura 5.25 – Distribuição esquemática dos elétrons de valência em um metal alcalino. A região branca ao redor dos núcleos indica a zona de exclusão do caroço, enquanto que a região mais escura representa a maior concentração eletrônica ao redor dos núcleos que dá origem à blindagem eletrostática. Um dos motivos para que isto ocorra é (mais uma vez...) o Princípio de Exclusão de Pauli. Quando falamos de colisão, em Mecânica Quântica, estamos nos referindo a um processo de espalhamento como o mostrado na Fig. 5.26, onde dois elétrons inicialmente com vetores de onda k1 e k2 interagem e são espalhados com vetores de onda finais k3 e k4. k3 k4 k1 k2 Figura 5.26 – Processo de espalhamento entre dois elétrons. A conservação do momento cristalino implica que k 1 k 2 k 3 k 4 , e a conservação da energia nos diz que (k 1 ) (k 2 ) (k 3 ) (k 4 ) . A T = 0K, k1 e k2 devem estar dentro da esfera de Fermi e portanto, pela conservação da energia, os estados 9 Como soldados marchando em um pelotão. 93 finais k3 e k4 também devem estar dentro da esfera de Fermi. No entanto, estes estados, assim como todos os outros dentro da esfera de Fermi já estão ocupados, e o Princípio de Exclusão impede que eles sejam ocupados ainda mais. Isto torna o processo de colisão impossível, e chegamos então ao resultado surpreendente: não há colisões eletrônicas a T=0K! Para temperaturas baixas, pode-se mostrar que a seção de choque de espalhamento 2 k T entre dois elétron em um gás de Fermi é B 0 , onde 0 é a seção de choque F para dois elétrons livres. Um outro fenômeno que contribui para enfraquecer a interação elétron-elétron é a blindagem. De forma semelhante à blindagem dos íons positivos, há também uma blindagem eletrônica de forma que cada elétron carrega consigo uma nuvem de “ausência de elétrons”, ou seja, uma carga efetiva positiva que blinda a interação Coulombiana entre os elétrons. Referências: - Gás de elétrons livres: Ashcroft (Cap. 2) e Kittel (Cap. 6). - Elétrons em potencial cristalino: Ashcroft (Cap. 8) e Kittel (Cap. 7). - Aproximação de elétron quase-livre: Ashcroft (Cap. 9) e Kittel (Cap. 7). - Método tight-binding: Ashcroft (Cap. 10) e Kittel (Cap. 9). - Pseudopotencial: Ashcroft (Cap. 11) e Kittel (Cap. 9). - Blindagem e interação elétron-elétron: Ashcroft (Cap. 32) e Kittel (Cap. 10) 94