UNIVERSIDADE ESTADUAL DE MATO GROSSO DO SUL LICENCIATURA EM FÍSICA ALESSANDRO DE FIGUEIREDO VIERMA CARACTERIZAÇÃO TEÓRICA DAS PROPRIEDADES VIBRACIONAIS E ELETRÔNICAS DO SILÍCIO NA ESTRUTURA ZINCBLENDE E WURTZITA DOURADOS - MS 2010 ALESSANDRO DE FIGUEIREDO VIERMA CARACTERIZAÇÃO TEÓRICA DAS PROPRIEDADES VIBRACIONAIS E ELETRÔNICAS DO SILÍCIO NA ESTRUTURA ZINCBLENDE E WURTZITA Trabalho de Conclusão de Curso apresentado ao curso de Licenciatura em Física da Universidade Estadual de Mato Grosso do Sul. Orientador: Prof. Dr. Adriano Manoel dos Santos DOURADOS - MS 2010 ALESSANDRO DE FIGUEIREDO VIERMA CARACTERIZAÇÃO TEÓRICA DAS PROPRIEDADES VIBRACIONAIS E ELETRÔNICAS DO SILÍCIO NA ESTRUTURA ZINCBLENDE E WURTZITA Trabalho de Conclusão de Curso apresentado ao curso de Licenciatura em Física da Universidade Estadual de Mato Grosso do Sul. BANCA EXAMINADORA: _________________________________ Prof. Dr. Adriano Manoel dos Santos _________________________________ Prof. Dr. Luis Humberto da Cunha Andrade _________________________________ Prof. Dr. Sandro Marcio Lima DOURADOS - MS 2010 Dedico este trabalho de conclusão de curso a minha mãe Marinilse de Figueiredo por todo apoio, motivação, dedicação e esperança. AGRADECIMENTOS À Deus, por toda sua graça. À minha mãe por todo apoio e esperança. Ao professor Dr. Adriano Manoel dos Santos pela orientação, amizade e paciência. Aos professores do curso de física pela mediação do conhecimento. Aos colegas e amigos pelos momentos de descontração, dedicação e disciplina. Principalmente a Katleen Suliany Scoca Rocha (Kat), Rafaella de Souza Matozo (Rafa), Joyce Monteiro Sampaio, Liliane do Nascimento Pereira (Lili), Gutierrez Rodriguês de Morais e Alcieres Espíndola Balbuena (Alcy). i RESUMO O sucesso da confecção de dispositivos eletrônicos tem sua base no silício (Si). Ele é amplamente empregado no desenvolvimento de circuitos integrados devido a sua característica semicondutora, que se mantém mesmo a alta temperatura. A abundância e a possibilidade de alta purificação viabilizam a incorporação de outros elementos ao Si, facilitando a criação de dispositivos com características específicas. A estrutura mais comum do silício em um cristal é a estrutura fcc, no entanto, seu polimorfismo abre caminho para investigações de possíveis aplicações tecnológicas. O silício wurtzita é uma destas estruturas, porém, ela tem sido pouco estudada devido à dificuldade em sua obtenção. Para simular as propriedades vibracionais do Si, utilizamos um software baseado no método semi-empírico denominado Valence Force Field. No cálculo das propriedades eletrônicas, usamos o pacote de simulação computacional wien97, que é baseado na utilização da Teoria do Funcional da Densidade. A partir destes métodos foi possível analisar o comportamento da curva de dispersão vibracional e eletrônica do silício wurtzita, crescido com uma impureza substitucional de oxigênio, e comparar nossos resultados com dados da literatura. Palavras – Chaves: Estrutura Zincblende, Estrutura Wurtzita, Silício, Simulação de Materiais. ii ABSTRACT The successful manufacture of electronic devices has its base in Silicon (Si). It is widely used in the development of integrated circuits due to its semiconducting character, which remains even at high temperature. The abundance and high purification ability to enable the incorporation of other elements to Si, facilitating the creation of devices with specific characteristics. The most common structure in a silicon crystal structure is fcc, however, their polymorphism paves the way for investigations of possible technological applications. The wurtzite silicon is one of those structures, however, it has been little studied because of the difficulty in obtaining it. To simulate the vibrational properties of Si, we use a software-based semi-empirical method called Valence Force Field. In calculating the electronic properties, we use the simulation package wien97, which is based on the use of Density Functional Theory. From these methods we could analyze the behavior of the dispersion curve of the vibrational and electronic wurtzite silicon, grown with a substitutional impurity of oxygen, and compare our results with literature data. Key - words: Structure zincblende, wurtzite structure, Silicon, Simulation of Materials. iii LISTA DE FIGURAS Figura (1.1) - Célula de Wigner-Seitz. Figura (1.2) - Redes de Bravais em duas dimensões. Figura (1.3) - Rede de Bravais em três dimensões. Figura (1.4) - Lei de Bragg e a Difração de Raios-X. Figura (1.5) - Primeira Zona de Brillouin. Figura (1.6) - a)Célula de Wigner-Seitz para uma bcc na rede direta. b)Zona de Brillouin, igual a célula de Wigner- Seitz na rede recíproca. Figura (1.7) - a) Célula de Wigner-Seitz para uma fcc na rede direta . b) Zona de Brillouin igual à célula de Wigner- Seitz na rede recíproca. Figura (1.8) – Rede cúbica de face centrada e base de dois átomos. Figura (1.9) - Representação da estrutura zincblende a partir de uma rede cúbica de face centrada e uma base de dois átomos. Figura (1.10) - Representação da primeira zona de Brillouin da estrutura zincblende, juntamente com os pontos de alta simetria no espaço k . Figura (1.11) - Comparação entre a estrutura zincblende e a estrutura wurtzita. Na estrutura zincblende os vizinhos mais próximos de um par de átomos estão em oposição de fase, na estrutura wurtzita os primeiros vizinhos de um par de átomos estão em fase. Figura (1.12) - Representação da estrutura Wurtzita a partir de uma rede hexagonal e uma base representada pelos átomos mais claros Figura (1.13) – Primeira zona de Brillouin de uma rede direta hexagonal e pontos de alta simetria no espaço k . iv Figura (2.1) – Função Distribuição Fermi-Dirac. Note que o potencial químico, , marca o limite de energia entre os estados ocupados e desocupados. A variação de f de 1 em baixas energias para 0 em altas energias se dá numa faixa de energia da ordem de alguns k B T ; Para T 0 , isto significa que função vale 1 para , e 0 para . Mas isto é justamente a definição da energia de Fermi. Assim, a T 0 o potencial químico do gás é igual à energia de Fermi, (T 0) F . Figura (2.2) – Imagem ilustrativa das bandas de energia. Figura (2.3) - Gráfico da Energia do elétron na rede vazia; As curvas em negrito encontram-se na primeira zona de Brillouin, sendo que / a k x / a . As bandas de energia desenhadas nesta zona encontram-se no chamado esquema de zona reduzida. Bandas de energia de uma rede cúbica simples para elétrons livres pertencentes às camadas inferiores são transformadas para a primeira zona da Brillouin e plotadas contra ( k x 00). Figura (2.4) - A introdução de átomos pentavalentes do Arsénio num semicondutor intrínseco (puro) faz com que apareçam eletrões livres no seu interior. Como esses átomos fornecem elétrons ao cristal semicondutor eles recebem o nome de impurezas dadoras. Figura (2.5) - A introdução de átomos trivalentes num semicondutor intrínseco (puro) faz com que surjam lacunas livres no seu interior. Como esses átomos recebem elétrons eles são denominados impurezas aceitadoras. Figura (2.6) – representação de um diodo de junção pn e símbolo elétrico. Figura (2.7) - (a) Portadores de carga majoritários em cada lado da junção, (b) difusão de elétrons recombinando-se com as lacunas do anodo, formando a região de depleção. Figura (2.8) – Polarização direta do diodo de junção PN. Figura (2.9) – Efeito de polarização reversa sobre a região de depleção. Figura (3.1) - Divisão do espaço cristalino em esferas muffin-tin e região intersticial, para um caso particular de uma célula unitária com dois átomos, situados nos centros das esferas. v Figura (3.2) - Diagrama de Execução do Wien. Figura (4.1) – gráfico de versus k. A região de k 1/ a ou λ a corresponde a aproximação continua, onde é diretamente proporcional a k. Figura (4.2) – Representação da relação de dispersão de uma rede monoatômica para longos comprimentos de onda. A inclinação da curva resulta na velocidade de propagação do som no meio e tem a forma v / k . Figura (4.3) – Ramo acústico e Ramo Óptico da dispersão diatômica de uma rede linear, mostrando o limite de freqüência em K=0 e K K max / a , onde a rede constante é a. Figura (4.4) – Estrutura cristalina bidimensional referente a posição de mínima energia vibracional. Os caracteres l, K e R permitem localizar a posição dos átomos nos planos s da rede cristalina. Figura (4.5) - Alterações na posição dos planos s, designadas por u s , provocadas por uma perturbação. O deslocamento da posição de equilíbrio do átomo lk é u (lk ) . Figura (5.1)- Curva de dispersão e Densidade de Estados Vibracionais (DEV) do silício cúbico na simulação realizada com 2 átomos na célula. Figura (5.2) - Curva de dispersão e Densidade de Estados Vibracionais (DEV) na simulação realizada com parâmetros teóricos do Si-w simulado com 4 átomos. Figura (5.3) - Curva de dispersão e Densidade de Estados Vibracionais (DEV) na simulação realizada com parâmetros teóricos do Si-w simulado com 32 átomos. Figura (5.4) - Curva de dispersão e Densidade de Estados Vibracionais (DEV) na simulação realizada com parâmetros teóricos do Si-w simulado com 31 átomos e uma impureza substitucional. Figura (5.5) - Densidade de Estados Eletrônico (DOS) do silício cúbico proveniente do cálculo com 2 átomos na célula. Figura (5.6) - Densidade de Estados Eletrônico (DOS) do Si-w simulado proveniente do cálculo com 4 átomos. vi Figura (5.7) - Densidade de Estados Eletrônico (DOS) do Si-w simulado com 32 átomos. Figura (5.8) - Densidade de Estados Eletrônicos (DOS) do Si-w simulado com 31 átomos e uma impureza substitucional. vii SUMÁRIO RESUMO i ABSTRACT ii LISTA DE FIGURAS iii INTRODUÇÃO 1 1- ESTRUTURA DE SÓLIDOS CRISTALINOS 5 1.1- ESTRUTURA CRISTALINA 5 1.2- LEI DE BRAGG 10 1.3- VETORES DA REDE RECÍPROCA 11 1.4- ZONAS DE BRILLOUIN 12 1.4.1- REDE RECÍPROCA DE UMA CÚBICA SIMPLES (SC) 13 1.4.2- REDE RECÍPROCA DE UMA CÚBICA DE CORPO CENTRADO (BCC) 14 1.4.3- REDE RECÍPROCA DE UMA CÚBICA DE FACE CENTRADO (FCC) 16 1.5- ESTRUTURA ZINCBLENDE E ESTRUTURA WURTZITA 2- DA TEORIA DO ELETRÔNICOS ELÉTRON LIVRE AOS 17 DIPOSITIVOS 22 2.1- TEORIA DO ELÉTRON LIVRE 22 2.2- GÁS DE ELÉTRONS LIVRES EM TRÊS DIMENSÕES 23 2.3- DENSIDADE DE ESTADOS 25 2.4- EFEITO DA TEMPERATURA NA DISTRIBUIÇÃO DE FERMI-DIRAC 25 2.5- BANDAS DE ENERGIA 26 2.5.1- MODELO DO ELÉTRON QUASE LIVRE 28 2.5.2- FUNÇÃO DE BLOCH 29 2.5.3- EQUAÇÃO DE ONDA DE UM ELÉTRON NUM POTENCIAL PERIÓDICO 30 2.5.4- SOLUÇÃO DA EQUAÇÃO CENTRAL 31 viii 2.5.4.1- APROXIMAÇÃO DA REDE VAZIA 2.6- LIGAÇÃO CRISTALINA 32 34 2.6.1- CRISTAIS DE GASES INERTES 35 2.6.2- CRISTAIS IÔNICOS 35 2.6.3- CRISTAIS COVALENTES 35 2.6.4- CRISTAIS METÁLICOS 36 2.7- CRISTAIS SEMICONDUTORES 36 2.7.1- DISPOSITIVOS SEMICONDUTORES 40 2.7.2- JUNÇÃO PN 40 3 - METODO AB INITIO 44 3.1 - PROBLEMA QUÂNTICO DE MUITOS CORPOS 45 3.2 - TEORIA DO FUNCIONAL DA DENSIDADE (DFT) 46 3.2.1 - APROXIMAÇÃO LDA E APROXIMAÇÃO GGA 3.3 - PACOTE DE SIMULAÇÃO WIEN97 4 - MÉTODO SEMI-EMPÍRICO NA ANÁLISE DO COMPORTAMENTO VIBRACIONAL 50 50 56 4.1 - VIBRAÇÃO DE REDES MONOATÔMICAS 56 4.2 - DOIS ÁTOMOS POR CÉLULA PRIMITIVA 60 4.3 - TEORIA CLÁSSICA DO CRISTAL HARMÔNICO 63 5 - RESULTADOS E DISCUSSÕES 71 5.1 - SILÍCIO (SI) 71 5.2 - SIMULAÇÃO COMPUTACIONAL 73 6 - CONSIDERAÇÕES FINAIS 81 7 - REFERÊNCIAS 82 1 INTRODUÇÃO Devido a sua característica semicondutora, mesmo a altas temperaturas, o uso do silício tem promovido um grande impacto na economia mundial por aplicações que vão da confecção de transistores, microchips até o desenvolvimento de circuitos integrados. Porém, para esses fins, exige se alto grau de pureza do silício tornando-se crucial o incremento de impurezas (dopagem) para que os dispositivos desenvolvidos apresentem características físicas desejadas. O interesse no estudo das propriedades vibracionais e eletrônicas do silício como material semicondutor está relacionada à sua aplicabilidade, abundancia e viabilidade de interação com outros elementos, podendo resultar em novos dispositivos promissores ao setor tecnológico. As propriedades vibracionais e eletrônicas dos materiais semicondutores nos permitem obter informações como a transmitância, condutividade térmica, resistividade elétrica e capacidade térmica. O avanço dos estudos teóricos de materiais semicondutores é resultante do aumento da capacidade computacional e da criação de novos métodos que permitem agilidade dos cálculos numéricos. A exemplo disto, o calculo ab initio, usado neste Trabalho de Conclusão de Curso (TCC), tem permitido o estudo das propriedades vibracionais e eletrônicas dos materiais semicondutores, necessitando de poucos dados para simular as interações. Na análise experimental da caracterização de materiais semicondutores, tanto a energia dos modos vibracionais, quanto a densidade de estados eletrônicos têm sido confirmado pela espectroscopia Raman. A coerência entre os resultados teóricos e experimentais permite a interpretação do que ocorre na amostra em estudo. Na natureza, o silício bulk cristaliza-se na estrutura zincblende (cúbica) apresentado características favoráveis de aplicações tecnológicas, bem como a facilidade na dopagem, maior mobilidade de elétrons e buracos, alta simetria cristalina, etc. No entanto, o polimorfismo desencadeia inúmeras investigações de aplicações tecnológicas do silício na estrutura wurtzita (hexagonal), também sendo conhecida como lonsdaleite. Estudos mostram uma similaridade estrutural para primeiros e 2 segundos visinhos entre as fases cúbicas e hexagonais do silício induzindo-se assim a semelhanças nas propriedades físicas de ambas as estruturas. Tivemos o interesse neste TCC em simular as propriedades vibracionais e eletrônicas do silício na estruturas zincblende e na estrutura wurtzita, a fim de comparar as diferenças e/ou similaridades entre as mesmas. Para o estudo das interações do silício dopado usamos o oxigênio como impureza substitucional. No cálculo vibracional utilizamos um software que vem sendo aprimorado pelo professor orientador deste TCC, que é baseado no método semi-empírico denominado Valence Force Field. Este método considera que as interações atômicas se dão principalmente pelos elétrons de valência, cuja interação pode ser representada pela lei de Hooke. O modelo para descrever o potencial de interação é baseado no proposto por Feenstra. A partir das constantes de força radial e angular, que representam as ligações entre os átomos da base e seus vizinhos, obtidas com o ajuste aos dados de espectroscopia Raman do silício em relação ao ponto Gama, foi possível representar o espectro de fônons do silício tanto na fase cúbica, quanto na fase hexagonal. Na caracterização das propriedades eletrônicas usamos o pacote de simulação computacional Wien97 que é baseado na teoria do funcional de densidades (DFT), e que trabalha com o método LAPW (Linearized Augmented Plane Wave), onde a energia total do sistema é dada como a soma das energias cinética, energia de repulsão elétronelétron, energia de atração elétron-núcleo, energia repulsiva colombiana e energia de troca e correlação. Este trabalho está organizado de forma a servir como fonte de pesquisa na área de física dos materiais semicondutores, uma vez que apresentamos aqui vários tópicos que não são abordados em livros textos. Apresentamos – o como descrito abaixo. No primeiro capítulo apresentamos a fundamentação teórica para compreensão da física da matéria condensada como a estrutura cristalina dos materiais semicondutores, descrição dos vetores primitivos da rede direta e da rede recíproca, identificando a primeira zona de Brillouin que é definida como uma célula de Wigner- 3 Seitz no espaço recíproca e a comparação entre a estrutura zincblende e a estrutura wurtzita. Para entender o funcionamento dos materiais é crucial o entendimento dos níveis de energia desses materiais. Para tanto é necessário a aplicação da mecânica quântica para a descrição do comportamento dos elétrons. Assim, no segundo capítulo faremos um estudo da teoria do elétron livre juntamente com a equação da densidade de estados e a distribuição de Fermi-Dirac, utilizada no calculo da distribuição das densidades de cargas. Para diferenciação dos isolantes, semicondutores e condutores foi feito uma breve apresentação das bandas de energia, da teoria do elétron quase-livre, da equação de onda de um elétron em um potencial periódico e da solução da equação central. Definimos os tipos, o sucesso e o principio básico envolvido por uma impureza nos semicondutores. O conhecimento das propriedades eletrônicas dos semicondutores instiga no setor de engenharia eletrônica aumentar a eficácia e diminuir os custos na confecção dos dispositivos eletrônicos. Na natureza é impossível resolver problemas envolvendo muitos corpos de modo exato, diante de necessidades como esta, surgem teorias e aproximações para resolver tais problemas. No terceiro capítulo estudamos os problemas quânticos envolvendo muitos corpos, a teoria do funcional de densidades e os métodos envolvidos no software de simulações wien97 usado para obter o cálculo eletrônico. A agilidade no processamento de dados nos computadores tem permitido tratar sistemas físicos baseados na incorporação do problema a cálculos numéricos. Desse modo, o ajuste dos dados experimentais como parâmetros dos cálculos computacionais tem sido bastante usado. No quarto capítulo estudamos os métodos semi-empíricos para compreender os resultados dos cálculos vibracionais, partimos primeiramente do caso da vibração da rede monoatômica, isto é, considerado a vibração elástica com um átomo por célula primitiva. A relação de dispersão dos fônons é mostrada em cristais com dois ou mais átomos por base primitiva, então analisamos o caso diatômico. Em seguida reescrevemos o caso diatômico fazendo algumas considerações e usando o método ab initio para obter a matriz dinâmica, possibilitando conhecer o espectro de fônons das estruturas em estudo. 4 No quinto capítulo descrevemos algumas características do semicondutor silício e apresentamos os resultados e discussões da simulação computacional dos cálculos vibracionais e eletrônicos do mesmo nas estruturas zincblende e wurtzita. Apresentamos também a analise da presença de uma impureza substitucional de oxigênio em ambas as estruturas. O sexto capítulo consiste das considerações finais referente à simulação computacional, em seguida apresentamos as referências estudadas para a confecção deste trabalho de conclusão de curso. 5 1 – ESTRUTURA DE SÓLIDOS CRISTALINOS 1.1 – Estrutura Cristalina Estudamos a estrutura cristalina dos materiais para compreender a disposição geométrica dos átomos no espaço. A análise das estruturas atômicas nos permite retirar alguns parâmetros importantes como o parâmetro de rede, número de átomos por célula unitária, número de vizinhos próximos de cada átomo na rede, etc., esses parâmetros possibilita comparar as estruturas atômicas. Quando um cristal cresce nas condições de um ambiente mantido constante, sua forma permanece imutável, como se blocos constituintes de átomos elementares estivessem sendo empilhados continuamente de forma que mantém uma periodicidade atômica ao longo do crescimento. Um cristal ideal é formado por infinitas repetições de unidades idênticas no espaço. A estrutura de um cristal pode ser descrita em termos de uma rede, com um grupo de átomos anexado em cada ponto da rede. Esse grupo de átomos é chamado de base e sua repetição no espaço de acordo com a rede cristalina, define a forma da estrutura cristalina. Logo temos Rede + Base = ESTRUTURA CRISTALINA (1.1) A rede é definida por três vetores de translação fundamentais a1 , a 2 , a3 cujo arranjo atômico é o mesmo para cada respectivo ponto r . Assim, um ponto qualquer no espaço é definido por r ' r u1a1 u 2 a2 u3 a3 , (1.2) 6 onde u1 , u 2 , u3 são inteiros arbitrários e, a1 , a 2 , a3 são os eixos primitivos da rede. A translação operacional de rede é definida com o deslocamento do cristal por uma translação vetorial do cristal dado por T u1a1 u2 a2 u3a3 . (1.3) A posição do centro de um átomo j de base relativa para associação de pontos na rede é r j x1a1 x2 a 2 x3 a3 . (1.4) Logo cada coordenada é uma representação do comprimento dos eixos a1 , a 2 , a3 na direção das coordenadas dos eixos i , j , k . O paralelepípedo definido pelos eixos primitivos a1 , a 2 , a3 é chamado de célula primitiva. A célula primitiva tem o menor volume da célula. O número de átomos na célula primitiva ou base primitiva é sempre o mesmo para uma dada estrutura cristalina e, há sempre um ponto na rede por célula primitiva, cujo volume é Vc a1 . a2 a3 . (1.5) Uma das maneiras de se escolher uma célula primitiva é utilizando a célula de Wigner-Seitz, conforme Figura (1.1), que consiste em traçar retas de um ponto a outro simétrico a ele, e traçando uma normal no ponto médio dessas retas, o resultado é um pequeno volume que chamamos de célula primitiva. 7 Figura (1.1) - Célula de Wigner-Seitz. A base associada com um ponto da rede de uma célula primitiva pode ser denominada base primitiva. As redes cristalinas podem ser transformadas nelas mesmas por meio de translação da rede e por várias outras operações de simetria. Cada tipo distinto de rede cristalina é denominado rede de Bravais. A rede de Bravais é um conjunto periódico de pontos nos quais unidades de células unitárias são repetidas. Em duas dimensões, os grupos pontuais estão associados com cinco tipos diferentes de redes representadas na Figura (1.2). Em três dimensões, os grupos de simetria pontuais estão distribuídos em 14 tipos de redes Bravais, ou seja, 14 formas de dispor os pontos no espaço, de tal forma que tenham sempre um mesmo ambiente, e é agrupada em sete sistemas cristalinos; cúbico, tetragonal, ortorrômbico, monoclínico, trigonal, hexagonal e triclínico. Na Figura (1.3), os módulos a, b e c denominam-se parâmetros da rede. 8 Figura (1.2) - Redes de Bravais em duas dimensões. 9 Figura (1.3) - Rede de Bravais em três dimensões. 10 1.2 – Lei de Bragg Os físicos ingleses William Henry Bragg (1862 – 1942) e seu filho William Lawrence Bragg (1890 – 1971) em 1913 apresentaram uma explicação simples para os feixes difratados por um cristal. Suponhamos que as ondas incidentes sejam refletidas especularmente por planos de átomos paralelos no interior do cristal, sendo que cada plano reflete somente uma pequena fração da radiação. Os feixes difratados formam-se quando as reflexões provenientes de planos paralelos de átomos produzem interferência construtiva. Consideramos somente o espalhamento elástico para qual a energia do raioX não varia com a reflexão. Figura (1.4) - Lei de Bragg e a Difração de Raios-X. Considerem-se planos paralelos da rede separados pela distancia d, como indicado na Figura (1.4). A radiação está incidindo sobre o plano da rede e a diferença de caminho para raios refletidos por planos adjacentes é 2dsen θ, onde θ é medido a partir do plano. A interferência construtiva da radiação proveniente de planos sucessivos 11 ocorre quando a diferença de caminho for um numero inteiro n de cumprimentos de onda λ, de modo que 2dsen n , (1.6) Esta é a Lei de Bragg, embora a reflexão em cada plano seja especular, somente para certos valores de θ somar-se-ão as reflexão provenientes de todos os planos paralelos, por estarem elas em fase e fornecendo um forte feixe refletido. Naturalmente, se cada plano fosse um espelho perfeito, só o primeiro plano do conjunto de planos paralelos deveria ser responsável pela reflexão, podendo refletir qualquer comprimento de onda. Porém, cada plano reflete somente cerca 10-3 a 10-5 da radiação incidente. A lei de Bragg é uma conseqüência da periodicidade da rede. Em 1915 pai e filho ganharam o prêmio Nobel de física por seus trabalhos na analise da estrutura cristalina por medidas de Raio-X. 1.3 – Vetores da Rede Recíproca Os vetores que definem a rede recíproca são escritos na forma de, a2 a3 a 3 a1 a1 a 2 b1 2 ; b2 2 ; b3 2 . a1. a 2 a 3 a1. a 2 a 3 a1. a 2 a 3 (1.7) Se a 1 , a 2 e a 3 são vetores primitivos da rede cristalina, logo b1 , b2 e b3 são vetores primitivos da rede recíproca. Cada vetor na equação (1.7) é ortogonal a dois outros vetores da rede cristalina. Portanto, b1 , b2 , b3 possuem a propriedade, b1 .a 1 2 b1 .a 2 0 , b1 .a 3 0 b3 .a 1 0 b2 .a 1 0 b2 .a 2 2 , b3 .a 2 0 . b2 .a 3 0 b3 .a 3 2 (1.8) 12 Qualquer conjunto arbitrário de vetores primitivos de rede recíproca a1 , a 2 , a3 de uma dada rede cristalina conduz ao mesmo conjunto de pontos de rede recíproca. Os pontos na rede recíproca são obtidos pela resolução dos vetores, G v1b1 v2b2 v3b3 , (1.9) onde os v1 , v2 , v3 são inteiros e o vetor G é o vetor da rede recíproca. Cada cristal tem duas redes associadas que são a rede cristalina e a rede recíproca. Uma figura de difração de um cristal pode ser encarada como uma representação da rede recíproca do cristal, em contraste com a imagem microscópica, que é a representação da estrutura cristalina real. As duas redes estão relacionadas pela definição da equação (1.7). Quando giramos um cristal, tanto a rede cristalina, quanto a rede recíproca sofrem a rotação. Os vetores da rede cristalina possuem a dimensão de [comprimento], já os vetores da rede recíproca tem a dimensão de [comprimento] -1. A rede recíproca é a rede no espaço de Fourier associada com o cristal. Logo, a resolução do vetor da rede recíproca G determina as possíveis reflexões do raio-X [1]. 1.4 – Zonas de Brillouin A formulação mais importante para a condição de difração para a Física da Matéria Condensada foi feita por Brillouin. A zona de Brillouin é definida como uma célula de Wigner-Seitz na rede recíproca. A zona de Brillouin fornece uma interpretação geométrica viva da condição de difração 2k .G G 2 . (1.10) Qualquer vetor k desenhado da origem até um ponto qualquer do conjunto de planos bissetores perpendiculares ao vetor G satisfará a condição de difração. O plano descrito deste modo, forma uma parte do limite da zona conforme Figura (1.5). Um feixe de raio-X incidindo sobre o cristal será difratado se seu vetor de onda tiver o 13 módulo, a direção e o sentido exigidos pela equação (1.10), e o feixe difratado estará na direção do vetor k G . No caso tridimensional a primeira zona de Brillouin é o menor volume inteiramente contido no interior dos planos bissetores perpendiculares aos vetores da rede recíproca, desenhados a partir da origem. Figura (1.5) - Primeira Zona de Brillouin. 1.4.1 – Rede Recíproca de uma Cúbica Simples (sc) Os vetores de translação primitivos de uma rede cúbica simples podem ser dados pelo conjunto: 14 a 1 ax̂ ; a 2 aŷ ; a 3 aẑ . (1.11) O volume da célula é dado por a 1 . a 2 a 3 a 3 . Os vetores de translação primitivos da rede recíproca são encontrados pelo uso da prescrição padronizada da equação (1.7), 2 b1 x̂ ; a 2 b2 ŷ ; a 2 b3 ẑ . a (1.12) Portanto, a rede recíproca de uma cúbica simples é a própria rede cúbica simples com constante de rede igual a 2 a . Os limites da primeira zona de Brillouin são os planos perpendiculares aos seis vetores da rede recíproca b1 ,b2 e b3 traçados passando pela metade de cada vetor, 1 b1 x̂ ; 2 a 1 b2 ŷ ; 2 a 1 b3 ẑ . 2 a (1.13) Os seis planos delimitam um cubo de aresta 2 a e de volume igual a ( 2 a )3. Este cubo é a primeira zona de Brillouin da rede cúbica simples sc. 1.4.2 – Rede Recíproca de Uma Cúbica de Corpo Centrado (bcc) Os vetores de translação primitivos da rede cúbica de base centrada são dados por, 1 1 1 a 1 a( x̂ ŷ - ẑ) ; a 2 a( x̂ ŷ ẑ) ; a 3 a( x̂ ŷ ẑ) , 2 2 2 (1.14) onde a é o lado de um cubo convencional, e x̂, ŷ e ẑ são vetores unitários ortogonais entre si e paralelos às arestas do cubo. O volume da célula primitiva é dado por, 1 V a1. a 2 a 3 a 3 . 2 (1.15) 15 As translações primitivas b1 , b2 e b3 , segundo a equação (1.14), ficam escritas como, 2 b1 (x̂ ŷ) ; a 2 b2 (ŷ ẑ) ; a 2 b3 (x̂ ẑ) . a (1.16) Na Figura (1.6) temos uma representação de uma Célula de Wigner-Seitz para uma bcc na rede direta. Figura (1.6) - a)Célula de Wigner-Seitz para uma bcc na rede direta. b)Zona de Brillouin, igual a célula de Wigner- Seitz na rede recíproca. Os menores vetores G são os seguintes: 2 ( x̂ ŷ) ; a 2 ( ŷ ẑ) ; a 2 ( x̂ ẑ) , a (1.17) onde todas as escolhas de sinais são independentes. A célula primitiva da rede recíproca é um paralelepípedo descrito por b1 , b2 e b3 definidos na equação (1.16). O volume da célula primitiva da rede recíproca é 16 b1 . b2 b3 2(2 a) 3 . É comum na Física da Matéria condensada considerar a célula primitiva da rede recíproca como primeira zona de Brillouin. Os vetores da origem ao centro de cada face são dados por, a ( x̂ ŷ) ; a ( ŷ ẑ) ; a ( x̂ ẑ) . (1.18) Todas as escolhas de sinais são independentes, fornecendo um total de 12 vetores. 1.4.3 – Rede Recíproca de uma Cúbica de Face Centrado (fcc) Os vetores de translação primitivos de uma rede fcc são dados por, 1 a 1 a (x̂ ŷ) ; 2 1 a 2 a (ŷ ẑ) ; 2 1 a 3 a (x̂ ẑ) . 2 (1.19) O volume da célula é dado por, 1 V a1. a 2 a 3 a 3 . 4 (1.20) Os vetores de translação primitivos b1 , b2 e b3 da rede recíproca da rede fcc são, 2 2 2 b1 ( x̂ ŷ - ẑ) ; b 2 (x̂ ŷ ẑ) ; b 3 ( x̂ ŷ ẑ) . a a a (1.21) Estes correspondem aos vetores de translação primitivos de uma rede bcc, de modo que a rede bcc é a rede recíproca da rede fcc. O volume da célula primitiva da rede recíproca é dado por b1 . b2 b3 4(2 a) 3 . Os oito vetores menores G são dados por, 2 ( x̂ ŷ ẑ) . a (1.22) 17 Os contornos da célula primitiva na rede recíproca são determinados, por oito planos perpendiculares a estes vetores e passando por seus pontos médios. Porém, os vértices do octaedro assim formado são cortados por planos bissetores ortogonais aos seis outros vetores da rede recíproca, 2 (2x̂); a 2 (2 ŷ); a 2 (2ẑ) . a (1.23) Na Figura (1.7) temos uma representação de uma Célula de Wigner-Seitz para uma fcc na rede direta. Figura (1.7) - a) Célula de Wigner-Seitz para uma fcc na rede direta . b) Zona de Brillouin igual à célula de Wigner- Seitz na rede recíproca. 1.5 – Estrutura Zincblende e Estrutura Wurtzita Nesta sessão fizemos a comparação entre as estruturas zincblende e wurtzita mostrando as diferenças e/ou similaridades entre as mesmas. Esta análise faz se necessária, pois no último capítulo será realizado um estudo teórico de materiais que apresentam tais estruturas. 18 A estrutura zincblende pode ser representada em uma rede cúbica de face centrada com uma base de dois átomos na célula primitiva, distantes um do outro ¼ do diâmetro do cubo conforme indica a Figura (1.8). Anexando a base de dois átomos a cada ponto na rede fcc, construímos a estrutura zincblende representada na Figura (1.9). Na Figura (1.10) representamos a primeira zona de Brillouin no espaço recíproco e os pontos de alta simetria. A partir da escolha dos pontos de alta simetria conseguimos representar os espectros eletrônicos e de fônons do silício zincblende. Figura (1.8) – Rede cúbica de face centrada e base de dois átomos. 19 Figura (1.9) - Representação da estrutura zincblende a partir de uma rede cúbica de face centrada e uma base de dois átomos. Figura (1.10) - Representação da primeira zona de Brillouin da estrutura zincblende, juntamente com os pontos de alta simetria no espaço k . 20 Como pode ser visualizada na Figura (1.11), a diferença básica entre a estrutura zincblende e a estrutura wurtzita está na disposição espacial dos átomos da rede. Na estrutura zincblende a disposição dos primeiros vizinhos de um átomo está em oposição de fase aos primeiros vizinhos de outro átomo da base. Na estrutura wurtzita a disposição dos primeiros vizinhos de cada átomo de um par ligado está em fase. Devido a esta diferença na disposição dos átomos na rede, a estrutura wurtzita apresenta uma simetria mais baixa que a estrutura zincblende [2]. A estrutura wurtzita pode ser representada por uma rede hexágona com 4 átomos na base, representada na Figura (1.12). Zincblende Wurtzita Figura (1.11) - Comparação entre a estrutura zincblende e a estrutura wurtzita. Na estrutura zincblende os vizinhos mais próximos de um par de átomos estão em oposição de fase, na estrutura wurtzita os primeiros vizinhos de um par de átomos estão em fase. 21 Figura (1.12) - Representação da estrutura Wurtzita a partir de uma rede hexagonal e uma base representada pelos átomos mais claros. Os pontos de alta simetria na primeira zona de Brillouin da estrutura wurtzita estão representados na Figura (1.13). Figura (1.13) – Primeira zona de Brillouin de uma rede direta hexagonal e pontos de alta simetria no espaço k . 22 2 – DA TEORIA DO ELÉTRON LIVRE AOS DIPOSITIVOS ELETRÔNICOS O estudo dos estados de energia dos elétrons nos metais pode nos ajudar a entender suas propriedades elétricas, magnéticas, as contribuições dos elétrons para o calor especifico e muitos outros fenômenos possibilitando o desenvolvimento e ampliação dos dispositivos eletrônicos [3]. Para entender o funcionamento dos materiais semicondutores com e sem a presença de impurezas, é crucial conhecer suas estruturas eletrônicas. Ou seja, é extremamente importante o entendimento dos níveis de energia desses materiais, e como eles são afetados pela presença de outros átomos. Para tanto é necessário a aplicação da mecânica quântica para a descrição do comportamento dos elétrons como a teoria do elétron livre, o efeito da temperatura na distribuição de Fermi, densidade de estado, equação da onda num potencial periódico, etc. Ainda nesse capítulo apresentaremos os tipos principais de ligação cristalina que caracterizam os elementos químicos da tabela periódica e a descrição dos tipos e do principio básico de uma junção do qual é feita a maioria dos semicondutores. Sem essas bases seria impossível o avanço cientifico - tecnológico. 2.1 – Teoria do Elétron Livre De acordo com o modelo do elétron livre, podemos entender um grande número de propriedades físicas dos metais. Esse modelo nos diz que os elétrons mais fracamente ligados dos átomos constituintes se movem livremente através do volume do cristal. Os elétrons de valência dos átomos tornam-se os elétrons de condução e as forças entre os elétrons de condução e os núcleos iônicos assim como a energia potencial são desprezíveis no modelo do elétron livre. Um cristal monovalente com N átomos terá N elétrons de condução e N núcleos iônicos. Na teoria do elétron livre, o elétron de condução não é desviado pelos íons positivos que estão distribuídos numa rede periódica porque as ondas materiais se propagam livremente numa estrutura periódica. Ele só pode ser espalhado, bem raramente, somente por outro elétron de condução ou por um defeito na rede cristalina. 23 Isto é uma conseqüência do princípio de exclusão de Pauli, que diz que dois elétrons não podem ter os mesmos números quânticos idênticos, ou seja, cada orbital poder ser preenchido no máximo por um único elétron. Logo, para acomodar mais de um elétron no mesmo orbital os spins tem que ser antiparalelo, um elétron com spin para cima e outro elétron com spin para baixo [1]. Mais de um orbital pode possuir a mesma energia. Quando os orbitais apresentam a mesma energia, chamamos estes níveis de energia de degenerados. O termo orbital é usado para designar uma solução da equação da onda para um sistema com um elétron. 2.2 – Gás de Elétrons Livres em Três Dimensões A equação de Schroedinger para uma partícula livre em três dimensões e dada por, 2 2 2 2 2 2 2 k r k k r . 2 m x y z (2.1) Estando os elétrons confinados num cubo de lado L, a função de onda é dada pela onda estacionária, k r A sen(n x x / L) sen(n y y / L) sen(n z z / L) (2.2) onde n x , n y e n z são números inteiros positivos. A condição de periodicidade permite que se escreva a função de onda sob a forma de uma onda progressiva, k r exp i k r . (2.3) 2n Desde que qualquer componente de k seja da forma , onde n é um inteiro L positivo ou negativo. Os componentes de k são números quânticos do problema, juntamente com os números quânticos m, para a direção do spin. 24 Substituindo a equação (2.3) na equação (2.1) encontramos a energia k do orbital com vetor de onda k por: k 2 2 2 2 k k x k y2 k z2 , 2m 2m onde o módulo do vetor de onda está relacionado com seu comprimento por k (2.4) 2 .A quantidade de movimento linear p pode ser representada na mecânica quântica, pelo operador P i , portanto, para o orbital descrito pela equação (2.3), P k r i k (r ) k k (r ) No estado fundamental de um sistema com N elétrons livres, os orbitais ocupados podem ser representados por pontos no interior de uma esfera no espaço k. A energia na superfície da esfera e a energia de Fermi, os vetores de onda na superfície de Fermi possuem um modulo k F tal que F 2 2 kF , 2m (2.5) escrevendo k F (vetor de onda na superfície da esfera) em termos de volume temos, 3 ² N kF V 2/3 , (2.6) onde N é número de elétrons livres e V é o volume. Logo temos que a energia de Fermi F definida como a energia do nível preenchido mais elevado do estado fundamental é escrita na forma, 2 3 ² N F 2m V 2/3 . (2.7) Esta é a energia de Fermi que relaciona a concentração de elétrons N pelo volume V. 25 2.3 – Densidade de Estados Para obter a Densidade de Estados (número de estados por unidade de intervalo de energia), escreveremos a equação (2.7) para o número total de orbitais de energia , V 2m N 3 ² ² 3/ 2 , (2.8) dentro de um fator com ordem de grandeza da unidade, sendo que o dobro do número de orbitais por unidade de energia da Energia de Fermi é igual ao número de elétrons de condução dividido pela Energia de Fermi. Logo a densidade de estados é dada por, 3 dN V 2m 2 2 3 N D( ) . . . d 2 ² ² 2 1 (2.9) 2.4 – Efeito da Temperatura na Distribuição de Fermi-Dirac Estando o sistema inicialmente no estado fundamental (em zero absoluto), a energia cinética do gás de elétrons cresce à medida que a temperatura cresce: alguns níveis de energia que estavam vazios no zero absoluto passam a ser ocupados, e outros que estavam ocupados no zero absoluto tornam-se vazios. A distribuição de FermiDirac nos dá a probabilidade de que um orbital com energia seja ocupado num gás ideal de elétrons em equilíbrio térmico na forma de, f 1 e k BT (2.10) 1 A quantidade é conhecida como potencial químico, e no zero absoluto, este valor é igual à energia de Fermi, F , pois no limite de T 0 , a função f varia descontinuamente desde o nível ocupado (valor 1) até o nível desocupado (valor 0). Para qualquer temperatura, f é igual a ½ se . A alta energia da distribuição de Fermi parte do caso em que k BT , assim temos f e k BT . Este limite é 26 conhecido como Boltzmann ou distribuição de Maxwell. A seguir, temos uma representação da distribuição de Fermi-Dirac em função da temperatura [1]. Figura (2.1) – Função Distribuição Fermi-Dirac. Note que o potencial químico, , marca o limite de energia entre os estados preenchidos e vazios. A variação de 0 em altas energias se dá numa faixa de energia da ordem de alguns função vale 1 para a f de 1 em baixas energias para k B T ; Para T 0 , isto significa que , e 0 para . Mas isto é justamente a definição da energia de Fermi. Assim, T 0 o potencial químico do gás é igual à energia de Fermi, (T 0) F . 2.5 – Bandas de Energia Nos materiais, como os átomos não estão isolados, as forças de interação entre os mesmos são significativas. Os elétrons nos cristais são agrupados em bandas de energia separadas por regiões de energia para os quais não existem elétrons orbitais. Estas lacunas de energia ou lacunas de bandas são conhecidas como zonas proibidas de energia (regiões onde não há níveis de energia eletrônicos que também são conhecidas pela expressão inglesa “gap”), resultantes da interação das ondas dos elétrons de condução com íons do cristal. Quando se passa para as subcamadas externas ocupadas e para as subcamadas não ocupadas do átomo no seu estado fundamental, as bandas tornam-se mais larga para uma dada separação interatômica. Isso se deve, ao fato de que quanto maior a energia 27 dos elétrons, maior a região ocupada por seu movimento e, portanto maior a interação com os íons vizinhos. Quando a energia aumenta, as bandas permitidas sucessivas são cada vez mais largas e se superpõem umas as outras em energia. Para que um material conduza eletricidade, é necessário que os elétrons de valência, sob ação de um potencial elétrico aplicado, saltem do nível de valência para o nível de condução [4]. Conforme Figura (2.2), em um material condutor não existem níveis ou banda de energias proibidas entre a condução e a valência e, portanto, a corrente flui facilmente sob a ação do campo elétrico. Um material isolante apresenta uma banda proibida de grande extensão entre a valência e condução. Por isso, dificilmente há condução da corrente. Os semicondutores possuem bandas proibidas com larguras intermediárias. Isso significa que podem apresentar alguma condução, melhor que a dos isolantes, mas pior que a dos condutores. Figura (2.2) – Imagem ilustrativa das bandas de energia. As bandas de energia provenientes dos elétrons podem ou não estar totalmente preenchidos. Se um campo elétrico for aplicado num sólido, os elétrons vão adquirir uma energia extra somente se existir níveis disponíveis não ocupados dentro do intervalo de energia que a intensidade do campo elétrico aplicado permitirá aos elétrons 28 adquirir. Caso contrário, o elétron não poderá adquirir energia nenhuma e o sólido se comportará como um isolante [5]. O que vai determinar se as bandas contendo elétrons de valência serão cheias ou vazias, é a valência dos átomos que constituem o sólido e a geometria da rede cristalina na qual este se solidifica. Uma banda isolada estará cheia se a célula unitária da rede cristalina contiver dois elétrons de valência, um para cada um dos dois valores possíveis do número quântico de spin ms. Relembrando que definimos a célula unitária como sendo o menor arranjo de átomos que por repetições periódicas ao longo dos eixos de coordenadas, com o qual se pode descrever totalmente um arranjo geométrico dos átomos nas unidades do cristal [5]. 2.5.1 – Modelo do Elétron Quase Livre No modelo do elétron livre, os valores permitidos da energia estão distribuídos continuamente de zero ao infinito. A estrutura de bandas de um cristal pode ser descrita pelo modelo do elétron quase livre para o qual os elétrons das bandas são tratados como perturbados apenas fracamente por um potencial periódico dos núcleos iônicos [1]. Sabemos que a reflexão de Bragg é um traço característico da propagação de ondas em cristais e é a causa das lacunas de energia na reflexão de ondas eletrônicas em cristais. Surgem regiões de energia (“gap”) para o qual a equação de Schroedinger não tem solução. A condição de Bragg ( k G ) 2 k 2 para a difração de uma onda com vetor de onda k em uma dimensão fica escrita na forma de 1 n , k G 2 a (2.11) onde G 2n / a é o vetor da rede recíproca, e n é um número inteiro. A primeira reflexão e a primeira lacuna de energia ocorrem para k / a . Outras lacunas de energia ocorrem para outros valores de n inteiro. A reflexão para k / a surge porque a onda refletida de um átomo na rede linear interfere construtivamente com uma 29 diferença de fase de 2 com a onda refletida por um átomo vizinho mais próximo. A região no espaço k entre / a e / a é a primeira zona de Brillouin da rede. Para k / a , as funções de onda não são as ondas progressivas eix / a e e ix / a do modelo do elétron livre. As soluções para estes valores particulares de k são constituídas por ondas caminhantes semelhantes tanto para a direita, quanto para a esquerda. Quando a condição de Bragg for satisfeita por uma onda caminhante em uma direção e for refletida, ela passará a se propagar no sentido oposto. A única situação independente do tempo é fornecida por ondas caminhantes eix / a e e ix / a , () e ix / a e ix / a 2 cos(x / a) ; (2.12) () e ix / a e ix / a 2isen(x / a) . As ondas estacionárias são formadas por porções iguais das ondas caminhantes para a direita e para a esquerda e são designadas pelo sinal negativo (-) ou positivo (+) quando substituir x por –x. 2.5.2 – Função de Bloch Bloch afirma que as soluções da equação de Schroedinger para um potencial periódico devem possuir a forma, k (r ) u k (r ) exp(ik.r) , (2.13) onde u k (r ) possui período igual ao da rede cristalina, sendo u k (r ) = u k (r T ) . O resultado da equação (2.13) é um enunciado do teorema de Bloch, o qual afirma serem as autofunções da equação de onda para um potencial periódico. É um produto de uma onda plana exp(ik.r)vezes uma função u k (r ) que possui a periodicidade da rede cristalina. Esta equação é dependente do vetor de onda k. Um orbital na forma da equação (2.13) é conhecido como função de onda de Bloch. Estas soluções são compostas por ondas progressivas, e elas podem se agrupar em pacotes de onda que 30 representam os elétrons propagando-se através do potencial dos campos dos íons centrais de forma livre [1]. 2.5.3 – Equação de Onda de um Elétron num Potencial Periódico Analisando a equação da onda para um potencial geral com valores gerais de k, sendo U(x) a energia potencial de um elétron numa rede linear e a, a constante de rede, temos que a energia potencial é invariante em relação a uma translação do cristal e é dada por U(x)=U(x+a). Escrevendo a série de Fourier para a energia potencial em termos dos vetores da rede recíproca G temos, U ( x) U G e iGx . (2.14) G Os valores dos coeficientes U G para os potenciais cristalinos tendem a decrescer rapidamente com o crescimento do módulo de G , para potenciais esféricos sem blindagem, U G decresce na forma de 1/ G 2 . Escrevendo a equação da onda para um elétron num cristal na forma de H , onde H é a hamiltoniana e é o autovalor da energia. As soluções são autofunções ou orbitais. Assim temos a equação da onda escrita na forma de, 1 1 p² U ( x) ( x) p² U G e iGx ( x) ( x) , 2m G 2m (2.15) onde p é a quantidade de movimento linear que pode ser representado na teoria quântica pelo operador i d . dx A equação (2.15) foi escrita na chamada aproximação de um elétron em que o orbital (x) descreve o movimento de um elétron no potencial dos núcleos iônicos e no potencial médio dos elétrons de condução. Expressando a equação da onda (x) numa série de Fourier somada sobre todos os valores do vetor de onda permitidos, temos, 31 C ( K )e iKx , (2.16) K onde K é real. Substituindo a equação (2.16) na equação (2.15) obtemos um conjunto de equações algébricas lineares para os coeficientes de Fourier. Somando os termos da energia cinética e da energia potencia obtemos a equação da onda, ² 2 m K ² C ( K )e K iKx U G C ( K )e i ( K G ) x C ( K )e iKx , G K (2.17) K como cada componente de Fourier deve possuir o mesmo coeficiente em ambos os membros desta equação, obtemos a equação central, ( K )C ( K ) U G C ( K G ) 0 , (2.18) G onde K ² K ² / 2m . A equação (2.18) é uma forma usual da equação de onda numa rede periódica, no entanto, ela não é muito usada, pois um conjunto de equações algébricas substituiu a equação diferencial usual. 2.5.4 – Solução da Equação Central A equação central, ( K )C ( K ) U G C ( K G ) 0 , representa um conjunto G de equações lineares simultâneos ligando os C ( K G) para todos os vetores da rede recíproca G. Estas equações serão compatíveis quando o determinante dos coeficientes for nulo. Escrevendo esta equação para um problema explicito, sendo g o menor entre os valores de G, e supondo que a energia potencia contenha somente um componente de Fourier Ug=U-g, designado por U. Podemos escrever da seguinte maneira: (K )U g C ( K g ) U g C ( K g ) 0 (K )C ( K ) UC( K g ) UC( K g ) 0 (2.19) Escrevendo K K ng , onde n = ..., -2, -1, 0, +1, +2, ..., e substituindo na equação (2.19). Temos as seguintes expressões: 32 ( K 2 g )C ( K 2 g ) UC ( K 3 g ) UC ( K g ) 0 ( K g )C ( K g ) UC ( K 2 g ) UC ( K ) 0 ( K )C ( K ) UC ( K g ) UC ( K g ) 0 (2.20) ( K g )C ( K g ) UC ( K ) UC ( K 2 g ) 0 ( K 2 g )C ( K 2 g ) UC ( K g ) UC ( K 3 g ) 0 Logo, K 2 g U K 2 g U 0 U 0 0 0 0 0 0 U 0 K 2 g U U K 2 g 0 U C ( K 2 g ) 0 C ( K g ) .C ( K ) 0 C ( K g ) 0 K 2 g C ( K 2 g ) 0 0 0 0 0 0 (2.21) A solução do determinante acima nos fornece um conjunto de energia nk , onde n é um índice para ordenar as energias e k é o vetor de onda que designa c k . 2.5.4.1 – Aproximação da Rede Vazia As estruturas das bandas verdadeiras são usualmente apresentadas na primeira zona de Brillouin. A energia do elétron livre é K ² K ² / 2m . Para qualquer K, podemos encontrar algum vetor da rede recíproca G tal que K=k+G, estando k na primeira zona. A energia é escrita como sendo, (k x , k y , k z ) (² / 2m)(k G)² ( ² / 2m)[(k x G x )² (k y G y )² (k z G z )²] (2.22) Cada célula primitiva contribui exatamente com um valor independente de k para cada banda de energia. Levando-se em conta duas orientações diferentes do spin do elétron, existe 2N orbitais independentes para cada banda de energia. Considerando as bandas mais inferiores dos elétrons livres de uma rede cúbica simples. Queremos a energia em função de k na direção [100], para tanto, mostramos diversas bandas inferiores com suas energias em k=0 e ao longo do eixo k x na primeira zona de Brillouin com ² / 2m 1 . 33 Banda Ga / 2 (000) ( K x 00 ) 1 000 0 kx ² 2,3 100 , 1 00 (2 / a)² (k x 2 / a)² 4,5,6,7 010 ,0 1 0,001,00 1 (2 / a)² k x ² (2 a )² 8,9,10,11 110 ,101,1 1 0,10 1 2(2 / a)² (k x 2 / a)² (2 / a)² 12,13,14,15 1 10 ,1 01,1 1 0,1 0 1 2(2 / a)² (k x 2 / a)² (2 / a)² 16,17,18,19 011,0 1 1,01 1,0 1 1 2(2 / a)² k x ² 2(2 a)² Para fazer o gráfico da energia do elétron na rede vazia, resolvemos a equação da energia (equação (2.22) para cada banda e variamos k x de / a à / a que são os extremos da primeira zona de Brillouin. Obtemos os seguintes pontos da primeira zona, ( 00) (000) ² / a² 0 ² / a² ² / a² ; 9 ² / a² 4 ² / a² ² / a² ; ² / a² 5 ² / a² 4 ² / a² 5 ² / a² 5 ² / a² 8 ² / a² 13 ² / a² 13 ² / a² 8 ² / a² 5 ² / a² 9 ² / a² 8 ² / a² 9 ² / a² a Logo geramos o seguinte gráfico, ( a 00) 34 Figura (2.3) - Gráfico da Energia do elétron na rede vazia; As curvas em negrito encontramse na primeira zona de Brillouin, sendo que / a k x / a . As bandas de energia desenhadas nesta zona encontram-se no chamado esquema de zona reduzida. Bandas de energia de uma rede cúbica simples para elétrons livres pertencentes às camadas inferiores são transformadas para a primeira zona da Brillouin e plotadas contra ( k x 00). 2.6 – Ligação Cristalina O que mantém os átomos ligados no cristal? A interação eletrostática entre as cargas negativas dos elétrons e as cargas positivas dos núcleos é a responsável pela coesão dos sólidos. 35 Há uma grande variação de energia de coesão entre os átomos das colunas da tabela periódica; os cristais de gases inertes são fracamente ligados, os cristais dos metais alcalinos possuem energia de coesão intermediária e os elementos metálicos de transição são fortemente ligados. Indicaremos a seguir os tipos principais de ligação cristalina. 2.6.1 – Cristais de Gases Inertes Os gases inertes formam os cristais mais simples. Os cristais são isolantes transparentes, fracamente ligados, temperatura de fusão baixa, possuem átomos com energia de ionização elevada, as camadas mais externas dos átomos estão completamente preenchidas, e a distribuição de carga eletrônica do átomo livre é esfericamente simétrica. Exemplos de cristais de gases inertes: He, Ne, Ar, Kr, e Xe. 2.6.2 – Cristais Iônicos Cristais iônicos são constituídos de íons positivos e negativos. A ligação iônica é resultado da interação eletrostática de íons com cargas de sinais opostos. As distribuições das cargas seguem uma simetria esférica. As cargas sofrem uma atração colombiana devido à diferença de potencial entre as cargas. Exemplos de estrutura cristalina iônica: NaCl, LiH, KCl, PbS, CsCl. 2.6.3 – Cristais Covalentes A ligação covalente possui marcantes propriedades direcionais, assim citamos alguns compostos de extrema importância tanto para a vida quanto para a economia; Carbono, Silício e Germânio. Esses elementos fazem ligação com quatro primeiros vizinhos, formando ângulos tetraédricos. A ligação covalente é a ligação de pares de elétrons ou ligação homopolar. É usualmente formada por dois elétrons, um para cada átomo participante na ligação. Os elétrons formados tendem a se localizar parcialmente na região entre os dois átomos unidos na ligação. Os spins dos dois elétrons na ligação são antiparalelos. 36 A ligação depende da orientação do spin não porque há força de dipolo magnético forte entre os spins, mais porque o princípio de Pauli modifica a distribuição de carga de acordo com a orientação do spin. Esse spin depende da energia de Coulomb e é chamada de troca de interação. 2.6.4 – Cristais Metálicos Os metais caracterizam-se por uma condutividade elétrica elevada, e um grande número de seus elétrons deve permanecer livre para se mover na rede, em geral um ou dois por átomo. Os elétrons suscetíveis de mover denominam-se elétrons de condução. As distâncias interatômicas são relativamente grandes nos metais alcalinos porque a energia cinética dos elétrons de condução é menor para distancias interatômicas. Isto conduz a uma ligação fraca. Assim, os metais tendem a se cristalizar em estruturas com agrupamento compacto como hcp, fcc, bcc. 2.7 – Cristais Semicondutores Um cristal semicondutor puro é um isolante no zero absoluto, isto é, a 0 K (Kelvin) o cristal não conduz eletricidade. As propriedades semicondutoras características dos cristais são oriundas da adição de impurezas, das excitações térmicas, dos efeitos da rede e até mesmo de suas variações químicas nominais. Assim, os semicondutores são substâncias cuja condutividade elétrica, ao contrário do que ocorre com os condutores normais, aumenta com a temperatura. Logo, são condutores nas temperaturas usuais e isolantes nas baixas temperaturas [6]. A formação de semicondutores amorfos covalentes é de fácil obtenção em varias regiões de composição, principalmente a partir dos elementos dos grupos IV, V e VI da tabela periódica. Seu comportamento é a de semicondutores intrínsecos com baixa mobilidade, sendo que a dependência entre a condutividade e a temperatura é caracterizada por uma energia de ativação. Os resultados da teoria de bandas resultaram da suposição de uma ordem regular da estrutura cristalina, porém, a reflexão de Bragg e a lacuna da banda desaparecem quando o material estiver desordenado por distorções térmicas. A lacuna de banda pode ser deduzida pela dependência da condutividade com a temperatura ou pela concentração de portadores na região intrínseca. Acredita-se que, na liga amorfa, o “gap” de banda é modificada de modo que as extremidades da banda 37 de valência e de condução se superpõem. A mobilidade associada aos estados no “gap” é muito pequena e deve envolver ativação térmica entre um estado localizado e outro. Este modelo de sólido amorfo é conhecido como modelo de Mott e Cohen-FritzscheOvshinsky [7]. Tipos de semicondutores: Semicondutores intrínsecos – a impureza é extremamente reduzida e a condutividade é devido à igual número de elétrons livres na camada inferior produzidos por ativação térmica dos elétrons através da zona proibida. Semicondutores impuros com excesso de elétrons – a condutividade é devido à predominância de elétrons na camada superior como resultado da ativação de elétrons provenientes de níveis de energia de átomos doadores de elétrons. Esses semicondutores são designados como do tipo N (a letra N é devido aos portadores negativos de corrente) e as impurezas são chamadas de doadoras. Semicondutores impuros com excesso de lacunas – a condutividade aqui é oriunda da predominância de lacunas (positivas) na camada inferior, resultantes da ativação de elétrons da camada inferior para dentro dos níveis de energia dos elétrons pertencentes aos átomos de impurezas. Tais semicondutores são conhecidos como de tipo P (a letra P é devido a serem os portadores de corrente positiva) e as impurezas são designadas de receptoras. Somente em semicondutores intrínsecos o número de elétrons livres é o número de lacunas são iguais. Nos semicondutores do tipo N encontramos mais elétrons na camada superior do que existem lacunas na camada inferior. Nestes materiais, os elétrons são chamados de portadores majoritários e, conseqüentemente, as lacunas são portadores minoritários. Já nos semicondutores de tipo P a situação se inverte [8]. O Silício é o semicondutor de maior aplicação tecnológica deste século [9]. Como ele é abundante e mantém suas características mesmo a altas temperaturas, as pesquisas e desenvolvimento de dispositivos eletrônicos levam ao estudo da possibilidade de integração do mesmo à outros materiais. 38 Se o material dopante apresentar um elétron a mais que o silício, como por exemplo, o arsênio, representado esquematicamente na Figura (2.4), o material a ser obtido com esta dopagem será denominado tipo-n (negativo), ou seja, a impureza que fornece elétrons será uma impureza doadora e o semicondutor resultante apresentará um excesso de elétrons livres. A presença destes elétrons suplementares dará origem a alguns níveis discretos de energia, situados logo abaixo da banda de condução. Figura (2.4) - A introdução de átomos pentavalentes do Arsénio num semicondutor intrínseco (puro) faz com que apareçam eletrões livres no seu interior. Como esses átomos fornecem elétrons ao cristal semicondutor eles recebem o nome de impurezas dadoras. Se o material dopante apresentar um elétron a menos que o silício, como por exemplo, o índio, representado esquematicamente na Figura (2.5), o material a ser obtido com esta dopagem será denominado tipo-p (positivo), ou seja, a impureza apresentará um déficit de elétrons e será uma impureza aceitadora. A ausência destes 39 elétrons dará origem a alguns níveis discretos de energia, situados logo acima da banda de valência. Os elétrons de valência são então facilmente excitados para esses níveis de impureza, que podem aceitá-los, deixando lacunas na banda de valência. O resultado é a formação de buracos que podem se deslocar através do cristal, comportando-se como uma carga positiva. Figura (2.5) - A introdução de átomos trivalentes num semicondutor intrínseco (puro) faz com que surjam lacunas livres no seu interior. Como esses átomos recebem elétrons eles são denominados impurezas aceitadoras. O sucesso dos semicondutores deve-se aos seguintes fatores: Existência de técnicas de sintetização de materiais semicondutores de alta pureza, com nível de impurezas bem menor que partes por bilhão. Os semicondutores constituem os materiais de maior pureza usada em aplicações. Existência de técnicas de cristalização de materiais semicondutores com alto nível de perfeição cristalina (como por exemplo, o crescimento de silício sobre substrato formando filmes finos na ordem de nanômetros). 40 Disponibilidade de técnicas de dopagem (adição de impurezas com características direcionadas) controlada, em nível e local no semicondutor, permite assim alterar localmente as propriedades do semicondutor. Permitindo se assim o desenvolvimento de inúmeros dispositivos, eletrônicos, ópticos e sensores. O silício e o germânio são materiais covalentes, fazem parte do grupo IV da tabela periódica possuindo quatro elétrons na ultima camada, suas estruturas são do tipo diamante e são os semicondutores de maior aplicação na indústria de eletrônicos [10]. 2.7.1 – Dispositivos Semicondutores Os dispositivos semicondutores são de extrema importância na eletrônica contemporânea. Os primeiros aparelhos eletrônicos tais como rádios, aparelhos de TV, equipamentos de transmissão e recepção de um modo geral eram fabricados com válvulas eletrônicas a vácuo. Com o avanço tecnológico as válvulas foram substituídas pelos dispositivos semicondutores, como por exemplo, os transistores, diodos, circuitos integrados, entre outros [3]. 2.7.2 – Junção PN Em muitos dispositivos semicondutores, o principio básico envolvido é o fato de que a condutividade do material é controlada pela concentração das impurezas, que pode variar em um grande intervalo de uma região para outra do dispositivo. Um exemplo é a junção pn que se forma com um semicondutor tipo p justaposto a um semicondutor de tipo n. A junção é constituída de três regiões distintas, sendo elas, a região tipo p, uma região de depleção e uma região tipo n. A região de depleção aparece quando se reúne as duas metades da junção e os elétrons moveis do doador se difundem para o lado p, deixando atrás de si os íons positivos fixo. Ou então, buracos se difundem para o lado n e deixam uma região de íons negativos fixo. Também, nesta região, há um campo elétrico interno, da ordem de 10 4 a 106 V/cm, que varre toda a carga móvel para fora da região e a mantém vazia. Este campo elétrico interno cria uma barreira de potencia V0 que impede o prosseguimento de uma difusão dos buracos, ou dos elétrons, através da junção e assegura que a corrente na junção seja nula quando não houver voltagem externa. 41 A característica mais notável da junção pn é a sua capacidade de deixar passar corrente em apenas uma direção. Sendo assim, está junção ganha o nome de Diodo, ilustrado na Figura (2.6). Figura (2.6) – representação de um diodo de junção pn e símbolo elétrico. Devido à continuidade da estrutura cristalina do diodo, os portadores podem se mover através da junção. Conforme a Figura (2.7), após a formação do diodo, alguns elétrons podem migrar para o anodo nas proximidades da junção. Ao encontrar as lacunas, ocorre a recombinação do par elétron-lacuna e, conseqüentemente, o aniquilamento dos portadores de carga majoritários na junção. A região formada pela neutralização das cargas denominada região de depleção, descrita anteriormente, está representada na Figura (2.7) (b). Figura (2.7) - (a) Portadores de carga majoritários em cada lado da junção, (b) difusão de elétrons recombinando-se com as lacunas do anodo, formando a região de depleção. 42 Assim, quando um diodo é fabricado, alguns elétrons atravessam a junção e preenchem as lacunas existentes no semicondutor tipo p criando uma barreira de potencial na região próxima à junção. Como na região de depleção não há cargas, é de se esperar que ela funcione como um isolante. Para vencer a barreira de potencial é necessário aplicar um campo elétrico numa direção apropriada, de tal forma a colapsar a região de depleção preenchendo-a com portadores de carga. A Figura (2.8) ilustra o processo de colapso da região de depleção através da aplicação de um campo elétrico com o anodo polarizado positivamente e o catodo polarizado negativamente. O sentido convencional da corrente é o sentido das cargas positivas e contrário ao sentido dos elétrons livres. Figura (2.8) – Polarização direta do diodo de junção PN. Com o colapso da região de depleção, o diodo passa a conduzir corrente. A condição de operação do diodo mostrada na Figura (2.8) é denominada polarização direta. Em eletrônica, a polarização é uma tensão ou corrente aplicada a um dispositivo para “ligá-lo”. No caso do diodo, a tensão de polarização é aplicada para vencer a barreira de potencial originada pela região de depleção. Se o diodo for polarizado reversamente, isto é, se for aplicado um potencial com polaridade negativa no anodo e positiva no catodo, a região de depleção se alargará, como mostra a Figura (2.9). 43 Figura (2.9) – Efeito de polarização reversa sobre a região de depleção. Como a região de depleção é isolante, o seu alargamento causará o bloqueio do fluxo de corrente pelo diodo. Na realidade, uma ínfima corrente flui devido aos portadores minoritários. O semicondutor tipo p possui alguns elétrons minoritários que serão empurrados para a junção por causa da repulsão causada pelo terminal negativo da fonte de tensão. O semicondutor tipo n, por sua vez, também possui algumas lacunas minoritárias, que serão empurradas para a junção. Dessa forma, uma corrente de fuga se estabelece quando o diodo está polarizado reversamente [11]. 44 3 – METODO AB INITIO A grande vantagem dos métodos teóricos é o fato de conseguir facilitar a resolução de problemas complexos. Com o advento dos recursos computacionais os cálculos teóricos se tornaram ainda mais promissores. Outro diferencial desta linha é o bom acordo com os resultados experimentais partindo, muitas vezes, apenas da descrição do material. O estudo teórico das propriedades vibracionais e eletrônicas tem sido realizado principalmente por estes métodos, cujos cálculos são de primeiros princípios e que não dependem de dados empíricos. Esse método permite fazer análises computacionais mais precisas de um sistema molecular na qual a convergência é exata, para pequenas aproximações. As desvantagens do método ab initio é que o número de átomos a ser estudado é limitado; eles levam freqüentemente muito tempo para convergir, e ocupam muito espaço na memória do computador. A maioria dos cálculos ab initio é oriunda da aproximação de Born-Oppenheimer que simplifica a equação de Schroedinger, o que significa que o nuclear e o movimento eletrônico são dissociados e tratados separadamente. A eletrônica de Schroedinger não pode ser resolvida, exceto para sistemas muito simples como o do átomo de hidrogênio, porém utilizado algumas aproximações é possível tratar um sistema com muitos átomos. Citamos alguns métodos que utilizam a teoria ab initio: Hartree-Fock, de acordo com a literatura esse método foi bem sucedido no cálculo da curva de dispersão dos fônons em materiais covalentes ou com pouca ionicidade; O Método Density Functional Theory (DFT). A grande vantagem desta teoria é conseguir reduzir a solução de problemas de um sistema que tem muitos corpos interagindo. Um grande problema é que esse método estabelece que a energia total do sistema é um funcional da densidade, mas não fornece uma expressão para esta energia. Para resolver este empecilho inicial, o funcional de densidade é aproximado como a soma de vários funcionais que se originam da chamada 45 energia total de Hartree e de um termo presumivelmente menor chamado de funcional de troca-correlação. A caracterização teórica a partir dos métodos ab initio permite obter dados relevantes em relação ao material, como a distribuição eletrônica no cristal, o espectro de raio-X, a estrutura de bandas, etc [12]. 3.1 – Problema Quântico de Muitos Corpos Um sólido é uma união de partículas leves (elétrons) e pesadas (núcleos) interagindo eletromagneticamente. O hamiltoniano exato para esse sistema é: H Te Tn Vnn Vne Vee , (3.1) onde o primeiro e o segundo termo são a energia cinética dos elétrons e dos núcleos, respectivamente. Os três últimos termos descrevem a interação coulombiana núcleonúcleo, núcleo-elétron e elétron-elétron. O problema acima é impossível de ser resolvido exatamente, entre outros motivos, devido ao acoplamento do movimento eletrônico ao movimento nuclear que tornam as equações extremamente difíceis de serem resolvidas e, também, devido à impossibilidade de descrever exatamente as interações repulsivas elétron-elétron. Assim, para diminuir a complexidade do problema, torna-se necessário adotar algumas aproximações. A primeira delas consiste em desprezar o movimento nuclear, desacoplando o movimento dos elétrons aos dos núcleos. Essa aproximação é conhecida como a de Born- Oppenheimer ou aproximação adiabática, o que equivale assumir que os núcleos estão em repouso, sendo que cada um deles comparece com uma carga positiva externa envolvida por uma nuvem eletrônica [13]. Aplicando-a, o problema agora se torna em um conjunto de partículas negativas interagindo, e se movendo no potencial externo, Vext , do sistema nuclear. De forma que a equação (3.1) poder ser escrita como: 46 H Te Vee Vext , (3.2) onde Vext Vnn Vne , com coordenadas nucleares constantes. É importante notar que os dois primeiros termos à direita da equação (3.2) são independentes da espécie particular do sistema eletrônico que esteja sendo estudado. Eles são, portanto, universais para qualquer tipo do sólido. As informações específicas do sistema estão inteiramente contidas no Vext . O caminho que deve ser seguido, depois dessa primeira aproximação, é transformar o problema de muitos corpos em um, de um único corpo. Um desses caminhos é através da teoria de Hartree e Fock. Mas, para tratar de sólidos, a mais apropriada é a teoria do Funcional da Densidade (DFT – Density Functional Theory). Nela os efeitos de troca e correlação são tratados através da Aproximação da Densidade Local (LDA - Local Density Approximiation). 3.2 – Teoria do Funcional da Densidade (DFT) Desde o nascimento da mecânica quântica, uma das grandes aspirações dos físicos era a de explicar e predizer as propriedades microscópicas da matéria. Mas, quando se trata de sistemas eletrônicos com muitos corpos interagindo, a solução das equações é extremamente complexa e não permite solução analítica. Com o objetivo de contornar esse problema, surgiram métodos teóricos possibilitando a solução de forma numérica e aproximada. Entre eles existem os baseados na Teoria do Funcional da Densidade (DFT). Como, na prática, esses métodos só são utilizados através de códigos de computadores, no início, suas aplicações ficaram limitadas ao estudo de estruturas simples e idealizadas. Nas últimas décadas, devido ao rápido desenvolvimento da tecnologia dos computadores, esses métodos obtiveram a capacidade de estudar os sistemas reais que se encontram na natureza, e também os que são produzidos nos laboratórios. Atualmente, eles são capazes de tratar cristais com defeitos, superfícies, interfaces, moléculas biológicas, e investigar fenômenos como magnetismo, 47 supercondutividade, interações hiper-finas, transições óticas, correlações eletrônicas e outros. Junto com os estudos experimentais, esses métodos se tornaram uma metodologia poderosa para investigar o amplo espectro das propriedades microscópicas da matéria [14]. A teoria dos funcionais da densidade (DFT) pode ser vista como uma reformulação da mecânica quântica baseada, não em funções de onda, mas no conceito de densidade eletrônica. Criada por Walter Kohn nos anos 60, a DFT é uma teoria revolucionária, já que alia simplicidade e precisão, permitindo assim estudar o que nos rodeia. Com a ajuda de computadores a DFT permite estudar sistemas cada vez mais complexos, contribuindo para a compreensão e previsão das propriedades dos átomos, moléculas e sólidos [14]. É também uma ferramenta fundamental em áreas tão diversas como a nanotecnologia, a biotecnologia, a invenção de novos materiais, etc. Em 1964, o norteamericano de origem austríaca Walter Kohn publicou, juntamente com o seu aluno francês Pierre Hohenberg, um artigo onde apresentavam uma reformulação da mecânica quântica baseada na densidade eletrônica. Esta densidade, normalmente representada por (r ) , mede a probabilidade de encontrarmos um elétron no ponto de coordenada r . Porém surgia o problema de como determinar na prática (r ) para um sistema real? A solução chegou ao ano seguinte, novamente num artigo de Kohn, mas agora com Lu Sham. Estes trabalhos formam a base DFT. Esta foi uma teoria revolucionária, Já que aliava uma extrema simplicidade a uma precisão notável. Além disso, o avanço computacional permitiu que as equações-chave desta teoria pudessem ser resolvidas para sistemas cada vez mais complexos. O teorema de Hohemberg afirma que existe correspondência um a um entre densidade eletrônica do estado fundamental, (r ) , e potencial externo, Vext (r ) , para um sistema de muitos elétrons. A média de qualquer observável Ô é funcional único de (r ) , isto é: Oˆ O[ ] , (3.3) 48 o teorema de Kohn diz que a energia no estado fundamental é também um funcional único de (r ) e atinge o valor mínimo quando (r ) é a verdadeira densidade eletrônica no estado fundamental do sistema. Sendo o hamiltoniano (equação (3.2) observável na presença de um potencial externo Vext (r ) , a energia funcional total no estado fundamental, é obtida no estado fundamental, e tem a forma, E[ ] T V Vext , (3.4) E[ ] FHK [ ] d ³rVext (r ) (r ) , (3.5) FHK [ ] onde FHK [ ] é um funcional desconhecido da densidade eletrônica, universal e não depende do potencial externo. Para que a DFT tenha valor prático é preciso implementar uma aproximação para o funcional desconhecido. Sendo assim escrevemos FHK [ ] como, e² (r ) (r ' ) FHK [ ] d ³rd ³r ' T0 [ ] V xc [ ] , 2 r r' (3.6) o primeiro termo corresponde a repulsão coulombiana dos elétrons (termo de Hartree). O segundo, a energia cinética de um sistema eletrônico não inter-agente, e o último é denominado como potencial de troca e correlação. A energia cinética aqui definida é apenas a energia cinética de um sistema fictício não inter-agente com densidade (r ) . A parte da energia cinética difícil de ser calculada está contida no desconhecido potencial de troca e correlação. O segundo teorema de Hohemberg e Kohn torna possível o uso do princípio variacional para encontrar a energia no estado fundamental. Assim, para que a energia seja minimizada, ela deve satisfazer a equação variacional: ( E[ ]) 0 , (3.7) substituindo a equação (3.6) na equação (3.5) e aplicando a condição da equação (3.7), temos, 49 (r ' ) T0 [ ] Vext [ ] d ³r (r )Vext (r ) e² d ³r ' r r' (r) (r) 0 . (3.8) A variação de carga, (r ) , está sujeita a condição: d ³r(r ) 0 . (3.9) Os termos dos potenciais entre chaves, na equação (3.8), são análogos aos da energia total de um sistema eletrônico não inter-agente em que os elétrons se movem em um potencial efetivo, (r ' ) Vef (r ) Vext (r ) e² d ³r ' v xc (r ) . r r' (3.10) Aqui o potencial de troca e correlação está sendo definido por, V [ ] v xc (r ) ext . (r ) (3.11) É importante ressaltar, que a analogia com o sistema de elétrons não interagentes só foi possível graças à transformação escolhida para o termo de energia cinética, isto é, devido à transferência dos efeitos de muitos corpos para o potencial de troca e correlação. O hamiltoniano desse sistema fictício é denominado hamiltoniano de Kohn e Sham e escrevemos na forma de, H KS 1 ² Vef (r ) . 2me (3.12) A densidade eletrônica do estado fundamental (r ) pode ser obtida achando-se autovalores e autovetores do H KS , isto é, resolvendo-se formalmente as equações de Schrödinger, 1 ² Vef (r )i (r ) ii (r ) , 2me logo calculamos, (3.13) 50 N (r ) i (r ) . 2 (3.14) i 1 A soma é sobre os estados ocupados com os menores autovalores. As funções i (r ) não apresentam qualquer significado físico e são apenas funções de onda de partículas fictícias. As equações (3.13) e (3.14) são denominadas equações de Kohn e Sham. As equações de Kohn e Sham demonstram que é possível transformar um problema de muitos corpos em vários de um único corpo que se move num potencial efetivo, determinando apenas a densidade no estado fundamental [14]. 3.2.1 – Aproximação LDA e Aproximação GGA A aproximação LDA (Local Density Approximiation) superestima a intensidade das ligações eletrônicas, de modo que a constante de rede obtida na minimização da energia total incorpora valores com erros na ordem de 3 unidades menores que os valores experimentais. A energia de troca e correlação LDA é uma função apenas da densidade eletrônica, sendo apropriada para sistemas na qual a densidade eletrônica varia lentamente com a posição, baseado no modelo de gás de elétrons homogêneos. Já a aproximação GGA (Generalized Gradient Approximation) a energia de troca e correlação é função não apenas da densidade eletrônica, mas também do gradiente desta. A aproximação de gradiente generalizada surgiu com o objetivo de prever correções na aproximação de densidade local [13]. 3.3 – Pacote de Simulação Wien97 Estudamos o manual do pacote de simulação wien97 a fim de obter melhores resultados na execução do programa. Este software trabalha com o método LAPW (Linearized Augmented Plane Wave), que está entre os métodos mais precisos para realizar cálculos da estrutura eletrônica de cristais na Teoria do Funcional de Densidades (DFT). O método LAPW é um procedimento para resolver as equações de Kohn-Sham para a densidade de estado fundamental, energia total e autovalores de um 51 sistema de muitos elétrons, introduzindo apenas uma base de parâmetros adaptada ao problema. Temos que a energia total em termos da densidade de spins é dada como: Etot ( , ) Ts ( , ) E ee ( , ) E ne ( , ) E xc ( , ) E NN , (3.15) onde T s é a energia cinética, E ee é a energia de repulsão elétron-elétron, E ne é a energia de atração elétron-núcleo, E xc é a energia de troca-correlação, e E NN é a energia repulsiva colombiana. O método LAPW trata a célula unitária como sendo divida entre duas regiões distintas: esferas atômicas (I) e uma região intersticial (II) conforme Figura (3.1). Isso porque a solução da equação de Schrödinger pode ser expressa como combinação linear de um número razoável de ondas planas. Por outro lado, nas regiões próximas aos núcleos, o potencial sofre grandes oscilações, e a solução exige a combinação de um número muito grande de ondas planas. Figura (3.1) - Divisão do espaço cristalino em esferas muffin-tin e região intersticial, para um caso particular de uma célula unitária com dois átomos, situados nos centros das esferas. 52 Dentro da esfera atômica (I) de raio R é usada uma combinação linear de funções radiais vezes os harmônicos esféricos Ylm (r ) : kn [ Alm u l (r , El ) Blm u l (r , El )Ylm (rˆ) , (3.16) lm onde u l ( r , E l ) é a solução regular da equação de Schroedinger para a energia E l , u l ( r , E l ) é a derivada da energia de u l tomando a mesma energia E l . Uma combinação linear dessas duas funções constitui a linearização da função radial. Os coeficientes Alm e Blm são funções de k n . Na região intersticial (II) é usada a expansão de uma onda plana, kn 1 e ik n r , (3.17) onde k n k K n .K n são vetores da rede recíproca e k é o vetor de onda dentro da primeira Zona de Brillouin. Cada onda plana é aumentada por uma função tipo atômica em cada esfera atômica. As soluções das equações de Kohn-Sham são expandidas na combinação de conjuntos de bases de LAPW’s de acordo com o método da variação linear: k n Cnkn , (3.18) onde os coeficientes C n são determinados pelo princípio variacional Rayleigh-Ritz [12]. Em geral o método LAPW expande o potencial da seguinte forma: lm Vlm (r )Ylm (rˆ) V (r ) iKr K VK e (dentro da esfera) (fora da esfera) (3.19) e analogamente para densidade de carga. O wien97 é constituído de vários programas independentes que são interligados. A seguir são dadas as principais tarefas de cada um dos programas que o constitui, desde os que fazem parte da inicialização de um cálculo (NN, SYMMETRY, LSTART, 53 KGEN e DSTART) aos que correspondem à parte do ciclo auto-consistente (LAPW0, LAPW1, LAPW2, LCORE e MIXER). Para executar um cálculo auto-consistente usando esse código é preciso executar, antes, uma série de pequenos programas auxiliares que usam um arquivo com as informações a cerca do material, os quais gerarão a partir delas dados de entrada para os principais programas a serem executados no ciclo auto-consistente. No início do cálculo é necessário um arquivo de entrada contendo as informações sobre os parâmetros de rede, as posições e espécie atômica que compõem o sólido. Nesse método, nenhuma informação a respeito das propriedades já conhecidas do material é introduzida nos cálculos. Métodos com essas características são denominados de primeiros princípios ou ab initio, pois exige poucos dados sobre o material. Assim, após preparar o arquivo de entrada, cuidadosamente, o processo inicial é rodar, na seqüência: NN: Esse programa calcula a distância dos vizinhos de todos os átomos e verifica se houve superposição das esferas atômicas. O programa, além disso, permite verificar se os átomos de um mesmo tipo foram especificados corretamente no arquivo de entrada. LSTART: Calcula a densidade eletrônica dos átomos livres (constituintes do composto estudado) que será usada no programa DSTART no calculo SCF, e determina como os diferentes orbitais serão tratados. Para isso, o programa interage pedindo para especificar uma energia de corte, isto é, um valor de energia que separará os elétrons que serão tratados como sendo da valência, e os que serão tratados como de caroço (elétrons em orbitais cujas energias são inferiores ao valor de corte e estão completamente dentro da esfera atômica). SYMMETRY: Este programa usa as informações de case.struct (tipo de rede, posições atômicas). São geradas as operações de simetria, expansão LM para harmônicos de rede e são determinadas as matrizes de rotação local. 54 KGEN: Gera a rede de vetores de onda k na parte irredutível da zona de Brillouin. Deve ser informado o número total de k-pontos na Zona de Brillouin e se haverá ou não inversão de simetria ao gerar a rede. DSTART: Gera uma densidade de cargas cristalina inicial por superposição de densidades dos átomos constituintes, calculadas no LSTART. Figura (3.2) - Diagrama de Execução do Wien. 55 Após executados esses programas é feita a análise dos dados gerados, o ciclo auto-consistente para a solução das equações de Kohn e Sham, pode ser, rodado. O ciclo é iniciado com um script run_lapw e consiste das seguintes etapas: LAPW0: Computa o potencial total como a soma do potencial colombiano e potencial de troca-correlação usando a densidade total de elétrons como entrada. O potencial de troca-correlação é computado numericamente em uma grade. Assim o potencial é obtido através da soma do potencial colombiano e do potencial de troca-correlação . LAPW1: Calcula bandas de valência (autovalores e autovetores). Estabelece o Hamiltoniano e as matrizes sobrepostas, e encontra os autovalores e autovetores por diagonalização. LAPW2: Computa a energia de Fermi e a expansão da densidade de carga eletrônica para cada estado ocupado e para cada vetor-k. As correspondentes cargas parciais são obtidas por integração. LCORE: Computa estados de núcleo para a atual parte esférica do potencial. É usado para distinguir três tipos de estados eletrônicos, nomeados de núcleo, semi-núcleo e estados de valência. MIXER: Esse programa mistura as densidades eletrônicas de caroço e valência para produzirem uma nova densidade eletrônica do cristal a ser utilizada na próxima interação, até que o critério de convergência não seja alcançado. Uma vez convergidos os cálculos, temos à nossa disposição a completa descrição quântica, no estado fundamental, do sistema em estudo. Em outras palavras, obtiveram-se as autofunções e autovalores do hamiltoniano de Kohn-Sham, e a partir desses pode-se calcular várias propriedades como densidade dos estados (DOS), estrutura das bandas, propriedades ópticas e espectro de raio-X. 56 4– MÉTODO SEMI-EMPÍRICO NA ANÁLISE DO COMPORTAMENTO VIBRACIONAL O aumento na velocidade de processamento de dados nos computadores tem permitido o tratamento de sistemas físicos baseados na incorporação de problema a métodos matemáticos. Os métodos matemáticos nos fornecem informações extras do sistema em estudo permitindo a previsão e interpretação dos experimentos. Desse modo, as técnicas que utilizam aproximação dos dados experimentais (métodos semiempíricos) como parâmetros no cálculo do comportamento vibracional tem obtido boa concordância com a literatura. 4.1 – Vibração de Redes Monoatômicas Abordamos por motivos de simplicidade o estudo da vibração monoatômica em uma dimensão, uma vez que os resultados permitem comparar os fenômenos físicos associados à estrutura dos cristais. Uma característica da vibração elástica de um átomo na célula primitiva do cristal é o surgimento dos ramos acústicos. No cristal, planos inteiros de átomos se movem em fase com o deslocamento ora paralelo ora perpendicularmente em relação à direção do vetor de onda. Nós podemos descrever com uma coordenada u s o deslocamento do plano s da posição de equilíbrio. Para cada vetor de onda ha três modos; uma polarização longitudinal e duas polarizações transversais. Assumindo que a repulsão elástica do cristal é uma função linear de forças. O que equivale supor que a energia elástica é uma função quadrática em relação ao deslocamento de dois pontos no cristal. Nós assumimos conseqüentemente que a força no plano s, causada por deslocamento do plano s+p, é proporcional a diferença u s p u s de seus deslocamentos. A força total sobre s é dada por, Fs C p (u s p u s ) . p (4.1) 57 Esta expressão é linear nos deslocamentos, e é a forma da lei de Hooke. C p é a constante da força entre planos separados por uma distancia p. A equação do movimento do plano s é dada por, M d 2u s C p (u s p u s ) , p dt 2 (4.2) onde M é a massa do átomo. A solução para todos os deslocamentos tem uma dependência exponencial exp(it ) . Logo d 2 u s / dt 2 2 u s e a equação (4.2) fica escrita como, M 2 u s C p (u s p u s ) , p (4.3) essa é a diferença da equação com deslocamento u e tem soluções de propagação de onda na forma, u s 1 ue i ( s p ) Ka , (4.4) onde a é o espaço entre os planos e K é o vetor de onda. O valor do espaçamento interplanar a para uma dada rede dependerá da direção do vetor K. Assim, a equação (4.3) se reduz a, 2 MueisKa C p (e i ( s p ) Ka e isKa )u , p (4.5) cancelando e isKa de ambos os lados obtemos, 2 M C p (e ipKa 1) . p (4.6) De acordo com a simetria de translação C p C p , e reagrupando a equação (4.6), 2 M C p (e ipKa e ipKa 2) , p 0 (4.7) com a identidade trigonométrica de 2 cos pka e ipKa e ipKa , nós temos a dispersão em relação a conexão de e K, 58 2 2 C p 1 cos pKa , M p 0 (4.8) com a equação (4.8) temos a inclinação de versus K igual a zero nos limites de K a , d ² 2 paC p sen pKa 0 , dK M p 0 (4.9) onde temos senka sen 0 . Se existe interação somente entre planos vizinhos mais próximos, a equação (4.8) se reduz a, 2 2C1 1 cos Ka M (4.10ª) Usando-se uma identidade trigonométrica, a equação (4.10ª) fica escrita como, 2 4C1 / M sen 2 1 ka 2 1 4C1 /M 1 / 2 sen ka 2 , (4.10b) 1 2 m sen ka onde m 2(C1 / M )1 / 2 . A equação (4.10b) representa a freqüência de uma onda em termos de uma constante elástica proposto no início da sessão. Temos na Figura (4.1) a seguir um gráfico (monoatômico) representando a razão de dois sucessivos planos onde os valores máximos K estão entre -π/a e π/a, essa faixa representa a primeira zona de Brillouin. 59 Figura (4.1) – gráfico de versus k. A região de k 1/ a ou λ a corresponde a aproximação continua, onde é diretamente proporcional a k. Expressando a relação da freqüência com o módulo do vetor de onda k para longos comprimentos de onda ( λ ), no caso monoatômico unidimensional, encontramos que na relação de dispersão a inclinação da curva tem um comportamento linear [15]. Assim, para k pequenos temos sen(ka / 2) ka / 2 , ou seja, 4C 1 /M 1 / 2 ka / 2 / k 4C 1 /M 1 / 2 a / 2 cte. Considerando a freqüência de vibração inversamente proporcional ao tempo 1/ T , verificaremos que a inclinação da curva resulta em uma velocidade na forma v / k , pois terá as mesmas dimensões de 1 x T v. k 2 2T t v x / t . Tomando k 2 / teremos, (4.11) A inclinação da curva dá a velocidade de propagação do som no meio (onda longitudinal em um meio elástico) [16]. A representação do comportamento linear está representada na Figura (4.2). 60 Figura (4.2) – Representação da relação de dispersão de uma rede monoatômica para longos comprimentos de onda. A inclinação da curva resulta na velocidade de propagação do som no meio e tem a forma v / k . 4.2 – Dois Átomos Por Célula Primitiva Para cada vetor de onda, a relação de dispersão de versus K , diferentemente da vibração monoatômica que é envolvido por apenas um ramo de vibração (ramo acústico), o caso diatômico é envolvido por dois ramos, conhecido como ramo acústico e ramo óptico. Nós temos o modo longitudinal acústico (LA) e o transversal acústico (TA). E também a longitudinal óptico (LO) e transversal óptica (TO). Desta forma, a relação de dispersão dos fônons surge em cristais com dois ou mais átomos por base primitiva. Nas energias correspondentes ao ramo óptico os átomos vibram em lados opostos, mais tem seu centro de massa fixo. O ramo óptico recebe este nome, pois as energias vibracionais são da ordem de grandeza das energias do espectro visível. Os 3 primeiros ramos de menor energia são denominados ramos acústicos. Nele os átomos e seus centros de massa se movem juntos (movimento de translação), com um longo comprimento de onda (vibração acústica). Se há p átomos na célula primitiva, então há 3p ramos de dispersão; 3 ramos acústicos e (3p – 3) ramos ópticos. A quantidade de ramos resulta dos graus de liberdade dos átomos. Com p átomos na célula primitiva e N células primitivas, há pN 61 átomos. Cada átomo tem três graus de liberdade, um para cada direção (x,y,z), fazendo um total de 3pN graus de liberdade para cada cristal. Nós consideramos um cristal cúbico com átomos de massa M1 em um determinado plano e átomos de massa M2 situado em outro plano. Onde a denota a repetição das distâncias do plano na direção normal as redes de planos envolvidos. Escrevemos a equação de movimento assumindo que cada plano tem interações unicamente com os planos vizinhos e as constantes de força ser iguais entre todos os planos vizinhos mais próximos. Logo temos: d ²u s C v s v s 1 2u s , dt ² d ²vs M2 C u s 1 u s 2v s . dt ² M1 (4.12) Temos que a solução é escrita na forma de uma onda progressiva, com diferentes amplitudes u e v, u s ue isKa e it ; v s ve isKa e it , (4.13) uma vez que a é a distância entre os planos idênticos e não entre os planos vizinhos. Na equação (4.13) as exponenciais levam em consideração a parte real e outra parte imaginária, esses artifícios são conhecidos como equações de Euler. Pelas equações de Euler, temos que; e i x iy e i x iy . (4.14a) Chamando x de cos x e y de senx , temos agora; ei cos x isenx e e i cos x isenx . Multiplicando os dois termos: (4.14b) 62 e i .e i (cosx isenx).(cosx isenx) e i 2 cos2 x sen 2 x (4.14c) . 1 Substituindo-se a equação (4.13) na equação (4.12) obtemos, d ²u s C vs vs 1 2u s dt ² 2 M 1u Cv 1 e ika 2Cu M1 d ² vs C u s1 u s 2vs . dt ² 2 ika M 2 v Cu e 1 2Cv M2 e (4.15) Aplicando os determinantes, 2C M 1 ² C 1 e ika C 1 e ika 2C M 2 ² u 0, (4.16) M 1 M 2 4 2C M 1 M 2 ² 2C ²1 cos ka 0 . (4.17) v ou Isolando ² e achando as raízes nos limites Ka 1e Ka no limite da zona. Para pequenos valores de Ka, temos cos Ka 1 1 2 2 K a ... , e as duas raízes 2 são 1 1 M1 M 2 2 2C ramo óptico . (4.18) Ck ² a ² 2 2M 1 M 2 ramo acústico. Nesta equação surgem dois ramos, o ramo acústico e o ramo óptico. Note que o ramo acústico é semelhante á relação de dispersão acústica obtida na vibração monoatômica (sessão 4.1). A extensão da primeira zona de Brillouin abrange valores de K entre os limites de / a K / a . 63 Temos na Figura (4.3) o gráfico de uma dispersão diatômica de uma rede linear onde a ela se difere dispersão monoatômica pelo número de átomos envolvidos na rede e conseqüentemente pelo número de ramos de vibração. Na dispersão monoatômica temos apenas o ramo acústico, enquanto que na dispersão diatômica temos o ramo acústico, juntamente com o ramo óptico. Figura (4.3) – Ramo acústico e Ramo Óptico da dispersão diatômica de uma rede linear, mostrando o limite de freqüência em K=0 e K K max / a , onde a rede constante é a. Outra característica da vibração diatômica é que na região de freqüências entre os dois ramos surge um “gap” vibracional na qual não temos solução para K real [17]. 4.3 – Teoria Clássica do Cristal Harmônico Apresentamos nesta sessão o caso geral da vibração cristalina considerando que as posições de equilíbrio dos átomos são oriundas das posições dadas pela rede de Bravais do cristal. A partir disso, escrevemos as equações de movimento para obter as informações a respeito dos modos de vibração do material (Matriz Dinâmica). Neste cálculo, desprezamos as interações que poderiam originar algum tipo de decaimento na energia dos fônons, isto é, consideramos que os átomos estão no seu estado fundamental 64 mantendo a temperatura nula (zero absoluto). Sendo assim, no cálculo vibracional consideramos as interações até segundos vizinhos. A dinâmica vibracional dos materiais semicondutores é bastante estudada na Física da Matéria condensada. Com o auxilio da mecânica clássica podemos conhecer os modos e as freqüências de vibração do material em estudo. De acordo com a teoria clássica do cristal harmônica, o estudo da dinâmica de rede é facilitado quando se considera que: Cada átomo vibra em torno de uma posição média, que corresponde a de equilíbrio, dada pela rede de bravais do cristal. O deslocamento médio de cada átomo é pequeno, quando comparado à distância entre os átomos. Como o caroço iônico do átomo é muito mais pesado que seus elétrons, a velocidade de deslocamento atômico é muito inferior a velocidade de seus elétrons. Logo, o movimento dessas partículas pode ser trabalhado separadamente. Sendo assim, podemos considerar o movimento dos núcleos não influencia no movimento dos elétrons, o que equivale assumir que os núcleos estão em repouso para uma dada configuração atômica. Esta aproximação é conhecida como aproximação adiabática ou aproximação de Born-Oppenheimer [18]. A partir destas suposições e considerando os termos de segunda ordem na descrição da energia em torno do ponto de equilíbrio, obtêm-se uma expressão que permite obter a dinâmica vibracional a partir da mecânica newtoniana. Porém, a quantificação desta dinâmica está vinculada ao conhecimento do potencial de interação entre os átomos [2]. Da mecânica clássica temos que o movimento de uma partícula sujeita a uma força de restauração é escrita como sendo F=-Kx. De acordo com as considerações citadas anteriormente, a força interatômica também pode ser descrita como sendo proporcionalmente ao deslocamento, seguindo a lei de Hooke, para pequenos deslocamentos. Esta consideração permite descrever a interação entre os átomos com base em uma representação pictórica, no qual a ligação seria feita por meio de molas que permitiriam que os átomos vibrassem em diversas direções. 65 No estudo do comportamento vibracional de uma rede cristalina é necessário definir a posição de todos os átomos a serem considerados no cálculo. A periodicidade da rede permite uma determinação precisa da posição média destes átomos em função de células (l), sendo que cada célula possuirá um número definido de átomos (K) [2]. Alguns caracteres da notação usada neste trabalho estão representados na Figura (4.4) a seguir. Figura (4.4) – Estrutura cristalina bidimensional referente a posição de mínima energia vibracional. Os caracteres l, K e R permitem localizar a posição dos átomos nos planos s da rede cristalina. Considerando que cada célula possa ser localizada no espaço em função dos vetores primitivos da rede, a posição será definida por, R(l ) l1a1 l2 a2 l3 a3 . (4.19) Para determinar a posição de cada átomo na rede é necessário conhecer a posição da célula (l) e a posição do átomo (K) dentro da célula, ou seja, 66 R(lK ) R(l ) R( K ) . (4.20) Considerando que os átomos se deslocam por meio de uma perturbação proporcional a variação da posição média, a energia potencial do sistema será descrita por, U U (u) , (4.21) onde a energia potencial depende de vetor deslocamento u . Na Figura (4.5), temos uma representação do possível efeito que uma perturbação provocaria na estrutura atômica da rede referente a Figura (4.4) Figura (4.5) - Alterações na posição dos planos s, designadas por u s , provocadas por uma perturbação. O deslocamento da posição de equilíbrio do átomo lk é u (lk ) . Expandindo a energia potencial em uma série de Taylor e Maclaurin, em função do deslocamento u de cada átomo na rede cristalina e utilizando a teoria de pequenas oscilações, sendo Uo a energia na condição de equilíbrio estável, temos; 67 U Uo lK U 1 u i (lK ) ij (lK , l ' K ' )u i (lK )u j (l ' K ' ) ... ui (lK ) 2 lK ,l 'K ' ij (4.22) onde ij0 (lK , l ' K ' ) é o tensor constante de força atômica, que pode ser escrito como sendo, 2U (lK , l ' K ' ) u i (lK )u j (l ' K ' ) o ij o , (4.23) os símbolos i e j representam as coordenadas cartesianas. Na equação (4.22) o primeiro e o segundo termo depois da igualdade podem ser desconsiderados, o primeiro porque representa uma constante, que no estudo comportamental vibracional da rede cristalina não provoca nenhuma influência, e o segundo é nulo, pois representa uma situação em equilíbrio estável (a somatória da forças é igual a zero). Os demais termos depois do terceiro estão relacionados à anarmonicidade, por isso não são considerados. Portanto, de acordo com a teoria clássica do cristal harmônico, a energia potencial elástica de um sistema cristalino pode ser escrita como, 1 ijo (lk , l ' K ' )ui (lK )u j (l ' K ' ) 2 lK ,l 'K ' ij . U (4.24) Tendo a energia potencial vibracional, a Hamiltoniana será dada pela soma da energia potencial elástica e cinética, H A 1 1 ijo (lk , l ' K ' )u i (lK )u j (l ' K ' ) M K u i2 (lK ) 2 lK ,l 'K ' ij 2 lKi . partir do conhecimento da .. ( F m(d 2 x / dt 2 ) m x) e a energia relação entre a (4.25) força potencial ( F dU / dx) newtoniana para o caso unidimensional, podemos generalizar para o caso tridimensional em uma rede cristalina, de acordo com a equação (4.24), onde temos, M K ui (lK ) U ui (lK ) , (4.26) 68 Como o comportamento vibracional de cada átomo pode ser descrito em termos de funções harmônicas, a função solução é dada em termos de um exponencial imaginário (equações de Euler). Desta forma o deslocamento do átomo lK em torno de sua posição de equilíbrio, pode ser dado por, Wi ( K | k )e i ( k R ( lK ) t ) ui (lK ) FM K , (4.27) onde M K representa a massa do átomo K , Wi ( K k ) representa o termo constante chamado de vetor de polarização, k o vetor de onda, .t representa a parte temporal associada ao deslocamento do K-ésimo átomo e F o fator de normalização. A equação (4.27) também pode ser escrita como, ui (lK ) Ae it onde A Wi ( K k )e i ( K .R (lK )) FM K , . (4.28) Em seguida, aplicando as derivadas parciais de primeira e segunda ordem em relação ao tempo, u i (lK ) iAe it , ui (lK ) (i ) 2 Ae it 2 Ae it . (4.29) Substituindo a equação (4.29) na equação (4.26) temos o seguinte resultado; Wi ( K | k ) 2 ij (lK , l ' K ' )W j ( K '| k )e i k (R (l 'K ') R (lK )) M K M K' l 'K ' j , (4.30a) que pode ser reescrito como, 2 (k )Wi ( K | k ) Dij ( KK ' | k )W j ( K ' | k ) K' j , (4.30b) ou na forma matricial, ( D I 2 )W 0 , onde, (4.30c) 69 Dij ( KK '| k ) ijo (lK , l ' K ' )e i k [ R (l 'K ') R (lK )] M K M K' l' . (4.31) A matriz D é conhecida na literatura como matriz dinâmica e pela equação c (4.30 ) é possível determinar o espectro de fônons, ou seja, as expressões descrevem o movimento de vibração de cada átomo da rede cristalina por meio de uma equação matricial que propicia o cálculo de autovalores e autovetores. Para calcular a constante de força atômica é preciso conhecer a energia potencial de interação entre os átomos da rede. Esta energia pode ser separada em duas interações; interação eletrônica e interação iônica. A interação eletrônica representa a interação entre os orbitais de um átomo com seus visinhos, enquanto a interação iônica seria resultante das interações colombianas resultante das cargas dos átomos presentes na rede. Logo temos que a energia total do sistema é dada pela soma da energia potencial eletrônica com a iônica. Com a simetria translacional do tensor constante de forca atômica e do argumento do termo exponencial na equação (4.31), a matriz dinâmica pode ser reescrita como, Dij ( KK ' | k ) l '' ijo (0K , l ' ' K ' )e i k [ R (l '' K ') R (0 K )] M K M K' (4.32) o resultado acima mostra explicitamente que, devido a simetria translacional, a construção da matriz dinâmica independe da escolha da célula l tomada como base para o cálculo. Para descrever esta dinâmica vibracional vamos considerar que a interação se dê por meio de orbitais eletrônicos (interação eletrônica). Para tratar as interações eletrônicas usaremos o método Valence Force Field - VFF (interações a curta distância). Dentro desse método, as forças responsáveis pelas interações atômicas são derivadas dos elétrons de valência, sendo forças de curto alcance. As ligações entre os átomos podem ser representadas por molas e a energia elástica pode ser expressa em termos do deslocamento interno dos átomos, que originam variações nos comprimentos e ângulos das ligações (Conhecidas como coordenadas de valência). O modelo proposto por Feenstra descreve a energia vibracional em termos de dois parâmetros: e . Para calcular a curva de dispersão dos fônons é necessário 70 conhecer esses parâmetros. Para a obtenção desses parâmetros é necessário ajustar os autos valores às energias conhecidas dos modos vibracionais do material estudado. Para a realização de tal ajuste, escolhemos pontos de alta simetria da primeira zona de Brillouin, já que as energias referentes a estes pontos são obtidas mais facilmente por medidas experimentais como o da espectroscopia Raman. Ainda que encontremos os parâmetros de rede, não podemos determinar uma expressão para cada termo da matriz dinâmica, devido a forte dependência dessa matriz com a rede direta, com o número de átomos da rede e com o número de vizinhos que serão considerados nos cálculos. Levando em conta essa considerações, a matriz dinâmica relaciona a interação de curto alcance, onde 1 e 1 é a constante de força em relação aos primeiros vizinhos, 2 e 2 é a constante de força em relação aos segundos vizinhos e assim por diante. Assim temos que a energia total no sistema é dada pela seguinte equação: 1 [ (lK , l ' K ' )[(u (lK ) u (l ' K ' )) e (lK , l ' K ' )]2 2 lK l 'K 'lK , (lK , l ' K ' ) | (u (lK ) u (l ' K ' )) e (lK , l ' K ' ) |2 ] U (4.33) onde e representam a constante de força bond-sctretching e a constante de força R(lK 0 R(l ' K ' ) bond-bending respectivamente. e (lK , l ' K ' ) é o versor deslocamento R(lK ' R(l ' K ' ) entre os átomos lK e l’K’. O vetor u representa o deslocamento do átomo lK . Uma vez conhecida a expressão matemática para a descrição do comportamento vibracional, o tensor constante de força atômica é encontrado a partir de, ijo (lK , l ' K ' ) 2U u i (lK )u j (l ' K ' ) o . (4.34) No cálculo direto do tensor constante de força atômica referente à interação eletrônica, é necessário considerar a presença do produto escalar e do produto vetorial. Na energia potencial, no termo da somatória que contem a constante de força , a ligação entre os vetores deslocamentos e o versor direcional é dada por um produto escalar, enquanto no termo que contém a constante de força , a ligação é dada por um produto vetorial. 71 5 – RESULTADOS E DISCUSSÕES 5.1 – Silício (Si) O Silício é um sólido covalente com “gap” de 1,12 eV [5], é o segundo elemento mais abundante na crosta terrestre (25,7%), se encontra na família 4A da tabela periódica contendo a seguinte configuração eletrônica [Ne] 3s2 3p2, num total de 14 elétrons. Esta disposição indica que os elétrons das camadas mais internas possuem uma configuração similar a do Neônio, somada a 4 elétrons de valência distribuídos entre os orbitais s e p. A distribuição dos elétrons mais externos é similar a do carbono, fazendo com que o silício apresente características parecidas com o carbono, como a hibridização dos orbitais da camada de valência. O encontramos o silício na argila, feldspato, granito, quartzo, areia e é vital para as indústrias de construção na produção de vidros, concreto e cimento. Na indústria de eletrônica o silício é considerado matéria prima fundamental para a confecção de microprocessadores, células e placas fotovoltaicas e, dispositivos ópticos (fibra óptica). Outras importantes aplicações do silício são: • Utilizados em fundições como elemento de liga; • Utilizados na produção de vidro e cristais para janelas e isolantes, entre outros usos; • O carboneto de silício é um dos abrasivos mais importantes. • Utilizado em lasers para se obter luz com um comprimento de onda na ordem de 456 nm; • O silício é um dos componentes do polímero silicone. A nano-cadeia de silício está entre os materiais promissores para aplicações futuras, em dispositivos nano-eletrônicos, devido a sua estrutura eletrônica e cristalina. A nano-cadeia de silício consiste em uma série de cristais de silício com diâmetros na ordem de nanômetros (nm). O silício é largamente empregado como material semicondutor porque mantém sua característica mesmo a altas temperaturas. Apesar de ser encontrado em várias formas estruturais (polimorfismo), a estrutura mais comum do silício em um cristal é a estrutura fcc (cúbica de face centrada), ou seja, considerando 72 um elétron por célula unitária, os átomos se encontrariam tanto no vértice do cubo, quanto no centro de suas respectivas faces. Kobliska e Solin são os pioneiros no trabalho com polítipos de estrutura hexagonal de silício, também denominada como lonsdaleite ou silício wurtzita. O silício wurtzita (Si-w) aparece naturalmente como micro cristais em Si amorfo, porém é pouco estudado por medidas de espectroscopia, devido à dificuldade em sua obtenção [19]. A dificuldade em se obter esse tipo de silício está nas poucas técnicas de fabricação, mas recentes estudos nessa área prometem mudar esse quadro. As pesquisas se baseiam na manipulação das propriedades elétrica e ópticas do silício, ou seja, com a dopagem desse material pode se obter as características desejadas pelo pesquisador. Na natureza o silício apresenta muitas impurezas em sua estrutura, mas técnicas de manipulação do silício reduzem a presença destas impurezas a níveis extremamente baixos, desta forma, teríamos o silício puro. O trabalho com o silício puro abre espaço para a alteração de suas propriedades físicas pela inclusão intencional de impurezas, cujo objetivo é criar um material com características físicas direcionada. Estas impurezas intencionalmente inseridas na estrutura cristalina são denominadas dopantes. Neste trabalho realizamos a simulação computacional das propriedades física do silício dopado com o oxigênio. A escolha da impureza substitucional de oxigênio (configuração eletrônica: 1s²2s²2p4) se deu a partir do estudo de artigos relacionados ao nosso trabalho, na qual relatam que oxigênio surge naturalmente como um nucleante no crescimento de filmes finos a vácuo, facilitando a estabilização da estrutura wurtzita [20]. Em altas temperaturas o oxigênio forma agregados ou clusters junto ao silício, bem como luxação intersticial [21]. As luxações são defeitos causados pelo deslocamento dos átomos no cristal que podem ser identificados pela microscopia eletrônica, a presença de deslocamentos influencia fortemente muitas das propriedades dos materiais. A teoria foi desenvolvida originalmente por Vito Volterra em 1905 [22]. Cálculos ab initio indicam que a presença dos átomos de oxigênio podem reduzir a largura do “gap” de banda à valores menores que o núcleo cristalino, tornando possível a recombinação de elétrons e buracos nessa região. O oxigênio também tem a 73 capacidade de passivar totalmente a superfície do silício agindo como um isolante químico e uma boa barreira de difusão [23]. Em temperaturas mais baixas (em torno de 450 °C) o oxigênio se comporta como doador térmico, agindo como uma lacuna ou carga na estrutura cristalina. A compreensão das ligações e da estrutura, bem como a difusão e cinética do oxigênio, permitirá que os fabricantes de silício aperfeiçoem seus processos de fabricação, a fim de obter rapidez, baixo custo e eficácia na tecnologia de microchips [21]. A semelhança microscópica na distribuição atômica entre a estrutura Zincblende (estrutura cúbica) e a estrutura Wurtzita (estrutura hexagonal) se reflete em uma similaridade nas propriedades eletrônicas e vibracionais do material estudado [2]. 5.2 – Simulação Computacional Usamos neste trabalho o método Valence Force Field (VFF) que, a partir do conhecimento de alguns parâmetros de interação, permite descrever importantes propriedades vibracionais. O software usado no cálculo dos fônons tem a capacidade de nos fornecer entres outros resultados a curva de dispersão e a densidade de estados vibracionais (DEV) do material estudado. Todos os dados necessários para a simulação computacional foram obtidos na literatura, principalmente na tese de doutorado do orientador desse TCC. Com o ajuste aos melhores dados da freqüência do silício em relação ao ponto Gama, foi possível determinar as constantes de força radial e angular [2]. A partir destes dados geramos primeiramente a curva de dispersão do Si bulk, na qual, o resultado mostrou bom acordo com a literatura. Os pontos no eixo horizontal da Figura (5.1) são conhecidos como pontos de alta simetria da Zona de Brillouin. No ponto Gama os três primeiros modos de energia são conhecidos como ramos acústicos, nele os átomos e seus centros de massa se movem juntos (movimento de translação). Os modos vibracionais restantes são denominados de ramos ópticos. Neles os átomos vibram em lados opostos, mantendo seu centro de massa fixo. A energia vibracional no ramo óptico é da ordem de grandeza das energias do espectro visível [1,2]. 74 Figura (5.1) - Curva de dispersão e Densidade de Estados Vibracionais (DEV) do silício cúbico na simulação realizada com 2 átomos na célula. Para gerar a Figura (5.1), usamos os seguintes dados: parâmetro de rede a 5,430 Å ; massa m 28,086 u.m.a ; constante de força 1 8.56 eV/Å2 , 2 =0.53 eV/Å2 , 1 =0,89 eV/Å2 e 2 = -0,19 eV/Å2 . O gráfico da Figura (5.1) represente dados experimentais do silício bulk. Verifica-se que não existe “gap” vibracional nem desdobramento de energia na região dos ramos ópticos, a densidade de estados vibracionais é baixo na região do ramos acústicos e alta na faixa de 512 cm-1. Considerando a semelhança estrutural para primeiros vizinhos, realizamos a simulação do espectro vibracional do silício wurtzita considerando as mesmas constantes de força do silício cúbico, juntamente com os parâmetros de rede experimentais para o silício wurtzita ( a 3,80 Å e c 6,28 Å ). Na Figura (5.2) o gráfico se refere a curva de dispersão e densidade de estados vibracionais do silício wurtzita. Para gerar o gráfico foi utilizada uma base com 4 75 átomos dispostos em uma rede hexagonal representada conforme Figura (1.12). Comparando a Figura (5.2) com a Figura (5.1) vemos que a densidade de estados tem um comportamento similar, sendo que ambas mostram que não há um “gap” vibracional entre os ramos acústicos e ópticos. A diferença estrutural entre o cúbico e o hexagonal é responsável pelo desdobramento dos ramos ópticos no ponto Gama. A proximidade entre as densidades de estados do silício cúbico e do silício wurtzita indica que a interação entre os vizinhos mais próximos é a principal responsável pelo processo vibracional. Figura (5.2) - Curva de dispersão e Densidade de Estados Vibracionais (DEV) na simulação realizada com parâmetros teóricos do Si-w simulado com 4 átomos. Para simular a alteração nas propriedades vibracionais pela inclusão de uma impureza substitucional de oxigênio, foi necessário aumentar o tamanho da célula a fim de garantir que não haja sobreposição dos estados vibracionais pela interação entre impurezas de oxigênio. A partir da célula com 4 átomos, por operações de simetria, geramos uma supercélula com 32 átomos em uma estrutura hexagonal. A Figura (5.3) representa a curva de dispersão vibracional referente a nova célula. A equivalência entre 76 as densidades de estados vibracionais entre a Figura (5.2) e a Figura (5.3) indica que as estamos tratando da mesma estrutura. Figura (5.3) - Curva de dispersão e Densidade de Estados Vibracionais (DEV) na simulação realizada com parâmetros teóricos do Si-w simulado com 32 átomos. A Figura (5.4) apresenta as alterações no espectro vibracional proveniente na inclusão da impureza de oxigênio, para este cálculo consideramos que a interação do oxigênio com seus vizinhos se dá por meio das mesmas constantes de força do silício. O resultado desta simulação mostra que a densidade de estados do silício sofre pouca influência pela presença do oxigênio, porém provoca o aparecimento de 3 estados localizados desdobrados na região acima dos ramos ópticos. Este resultado é compatível com resultados teóricos de cálculos referentes a outras estruturas do silício e de resultados experimentais [24]. Pela análise da curva de dispersão vemos que a presença de uma impureza mais leve, promove o desdobramento dos níveis de energia, principalmente aqueles ligados aos ramos ópticos. 77 Na simulação eletrônica foi utilizado um pacote de simulação chamado Wien97 baseado no DFT que trabalha com o método LAPW (Linearized Augmented Plane Wave), onde a energia total do sistema é dada como a soma das energias cinética, energia de repulsão elétron-elétron, energia de atração elétron-núcleo, energia repulsiva colombiana e energia de troca e correlação [14]. Figura (5.4) - Curva de dispersão e Densidade de Estados Vibracionais (DEV) na simulação realizada com parâmetros teóricos do Si-w simulado com 31 átomos e uma impureza substitucional. No cálculo da estrutura eletrônica nos concentramos na determinação da densidade de estados para o Si bulk, sendo que para esta simulação utilizamos a aproximação GGA. A Figura (5.5) apresenta o resultado do comportamento da densidade para o silício cúbico, no qual verificamos a presença de um “gap” (ausência de elétrons nos níveis eletrônicos) em torno das energias de 0 eV à 0.5 eV, valores estes próximos dos dados experimentais. 78 Figura (5.5) - Densidade de Estados Eletrônico (DOS) do silício cúbico proveniente do cálculo com 2 átomos na célula. A partir dos parâmetros de rede experimentais geramos o comportamento da densidade de estados para o silício wurtzita considerando uma célula com 4 átomos em uma rede hexagonal. O resultado desta simulação está na Figura (5.6), nesta figura verificamos a presença de um “gap” cujo resultado é próximo do valor alcançado para o cúbico, concordando com o esperado. Figura (5.6) - Densidade de Estados Eletrônico (DOS) do Si-w simulado proveniente do cálculo com 4 átomos. 79 Na Figura (5.7) realizamos a simulação para 32 átomos na estrutura hexagonal, comparando o resultado obtido com a Figura (5.6) verificamos que os gráficos são equivalentes apresentando o mesmo “gap”. As diferenças se devem ao fato da necessidade de se reduzir alguns parâmetros necessários ao cálculo, de forma a tornar o cálculo viável computacionalmente. Figura (5.7) - Densidade de Estados Eletrônico (DOS) do Si-w simulado com 32 átomos. O gráfico da Figura (5.8) representa o comportamento da densidade de estados obtida com a inclusão de uma impureza substitucional. Nela vemos que a presença da impureza altera completamente o comportamento da densidade indicando que no caso da interação eletrônica, a célula com 32 átomos, construída a partir da célula com 4 átomos em uma rede hexagonal, não é suficiente para evitar a sobreposição entre os estados eletrônicos. Alterando para este caso inclusive o tamanho do “gap” do silício. Este resultado indica que para simular uma impureza de oxigênio é necessário incluir um maior número de átomos no cálculo. 80 Figura (5.8) - Densidade de Estados Eletrônicos (DOS) do Si-w simulado com 31 átomos e uma impureza substitucional. 81 6 – CONSIDERAÇÕES FINAIS A partir do modelo de interação de curto alcance, baseado no método de Feenstra, no qual as interações podem ser representadas por molas com constantes de força radial e angular, foi possível representar o espectro de fônons e a densidade de estados vibracionais do silício wurtzita. Verificamos a partir de nossos resultados que a proximidade estrutural relacionada a primeiros e segundos vizinhos conduz praticamente a um mesmo comportamento vibracional, porém, esta diferença se traduz em um desdobramento dos ramos ópticos no ponto Gama no silício wurtzita. A presença da impureza de oxigênio no silício wurtzita promove o aparecimento de modos vibracionais localizados na região acima do “gap”. Este comportamento é coerente com resultados experimentais indicando que há uma forte ligação entre o oxigênio e seus vizinhos. O oxigênio também provoca desdobramento dos níveis de energia na região dos ramos ópticos. Os resultados obtidos na simulação eletrônica mostram que o silício wurtzita também apresenta o caráter de um semicondutor com um “gap” próximo ao encontrado para o silício cúbico. A presença da impureza em nosso cálculo provoca fortes alterações no comportamento da densidade de estados, indicando que a supercélula gerada não coíbe a interação eletrônica entre as impurezas, sendo necessária uma alteração no número de átomos na célula unitária. Comparando os resultados verificamos que no processo vibracional a principal interação se dá com os vizinhos mais próximos, diferente do que ocorre na interação eletrônica. 82 7 – REFERÊNCIAS [1] KITTEL, C. Introduction to Solid State Physics, 7a ed., John Wiley & Sons Inc, 1996. [2] SANTOS, A. M. Propriedades Vibracionais dos Nitretos do Grupo III e de suas Ligas. Tese de Doutorado, USP, 2004. [3] SERWAY, R.A. Physics for Scientists and Engineer with Modern Physics, Ed. LTC, 1996. [4] MSPC - Informações Técnicas. Semicondutores I-10: princípios básicos. Disponível em http://www.mspc.eng.br/eletrn/semic_110.shtml, acessando em Agosto de 2010. [5] EISBERG, R e RESNICK, R. Física Quântica Átomos, Moléculas, Sólidos, Núcleos e Partículas, Ed. Campus, 1988. [6] GRUPO DE ENSINO DE FÍSICA. Texto Avançados - Semicondutores. UFSM. Disponível em http://www.ufsm.br/gef/Moderna24.htm, acessado em Agosto de 2010. [7] MOTT, N. F E DAVIS, E. F. Electrical processes in non-crystalline materials. Oxford, 1971. [8] SHIVE, J. N. A Física da Eletrônica do Estado Sólido. Ed. EDGARD BLUCHER LTDA, 1972. [9] Laboratório Associado de Sensores e Materiais. Semicondutores de banda proibida estreita – PbSnTe. INPE. Disponível em http://www.las.inpe.br/~cesar/Infrared/pbsnte.htm, acessado em Setembro de 2010. [10] SWART, J. W. Materiais Elétricos, Cap. 08. Centro de Materiais Semicondutores, UNICAMP. Disponível em http://www.scribd.com/doc/14825904/Semicondutores, acessado em Agosto de 2010. [11] Escola de Engenharia de Lorena, USP. Notas de aula, Diodos. Disponível em http://www.demar.eel.usp.br/eletronica/aulas/Diodos.pdf, acessado em Setembro de 2010. 83 [12] BLAHA, P; SCHWARZ, K; LUITZ, J. WIEN97- A Full Potential Linearized Augmented Plane Wave Package for Calculating Crystal Properties, 2000. [13] NETO, J. M. H. Cálculos ab Initio De Propriedades Estruturais, Eletrônicas e Ópticas de Compostos Caxo3 (X= Si, Ge, Sn). Tese de Doutorado, UFRN, 2006. [14] MARQUES, M. A. L; BOTTI, S. O Que é e para Que Serve a Teoria Dos Funcionais de Densidade? Gazeta de Física, v.29, 2006. [15] Departamento de Ciência dos Materiais, Seção de Materiais Elétro-Ativos, UNL. Física do Estado sólido I, Vibrações na rede cristalina. Disponível em http://sme.dcm.fct.unl.pt/u/dias/docencia/FESI/8.fonoes.PDF, acessado em Setembro de 2010. [16] GUSMÃO. M, A. FÍSICA DA MATÉRIA CONDENSADA: ESTADO SÓLIDO, UNIDADE 3, Texto n° 17, Vibrações de rede (revisão). UFRS. Disponível em http://www.if.ufrgs.br/~magusmao/FIP10601/texto17.pdf, acessado em Setembro de 2010. [17] JÚNIOR SILVA, M. P. Cadeias com Desordem Correlacionada nas Constantes de Força Harmônica. Trabalho de Conclusão de Curso, UFAL, 2006. [18] BOUCHARD, A.M. Vibrational properties of amorphous silicon-germanium alloys and superlattices. Physical Review B, v.38, n.15, 1988. [19] BANDET, J; DESPAX, B; CAUMONT, M. Vibrational and electronic properties of stabilized wurtzite-like silicon. Journal of Physics D: Applied Physics, n.35, 2002. [20] K, U. M. K e KRISHNA, M. G. Chromium-Induced Nanocrystallization of a-Si Thin Films into the Wurtzite Structure. Journal of Nanomaterials, v. 2008, 2008. [21] JONES, R; ÖBERG, S; WELS, C. P; COUTINHO, J. P. Oxygen Defects in Silicon. University of Exeter. [22] REED-HILL, R.E. Princípios de Metalurgia Física. 1994. 84 [23] SIAS, U. S; AMARAL, L; BEHAR, M; BOUDINOV, H E MOREIRA, E.C. The Excitation Power Density Effect On The Si Nanocrystals Photoluminescence. ELSEVIER, 2006. [24] PESOLA, M; VON BOEHM, J; NIEMINEN, R.M. Vibrations of the Interstitial Oxygen Pairs in Silicon. Physical Review Letters, v.82, n.20, 1999.