Miguel Dias Costa
Propriedades Magnéticas de
Sistemas de Partículas Acopladas
por Interacção Magnetostática
Dissertação orientada pelo Prof. Dr. Yuriy Pogorelov e pelo Prof. Dr. João Viana
Lopes, submetida à Faculdade de Ciências da Universidade do Porto para a obtenção do
grau de Doutor em Física
Departamento de Física
Faculdade de Ciências da Universidade do Porto
Junho 2010
Agradecimentos
Ao longo de todos estes anos, foram muitas as pessoas que me apoiaram e criaram
condições para que eu pudesse levar a cabo este desafio. Por tudo o que fizeram por
mim, estou grato à minha família, aos meus orientadores e professores e a todos os amigos
na Universidade do Porto (dos Departamentos de Física e de Química da Faculdade de
Ciências, na Escola de Gestão do Porto e na Faculdade de Economia), na Escola Superior
de Tecnologia a Gestão do Instituto Politécnico de Viana do Castelo, na GMS Consulting
e na Neoscopio.
Esta dissertação foi apoiada pela Fundação para a Ciência e Tecnologia, através da Bolsa
de Doutoramento SFRH/BD/7003/2001, com o co-financiamento do Programa Operacional Ciência e Tecnologia 2010 e do Fundo Social Europeu.
3
Agradecimentos
4
Resumo
Este trabalho dedica-se ao estudo, através de métodos tanto analíticos como numéricos,
de propriedades termodinâmicas de sistemas planares constituídos por partículas magnéticas nanoscópicas acopladas pela interacção magnetostática entre os seus momentos
magnéticos. Do ponto de vista prático, estes sistemas servem como modelos de modernos
dispositivos nano-estruturados. Do ponto de vista teórico, apresentam comportamentos
interessantes, quando comparados com sistemas mais tradicionais de física estatística,
devido ao carácter de longo alcance e anisotrópico das interacções.
Na introdução são apresentados alguns desenvolvimentos experimentais e tecnológicos
que continuam a sustentar o interesse nestes sistemas, bem como os modelos utilizados
para os estudar. Segue-se uma exposição de métodos utilizados durante este trabalho.
No capítulo 2 é apresentado um método de expansão de altas temperaturas que, pela sua
generalidade, pode ser usado como mecanismo de controlo de métodos numéricos como,
no caso particular, simulações de Monte Carlo. Estes métodos numéricos são apresentados
no capítulo 3, bem como os problemas de convergência em sistemas magnéticos frustrados
e formas de ultrapassar estes problemas. É também incluído um levantamento de algumas
ferramentas de software utilizadas para a realização deste trabalho, na esperança de vir
a ser útil para quem se esteja a iniciar neste ramo.
No capítulo 4, os métodos apresentados anteriormente são aplicados a redes regulares
de dipolos pontuais. A medição dos tempos de autocorrelação na energia e no parâmetro
de ordem de uma rede quadrada revelou não só o problema típico de critical slowing down
mas também um abrandamento abaixo da temperatura crítica relacionado com aspectos
particulares da interacção dipolar. Através da utilização de técnicas como o método de
Parallel Tempering e optimizações da taxa de aceitação das simulações, estes tempos de
autocorrelação foram reduzidos significativamente relativamente às abordagens canónicas,
o que permitiu melhorar a precisão das simulações e caracterizar melhor o comportamento
crítico destes sistemas. No capítulo 5, alguns destes métodos foram aplicados a um sistema
desordenado de dipolos pontuais, com o objectivo de clarificar o efeito da anisotropia da
interacção no comportamento das correlações magnéticas entre partículas.
No capítulo 6, é abandonada a aproximação de dipolos pontuais e são calculadas correcções de tamanho finito para diferentes formas das partículas. Estes resultados são utiliza-
5
Resumo
dos para explicar a anisotropia encontrada em experiências de ressonância ferromagnética
numa rede quadrada de discos magnéticos, quando é variada a orientação, relativamente
aos eixos da rede, do campo aplicado. É demonstrado que a inclusão destas correcções de
tamanho finito, mantendo a magnetização uniforme e considerando as interacções entre
partículas, leva a uma distribuição de campos internos que exibe a anisotropia verificada
experimentalmente. É também apresentado um procedimento variacional que permite
estimar a deformação da magnetização no interior da partícula devida tanto à forma das
partículas como à interacção entre partículas.
Finalmente, no capítulo 7, são apresentadas as conclusões e questões em aberto relacionadas com este trabalho.
6
Abstract
This works focuses on the analytical and numerical study of thermodynamic properties
of planar systems with nanoscopic magnetic particles coupled by the magnetostatic interaction between their magnetic moments. From a practical point of view, these systems
act as models for modern nanostructured devices. From a theoretical point of view, they
present interesting behaviours, when compared to more traditional statistical physics systems, due to the long-range and anisotropic character of the interactions.
In the introduction, some relevant experimental and technological developments are
presented, along with the models used to study these systems. This is followed by an
exposition of methods that were used during this work. In Chapter 2, a method of high
temperature series expansion is presented, which, thanks to its generality, can be used
as a control mechanism for numerical methods such as, in our present case, Monte Carlo
simulations. These numerical methods are presented in Chapter 3, as well as the convergence problems in frustrated magnetic systems and ways of overcoming those problems.
A survey of some software tools used during this work is also included, with the hope that
it can be useful to someone coming into computational physics.
In Chapter 4, these methods are applied to studying regular lattices of point dipoles.
Measuring the autocorrelation times of the energy and order parameter revealed not only
the typical problem of critical slowing down but also an increase of these times below
the critical temperature, which is related to relevant specific aspects of the magnetostatic interaction. Through the use of techniques like the method of Parallel Tempering
and optimizations of the acceptance rate in simulations, these autocorrelation times were
significantly reduced when compared with canonical approaches, which allowed for an increased accuracy of the simulations and a better characterization of the critical behaviour
of these systems. In chapter 5, some of these methods were applied to a disordered array of point dipoles, in order to clarify the effect of the interaction’s anisotropy in the
behaviour of the magnetic correlations between particles.
In Chapter 6, the point dipole approximation is dropped and finite size corrections for
different particle shapes are considered. These results are used to explain the anisotropy
found in ferromagnetic resonance experiments on a square lattice of magnetic disks, when
the orientation of the applied field is varied with relation to the lattice axis. It is shown
7
Abstract
that the inclusion of these finite size corrections, mantaining an uniform magnetization
and considering interactions between disks, leads to a distribution of internal fields that
already exhibits the anisotropy that had been found in the experiments. A variational
procedure is presented to estimate the deformation of the magnetization inside each disk,
due not only to the shape but also to the interaction with other disks.
Finally, in Chapter 7, we present our conclusions and open questions related to this
work.
8
Conteúdo
Agradecimentos
3
Resumo
5
Abstract
7
1 Introdução
13
1.1
Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2
Modelos teóricos e computacionais
1.3
Notação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.4
Unidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.5
Conteúdo original e material externo . . . . . . . . . . . . . . . . . . . . . 22
2 Métodos analíticos
. . . . . . . . . . . . . . . . . . . . . . 18
23
2.1
Propriedades termodinâmicas . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2
Momentos livres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3
Interacções como perturbação . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4
Expansão de altas temperaturas . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5
Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3 Métodos numéricos
41
3.1
Revisão de métodos de Monte Carlo . . . . . . . . . . . . . . . . . . . . . . 42
3.2
Observáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3
Ferramentas de computação científica . . . . . . . . . . . . . . . . . . . . . 55
3.4
Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4 Redes regulares de dipolos pontuais
65
4.1
Rede quadrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2
Cadeia unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.3
Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
9
Conteúdo
5 Plano desordenado de dipolos pontuais
5.1 Modelo . . . . . . . . . . . . . . . . .
5.2 Efeitos de tamanho finito . . . . . . .
5.3 Simulações . . . . . . . . . . . . . . .
5.4 Magnetização . . . . . . . . . . . . .
5.5 Correlações magnéticas . . . . . . . .
5.6 Conclusões . . . . . . . . . . . . . . .
6 Partículas de tamanho finito
6.1 Função de forma . . . .
6.2 Magnetização uniforme .
6.3 Rede de discos . . . . .
6.4 Conclusões . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
79
79
81
83
85
87
89
.
.
.
.
91
92
95
99
108
7 Considerações finais
111
A Médias livres
115
B Amplitudes de forma
121
C Lista de publicações
125
Bibliografia
131
10
Lista de Figuras
1.1
Métodos de fabrico de sistemas experimentais . . . . . . . . . . . . . . . . 15
1.2
Esquema STM
1.3
Esquema MFM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4
Esquema FMR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5
Aproximação de dipolos pontuais . . . . . . . . . . . . . . . . . . . . . . . 19
2.1
Representação diagramática de partições de conjuntos . . . . . . . . . . . . 37
2.2
Representação diagramática da correcção de segunda ordem à energia livre. 38
2.3
Representação diagramática de derivadas de partições . . . . . . . . . . . . 38
2.4
Representação diagramática da correcção de segunda ordem à magnetização. 38
2.5
Representação diagramática da correcção de segunda ordem à correlação. . 38
3.1
Peso estatístico em função da energia . . . . . . . . . . . . . . . . . . . . . 42
3.2
Representação esquemática da selecção uniforme . . . . . . . . . . . . . . . 44
3.3
Representação esquemática da selecção com campo externo . . . . . . . . . 46
3.4
Representação esquemática da selecção com componente planar . . . . . . 47
3.5
Histogramas em função da energia . . . . . . . . . . . . . . . . . . . . . . . 49
3.6
Histograma multicanónico em função da energia . . . . . . . . . . . . . . . 50
3.7
Escolha de temperaturas para Parallel Tempering . . . . . . . . . . . . . . 50
3.8
Ferramentas de computação científica. . . . . . . . . . . . . . . . . . . . . 56
4.1
Estado de micro-vórtice e os casos particulares de Luttinger e Tisza. . . . . 67
4.2
Representação esquemática das condições de fronteira periódicas. . . . . . 68
4.3
Parâmetro de ordem e calor específico na rede quadrada
4.4
Susceptibilidade e cumulante de Binder na rede quadrada . . . . . . . . . . 70
4.5
Exemplo de cálculo de tempos de autocorrelação . . . . . . . . . . . . . . . 71
4.6
Tempos de autocorrelação com Metropolis convencional . . . . . . . . . . . 71
4.7
Comparação entre dinâmicas na rede quadrada . . . . . . . . . . . . . . . . 72
4.8
Comparação entre métodos de selecção na rede quadrada . . . . . . . . . . 72
4.9
Comparação de tempos de autocorrelação com diferentes dinâmicas . . . . 73
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
. . . . . . . . . . 69
11
Lista de Figuras
4.10
4.11
4.12
4.13
Cumulante de Binder na rede quadrada . . . . . . . . . . . . . . . . . . . .
Colapsos das curvas de magnetização, cumulante de Binder e susceptibilidade.
Magnetização e cumulante de Binder para uma cadeia unidimensional . . .
Tempos de autocorrelação para uma cadeia unidimensional . . . . . . . . .
74
75
77
77
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9
5.10
5.11
5.12
5.13
Representação esquemática de cada amostra desordenada. . . .
Distribuição de partículas num plano aleatório . . . . . . . . . .
Distribuição da magnetização com condições de fronteira abertas
Representação esquemática da “esfera de Lorentz” . . . . . . . .
Convergência do campo de Lorentz . . . . . . . . . . . . . . . .
Distribuição da magnetização com condições de fronteira abertas
Taxas de aceitação no sistema desordenado . . . . . . . . . . . .
Magnetização em função do campo aplicado . . . . . . . . . . .
Magnetização em função do campo aplicado . . . . . . . . . . .
Magnetização em função da temperatura e concentração . . . .
Exemplo da distribuição da correlação magnética . . . . . . . .
Correlação em função do campo aplicado . . . . . . . . . . . . .
Correlação das componentes paralelas ao campo . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
80
80
81
82
82
83
84
85
86
86
87
88
88
6.1
6.2
6.3
6.4
6.5
6.6
6.7
6.8
6.9
6.10
Representação esquemática do teorema da reciprocidade. . . . . . . . . .
Representação esquemática da função de forma. . . . . . . . . . . . . . .
Representação esquemática de um corpo com magnetização não uniforme.
Representação esquemática de um corpo com magnetização uniforme. . .
Representação esquemática da magnetização distribuída . . . . . . . . .
Representação esquemática de uma rede quadrada de discos . . . . . . .
Campo de ressonância em função do ângulo do campo aplicado . . . . . .
Campo de ressonância e anisotropia em função do parâmetro de rede . .
Intensidade de absorção em função do campo . . . . . . . . . . . . . . . .
Deformação da magnetização num disco . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
91
92
93
95
97
99
100
101
105
108
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A.1 Ângulo entre o momento e o campo externo . . . . . . . . . . . . . . . . . 115
B.1 Esquema de esfera com magnetização uniforme . . . . . . . . . . . . . . . . 121
B.2 Esquema das configurações de um cilindro . . . . . . . . . . . . . . . . . . 122
12
1 Introdução
À escala atómica, a interacção magnetostática entre os momentos magnéticos atómicos
é fraca quando comparada com a interacção de troca, principal responsável pela ordem
magnética dos materiais. Ainda assim, o carácter de longo alcance da interacção magnetostática pode alterar as propriedades magnéticas de materiais com a ordem microscópica
já assegurada pela interacção de troca, como a formação de domínios, anisotropias de
forma e modos de inversão magnética.
Já entre os sistemas constituídos por partículas de domínio único (normalmente de dimensões nanométricas), com um número significativo, mas contável, de momentos atómicos ordenados ferromagneticamente, a interacção magnetostática assume uma relevância
adicional, tanto dentro das partículas, onde pode ter uma magnitude comparável à da
interacção de troca, como entre as partículas, podendo inclusivamente ser responsável
pela ordem magnética do sistema composto à temperatura ambiente.
Estas nano-estruturas magnéticas constituídas por partículas separadas possuem propriedades estáticas e dinâmicas muito distintas das propriedades de amostras macroscópicas dos materiais que as constituem. A dimensão e a forma de pequenas partículas
magnéticas afectam não só a distribuição e dinâmica internas da magnetização (e.g. Cowburn [1]) como também a interacção entre as partículas (e.g. Guslienko [2]).
Compreender estes efeitos, para além do interesse do ponto de vista fundamental, permite a concepção de novos materiais cujo comportamento pode ser ajustado à medida de
cada aplicação particular, e é esta a principal motivação de trabalhos nesta área como os
que são apresentados nesta dissertação.
Algumas destas aplicações são apresentadas na secção que se segue. Posteriormente,
serão apresentados os modelos teóricos e computacionais utilizados para estudar estes
sistemas.
1.1 Aplicações
As aplicações tecnológicas de materiais magnéticos nano-estruturados encontram-se em
áreas tão distintas como o fabrico de ímans mais fortes e a criação de sensores biomédicos,
13
1 Introdução
passando por meios de armazenamento digital de maior densidade, memórias magnéticas,
dispositivos de lógica programável, sistemas micro-electromecânicos, etc. (e.g. Moriarty [3], Bader [4, 5], Skomski [6]).
Por exemplo, no domínio do armazenamento de dados digitais em meios magnéticos, o
desenvolvimento de sensores com maior resolução graças aos efeitos de magneto-resistência
gigante (e.g. Prinz [7]) permitiu um aumento exponencial nas densidades de gravação dos
discos que usamos nos nossos computadores.
No entanto, esse aumento está limitado por instabilidades térmicas no meio de armazenamento, e tem sido referida a possibilidade de usar sistemas regulares de nanopartículas
de domínio único (patterned media) como uma forma de ultrapassar este limite (e.g.
Ross [8], Moser et al. [9], Adeyeye e Singh [10], Chien et al. [11]).
As memórias magnéticas de acesso aleatório (MRAM, e.g. Tehranie et al. [12, 13]) têm
como principal característica diferenciadora das memórias actuais, baseadas em semicondutores, a não-volatilidade, sem prejudicar, ou até melhorando, as velocidades de acesso
e escritas convencionais. Isto permitiria, por exemplo, o desenvolvimento de computadores que podem ser ligados e desligados restaurando instantaneamente o estado anterior,
sem o procedimento de gravação e leitura no disco que actualmente permite um resultado
semelhante.
O conceito de dispositivos lógicos com nano-estruturas magnéticas (e.g. Cowburn e
Welland [14], Csaba et al. [15], Allwood et al. [16], Imre et al. [17]) foi proposto como
alternativa aos dispositivos actuais, que processam a informação de forma electrónica.
Usando redes de partículas magnéticas para registar estados lógicos e excitações magnéticas para propagar informação através da rede, alimentada por um campo magnético
oscilatório que serve também como relógio, estas propostas prometem aumentos ambiciosos na densidade de integração e reduções na dissipação de energia quando comparados
com os sistemas microelectrónicos actuais.
No entanto, estas eventuais aplicações requerem o conhecimento detalhado dos efeitos
colectivos das interacções magnéticas na sua forma mais relevante, a interacção dipolar,
com as particularidades de serem anisotrópicas e de longo alcance, o que não acontece
com a interacção de troca.
Para além da compreensão teórica do comportamento destas estruturas, tem sido necessário desenvolver métodos de preparação e observação destes sistemas regulares em grande
escala, bem como sistemas de leitura, gravação e processamento diferentes dos actuais, o
que constitui por si só uma área de investigação activa. Estes métodos de preparação e
observação são apresentados nas sub-secções seguintes.
14
1.1 Aplicações
Sistemas experimentais
Os métodos de fabrico são normalmente [18] divididos entre os métodos top-down (e.g.,
litografia, deposição) e bottom-up (e.g., self-assembly), e tanto podem produzir sistemas
ordenados, por exemplo para sistemas de armazenamento magnético (e.g. Ross [8]), como
desordenados, cujas aplicações se encontram mais frequentemente em sensores. Estes
sensores exploram a ligação entre as propriedades magnéticas e eléctricas destes materiais,
nomeadamente a magneto-resistência gigante (GMR, Berkowitz et al. [19]) semelhante à
inicialmente observada em multicamadas magnéticas (Baibich et al. [20]).
Top-down
Bottom-up
(e.g. litograﬁa)
(e.g. self-assembly)
Figura 1.1: Ilustração de métodos de fabrico de sistemas experimentais.
Métodos top-down Os métodos top-down são tipicamente evoluções, em termos de resolução, dos processos convencionais de microfabricação utilizados pela indústria
da microelectrónica e processadores. Não são (ainda) os métodos imaginados por
Feynman [21], na famosa palestra There’s plenty of room at the bottom, que sugeriu
uma recursão de máquinas que construiriam sucessivamente máquinas mais pequenas até à escala atómica, mas, ainda assim, já demonstraram um controlo e precisão
considerável. O principal desafio nesta área é o fabrico de estruturas regulares em
grande escala.
Métodos bottom-up Os métodos bottom-up utilizam propriedades físicas e químicas de
átomos e moléculas, nomeadamente as taxas anisotrópicas de difusão na superfície
atomicamente lisa do substrato e as interacções entre os átomos no substrato, para
fazer com que estes se auto-organizem para formar uma determinada configuração
estrutural e/ou posicional (Drexler [22]). A ideia é emular os sistemas biológicos,
onde “dispositivos” baseados em proteínas se auto-organizam para formar “máquinas” moleculares. A capacidade de replicação que encontramos nos sistemas
biológicos poderia permitir a produção em paralelo de estruturas macroscópicas.
15
1 Introdução
Aqui, a principal dificuldade é manter o controlo preciso das estruturas moleculares
à medida que as dimensões e complexidade aumentam.
Métodos híbridos Existem também métodos de preparação híbridos, que tipicamente
combinam uma primeira fase top-down para definir uma máscara onde elementos
atómicos e moleculares são depositados, seguidos de uma fase de auto-organização
confinada à estrutura preparada inicialmente.
Imagiologia
A engenharia de sistemas à escala nanométrica exige novas formas de observar estes sistemas, novos nanoscópios que vão além do uso comum da luz visível, dado que esta não
permite resoluções muito inferiores a um micrómetro. Estas novas formas de observação
exploram efeitos eléctricos e magnéticos à escala atómica para produzir imagens com a resolução necessária. À invenção do microscópio de efeito de túnel (STM, Binnig et al. [23],
figura 1.2), que permite não só a observação mas também, em certas condições, a manipulação à escala atómica, seguiu-se o desenvolvimento de tecnologias relacionadas como
a microscopia de força atómica (AFM, Binnig et al. [24]) e a microscopia de força magnética (MFM, Martin e Wickramasinghe [25], figura 1.3), com as suas várias modificações,
tecnologias estas que marcaram o nascimento da nanociência e nanotecnologia.
VT
IT
Figura 1.2: Representação esquemática da experiência de STM.
Figura 1.3: Representação esquemática da experiência de MFM.
16
1.1 Aplicações
Ressonância Ferromagnética Existem muitos outros mecanismos de caracterização das
propriedades estruturais, eléctricas e magnéticas de sistemas experimentais. Pela
sua relevância na parte final desta dissertação, as medições de ressonância ferromagnética (FMR, Griffiths [26], Kittel [27]), desenvolvidas muito antes do surgimento
das nanotecnologias, merecem aqui um destaque especial. A experiência de ressonância ferromagnética consiste em colocar a amostra na parede de uma cavidade
rectangular que termina um guia de ondas alimentado por um gerador de microondas, de tal forma que o campo magnético das micro-ondas esteja sempre no plano
da amostra (figura 1.4). É aplicado um campo magnético constante, podendo situarse tanto no plano da amostra como sob um ângulo φ com este, mas perpendicular ao
campo magnético das micro-ondas, campo este que alinha os momentos magnéticos
da amostra induzindo uma precessão a uma frequência que depende da intensidade
do campo magnético aplicado e do campo desmagnetizante da amostra, relacionado
com as interacções magnetostáticas dentro desta. À medida que se varia o campo
aplicado, verifica-se um aumento abrupto na perda de energia com a passagem da
onda através da cavidade, correspondente à condição de ressonância entre a frequência de micro-ondas do campo alternado e a precessão dos momentos magnéticos, o
que nos dá informação sobre os campos locais no interior da amostra.
Figura 1.4: Representação esquemática da experiência de FMR.
17
1 Introdução
1.2 Modelos teóricos e computacionais
Para estudar o efeito das interacções entre partículas magnéticas de domínio único, objectivo que constitui a maior componente desta dissertação, o modelo mais simples passa por
substituir as partículas pelo seu momento magnético, colocando um momento magnético
pontual, de magnitude igual à soma dos seus momentos atómicos, no centro de cada partícula. Em tudo o que se segue, assumimos que a magnitude deste momento magnético
total é suficiente para justificar uma abordagem puramente clássica ao problema, dado
que os sistemas experimentais que pretendemos modelar são constituídos por partículas
com, pelo menos, milhares de átomos ordenados ferromagneticamente.
Momentos magnéticos
Como não existem cargas magnéticas livres, a entidade mais simples que podemos usar
para descrever materiais magnéticos é o dipolo magnético pontual, ou seja, considerar
a existência dos dois pólos magnéticos no mesmo ponto do espaço. Excepto no caso
das partículas elementares, isto é uma aproximação. Como iremos ver, o tamanho finito
das partículas, mantendo a magnetização uniforme, pode ser tratado considerando uma
separação entre os pólos magnéticos, dando origem a correcções de ordens superiores
à interacção dipolar, ou tendo em conta toda a forma da amostra. Isto dá origem a
correcções à energia de interacção entre dois momentos magnéticos. Já uma distribuição
não uniforme da magnetização dentro das partículas pode obrigar-nos a abandonar por
completo este modelo de interacção entre partículas magnéticas.
Dipolos pontuais
No caso de considerarmos as partículas como dipolos pontuais, e se designarmos por µi
o momento magnético da partícula i e por r ij a posição relativa entre os centros das
partículas i e j, a energia de interacção entre duas partículas é dada por
E=
µi · µj
−3
3
rij
(µi · r ij ) µj · r ij
5
rij
.
(1.1)
Esta aproximação é exacta no caso de partículas esféricas uniformemente magnetizadas
(e.g. Jackson [28]), mas só é razoável assumir esta uniformidade em partículas muito
pequenas e/ou campos muito fortes. Para partículas não esféricas, mesmo que uniformemente magnetizadas, existem correcções à interacção entre as partículas que podem alterar
as simetrias e o decaimento da interacção, particularmente a distâncias comparáveis com
o tamanho da partícula.
18
1.2 Modelos teóricos e computacionais
Figura 1.5: Dipolos pontuais como modelo da interacção entre partículas.
A dimensionalidade do momento magnético também pode ser relevante (e.g. [29]),
considerando-se momentos com apenas duas orientações possíveis (correspondente ao modelo de Ising), livres para rodar no plano (modelo XY) ou no espaço (modelo Heisenberg).
Em sistemas planares, dado que o estado fundamental será também planar, os casos XY e
Heisenberg são muitas vezes considerados equivalentes, mas o grau de liberdade adicional
fora do plano afecta as excitações a temperatura finita e pode ser relevante, pelo que
iremos considerar este último caso.
Expansão de altas temperaturas
Dado que a interacção entre as partículas pode assumir diferentes formas, no capítulo 2
desenvolvemos uma expansão de altas temperaturas que assume apenas uma interacção
da forma
− Uijαβ µαi µβj
(1.2)
ou seja, que é possível escrever um tensor de interacção que contém toda a informação
excepto a direcção e magnitude dos momentos magnéticos das partículas. O sinal negativo
é apenas uma convenção que nos permite, se definirmos um campo
Hjβ =
X
Uijαβ µαi
(1.3)
i,α
escrever a energia em termos do campo local na forma canónica
E=−
X
Hjβ µβj .
(1.4)
j,β
No caso da interacção U corresponder à interacção dipolar, este tensor será dado explicitamente por
Uijαβ
3uαij uβij − δαβ
,
= δ ij
3
rij
(1.5)
19
1 Introdução
com δ ij = (1 − δij ) e uij = r ij /rij , r ij = r i − r j .
Como já foi mencionado, as duas características mais importantes desta matriz de
interacção são o facto de ser anisotrópica e de longo alcance. Ao contrário de outros
Hamiltonianos magnéticos, a anisotropia não vem simplesmente do facto de a interacção
ter magnitudes diferentes para componentes diferentes - a interacção depende da posição
relativa das partículas, de tal forma que tanto pode ser ferromagnética como antiferromagnética.
Simulações de Monte Carlo
O objectivo do nosso desenvolvimento da expansão de altas temperaturas foi validar, no
limite correspondente a este regime, o resultado de simulações de Monte Carlo. Desde
que mantenhamos a magnetização uniforme e de igual magnitude em todas as partículas,
tanto a expansão de altas temperaturas como as simulações de Monte Carlo são genéricas,
bastando alterar o tensor de interacção para estudar outros sistemas, e com ambas as
técnicas tratamos as interacções de longo-alcance sem qualquer cut-off. Este aspecto
contrasta com diversos trabalhos, tanto analíticos como numéricos, que ou limitam a
interacção a próximos vizinhos ou têm em conta o decaimento da interacção para, no
limite termodinâmico, excluir correcções de ordem superior. Se por um lado o facto de
as simulações de Monte Carlo tratarem sempre sistemas finitos já justifica o tratamento
completo das interacções, o facto de estarmos a estudar sistemas nano-estruturados, com
um número contável de partículas, põe em causa a utilização do limite termodinâmico
mesmo em estudos analíticos, pelo que se torna ainda mais relevante esta abordagem.
No capítulo 3, é feita uma revisão sobre métodos de Monte Carlo em geral e sobre
as técnicas adoptadas nesta dissertação em particular. São discutidos os problemas de
convergência e baixas taxas de aceitação das simulações, e as formas utilizadas para os
ultrapassar. Neste capítulo, será ainda apresentado um levantamento de ferramentas de
computação científica utilizadas.
Redes regulares de dipolos pontuais
No caso de a interacção dipolar ser a única interacção entre partículas colocadas numa rede
regular, a combinação das simetrias da rede e da interacção produz comportamentos não
triviais, reconhecidos pela primeira vez por Luttinger e Tisza [30], começando pelo facto de
o estado ferromagnético não ser o estado fundamental para uma simples rede quadrada,
e que continuam a surpreender. Para estudar as consequências termodinâmicas destes
efeitos, os métodos de Monte Carlo descritos anteriormente serão aplicados, no capítulo
20
1.3 Notação
4, ao estudo de uma rede quadrada de dipolos pontuais, onde poderemos também verificar
a importância da escolha de diferentes dinâmicas de simulação.
Sistemas desordenados
Como vimos, alguns dos sistemas experimentais com relevância tecnológica são constituídos por distribuições desordenadas de grânulos magnéticos, cuja presença define as
propriedades eléctricas e magnéticas do sistema composto. Nomeadamente, a interacção
magnetostática entre os grânulos introduz correlações magnéticas que se manifestam na
resistência eléctrica dos materiais. No capítulo 5, estudamos as correlações magnéticas
em planos com distribuições aleatórias de dipolos pontuais, com vista a caracterizar estes
efeitos.
Tamanho finito das partículas
Em geral, a dimensão e a forma de uma partícula produz um campo desmagnetizante que
provoca a deformação da magnetização no interior desta. Para além disso, as interacções
magnetostáticas entre partículas podem dar origem a importantes correcções a este campo
desmagnetizante, e é este o tópico da última parte da dissertação. Será apresentado
um mecanismo genérico de introdução da forma das partículas no cálculo da energia
magnetostática. Este mecanismo é utilizado para calcular a distribuição de campos e
a deformação da magnetização no interior de partículas com, neste caso em particular,
a forma de discos e dispostas numa rede quadrada, com o objectivo de explicar uma
anisotropia de quarta ordem verificada em experiências de ressonância ferromagnética.
1.3 Notação
Ao longo da dissertação, adoptamos a seguinte notação:
• o momento magnético de uma partícula é designado por µ
• os índices que identificam partículas são letras do alfabeto latino, colocadas em
subscripto, e.g. µi
• os índices que identificam componentes geométricas são letras do alfabeto grego,
colocadas em sobrescrito, e.g. rα
• vectores são representados a negrito, e.g. r = (rx , ry , rz )
21
1 Introdução
• índices de componentes geométricas repetidos no mesmo termo definem implicitaP
P
mente uma soma nesses índices, e.g. i Uijαβ µαi ≡ i,α Uijαβ µαi
• o valor esperado de uma variável aleatória A é designado por hAi
• o momento estatístico de ordem n de uma variável aleatória A é designado por hAn i
• o cumulante estatístico de ordem n de uma variável aleatória A é designado por [An ]
Outras notações mais específicas serão introduzidas ao longo do texto, quando apropriado.
1.4 Unidades
Na apresentação de resultados de simulações, nos capítulos 4 e 5, são usadas as unidades
naturais dos modelos estudados. Esta escolha é feita, por um lado, porque os resultados só
dependem de relações entre os parâmetros do modelo, como entre o momento magnético
µ de cada partícula e uma distância característica d do modelo. Por exemplo, no caso de
uma rede quadrada, de lado a, de dipolos pontuais com momento magnético µ, a energia
é apresentada em unidades de µ2 /a3 . Por outro lado, é preferível usar nas simulações
grandezas da ordem da unidade, para evitar perdas de precisão numérica, pelo que consideramos, na temperatura ou no calor específico, que kB , a constante de Boltzmann, é
igual à unidade. Os tempos de simulação são sempre medidos em passos de Monte Carlo.
Já no capítulo 6, onde o objectivo é modelar um sistema experimental em particular, são
usadas unidades do Sistema Internacional.
1.5 Conteúdo original e material externo
Excepto quando especificamente indicado, todo o conteúdo é de autoria própria, incluindo
textos, ilustrações e programas de computador (sem prejuízo da utilização das ferramentas
e bibliotecas indicadas).
22
2 Métodos analíticos
Os sistemas de partículas magnéticas de que nos vamos ocupar podem ser descritos por um
modelo clássico de momentos magnéticos pontuais, colocados no centro de cada partícula,
acoplados por uma interacção de longo alcance e eventualmente sujeitos a um campo
magnético externo. O Hamiltoniano deste modelo pode ser escrito como
H = HI + HZ ,
(2.1)
onde HI representa a interacção entre os momentos magnéticos e o termo de Zeeman HZ
representa a interacção com o campo externo.
O termo de interacção HI pode ser apresentado, sem perda de generalidade, na forma
de uma soma sobre todos os pares de momentos magnéticos
HI = −
1 X χλ χ λ
U µ µ ,
2 k,l kl k l
(2.2)
onde, como foi indicado na secção 1.3, estão implícitos os somatórios sobre índices de
componentes geométricas χ e λ1 . Escolhemos fazer a soma sobre toda a matriz (e dividir
por 2 para não contar duplamente os pares) em vez de somar sobre pares para que, no
que se segue, os índices k e l sejam equivalentes.
De momento, vamos assumir apenas que não existem termos de auto-interacção e que a
interacção de k com l é igual à interacção de l com k (ou seja, que Ukl é simétrica e que os
elementos diagonais são nulos). Qualquer interacção binária satisfaz estas condições, seja
de curto alcance ou longo alcance, isotrópica ou anisotrópica. Os momentos magnéticos,
por simplicidade com igual magnitude, podem estar confinados a um eixo, a um plano ou
livres para rodar no espaço, pelo que engloba qualquer modelo (clássico) de Ising, XY ou
Heisenberg.
Estando nós interessados em sistemas de partículas acopladas por interacção magne1
Vamos reservar os índices i, j e α, β para designar partículas específicas para as quais queremos calcular
médias termodinâmicas. Os índices k, l, m, n... e χ, λ, µ, ν... serão índices mudos dos somatórios
presentes nos Hamiltonianos.
23
2 Métodos analíticos
tostática, a matriz de interacção irá depois ser dada por
Uklχλ = δ kl
3uχkl uλkl − δχλ
,
3
rkl
(2.3)
com δ kl = (1 − δkl ) e ukl = r kl /rkl , r kl = r k − r l , mas no que se segue vamos considerar
uma matriz arbitrária.
Quanto ao termo de Zeeman, HZ , vamos escrevê-lo também de uma forma generalizada,
como
HZ = −
X
µk · hk = −
X χ χ
k
µk hk .
(2.4)
k
onde está implícito o somatório sobre o índice de componente cartesiana χ. Não assumimos nada em relação ao campo local, não só para manter a generalidade mas, principalmente, porque ter um campo local por partícula vai permitir-nos calcular funções
de correlação entre momentos magnéticos como derivadas da energia livre em ordem aos
campos locais. Após este cálculo, os campos locais podem ser igualados a zero para obter as grandezas a campo nulo ou identificados com um campo externo para estudar o
comportamento em função do campo aplicado.
2.1 Propriedades termodinâmicas
As propriedades em que estamos interessados são médias termodinâmicas em sistemas com
um número fixo de partículas em equilíbrio térmico com o ambiente (ensemble canónico,
e.g. Lage [31]). Neste caso, a termodinâmica do sistema é completamente descrita pela
sua função de partição
Z=
onde
dµ e−βH ,
(2.5)
dµ representa o integral sobre todas as configurações possíveis do sistema e
β=
1
,
kB T
(2.6)
ou pela energia livre
1
F = − ln Z.
β
(2.7)
A média termodinâmica de qualquer observável O, tipicamente uma função dos momentos magnéticos µi , é dada pela média dessa grandeza sobre todas as configurações
24
2.2 Momentos livres
possíveis, ponderada pelo peso de Boltzmann de cada configuração,
dµ O e−βH
.
hOi =
−βH
dµ e
(2.8)
Note-se que, se o Hamiltoniano H incluir o termo HZ como definido na equação 2.4,
então as grandezas que dependem dos momentos magnéticos µi podem ser escritas à custa
de derivadas da energia livre em ordem aos campos locais hi . Por exemplo,
hµαi i
∂
F=
=
∂hαi
dµ µαi e−βH
.
dµ e−βH
(2.9)
Na presença de interacções, ainda para mais de longo alcance, estas grandezas tornam-se
difíceis ou mesmo impossíveis de calcular, à medida que aumenta o número de partículas.
No entanto, o sistema sem interacções pode ser resolvido exactamente, como veremos a
seguir.
2.2 Momentos livres
No caso de momentos magnéticos sem interacção (referidos no que se segue como momentos livres), o Hamiltoniano é constituído apenas pelo termo de Zeeman, que é um
somatório de termos que envolvem uma única partícula, pelo que a função de partição
Z0 =
(2.10)
dµ e−βHZ
factoriza, podendo escrever-se como um produtório sobre todas as partículas
Z0 =
N
Y
χ
χ
dµk eβµk Hk .
(2.11)
k=1
O índice “0” aqui introduzido será usado para designar todas as grandezas calculadas com
um Hamiltoniano sem interacções.
De forma análoga à eq. 2.7, a energia livre deste sistema sem interacções apresenta-se
como
1
F0 = − ln Z0
β
(2.12)
e para a análise que se segue, vai ser particularmente relevante definir a média termodinâmica livre,
dµ O e−βHZ
hOi0 = ,
−βH
dµ e
Z
(2.13)
25
2 Métodos analíticos
onde O é uma função arbitrária dos momentos magnéticos µi . De forma análoga à equação 2.9, podemos também apresentar estas médias livres como
hµαi i0
∂
=
F0 =
∂hαi
dµ µαi e−βHZ
.
dµ e−βHZ
(2.14)
Note-se que os termos de HZ que envolverem momentos magnéticos que não estejam
presentes em O vão cancelar no numerador e denominador, pelo que
α α
dµi Oi eβhi µi
.
hOi i0 = α α
dµi eβhi µi
(2.15)
A propriedade mais importante desta média livre é o facto de que uma média que
envolva partículas diferentes pode ser separada num produto de médias que envolvem
apenas uma partícula, ou seja, se i 6= j,
α α
hOi Oj i0 =
=
α α
dµi dµj Oi Oj eβhi µi eβhj µj
α α
α α
dµi dµj eβhi µi eβhj µj
α
βhα
i µi
dµi Oi e
α α
dµi eβhi µi
(2.16)
α
βhα
j µj
dµj Oj e
α α
dµj eβhj µj
ou
hOi Oj i0 = hOi i0 hOj i0 .
(2.17)
Este facto irá ser usado para simplificar as expressões que ocorrem nos termos de ordem
superior de uma expansão de altas temperaturas.
2.3 Interacções como perturbação
Se, na função de partição, separarmos os dois termos do Hamiltoniano da equação 2.1
Z=
−βH
dµ e
=
dµ e−βHI e−βHZ
(2.18)
verificamos que podemos tratar o primeiro termo exponencial como uma “observável” O
da eq. 2.13 no sistema sem interacções, e escrever
D
Z = Z0 e−βHI
e, consequentemente,
26
E
0
(2.19)
2.4 Expansão de altas temperaturas
E
1
1 D
1
F = − ln Z = − ln Z0 − ln e−βHI .
0
β
β
β
(2.20)
A análise que se segue centra-se no último termo desta equação.
2.4 Expansão de altas temperaturas
Quando a temperatura é alta por comparação com a interacção, ou seja, quando βHI 1,
podemos expandir a exponencial na equação 2.20,
D
ln e
−βHI
1
' ln 1 − βHI + (βHI )2 + ...
2
0
!
2 D
E
β
= ln 1 − β hHI i0 +
HI2 + ...
0
2
E
0
(2.21)
e o logaritmo, no mesmo limite,
β 2 D 2E
1
β 2 D 2E
' − β hHI i0 −
HI
−
β hHI i0 −
HI
0
0
2
2
2
h
i
β 2 D 2 E
−β hHI i0 +
HI − hHI i20 + O (βHI )3
0
2
!
!2
+ ...
(2.22)
onde mantivemos apenas os termos até segunda ordem em βHI .
D
A expressão e−βHI
E
0
é a função geradora dos momentos estatísticos (e.g. Kubo [32]),
D
−βHI
e
E
0
(−β)n
hHIn i0
=
n!
n=0
∞
X
(2.23)
e o seu logaritmo é a função geradora dos cumulantes estatísticos (Fisher e Wishart [33]),
D
ln e−βHI
E
0
=
(−β)n n
[HI ]0 ,
n!
n=1
∞
X
(2.24)
o que nos permite escrever a energia livre do sistema com interacções como uma expansão
em cumulantes livres,
∞
1
1X
(−β)n n
[HI ]0 .
F = − ln Z0 −
β
β n=1 n!
(2.25)
Os primeiros termos desta expansão serão
27
2 Métodos analíticos
β 2 h 3i
1
β h 2i
HI +
HI + ...
F ≈ − ln Z0 + [HI ]0 −
0
0
β
2
6
(2.26)
ou, alternativamente, em termos dos momentos estatísticos,
1
β D 2 E
F ≈ − ln Z0 + hHI i0 −
HI − hHI i20 + ... .
0
β
2
(2.27)
As grandezas que vamos estar interessados em calcular podem escrever-se à custa de
derivadas da energia livre em ordem aos campos locais hk . Por exemplo, a componente
α da magnetização da partícula i é dada por
hµαi i = −
∂
∂
∂
F = − α F0 − α F1 − ....,
α
∂hi
∂hi
∂hi
(2.28)
onde Fn = (−β)n−1 [HIn ]0 /n!, para n > 0, e a correlação entre os momentos magnéticos
das partículas i e j escreve-se como
D
E
D
E
µαi µβj − hµαi i µβj = −
1 ∂ ∂
1 ∂ ∂
1 ∂ ∂
F1 − ...
βF = −
β F0 −
α
α
β ∂hi ∂hj
β ∂hi ∂hj
β ∂hαi ∂hβj
(2.29)
No que se segue, vamos calcular explicitamente as correcções de primeira e segunda ordem
à magnetização e à função de correlação, designando por Miα (n) a correcção de ordem n
ao valor médio da componente α da magnetização da partícula i
Miα (n) = −
∂
Fn
∂hαi
(2.30)
e por Cijαβ (n) a correcção de ordem n à correlação média entre as componentes α e β dos
momentos magnéticos das partículas i e j,
Cijαβ (n) = −
1 ∂ ∂
Fn .
β ∂hαi ∂hβj
(2.31)
Naturalmente,
hµαi i
=
∞
X
Miα (n)
(2.32)
n=0
e
D
E
D
E
µαi µβj − hµαi i µβj =
∞
X
n=0
de acordo com as expressões 2.28 e 2.29.
28
Cijαβ (n)
(2.33)
2.4 Expansão de altas temperaturas
Notação simplificada
Para simplificar a notação, vamos introduzir definições específicas para os momentos estatísticos relevantes:
hµχk i0 ≡ mχk
D
µχk µλk
D
E
µχk µλk µµk
0
E
0
≡ mχλ
k
≡ mχλµ
k
(2.34)
(2.35)
(2.36)
e assim sucessivamente. Estas grandezas dependem dos graus de liberdade dos momentos
magnéticos (Apêndice A), mas são sempre função dos campos locais hαi e da temperatura.
Quanto às derivadas em ordem aos campos locais, é importante verificar que a média livre
de qualquer observável de uma partícula só depende do campo local nessa partícula, pelo
que as derivadas de médias de observáveis da partícula k em ordem a observáveis da
partícula i só não são nulas se k = i. Sendo assim, podemos introduzir as notações para
as derivadas correspondentes,
∂
hµχk i0 ≡ δik ∂α mχi
∂hαi
(2.37)
∂ D χ λE
µk µk ≡ δik ∂α mχλ
i
α
0
∂hi
(2.38)
∂ D χ λ µE
µk µk µk ≡ δik ∂α mχλµ
i
α
0
∂hi
(2.39)
e assim sucessivamente.
2.4.1 Termo de ordem zero
O termo de ordem zero da expansão 2.25 corresponde ao sistema sem interacções, logo a
energia livre é simplesmente dada por
1
F0 = − ln Z0 .
β
(2.40)
A média de qualquer momento magnético é dada pela equação 2.28
Miα (0) = hµαi i0 = −
∂
F = mαi
α 0
∂hi
(2.41)
29
2 Métodos analíticos
e a correlação entre os momentos magnéticos de duas partículas diferentes resulta nula
D
Cijαβ (0) = µαi µβj
E
D
0
− hµαi i0 µβj
E
= −
0
1 ∂ ∂
1 ∂
mα = 0,
β F0 =
α
β ∂hi ∂hj
β ∂hβj i
(2.42)
dado que mαi não depende de hβj .
2.4.2 Correcção de primeira ordem
Segundo a equação 2.25, a correcção de primeira ordem à energia livre é dada pela média
livre do Hamiltoniano de interacção
F1 = hHI i0 = −
1 X χλ D χ λ E
U
µk µl ,
0
2 k,l kl
(2.43)
onde, mais uma vez, está implícita a soma sobre os índices de componentes χ e λ. Como
a matriz de interacção obriga a que k seja diferente de l, obtemos
F1 = −
1 X χλ χ λ
U m m .
2 k,l kl k l
(2.44)
Este resultado pode ser usado para calcular a correcção de primeira ordem à magnetização média da partícula i, que é dada pela derivada em ordem ao campo local,
hµαi i1 = −
∂
1 ∂ X χλ χ λ
F
=
U m m
1
∂hαi
2 ∂hαi k,l kl k l
(2.45)
Derivando cada um dos termos do produto de magnetizações,
Miα (1) = hµαi i1 =
1 X χλ χ 1 X χλ λ
Ukl mk δli ∂α mλl +
U m (δik ∂α mχk )
2 k,l
2 k,l kl l
(2.46)
e notando que os índices k e l são equivalentes, podemos escrever
hµαi i1 =
X
χλ χ
Uki
mk ∂α mλi ,
(2.47)
k
onde agora o somatório sobre partículas é só sobre o índice k.
A correcção de primeira ordem à correlação entre as partículas i e j obtém-se directamente a partir da correcção de primeira ordem à magnetização,
30
2.4 Expansão de altas temperaturas
Cijαβ (1) = −
1 ∂ ∂
1 ∂
α
F
=
1
β
β hµi i1
α
β ∂hi ∂hj
β ∂hj
1 ∂
=
β ∂hβj
(
X
χλ χ
Uki
mk
∂α mλi
(2.48)
)
.
k
A derivada só não é nula quando k = j, logo
Cijαβ (1) =
1 χλ Uji ∂β mχj ∂α mλi ,
β
(2.49)
reduzindo-se portanto a uma forma separável de médias termodinâmicas livres. Esta
forma separável será sempre o objectivo também no tratamento dos termos de ordens
superiores. Note-se que, em primeira ordem, a correlação entre i e j não envolve nenhum
somatório sobre as restantes partículas, apenas a interacção entre i e j. Nos termos de
ordem superior, esperamos encontrar o efeito da presença das restantes partículas.
2.4.3 Correcção de segunda ordem
A correcção de segunda ordem à energia livre envolve médias de quatro momentos magnéticos, na seguinte forma
1 D E
F2 = − β HI2 − hHI i20
0
2
D E
1 X X χλ µν D χ λ µ ν E
µν
= − β
Ukl Umn µk µl µm µn − Uklχλ hµχk i0 µλl Umn
hµµm i0 hµνn i0
0
0
8 k,l m,n
D E
1 X χλ µν D χ λ µ ν E
Ukl Umn µk µl µm µn − hµχk i0 µλl hµµm i0 hµνn i0 .
= − β
0
0
8 k,l,m,n
(2.50)
Nos casos em que todos os índices k, l, m e n são diferentes, os dois termos são iguais
e a expressão é nula, pelo que só temos de considerar os casos restantes. Este procedimento pode ser automatizado particionando o conjunto {k, l, m, n} em blocos de tamanho
b = 1 até 4 (e.g., com a função KSetP artitions do Mathematica), mas, numa primeira
exposição, vamos tratar este termo de segunda ordem manualmente.
Em primeiro lugar, verificamos que nunca ocorrem três nem quatro índices iguais,
porque as matrizes de interacção obrigam a que k 6= l e m 6= n. Portanto, as únicas
composições não nulas são as de três índices diferentes (4 casos):
31
2 Métodos analíticos
k 6= m, l = n
k 6= n, l = m
l 6= m, k = n
l 6= n, k = m
e dois índices diferentes (2 casos, dado que são proibidos os que implicam k=l e/ou
m=n):
k = m, l = n
k = n, l = m
Como em F2 os índices são todos equivalentes, podemos fazer uma rotação cíclica dos
índices e escrever:
D E
D
E
1 X χλ µν h
Ukl Umn 4δlm δ kn hµχk i0 hµνn i0 µλl µµm − µλl hµµm i0 (2.51)
F2 = − β
0
0
8 k,l,m,n
D
+2δlm δkn hµχk µνn i0 µλl µµm
E
D
0
− hµχk i0 µλl
E
0
hµµm i0 hµνn i0
i
.
Contraindo os índices iguais (nas partículas) e, usando a notação da secção 2.4, chegamos à forma
1 X χλ µν
λ µ
Ukl Uln δ kn mχk mνn mλµ
F2 = − β
l − ml ml
2 k,l,n
1 X χλ µν χν λµ
− β
Ukl Ulk mk ml − mχk mλl mµl mνk .
4 k,l
(2.52)
Esta equivalência entre as equações 2.50 e 2.52 foi verificada numericamente para um
sistema de três partículas com interacção dipolar.
Magnetização
A correcção de segunda ordem à magnetização média da partícula i é dada por
∂
F2
∂hαi
1 ∂ X χλ µν
λ µ
−
m
m
=
β α
Ukl Uln δ kn mχk mνn mλµ
l
l
l
2 ∂hi k,l,n
Miα (2) = hµαi i2 = −
+
32
1 ∂ X χλ µν χν λµ
β α
Ukl Ulk mk ml − mχk mλl mµl mνk .
4 ∂hi k,l
(2.53)
2.4 Expansão de altas temperaturas
Separando nos casos em que cada um dos índices na soma é igual a i, temos a série de
contribuições

X χλ µν
1
λ µ
Ukl Uln δ kn (δki ∂α mχk ) mνn mλµ
hµαi i2 = β 
l − ml ml
2 k,l,n
+
X
µν
λ µ
Uklχλ Uln
δ kn mχk (δni ∂α mνn ) mλµ
l − ml ml
k,l,n
+
X
µν
Uklχλ Uln
δ kn mχk mνn
n
δli ∂α mλµ
− δli ∂α mλl mµl
l
o
(2.54)
k,l,n
+
o
1 X χλ µν n
λµ
χ ν
λ µ
Ukl Ulk (δki ∂α mχν
k ) ml − ml ml (δki ∂α mk mk )
2 k,l
+
1
2

X
n
Uklχλ Ulkµν mχν
δli ∂α mλµ
− mχk mνk ∂α mλl mµl
k
l
o
.
k,l
Contraindo os índices iguais e renumerando índices equivalentes, podemos simplificar
para

hµαi i2
1  X χλ µν
λ µ
Ukl Uli δ ki mχk (∂α mνi ) mλµ
=
β 2
l − ml ml
2
k,l
+
X
χλ µν
Uki
Uin δ kn mχk mνn
n
∂α mλµ
− ∂α mλi mµi
i
o
(2.55)
k,n
+
X
χλ µν
Uik
Uki
n
mχν
k
∂α mλµ
i
−
mχk mνk
∂α mλi mµi
o
#
,
k
que pode ser interpretado como, no primeiro termo, as interacções entre todas as partículas k com a partículas i mediadas por todas as partículas l, no segundo termo a
interacção entre todas as partículas k e l mediadas pela partículas i e, por último, uma
auto-interacção de i mediada por todas as partículas k.
Correlação
Mais uma vez, a correcção de segunda ordem à correlação entre as partículas i e j, é dada
pela derivada em ordem ao campo local de j da magnetização de i,
Cijαβ (2) = −
1 ∂ ∂
1 ∂
hµα i .
β F2 =
α
β ∂hi ∂hj
β ∂hβj i 2
(2.56)
Substituindo o termo de segunda ordem da magnetização, já calculada na eq. 2.55,
33
2 Métodos analíticos
obtemos

1 ∂  X χλ µν
χ
λµ
ν
λ µ
(∂
)
2
U
U
δ
m
m
m
−
m
m
Cijαβ (2) =
α i
l
kl
li ki k
l
l
2 ∂hβj
k,l
+
X
χλ µν
Uki
Uin δ kn mχk mνn
n
∂α mλµ
− ∂α mλi mµi
i
o
(2.57)
k,n
+
X
χλ µν
Uki
Uik
n
mχν
k
∂α mλµ
i
−
mχk mνk
∂α mλi mµi
#
o
.
k
Separando nos casos em que cada um dos índices é igual a j,

1  X χλ µν
λ µ
Cijαβ (2) =
2
Ukl Uli δ ki (δkj ∂β mχk ) (∂α mνi ) mλµ
−
m
m
l
l
l
2
k,l
+ 2
X
Uklχλ Uliµν δ ki mχk (∂α mνi )
n
o
o
δlj ∂β mλµ
− δlj ∂β mλl mµl
l
o
k,l
+
X
χλ µν
Uin δ kn (δkj ∂β mχk ) mνn
Uki
n
χλ µν
Uin δ kn mχk (δnj ∂β mνn )
Uki
n
∂α mλµ
− ∂α mλi mµi
i
(2.58)
k,n
+
X
∂α mλµ
− ∂α mλi mµi
i
k,n
+
X
χλ µν
Uki
Uik
n
(δkj ∂β mχν
k )
∂α mλµ
i
−
∂α mλi mµi
#
o
(δkj ∂β mχk mνk )
k
e, contraindo os índices iguais e rodando índices equivalentes, podemos simplificar para
Cijαβ (2) =
X
+
X
λ µ
Ujlχλ Uliµν δ ji ∂β mχj (∂α mνi ) mλµ
l − ml ml
l
χλ µν
Uji δ ki mχk (∂α mνi )
Ukj
n
∂β mλµ
− ∂β mλj mµj
j
o
(2.59)
k
+
X
χλ µν
Uki
Uij δ kj mχk ∂β mνj
n
∂α mλµ
− ∂α mλi mµi
i
o
k
o
1 χλ µν n
+
Uji Uij
∂β mχν
∂α mλµ
− ∂α mλi mµi ∂β mχj mνj ,
j
i
2
expressão que pode ser interpretada de forma semelhante à da secção anterior.
2.4.4 Generalização
Ao longo do cálculo dos diferentes termos da expansão, o que fizemos foi expandir os
cumulantes em momentos estatísticos e, posteriormente, separar os momentos estatísticos
34
2.4 Expansão de altas temperaturas
em todas as possibilidades de os índices, somados sobre todas as partículas, serem a)
diferentes, caso em que as médias livres factorizam, ou b) iguais, dando origem a médias
de produtos de componentes. Em ambos os casos, o que fizemos é conhecido em Análise
Combinatória como partições de conjuntos (e.g. Kreher e Stinson [34]).
Cumulantes como partições
Em primeiro lugar, notamos que os cumulantes de HI que aparecem na expansão 2.25
podem ser genericamente escritos como (Fukushima [35])
h
n
X
X
D
(1)
(n)
HI ...HI
(1)
(j )
(−1)k−1 (k − 1)! HI ...HI 1
k=1 P (n,k)
i
E D
0
=
0
(j +1)
HI 1
(2.60)
(j )
...HI 2
E
0
D
(j
... HI k−1
+1)
(j )
...HI k
n
(1)
E
0
(n)
onde a soma sobre P (n, k) é a soma sobre todas as partições do conjunto HI ...HI
em k blocos. Alguns casos particulares são
[Hi ]0 = hHI i0
D
[Hi2 ]0 = Hi2
D
[Hi3 ]0 = Hi3
E
0
E
0
D
− 3 HI2
(2.61)
(2.62)
− hHI i20
E
0
o
(2.63)
hHI i0 + 2 hHI i30
onde já tiramos partido do facto de que os n Hamiltonianos no cumulante são todos
equivalentes.
Somas de momentos como partições
Quando, na exposição anterior, escrevemos explicitamente os Hamiltonianos que figuram
nos momentos estatísticos, encontrámos termos que se podem escrever genericamente
como
hHin i0 = −
1
2
n X
X
i1 ...i2n α1 ...αn
α
α
D
α
2n−1 2n
2n−1 α2n
Uiα11i2α2 ...Ui2n−1
µαi11 µαi22 ...µi2n−1
µi2n
i2n
E
0
(2.64)
e separámos estes momentos estatísticos contabilizando o número e o tipo de formas como
os índices de partícula i podem ser iguais ou diferentes. Para generalizar este cálculo,
vamos necessitar de introduzir algumas noções de Análise Combinatória.
35
2 Métodos analíticos
Relação com partições de conjuntos
O número de partições do conjunto {1, 2, ..., n} é conhecido como número de Bell, B(n), e
o número de partições desse conjunto em k subgrupos é o número de Stirling do segundo
tipo, S2 (n, k). Naturalmente,
B(n) =
n
X
S2 (n, k)
(2.65)
k=1
Como os Hamiltonianos no cumulante são todos equivalentes, podemos agrupar termos
do mesmo tipo (o mesmo número de Hamiltonianos em cada média). Os tipos possíveis
são dadas pelas partições inteiras de n, P (n), ou seja, as formas de escrever n como uma
soma de inteiros.
Para exemplificar, o conjunto {1, 2, 3, 4} tem B(4) = 15 partições diferentes, S2 (4, 1) =
1 com um bloco
{1, 2, 3, 4}
S2 (4, 2) = 7 com dois blocos
{{1, 2, 3}, {4}} {{1, 2, 4}, {3}} {{1, 3, 4}, {2}} {{2, 3, 4}, {1}}
{{1, 2}, {3, 4}} {{1, 3}, {2, 4}} {{1, 4}, {2, 3}}
S2 (4, 3) = 6 com três blocos
{{1, 2}, {3}, {4}} {{1, 3}, {2}, {4}} {{1, 4}, {2}, {3}}
{{2, 3}, {1}, {4}} {{2, 4}, {1}, {3}} {{3, 4}, {1}, {2}}
e S2 (4, 4) = 1 com quatro blocos
{{1}, {2}, {3}, {4}}.
De seguida, tentaremos sistematizar a contagem dos tipos de partições relevantes.
Tipos de partições
As partições do inteiro 4 são dadas por [4], [3, 1], [2, 2], [2, 1, 1] e [1, 1, 1, 1], que correspondem aos tipos de partições equivalentes que encontramos em cima. Note-se que existem
dois tipos de partições com dois blocos, mas com diferentes tamanhos de bloco, pelo que
o número de Stirling do segundo tipo não é o coeficiente que procuramos para enumerar
36
2.4 Expansão de altas temperaturas
partições equivalentes. O número de vezes que cada tipo aparece é dado pelos coeficientes
de di Bruno [36],
Cn (m1 , ..., mn ) =
n!
m1 !m2 !m3 ! · · · 1!m1 2!m2 3!m3 · ··
(2.66)
onde mi é o número de blocos de tamanho i. Ou seja, existem C4 (, 0, 0, 0, 4) = 1 partições
do tipo [4], C4 (1, 0, 1, 0) = 4 partições do tipo [3, 1], C4 (0, 2, 0, 0) = 3 partições do tipo
[2, 2], C4 (2, 1, 0, 0) = 6 do tipo [2, 1, 1] e C4 (4, 0, 0, 0) = 1 do tipo [1, 1, 1, 1].
Representação Diagramática
Existe uma representação de partições de conjunto que é particularmente útil no nosso
contexto. Trata-se de representar um conjunto de n elementos por um polígono regular
com n vértices onde elementos pertencentes ao mesmo bloco são unidos por um segmento de recta e blocos de apenas um elemento são representados por um ponto isolado
(figura 2.1). As Cn (m1 , ..., mn ) partições de cada tipo correspondem simplesmente a diferentes posições para os pontos e segmentos de recta, pelo que basta representar uma
delas.
Figura 2.1: Representação diagramática dos tipos de partições de um conjunto de 4
elementos.
No nosso caso, em que os momentos magnéticos vêm de Hamiltonianos de interacção,
existem restrições devido ao facto de não existir auto-interacção, ou seja, os índices de
momentos magnéticos provenientes do mesmo Hamiltoniano nunca podem ser iguais. Isto
quer dizer que num conjunto de n elementos provenientes de n/2 Hamiltonianos, não
podem existir blocos com mais de n/2 elementos, pelo que esses tipos podem ser eliminados
à partida (no exemplo, os tipos [4] e [3, 1] não são permitidos). Esta restrição significa
também que se k for um número ímpar, não são permitidas partições em ik e ik+1 apareçam
no mesmo bloco.
Usando esta representação, verificamos rapidamente que as partições de momentos
estatísticos de F2 na equação 2.50 podem ser apresentados como na figura 2.2
37
2 Métodos analíticos
Figura 2.2: Representação diagramática da correcção de segunda ordem à energia livre.
o que corresponde à forma separada da equação 2.52. Esta notação permite calcular
a expansão da energia livre de forma mais simples e, consequentemente chegar a termos
de ordem superior. No entanto, para calcular a magnetização e funções de correlação é
necessário introduzir uma notação para as derivadas em ordem a cada índice.
Uma forma de o fazer é marcar os pontos ou linhas com o índice em ordem aos quais
esse bloco foi derivado, e multiplicar o número de partições equivalentes pelo número de
blocos equivalentes a esse, como exemplificado na figura 2.3.
Figura 2.3: Representação diagramática das derivadas de tipos de partições num conjunto
de 4 elementos.
Usando este esquema, e sabendo que M α (2) = −∂α F2 , a correcção de segunda ordem à
magnetização pode ser representada como na figura 2.4, o que corresponde à equação 2.55.
Figura 2.4: Representação diagramática da correcção de segunda ordem à magnetização.
Quanto à correcção de segunda ordem à correlação, C αβ (2) =
representada como na figura 2.5, correspondente à equação 2.59.
1
∂ M α (2),
β β
pode ser
Figura 2.5: Representação diagramática da correcção de segunda ordem à correlação.
Esta representação, embora não substitua o cálculo analítico por completo, permite
verificar rapidamente quais as partições de conjuntos que contribuem para cada grandeza,
e o respectivo peso.
38
2.5 Conclusões
2.5 Conclusões
Neste capítulo, revimos noções elementares de Física Estatística à medida que apresentámos os modelos que servem de base ao estudo que se segue. Para melhor enquadrar
e controlar os resultados de métodos numéricos como os que veremos no capítulo seguinte, calculámos analiticamente médias termodinâmicas de um sistema sem interacções
e sucessivas correcções no âmbito de uma expansão de altas temperaturas.
39
2 Métodos analíticos
40
3 Métodos numéricos
No capítulo 2, vimos como podemos obter uma aproximação analítica para as médias
termodinâmicas
dµ O(µ) e−βH
hOi =
(3.1)
dµ e−βH
de um sistema com interacções arbitrárias, através de uma expansão de altas temperaturas. Neste capítulo, vamos explorar uma outra forma de obter estimativas de médias
termodinâmicas, desta feita para qualquer temperatura.
Se projectarmos na energia o integral sobre todas as configurações, definindo a média
microcanónica
dµ O(µ) δ(E − Eµ )
(3.2)
O(E) =
dµ δ(E − Eµ )
e a densidade de estados
n(E) = log S(E) =
dµ δ(E − Eµ )
(3.3)
podemos escrever a média termodinâmica como um integral sobre a energia em vez das
configurações
hOi =
=
dE O(E) n(E) e−βE
dE n(E) e−βE
(3.4)
dE O(E) eS(E)−βE
,
dE eS(E)−βE
e notar que o termo eS(E)−βE faz com que para cada temperatura, apenas configurações
dentro de um intervalo estreito de valores da energia tenham uma contribuição relevante
para o valor do integral (figura 3.1), o que sugere a utilização de um método de integração
de Monte Carlo com amostragem por importância.
41
3 Métodos numéricos
Figura 3.1: O peso estatístico das configurações em função da sua energia é aproximadamente uma gaussiana.
3.1 Revisão de métodos de Monte Carlo
Quando uma função é conhecida analiticamente, a sua integração numérica por Monte
Carlo com amostragem por importância é trivial. No entanto, no caso do cálculo de
médias termodinâmicas, não sabemos escrever a densidade de estados e as médias microcanónicas das observáveis de interesse como função da energia, pelo que é necessário gerar
as configurações do sistema para calcular as suas propriedades. A dificuldade reside, naturalmente, em como gerar configurações do sistema com uma determinada distribuição
de amostragem e em saber qual a distribuição que permite uma melhor convergência, na
prática, ao valor da função.
3.1.1 Cadeias de Markov
Para resolver a primeira questão, de gerar configurações com uma determinada distribuição assimptótica, utiliza-se o formalismo de cadeias de Markov (e.g. Newman e Barkema [37]), uma forma de, a partir de um determinado estado inicial i, gerar um estado
final f . A probabilidade de transição entre os dois estados designa-se por P (i → f ) e,
para se gerar uma cadeia de Markov, é necessário que estas probabilidades não variem
com o tempo e que dependam apenas das propriedades dos estados i e f . Naturalmente,
é necessário que se cumpra a condição de normalização
X
P (i → f ) = 1,
(3.5)
f
onde não é necessário que P (i → i) seja igual a zero, ou seja, pode existir uma probabilidade de o sistema ficar no mesmo estado. Este facto é normalmente utilizado na
construção dos algoritmos, e de facto, em geral, P (i → i) não será igual a zero.
Para garantir que esta forma de escolher estados converge para uma amostragem com
42
3.1 Revisão de métodos de Monte Carlo
a distribuição assimptótica desejada, é necessário garantir que as probabilidades de transição, por um lado, são tais que nenhum estado do sistema é completamente inacessível
(ergodicidade) e que, por outro lado, satisfazem a condição de equilíbrio detalhado,
pi P (i → f ) = pf P (f → i),
(3.6)
onde pi é a probabilidade assimptótica de encontrar o sistema no estado i (no ensemble
canónico, pi = e−βEi /Z).
3.1.2 Selecção e aceitação
Como vimos, não é necessário que a probabilidade de ficar no mesmo estado seja nula, o
que sugere introduzir alguma liberdade na escolha das probabilidades de transição, sem
violar a condição de equilíbrio detalhado, separando a transição em dois passos, onde
primeiro seleccionamos um novo estado e, de seguida, decidimos se o aceitamos ou não.
Vamos então escrever a probabilidade de transição como o produto
P (i → f ) = S(i → f )A(i → f )
(3.7)
onde S(i → f ) é a probabilidade de selecção, a probabilidade de propor um estado f a
partir do estado i, e A(i → f ) é a probabilidade de aceitação, a probabilidade com que
aceitamos essa proposta. A condição de equilíbrio detalhado (eq. 3.6) fixa apenas a razão
entre as probabilidades de transição
S(i → f )A(i → f )
pf
=
pi
S(f → i)A(f → i)
(3.8)
Dado que pretendemos amostrar o maior número de estados diferentes para calcular
os estimadores das grandezas relevantes, é conveniente garantir que a probabilidade de
aceitação não é demasiado baixa.
Algoritmo de Metropolis
O algoritmo de Metropolis [38] consiste em seleccionar os estados acessíveis com uma
probabilidade uniforme (figura 3.2) e fazer com que uma das probabilidades de aceitação
seja igual à unidade, nomeadamente a aceitação no sentido em que a energia diminui.
43
3 Métodos numéricos
Para tal, a probabilidade de aceitação é dada então por


1,
Ef 6 Ei
pf /pi ,
Ef > Ei
A(i → f ) = 
.
(3.9)
Esta escolha, apesar de garantir a condição de equilíbrio detalhado, pode levar a probabilidades de aceitação pouco satisfatórias, principalmente a baixas temperaturas e/ou
campos elevados, dado que a maior parte das propostas implica um custo energético demasiado elevado. O ideal para uma exploração eficiente do espaço de fase seria seleccionar
os estados propostos com a probabilidade de transição correcta, de tal forma que a probabilidade de aceitação fosse sempre igual à unidade. De seguida, vamos procurar formas
de propor configurações que nos permitam aproximar deste objectivo.
S
Figura 3.2: Representação esquemática da selecção uniforme.
Selecção Optimizada
Designando por Pf i a probabilidade de transição do estado i para o estado f
Pf i = P (i → f ) = Sf i Af i
(3.10)
onde Sf i é a probabilidade de selecção do estado f e Af i é a probabilidade de aceitação
da transição i → f , a condição de equilíbrio detalhado diz-nos que
Pf i
Af i Sf i
=
= e−β(Ef −Ei ) .
Pif
Aif Sif
(3.11)
Escrevendo a energia à custa dos campos locais H k (que podem incluir tanto o campo
externo como a interacção entre as partículas), e tendo em conta que a diferença de
energia se deve apenas a uma partícula k e que os campos nessa partícula dependem do
44
3.1 Revisão de métodos de Monte Carlo
momento dessa partícula (mk,f na configuração f e mk,i na configuração i), verificamos
que a diferença de energias que aparece na exponencial é dada por
Ef − Ei = −H k · (mk,f − mk,i ).
(3.12)
Quando a selecção é uniforme, é a probabilidade de aceitação que tem de satisfazer a
condição da eq. 3.11. Para melhorar a probabilidade de aceitação, é necessário incluir
parte desta diferença de energia na proposta da nova orientação do momento.
Energia de Zeeman na probabilidade de selecção
Vamos então separar o campo local H k no campo devido às interacções, H I,k , e o campo
externo, H ext ,
H k = H I,k + H ext
(3.13)
e escrever o produto escalar à custa do ângulo que o momento que estamos a trocar faz
com o campo externo,
Ef − Ei = −H I,k · (mk,f − mk,i ) − Hext (cos θk,f − cos θk,i ).
(3.14)
Se escolhermos a nova posição com uma probabilidade proporcional a eβHext cos θ , ou
seja,
Sf i ∝ eβHext cos θk,f
e
Sif ∝ eβHext cos θk,i
então a probabilidade de aceitação vai depender apenas das interacções entre partículas.
Af i
= eβH I,k ·(mk,f −mk,i )
Aif
(3.15)
Na prática, deixamos de propor configurações cujo custo energético devido ao campo
externo seria demasiado alto, o que melhora a taxa de aceitação a campos altos.
Energia de interacção na probabilidade de selecção
Para melhorar a taxa de aceitação a campos fracos e baixas temperaturas, podemos notar
que, nos sistemas planares de que nos vamos ocupar, e se o campo externo estiver também
45
3 Métodos numéricos
S
Figura 3.3: Representação esquemática da selecção optimizada tendo em conta o campo
externo.
k
aplicado no plano, H ext = H ext , então a componente dos campos locais perpendicular
k
⊥
ao plano, Hk⊥ = HI,k
, é muito pequena. Se a separarmos da componente planar H k =
k
H ext + H I,k , podemos escrever a diferença de energia de uma forma semelhante ao que
fizemos com o termo de Zeeman,
k
⊥
e
Ef − Ei = −Hk⊥ (m⊥
k,f − mk,i ) − Hk (cos θk,f − cos θ̃k,i )
(3.16)
onde agora θe é o ângulo que o momento faz com a componente planar do campo local
k
k
H k = H ext + H I,k .
Se, mais uma vez, escolhermos a nova orientação do momento com uma probabilidade
tal que
k
e
Sf i ∝ eβHk cos θk,f
e
k
Sif ∝ eβHk cos θ̃k,i
então a probabilidade de aceitação vai depender apenas da componente da energia de
interacção devida às componentes perpendiculares ao plano dos momentos,
⊥
⊥
⊥
Af i
= eβHk (mk,f −mk,i ) .
Aif
(3.17)
Como iremos ver mais à frente, esta simples modificação pode ter efeitos muito relevantes na convergência e precisão das simulações.
46
3.1 Revisão de métodos de Monte Carlo
S
~
~
Figura 3.4: Representação esquemática da selecção optimizada tendo em conta o campo
externo e a componente planar do campo dipolar local.
Números aleatórios com distribuição exponencial
Para implementar esta selecção optimizada, é necessário gerar os novos valores de u = cos θ
de acordo com a seguinte distribuição de probabilidade
P (u) = 1
eβHu
−1
eβHu du
=
2
βH
eβHu
.
sinh(βH)
(3.18)
Para gerar um número u com esta probabilidade, geramos um número aleatório r com
distribuição uniforme entre 0 e 1 e usamos a função cumulativa para inverter,
U
P (u)du =
r=
−1
U=
eβHU − eβH
2 sinh(βH)
1
log 2 sinh(βH)r + e−βH .
βH
(3.19)
(3.20)
No caso de u = cos θ, sendo θ o ângulo que o momento faz com o eixo x, então
mx = u,
my =
mz =
√
1 − u2 sin φ,
(3.21)
√
1 − u2 cos φ
e sendo θe o
onde o ângulo φ é gerado uniformemente entre 0 e 2π. No caso de u = cos θ,
ângulo que o momento faz com a componente planar do campo local, então as componentes
cartesianas mx,y,z são calculadas a partir de u e φ através de uma rotação adicional,
47
3 Métodos numéricos
descrita pela matriz


cos ω − sin ω 

sin ω cos ω
(3.22)
onde ω é o ângulo que a componente planar do campo local faz com o eixo x, definido por
cos ω = r
sin ω = r
x
Hext + HI,k
Hext +
x
HI,k
2
+
+
2
y
HI,k
y
HI,k
Hext +
x
HI,k
2
2
y
HI,k
,
(3.23)
.
(3.24)
Estes cálculos têm um custo computacional apreciável quando comparados com o caso
da selecção uniforme. No entanto, dado que a taxa de aceitação passa a ser próxima de 1,
este custo é desprezável quando comparado com o custo de actualização dos campos em
todas as partículas, que acaba sempre por dominar o perfil computacional, principalmente
em sistemas com interacções de longo alcance.
3.1.3 Distribuições de amostragem
Outro grau de liberdade à nossa disposição quando efectuamos simulações de Monte
Carlo é a escolha da distribuição de amostragem, mantendo a mesma conectividade entre
estados, permitindo formas de explorar o espaço de fase que podem ser mais eficientes em
determinadas situações.
Peso de Boltzmann
A escolha mais natural para a distribuição de amostragem consiste em usar uma probabilidade proporcional ao peso de Boltzmann dessa configuração, dado ser essa a importância
da sua contribuição para o integral. Usando a condição de equilíbrio detalhado, isto
equivale a dizer que
pf
P (i → f )
=
= e−β(Ef −Ei ) .
(3.25)
pi
P (f → i)
Neste caso, as médias termodinâmicas são dadas simplesmente pela média aritmética
das medições de cada observável a temperatura constante. Num cenário ideal, esta é a escolha mais eficiente, porque concentra o tempo de simulação precisamente nas regiões do
espaço de fase que mais contribuem para as médias termodinâmicas a uma determinada
temperatura. No entanto, na prática esta escolha pode limitar a convergência da amostragem para esta distribuição, que só está garantida assimptoticamente. Sendo assim, pode
48
3.1 Revisão de métodos de Monte Carlo
compensar modificar a distribuição de amostragem, se isso permitir uma convergência
mais rápida para o regime assimptótico.
Figura 3.5: Representação esquemática do histograma de estados visitados a temperatura
constante.
Peso inversamente proporcional à densidade de estados
É possível também escolher distribuições de amostragem alargadas (Torrie e Valleau [39]),
por comparação com o peso de Boltzmann, no sentido em que a frequência com que uma
determinada configuração ocorre na simulação não corresponde ao peso estatístico no
ensemble canónico. Para ultrapassar problemas de ergodicidade, ou seja, para evitar que a
simulação fique confinada a uma região do espaço de fase, uma escolha comum é usar como
distribuição de amostragem o inverso da densidade de estados n(E) = log S(E) (Lee [40],
Berg [41, 42], Wang e Landau [43]), de tal forma que a probabilidade de encontrar a
simulação numa determinada energia é uniforme. Neste caso, podemos escrever a condição
de equilíbrio detalhado como
P (i → f )
pf
=
= e−(S(Ef )−S(Ei )) .
pi
P (f → i)
(3.26)
Neste formalismo, a escolha do peso de Boltzmann pode ser vista como uma aproximação linear à entropia, S(E) = βE, com β constante, enquanto que a utilização do inverso
da densidade de estados corresponde à construção de uma função β(E) = dS(E)/d(E),
o que está na origem do termo “multicanónico” para designar esta abordagem. Neste
caso, as médias termodinâmicas são acumuladas em função da energia e repesadas para
cada uma das temperaturas desejadas. A aplicação deste método à simulação de redes
quadradas de dipolos pontuais pode ser encontrada na dissertação de Mestrado do autor
[44].
49
3 Métodos numéricos
Figura 3.6: Representação esquemática do histograma de estados visitados numa simulação multicanónica.
3.1.4 Parallel Tempering
O método de Parallel Tempering, com origem em diversas propostas como as de Swendsen
e Wang [45], Marinari e Parisi [46], Lyubartsev et al. [47] e Hukushima e Nemoto [48],
consiste em simular M réplicas independentes do sistema a temperaturas diferentes,
{T1 , T2 , ..., TM } e intercalar as cadeias de Markov de cada simulação com uma cadeia
de Markov adicional que consiste em propor a troca de duas temperaturas adjacentes, Ti
e Ti+1 , proposta esta que é aceite com uma probabilidade
P (Ei , Ti → Ei+1 , Ti+1 ) = min{1, exp(∆B∆E)},
(3.27)
onde ∆B = 1/Ti+1 − 1/Ti e ∆E = Ei+1 − Ei . Esta cadeia de Markov adicional introduz
um passeio aleatório das réplicas no espaço de temperaturas, sem quebrar a condição de
equilíbrio detalhado, o que permite uma exploração mais eficiente do espaço de fase e
consequente diminuição dos tempos de autocorrelação. Naturalmente, simular M réplicas
independentes do sistema custa M vezes mais tempo de computação do que uma única
réplica, mas em geral estamos interessados em obter resultados a temperaturas diferentes,
pelo que já iríamos ter de assumir pelo menos parte desse custo de qualquer forma.
Figura 3.7: Representação esquemática da escolha de temperaturas numa simulação de
Parallel Tempering.
Este esquema de simulação deixa ainda vários parâmetros em aberto que podem ser
50
3.1 Revisão de métodos de Monte Carlo
afinados para optimizar a relação entre a convergência das simulações e o custo computacional, nomeadamente o número de passos de Monte Carlo (MC) entre cada troca de
temperatura, a que vamos chamar passo Parallel Tempering (PT), o número de temperaturas e a sua distribuição.
Em relação ao número de passos MC entre cada passo PT, que vamos designar por
Nlocal , a escolha mais comum é Nlocal = 1, em unidades de passos de Monte Carlo. Bittner
et al. [49] sugeriram recentemente que medir o tempo de autocorrelação de simulações
canónicas τcan (β) a cada uma das temperaturas utilizadas e escolher Nlocal (β) de forma
proporcional a este tempo de autocorrelação permitiria reduzir drasticamente os tempos
de autocorrelação das simulações com Parallel Tempering, chegando mesmo a eliminar o
efeito de abrandamento crítico quando presente nas simulações canónicas. No entanto,
nas nossas implementações verificámos que não é esse o caso - efectivamente, esse aumento
de passos locais corresponde a uma diminuição de frequência de troca de temperaturas,
o que aumenta o tempo de autocorrelação, em vez de o diminuir. A única forma de
reproduzir os resultados desse trabalho foi medir o tempo de autocorrelação sem ter em
conta que foram efectuados Nlocal (β) passos adicionais, o que corresponde a medir o tempo
de autocorrelação em unidades de Nlocal (β), o que explica o aparente desaparecimento do
abrandamento crítico.
No que diz respeito às temperaturas, T1 e TM devem ser naturalmente as temperaturas
máxima e mínima em que estamos interessados, devendo a máxima situar-se acima da
temperatura crítica ou de bloqueio, caso exista. Dado que uma troca de temperaturas é
aceite com a probabilidade da equação 3.27, é importante que ∆β e ∆E sejam pequenos,
o que equivale a dizer que existe uma grande sobreposição entre as energias visitadas
por cada simulação. O esquema utilizado para definir estas temperaturas (Lopes [50]),
foi o de, começando na temperatura mais alta, medir as larguras σ dos histogramas
obtidos à temperatura actual e colocar a temperatura seguinte a βi+1 = βi + f /σ, sendo
o multiplicador f utilizado para controlar a taxa de aceitação de trocas PT. Um valor
de f demasiado elevado leva a que não exista sobreposição entre as distribuições e as
trocas nunca sejam aceites, enquanto que um valor demasiado pequeno tem um custo
computacional demasiado elevado, dado serem necessárias mais temperaturas para cobrir
o mesmo intervalo. Neste trabalho, foi utilizado um valor de f = 1, o que garantiu uma
taxa de aceitação próxima dos 50%, e um número de réplicas da ordem das centenas para
os intervalos considerados (note-se que o número de réplicas necessário cresce também com
√
o tamanho do sistema, sendo proporcional a N ). Katzgraber et al. [51] propuseram
um esquema dinâmico de alocação de temperaturas de forma a maximizar as “viagens de
ida-e-volta” de réplicas entre as temperaturas Ti e Ti+1 , com resultados interessantes a
nível de diminuição dos tempos de autocorrelação. No entanto, este método torna-se algo
51
3 Métodos numéricos
complexo, e não chegou a ser implementado neste trabalho.
3.1.5 Dinâmicas
Para além das probabilidades de selecção e aceitação e da escolha da distribuição de
amostragem, existem ainda diferentes formas de gerar um estado a partir de outro. O
método mais simples é alterar apenas um momento de cada vez, um método conhecido
como single spin flip. Conjugado com o algoritmo de Metropolis e o peso de Boltzmann
como distribuição de amostragem, verifica-se que este método leva a um abrandamento
da convergência das simulações à medida que nos aproximamos de uma temperatura
crítica, um efeito designado por critical slowing down. Para evitar este abrandamento,
foram propostas várias alternativas, como a utilização de algoritmos de cluster, tanto para
interacções de curto alcance (e.g. Swendsen e Wang [52], Wolff [53]), como, dentro de
certas aproximações, para interacções de longo alcance (e.g. [54]).
3.2 Observáveis
A primeira observável a ter em conta ao efectuar simulações de Monte Carlo é a energia
do sistema, dado ser esta que caracteriza o peso estatístico da configuração no cálculo
de médias termodinâmicas. A sua evolução deverá tender para uma distribuição estreita,
aproximadamente gaussiana, à volta de uma energia média que depende da temperatura,
com uma largura dada por
D
E
∆E 2 = E 2 − hEi2 .
(3.28)
As flutuações da energia estão relacionadas com o calor específico do sistema por momento magnético,
D E
dE
(3.29)
= β 2 E 2 − hEi2 /N,
dT
cujo comportamento térmico é utilizado na caracterização do regime crítico dos sistemas.
C=
Nos sistemas constituídos por momentos magnéticos, estaremos também interessados
na magnetização (ou de um parâmetro de ordem relacionado com a magnetização) média
dos sistemas, que iremos estudar em função da temperatura e/ou de um campo externo
aplicado. A magnetização terá uma evolução semelhante à energia, e as suas flutuações
são caracterizadas pela susceptibilidade magnética por momento magnético,
χ=
52
D
E
dM
= β M 2 − hM i2 /N.
dT
(3.30)
3.2 Observáveis
Nos sistemas com uma transição de fase, estas flutuações divergem na temperatura
crítica, mas os efeitos de tamanho finito tornam difícil a tarefa de a localizar, pelo que é
utilizada uma grandeza especificamente concebida para cancelar estes efeitos na temperatura crítica (e.g. Binder e Heermann [55]), o cumulante de Binder
2
hM 2 i
,
U =1−
3 hM 4 i
(3.31)
cujo valor a T = Tc deverá ser aproximadamente independente do tamanho do sistema.
Para cada grandeza A, são então armazenadas médias temporais de hAn i, com n =
1, 2, 4 e 8, para permitir o cálculo destas grandezas e das suas barras de erro. No entanto,
para este último efeito, estimar o erro na medição de cada grandeza, é necessário também medir a correlação, devida à utilização de uma cadeia de Markov, entre valores da
observável em diferentes instantes da evolução.
Para perceber de que forma esta auto-correlação afecta as barras de erro, temos de ter
em conta que aquilo a que temos chamado de valor médio é na verdade um estimador do
valor médio, calculado a partir de uma série temporal finita A1 ...At ...ANt . O estimador
do valor médio é dado por
Nt
1 X
Ā =
Ai
(3.32)
Nt i=1
e o valor médio do estimador é igual ao valor médio da população,
< Ā >=
Nt
1
1 X
< Ai >=
Nt < A >=< A > .
Nt i=1
Nt
(3.33)
No entanto, para calcular a variância do estimador,
var(Ā) = < Ā2 > − < Ā >2
(3.34)
= < Ā2 > − < A >2
é necessário ter em conta a forma como a série foi gerada. Para tal, começamos por notar
que o termo
< Ā2 > =
1 X
< Ati Atj >
Nt2 ti tj
(3.35)
pode ser escrito, separando os casos em que ti = tj , na forma



X
1 X
< Ā2 >= 2
< A2ti > +
< Ati Atj > .

Nt  ti
ti 6=tj
(3.36)
53
3 Métodos numéricos
Se todos os pontos da série fossem descorrelacionados, então para ti 6= tj ,
(3.37)
< Ati Atj >=< Ati >< Atj >=< A >2
e a variância seria dada por
o
1 n
2
2
2
2
2
N
<
A
>
+(N
−
N
)
<
A
>
−N
<
A
>
t
t
t
t
Nt2
o
1 n
=
< A2 > − < A >2 ,
Nt
var(Ā) =
(3.38)
como seria de esperar. No entanto, quando existe correlação entre os valores medidos a
tempos diferentes, a equação 3.37 não se verifica. Se definirmos a função de autocorrelação
temporal da grandeza A como
D
CA (ti , tj ) =
E
D
Ati Atj − hAti i Atj
hA2 i − hAi2
E
,
(3.39)
(3.40)
podemos substituir a equação 3.37 por
< Ati Atj >=< Ati >< Atj > +
D
E
A2 − hAi2 CA (ti , tj ).
Neste caso, a variância do estimador, tendo em conta a autocorrelação, será então dada
por



D E
i
X h
1 
2
2
2
2
2
2
var(Ā) =
N
<
A
>
+
hAi
+
A
−
hAi
C
(t
,
t
)
−
N
<
A
>
t
A i j
t

Nt2 
ti 6=tj


< A2 > − < A >2 X
1 
< A2 > − < A >2 +
CA (ti , tj )
=
Nt
Nt
ti 6=tj

(3.41)

< A2 > − < A >2 
1 X
=
1+
CA (ti , tj ) .
Nt
Nt ti 6=tj
Se assumirmos que a função de autocorrelação só depende da diferença entre os tempos
ti e tj ,
CA (ti , tj ) = CA (|ti − tj |)
(3.42)
e que o tamanho da série, Nt , é suficientemente grande para podermos desprezar efeitos
54
3.3 Ferramentas de computação científica
de fronteira, então podemos ainda simplificar para
Nt
X
< A2 > − < A >2
CA (t) .
1+2
var(Ā) ≈
Nt
t
!
(3.43)
O somatório da função de correlação que aparece nesta expressão é frequentemente
designado por tempo de autocorrelação integrado,
τA =
Nt
X
CA (t),
(3.44)
t
e é esta a grandeza que iremos medir nas simulações para poder estimar o erro na medição
de grandezas termodinâmicas. O fenómeno de critical slowing down, já referido, deve-se
à divergência destes tempos próximo de uma temperatura crítica, e é dependente da
dinâmica de simulação utilizada, como iremos ver.
3.3 Ferramentas de computação científica
Um dos aspectos mais importantes a ter em conta ao programar algoritmos de computação
científica é ter resultados reprodutíveis, o que não é tão fácil de garantir como possa
parecer à partida. Esta secção é uma tentativa de transmitir experiências, métodos e
ferramentas de engenharia de software que possam ajudar o leitor a evitar alguns desses
obstáculos. Tratando-se apenas de um levantamento de alguns aspectos que devem ser
tidos em conta, recomenda-se a consulta de textos mais detalhados (e.g. Katzgraber [56])
e da documentação de cada uma das ferramentas.
Software livre Software livre [57] é, em termos gerais, software que pode ser usado, estudado e modificado sem restrições. A utilização de software livre nas tarefas comuns
do dia a dia já é importante pelas garantias de liberdade de utilização incondicional
e de interoperabilidade com outros sistemas. No desenvolvimento de algoritmos de
computação científica, as liberdades de estudo, modificação e reutilização ganham
especial relevância. Por exemplo, as bibliotecas livres permitem reutilizar código
já existente para as componentes não originais dos algoritmos (e.g. álgebra linear,
transformadas de Fourier, etc.), sem perder a possibilidade de verificar a implementação e, se necessário, alterá-la.
Ambientes Integrados de Desenvolvimento Como é bem sabido, qualquer editor de
texto pode ser usado para escrever um programa de computador, pelo que não é
forçosa a utilização de um ambiente integrado de desenvolvimento (IDE). Frequen-
55
3 Métodos numéricos
Figura 3.8: Ferramentas de computação científica.
56
3.3 Ferramentas de computação científica
temente, estes ambientes são vistos como demasiado complexos, desnecessários e
até como um obstáculo. No entanto, à medida que aumenta a complexidade dos
códigos, a integração de um editor de texto com as ferramentas que iremos ver a
seguir tornam o processo de desenvolvimento mais rápido e ágil, pelo que a sua
utilização é aconselhada desde o início. Entre IDE’s livres que podem ser utilizados
para este fim, salientamos o Eclipse [58], Kdevelop [59] e Anjuta [60], dependendo
das preferências de ambiente de trabalho do programador. Um IDE permite a integração do editor com ferramentas como sistemas de controlo de versões, gestão
de tarefas e projectos, depuradores, profilers, gestão de dependências e geração de
documentação, ferramentas que passamos a descrever a seguir.
Controlo de versões Um sistema de controlo de versões é um conjunto de ferramentas
que permitem gerir, como o nome indica, diferentes versões de um código ou documento. Estas diferentes versões podem referir-se a diferentes momentos da evolução
do projecto, a diferentes cópias distribuídas por pessoas diferentes ou a diferentes
ramos de um tronco comum. Isto é feito através da utilização de cópias de trabalho,
onde as alterações são feitas, de repositórios, onde as diferentes revisões são armazenadas, e de um conjunto de algoritmos que permitem submeter, extrair, comparar
e combinar alterações. Para a reprodutibilidade de simulações, têm o contributo
fundamental de permitirem, a qualquer altura no futuro, extrair do repositório a
revisão exacta do código que gerou um determinado resultado (desde que seja feita
uma submissão ao repositório antes de todos as corridas de produção e registado o
número revisão junto com os resultados.). Entre os sistemas de controlo de versões
mais usados, salientamos o Subversion [61], Git [62] e Mercurial [63].
Gestão de projectos No contexto de desenvolvimento de software, estamos a referir-nos
a sistemas que permitem, tipicamente através de um interface web, a visualização da
informação constante de um sistema de controlo de versões e a sua integração com
tarefas, documentos, etc. Entre estes, salientamos o Redmine [64], pela facilidade de
gestão de múltiplos projectos, mas um outro sistema muito utilizado por projectos
de software livre é o Trac [65].
Depuração Um depurador (debugger) permite inspeccionar a execução de um programa
à procura de erros de programação ou lógica. Para além do conhecido gdb [66],
ferramentas como o Valgrind [67] são particularmente úteis na detecção de fugas de
memória.
Perfis de utilização A medição de perfis de utilização (Profiling) refere-se ao acto de
analisar que componentes do programa consomem mais tempo e/ou recursos, de
57
3 Métodos numéricos
forma a permitir concentrar a optimização nos aspectos que podem ter um impacto
mais relevante. O gprof [68] é a escolha tradicional, mas o valgrind, já referido, pode
ser executado com duas ferramentas adicionais, callgrind e cachegrind, que permitem
gerar essa informação de profiling. A visualização destes dados é particularmente
facilitada pelo kcachegrind [69].
Construção de software Por construção (building) referimo-nos à automatização do processo de compilação e gestão de dependências de um programa. Tipicamente, é
usada uma Makefile feita à mão para automatizar algumas destas tarefas. Ferramentas como as autotools [70] e scons [71] permitem tornar este processo mais
independente do ambiente (sistema operativo, arquitectura, etc.) onde o software
está a ser instalado.
Linguagens
A escolha de linguagem de programação é sempre muito pessoal e alvo até de discussões
acaloradas. No entanto, há distinções objectivas que se podem fazer quanto à tarefa a
desempenhar. Por exemplo, é consensual que para as componentes mais computacionalmente intensivas se deve usar uma linguagem compilada e de baixo nível como Fortran ou
C, e que para tarefas como análise de dados, integração de componentes e automatização
de tarefas, a utilização de linguagens interpretadas e de alto nível como Python ou Perl
poupa muito tempo ao programador.
Uma questão menos consensual poderá ser, por exemplo, a escolha entre C ou C++.
Dado que o autor tem feito um esforço de migração para C++, linguagem que foi usada
para as simulações descritas nesta dissertação, ficam aqui algumas razões que motivaram
a escolha:
• programação orientada por objectos - apesar de obrigar a uma nova forma de pensar
sobre os problemas, o resultado final é mais estruturado e pode facilitar a reutilização
de código para outras simulações. Permite também o encapsulamento de dados e
métodos em objectos, encapsulamento que facilita o desenvolvimento e pode até
constituir uma boa estratégia de paralelização.
• bibliotecas standard de algoritmos e estruturas de dados - não sendo o nosso objecto de estudo a ciência de computadores, e apesar de ser didático implementar os
algoritmos e estruturas de dados mais comuns, na maior parte dos casos é preferível confiar no trabalho de especialistas que se dedicaram a encontrar as melhores
implementações para cada caso. Através do uso de templates, bibliotecas como a
STL e a Boost implementam interfaces genéricos para estas estruturas e algoritmos
58
3.3 Ferramentas de computação científica
de dados com implementações optimizadas para cada caso particular, pelo que o
desempenho não é prejudicado pela generalidade.
• templates - uma característica da linguagem que permite a definição de funções ou
classes genéricas que posteriormente o compilador implementa para cada caso particular usado no programa. Por exemplo, o caso mais simples seria uma função que
pode actuar sobre qualquer tipo de variável (int, float, double, etc.). Através de um
template, a função pode ser definida para um tipo em abstracto e depois o compilador trata de gerar as funções correctas dependendo do tipo de variável efectivamente
usado no programa. Há outros casos que poderiam ser tratados sem templates mas
para os quais a utilização de templates é mais eficiente, por definir um determinado parâmetro em tempo de compilação, como por exemplo a dimensionalidade do
problema.
• referências - em C, é frequente o uso de pointers, apontadores para endereços de
memória, não só para permitir o acesso a variáveis entre funções mas também para
optimizações e gestão de memória, entre outras tarefas. Um “programador perfeito”
não terá qualquer problema com esta abordagem, mas na prática nada impede que
um pointer aponte para um endereço de memória errado ou até não alocado. A
linguagem C++ introduziu o conceito de referência, que, apesar de ser muitas vezes
confundido com um pointer mais seguro, é na verdade um alias, um atalho para
um determinado objecto. O que torna as referências mais seguras é que têm de se
referir sempre a um objecto (um pointer pode ser declarado nulo e só depois lhe
ser atribuído um endereço) e não podem ser alteradas. Para além disso, sendo um
atalho para o objecto, a sintaxe de utilização é a mesma da do objecto, ao contrário
dos pointers que obrigam a uma notação própria. Por estas razões, quando se aceder
a um objecto por referência, podemos simplesmente agir como quando estamos a
aceder directamente ao objecto.
Compiladores A Gnu Compiler Collection [72] é uma colecção de compiladores livres que
inclui compiladores de C, C++, Fortran, Java, etc., e é, na opinião do autor, aquela
que mais garantias oferece de performance e portabilidade entre diferentes arquitecturas e sistemas operativos. No entanto, se a performance numa determinada
arquitectura em particular for um aspecto crítico, existem compiladores optimizados, como o caso da Intel Compiler Collection [73], que apesar de não ser livre, é
gratuita para fins não comerciais.
59
3 Métodos numéricos
Bibliotecas
Dependendo das aplicações, existem inúmeras bibliotecas para cálculo científico que podem ser usadas para diminuir o tempo de programação e aumentar a fiabilidade e performance das simulações.
Uma biblioteca bastante completa, e até didática, escrita em C mas que também pode
ser usada em C++, entre outras, é a Gnu Scientific Library [74]. De especial relevância
para este trabalho foram as funcionalidades de geração de números aleatórios, com diferentes métodos de elevado desempenho que podem ser usados para garantir que os resultados
não são dependentes do gerador. No entanto, a GSL inclui também o cálculo de funções
especiais, algoritmos de minimização, álgebra linear, análise combinatória, transformadas
de Fourier, integração numérica, entre outras.
Para quem optar por C++, já referimos a Standard Template Library, que implementa
estruturas de dados como vectores, listas, conjuntos e mapas e algoritmos como pesquisa
e ordenação nestas estruturas de dados, e a Boost, que é na verdade um conjunto de
bibliotecas tão diversas como o manuseamento de parâmetros e opções de um programa,
arrays multidimensionais, mapas bidireccionais, interacção com o sistema de ficheiros
de forma portável, paralelização e ligação com outras linguagens de programação como
Python.
No que diz respeito a arrays multidimensionais, vale a pena referir ainda uma outra
biblioteca, a Blitz++, que, alegadamente sem perda de performance, permite funcionalidades de alto nível como operações com notação vectorial ou tensorial, extracção de
componentes, entre outras. No entanto, o autor optou pela Boost::multi_array para este
efeito, principalmente pelas garantias de continuidade e eventual integração no standard
que a Boost oferece.
Mais uma vez, existem bibliotecas fornecidas pelos fabricantes de processadores optimizadas para cada arquitectura em particular. É o caso da Intel Math Kernel Library [75] e
da AMD Core Math Library [76] (não livres), que implementam versões optimizadas de
álgebra linear, transformadas de Fourier e geração de números aleatórios.
Paralelização
Apesar de todas as optimizações introduzidas por compiladores, bibliotecas e pelo próprio programador, é frequente encontrar problemas de computação científica para os quais
qualquer computador, sozinho, demoraria demasiado tempo a produzir os resultados esperados. É este tipicamente o caso das simulações de Monte Carlo, mas também de
algoritmos de dinâmica molecular, estrutura electrónica, dinâmica de fluidos, investigação operacional e até algoritmos que podem constituir alguma surpresa, como o cálculo
60
3.3 Ferramentas de computação científica
do preço de derivados financeiros.
Quando um computador não é suficiente, a solução passa por paralelizar o algoritmo,
ou seja, encontrar uma forma de dividir o problema em problemas mais pequenos que
possam ser enviados para diferentes processadores do mesmo ou de outros computadores
e implementar essa divisão. Existem diferentes formas de paralelizar (e.g., a nível das
tarefas ou a nível dos dados), e nalguns algoritmos a paralelização é mais eficiente do que
noutros, devido à quantidade de comunicação necessária em cada etapa e/ou tempos de
espera entre tarefas.
No caso mais simples, será necessário correr o algoritmo para muitos parâmetros independentes, caso em que bastará distribuir o cálculo por diferentes máquinas, o que não é
normalmente considerado uma paralelização. Pode acontecer também que haja um conjunto de tarefas que podem ser realizadas de forma independente, necessitando apenas de
comunicar alguma informação no fim dessas tarefas. Felizmente para nós, as simulações
de Monte Carlo cabem neste domínio e são facilmente paralelizáveis, e ainda mais no
caso de ser necessário fazer médias sobre a desordem, no sentido que se pode acumular
estatísticas durante muito tempo sem qualquer comunicação e pontualmente comunicar
médias da evolução do sistema durante esse tempo.
O caso em que a paralelização pode implicar mais comunicação é o caso da decomposição
dos dados em domínios, como nos algoritmos de álgebra linear, elementos finitos, etc.
Neste caso, a eficácia da paralelização depende em grande medida do tamanho dos dados
(quanto maiores, mais eficiente a paralelização).
Independentemente do tipo de decomposição, a implementação depende da arquitectura
em termos de acesso à memória, ou seja, se todos os processadores acedem directamente à
mesma memória (memória partilhada) ou se é necessário comunicar por rede para aceder
a dados que estão a ser executados noutro processador (memória distribuída). Neste
último caso, terá de ser usada uma biblioteca de passagem de mensagens (MPI [77, 78]),
enquanto que no caso de memória partilhada tanto pode ser usada uma implementação de
MPI como um método mais simples, a nível do compilador, designada por OpenMP [79].
Um desenvolvimento recente nesta área é a utilização de processadores gráficos (GPUs)
que exploraram a paralelização a nível dos dados para obter, para operações particularmente adequadas a este modelo, resultados comparáveis aos de clusters de computadores.
A Nvidia e a AMD / ATI disponibilizam kits de desenvolvimento para as suas plataformas, Cuda [80] e Stream [81], respectivamente, que permitem tirar partido deste tipo de
processadores. Começa também a ser possível encontrar bibliotecas que facilitam este
uso, nalguns casos com interfaces standard, como o da Lapack ou FFTs, de tal forma que
pode não ser necessária nenhuma alteração ao código para que a operação seja executada
nos processadores gráficos. É sem dúvida uma evolução a seguir na área de computação
61
3 Métodos numéricos
de elevado desempenho.
Clusters
Depois de paralelizado o algoritmo, é necessário submetê-lo ao maior número de computadores/processadores possível, se quisermos tirar partido dessa paralelização. Isto pode ser
feito simplesmente ligando vários computadores em rede, mas a complexidade de implementação e gestão deste cluster torna-se rapidamente um obstáculo, gastando os recursos
e tempo cuja optimização era o objectivo da paralelização em primeiro lugar.
Felizmente, existem diversas ferramentas que tornam esta tarefa muito mais simples,
reduzindo essa complexidade a pouco mais do que a de uma única máquina, pelo menos
no que diz respeito ao software. Os problemas que podem surgir a nível de hardware serão
sempre proporcionais ao número de componentes do sistema.
Um cluster pode ser implementado de muitas formas diferentes. As opções que o autor
tem seguido, passam por usar uma distribuição de Linux Enterprise como o CentOS [82],
pelo tempo de vida mais longo que proporcionam, e um sistema de aprovisionamento como
o Perceus [83] (uma alternativa semelhante seria o XCat [84]), que permite a distribuição,
por rede, de imagens stateless do sistema operativo a partir do master para os nodos de
cada vez que estes arrancam. Isto faz com que seja necessário gerir apenas um computador,
o master do cluster, e a imagem que é enviada para os nodos. Um upgrade a todos os
nodos pode ser tão simples quanto mudar a imagem e reiniciar os nodos.
Para submeter trabalhos de computação ao cluster, usa-se um gestor de recursos e
agendamento como o Sun Grid Engine [85] ou o Torque [86] com o Maui [87], que recebem
as submissões e tratam de as prioritizar, verificar quais os nodos disponíveis e enviar os
trabalhos para execução, ao mesmo tempo que permitem a contabilização e relatórios de
utilização.
Por fim, são necessárias ferramentas que permitam monitorizar o estado do cluster, a
nível da ocupação e disponibilidade dos recursos, tarefa esta que pode ser levada a cabo
com o Ganglia [88], o Nagios [89] e/ou o MRTG [90].
Formatos de dados
Um dos problemas com a reprodutibilidade na computação científica é o facto de, frequentemente, os ficheiros de dados resultantes das simulações não conterem informação sobre
as condições em que foram gerados, nem serem suficientemente descritivos para serem
entendidos por outras pessoas ou mesmo pelo seu criador algum tempo mais tarde. Uma
forma simples, e comum, de atenuar este problema é guardar os parâmetros de corrida
62
3.3 Ferramentas de computação científica
junto com os ficheiros de dados, e anexar alguns meta-dados aos ficheiros, o que faz sentido. Algo menos frequente mas que o autor recomenda vigorosamente é que seja incluída
também a revisão do código que gerou os dados (assumindo que se está a usar um sistema
de controlo de versões e que se actualiza o repositório antes de uma corrida de produção),
algo que pode ser feito de forma automática em tempo de compilação ou execução.
Existem também formatos de dados estruturados e descritivos especialmente concebidos
para armazenar e gerir grandes quantidades de dados numéricos (e.g. campos vectoriais),
como o NetCDF [91] ou o HDF [92]. A utilização destes formatos standard, além de tornar
o armazenamento e manuseamento mais eficiente, permite que os dados possam ser lidos
por outras aplicações de visualização ou análise de dados, dado que são auto-descritivos.
Visualização e Análise de Dados
No caso mais simples, o output de uma simulação pode ser simplesmente uma função
unidimensional armazenada na forma de duas colunas num ficheiro de texto, que pode
facilmente ser visualizado e analisado com uma aplicação como o xmgrace [93] ou o gnuplot [94]. Para muitos trabalhos científicos, isto é mais do que suficiente. Nos outros
casos, podem ser usadas bibliotecas e aplicações para a visualização campos escalares
ou vectoriais a duas dimensões (e.g., matplotlib [95]), a três dimensões (e.g. vtk [96],
mayavi [97]), ferramentas estas que produzem gráficos vectoriais que podem ser manipulados pelo inkscape [98]. Estas bibliotecas podem ser integradas com outras bibliotecas
de análise de dados como o SciPy [99][100].
Álgebra Computacional
Uma aplicação de uma utilidade extraordinária na computação científica (e não só) é o
Mathematica [101], da Wolfram, que provavelmente só tem um defeito - não é livre. Uma
alternativa livre poderá ser, para algumas aplicações, o sistema Sage [102].
Documentação
Para além dos comentários que o programador insere no código, ferramentas como o doxygen [103] permitem gerar documentação (html ou latex) com toda a estrutura do código,
incluindo parâmetros de funções, ligações entre classes e ficheiros, perfis de chamada de
funções, etc. Esta documentação pode ser gerada exclusivamente a partir do código,
mas é mais completa e adequada se o programador introduzir comentários num formato
standard que estas ferramentas entendem.
63
3 Métodos numéricos
Este capítulo não ficaria completo sem uma referência à aplicação usada para escrever
artigos e esta dissertação, o Lyx [104]. Trata-se de um frontend para latex cujo objectivo
é permitir aos autores concentrarem-se no conteúdo do que escrever e não na forma.
A recolha e gestão de referências bibliográficas pode ser feita com o Zotero [105], uma
extensão para o browser Firefox que recolhe referências a partir de páginas web com
informação bibliográfica (editoras, revistas, catálogos de biblioteca) e as exporta para o
formato bibtex.
3.4 Conclusões
Neste capítulo, apresentámos formas numéricas de calcular médias termodinâmicas de sistemas constituídos por momentos magnéticos clássicos, nomeadamente através de métodos de Monte Carlo. Foram introduzidas algumas das dificuldades típicas de convergência
das simulações para o regime assimptótico, e os métodos e ferramentas utilizados neste
trabalho para ultrapassar essas dificuldades. Como iremos ver de seguida, a eficácia destes métodos depende bastante do sistema a simular, mas é sempre preferível à utilização
dos métodos canónicos. Nos dois capítulos seguintes, são apresentados os resultados de
simulações para redes tanto ordenadas como desordenadas de dipolos pontuais.
64
4 Redes regulares de dipolos pontuais
Neste capítulo e no seguinte, iremos aplicar os métodos analíticos e numéricos apresentados nos capítulos anteriores para estudar o comportamento termodinâmico de sistemas
constituídos por dipolos pontuais, com três componentes cartesianas (momentos de Heisenberg), cuja interacção é descrita pelo tensor
Uijαβ
3uαij uβij − δαβ
,
= δ ij
3
rij
(4.1)
onde δ ij = (1 − δij ), uij = r ij /rij , e r ij = r i − r j .
Neste capítulo, iremos considerar redes regulares de dipolos pontuais, na sequência dos
trabalhos, tanto analíticos e computacionais, que resumimos de seguida.
Estado fundamental
Um dos resultados mais importantes de sistemas regulares constituídos por dipolos pontuais foi obtido usando o método de Luttinger e Tisza [30] para calcular a energia do
estado fundamental de uma rede cúbica ou quadrada de dipolos pontuais. O principal
resultado de Luttinger e Tisza foi o de que o estado antiferromagnético tem uma energia
mais baixa do que o estado ferromagnético.
Belobrov et al. [106, 107] mostraram que o estado fundamental é na verdade continuamente degenerado, tanto na rede quadrada como na rede cúbica. Brankov e Danchev
[108] generalizaram esta análise a duas dimensões para uma rede rômbica arbitrária, verificando que, dos estados continuamente degenerados na rede quadrada, o levantamento
da simetria da rede selecciona o estado antiferromagnético, mas também que o estado
fundamental pode passar a ferromagnético, como no caso da rede triangular. Zimmerman
et al. [109] consideraram o caso da rede de favo de mel, onde voltaram a encontrar um
estado fundamental continuamente degenerado e sem magnetização total.
As condições para o levantamento da degenerescência foram analisadas por Prakash e
Henley [110], propondo o mecanismo de “ordem devido a desordem”, em que a temperatura e pequenas desordem posicionais ou diluições da rede seleccionam estados particulares
do contínuo de estados degenerados.
65
4 Redes regulares de dipolos pontuais
Transição de Fase
Apesar de se verificar que o estado fundamental de um sistema puramente dipolar pode
ser ordenado, não é claro se é possível existir uma transição de fase a uma temperatura
finita. A uma dimensão, o trabalho de Dyson [111] excluiu essa hipótese, e a duas dimensões o teorema de Mermin-Wagner [112] diz-nos que, para sistemas de Heisenberg
com interacções isotrópicas e de curto alcance, não pode existir magnetização espontânea
a temperatura finita. No entanto, como vimos, a interacção dipolar não satisfaz estes
critérios, além de que o estado fundamental pode ter magnetização nula.
Bruno [113] generalizou estes resultados, excluindo ordem magnética a temperatura
finita para sistemas Heisenberg ou XY com interacções de longo alcance a decair como
r−α desde que o expoente α seja superior a 2d, sendo d a dimensionalidade do sistema.
Para a interacção dipolar, temos α = 3, pelo que este resultado exclui uma transição
de fase a temperatura finita em uma dimensão mas não em duas. Lax [114] estudou
uma rede de dipolos usando o modelo esférico, ou seja, substituindo a condição de todos
os momentos terem magnitude fixa pela condição de fixar a soma dos quadrados dos
momentos, e verificou que neste modelo não existe transição nem a uma nem a duas
dimensões, existindo uma transição para um estado antiferromagnético a três dimensões.
Simulações de Monte Carlo
S. Romano efectuou simulações de Monte Carlo de sistemas puramente dipolares [115,
116], que verificou as previsões teóricas, seguido de Rastelli et al. [117, 118, 119, 120,
121, 122, 123, 124, 125] e De ’Bell et al. [126, 127], que estudaram diversas variantes
de sistemas dipolares em redes regulares. No entanto, estas simulações foram feitas com
momentos XY, que podem não descrever correctamente as excitações a temperatura finita,
e usando o algoritmo de Metropolis, cujos problemas de convergência são particularmente
limitadores em sistemas com interacção dipolar, como iremos ver de seguida.
Muito recentemente, Tomita [128] efectuou simulações em redes planares de dipolos
pontuais do tipo Heisenberg, usando uma combinação de Parallel Tempering com um
novo algoritmo de Monte Carlo para interacções de longo alcance proposto por Fukui e
Todo [54]. Seria interessante comparar os tempos de autocorrelação obtidos com este método e os resultados apresentados de seguida, mas a publicação não fornece esses dados. A
análise do comportamento crítico da rede quadrada de dipolos pontuais será directamente
comparada com esse trabalho.
66
4.1 Rede quadrada
4.1 Rede quadrada
Como referido em cima, o estado fundamental de uma rede quadrada (infinita) de dipolos
pontuais é continuamente degenerado, em que a orientação de um momento no ponto
(nx , ny ) da rede pode ser descrito por
mnx ,ny = ((−1)ny cos θ, (−1)nx sin θ) ,
(4.2)
onde θ é um ângulo arbitrário. A forma deste estado, conhecido como “estado de microvórtice”, está esquematizada na figura 4.1.
Figura 4.1: Estado de micro-vórtice e os casos particulares de Luttinger e Tisza.
Quando θ é um múltiplo de π/2, encontramos um estado antiferromagnético por colunas, com os momentos magnéticos orientados ao longo dos eixos da rede, embora qualquer
ângulo θ produza um estado com a mesma energia.
A magnetização total deste estado é nula, apesar do estado fundamental ser ordenado,
pelo que é necessário encontrar um outro parâmetro que descreva o estabelecimento desta
ordem. Por analogia com um antiferromagnete comum, é possível construir uma “magnetização alternada” (staggered), da seguinte forma:
1
mst =
N
v
u
u X
u
t
nx ,ny
2
2

(−1)ny mxnx ,ny  + 
X
(−1)nx mynx ,ny  ,
(4.3)
nx ,ny
onde mαnx ,ny é a componente cartesiana α do momento magnético na posição (nx , ny ) da
rede. Este parâmetro de ordem aplica-se quer a magnetização tenha apenas duas componentes cartesianas, no plano da rede (ditos rotores planares ou momentos clássicos XY)
como três componentes (momentos clássicos de Heisenberg). No que se segue consideramos sempre momentos com três componentes cartesianas.
67
4 Redes regulares de dipolos pontuais
4.1.1 Condições de fronteira
Este estado de micro-vórtice é o estado fundamental de uma rede quadrada de dipolos
pontuais apenas no limite de amostra infinita. Se considerarmos uma amostra finita,
quadrada, com condições de fronteira abertas, a degenerescência é levantada. Em vez
de um ângulo de micro-vórtice arbitrário mas uniforme em toda a amostra encontramos
uma variação contínua deste ângulo, desde π/4 no centro da amostra a múltiplos de π/2
na periferia, de forma a alinhar os momentos com a fronteira da amostra (Costa [44],
Matsushita [129] e Sugano [130]).
Para eliminar este efeito, é necessário introduzir condições de fronteira periódicas, através de réplicas periódicas da amostra de simulação que preenchem todo o espaço. Em
sistemas com interacções de curto alcance, considera-se apenas a imagem mais próxima,
o que é equivalente a “dobrar” a amostra num toro a d + 1 dimensões.
Figura 4.2: Representação esquemática das condições de fronteira periódicas.
No nosso caso, com interacções de longo alcance, pode ser necessário considerar a
interacção com réplicas mais afastadas, até a distância tornar a interacção desprezável.
Na prática, como a configuração posicional e magnética das réplicas é igual à da amostra
de simulação, basta substituir a matriz de interacção da equação 4.1 por uma matriz de
interacção efectiva somada sobre todas as réplicas (figura 4.2), ou seja,
Uijαβ
=
X
n
68
3ũαij ũβij − δαβ
δ ij
,
3
r̃ij
(4.4)
4.1 Rede quadrada
onde n é a posição de cada réplica, ũij = r̃ ij /r̃ij , e r̃ ij = r ij + n.
4.1.2 Simulações Metropolis
Utilizando simulações de Metropolis convencionais, a diferentes temperaturas, para estudar o comportamento deste parâmetro em redes de N = L × L partículas, com condições
de fronteira periódicas, verificamos que de facto parece existir uma transição de fase a
temperatura finita para este estado ordenado. As figuras 4.3 e 4.4 mostram o comportamento, em função da temperatura e do tamanho L, das médias canónicas do parâmetro
de ordem mst , calor específico C, susceptibilidade χst e cumulante de Binder Ust , como
definidos na secção 3.2.
1
b)
a)
L=8
L=16
L=24
L=8
L=16
L=24
2
0.6
C
< mst >
0.8
1
0.4
0.5
0.2
0
0.125
0.25
0.5
T
1
2
0.25
0.5
1
2
T
Figura 4.3: Parâmetro de ordem (a) e calor específico (b) em função da temperatura,
obtido com simulações Metropolis convencionais e condições de fronteira periódicas e 107
passos de Monte Carlo.
Estes resultados são coerentes com a existência de uma transição de fase a uma temperatura próxima de T = 0.6 µ2 /(kb a3 ). No entanto, para caracterizar o comportamento
crítico do sistema, é necessário quantificar a precisão das simulações e simular sistemas
maiores. Como vimos no capítulo 3, a precisão com que estimamos uma determinada
grandeza termodinâmica está relacionada com o tempo de autocorrelação integrado dessa
grandeza na série temporal gerada pela cadeia de Markov, definido pela equação 3.44.
A medição deste tempo de autocorrelação em corridas finitas de simulações de Monte
Carlo levanta alguns problemas técnicos. O comportamento assimptótico da função CA (t),
para tempos muito longos, deverá ser um decaimento exponencial, mas, por um lado, este
comportamento poderá aparecer muito tarde e, por outro, o erro estatístico na medição
da correlação faz com que esta nunca seja de facto nula, mas sim que flutue à volta de
69
4 Redes regulares de dipolos pontuais
100
0.7
a)
b)
L=8
L=16
L=24
L=8
L=16
L=24
0.6
χst
Ust
10
0.5
1
0.4
0.1
0.25
0.5
1
2
0.3
0.125
0.25
T
0.5
1
2
T
Figura 4.4: Susceptibilidade e cumulante de Binder do parâmetro de ordem em função da
temperatura, obtida com Simulações Metropolis convencionais e condições de fronteira
periódicas.
zero com uma variância da ordem de 1/Nt , em que Nt é o número de medições para cada
t, pelo que o somatório não converge como seria de esperar (e.g. Madras e Sokal [131]).
O método que adoptámos para medir o tempo de autocorrelação foi calcular o somatório
e o desvio padrão do somatório em função do cut-off tmax ,
tX
max
CA (t)
(4.5)
< τA2 (tmax ) > − < τA (tmax ) >2
(4.6)
τA (tmax ) =
t=0
e
δτA (tmax ) =
q
e fixar tmax quando o erro relativo passa a ser superior a 1% (figura 4.5).
Os tempos de autocorrelação da energia e do parâmetro de ordem, estimados com este
método, para simulações de Monte Carlo convencionais da rede quadrada dipolos pontuais,
são apresentados na figura 4.6. Note-se que, mesmo para estes tamanhos relativamente
pequenos, os tempos de autocorrelação chegam, na região crítica, a valores da ordem
de 100 passos de Monte Carlo na energia e da ordem de 1000 passos de Monte Carlo
no parâmetro de ordem, e que nessa região os tempos aumentam com o tamanho do
sistema. Por outro lado, seria de esperar que esse comportamento desaparecesse longe da
região crítica, mas tal não acontece a temperaturas baixas, voltando mesmo a crescer e
eventualmente divergir à medida que a temperatura tende para zero, de uma forma que
parece independente do tamanho do sistema.
70
4.1 Rede quadrada
a)
b)
8
τ(tmax)
100*δτ(tmax)
τ
(MCSteps)
(MCSteps)
100
4
2
1
1
100
10000
1
1
1e+06
100
tmax (MCSteps)
10000
1e+06
tmax (MCSteps)
Figura 4.5: Exemplo de cálculo do tempo de autocorrelação em duas situações distintas.
No painel da esquerda, o tempo de autocorrelação é baixo mas é importante truncar o
somatório antes de o erro ser demasiado grande. No painel da direita, o regime exponencial
só aparece para tempos muito longos.
1000
10000
a)
L=8
L=16
L=24
L=8
L=16
L=24
1000
< τE >
< τM >
100
b)
100
10
10
1
0.25
0.5
T
1
2
1
0.25
0.5
1
2
T
Figura 4.6: Tempos de autocorrelação da energia (à esquerda) e parâmetro de ordem
(à direita) em função da temperatura e do tamanho do sistema, usando o algoritmo de
Metropolis convencional.
Se analisarmos a taxa de aceitação em função da temperatura, verificamos que ela
tende rapidamente para zero à medida que baixamos a temperatura, independentemente
do tamanho do sistema, pelo que deverá estar relacionada com o comportamento a baixas
temperaturas do tempo de autocorrelação. Na secção que se segue, vamos estudar o efeito
da aplicação do método de selecção optimizada apresentado no capítulo 3 nos tempos de
autocorrelação das simulações.
71
4 Redes regulares de dipolos pontuais
4.1.3 Taxa de aceitação optimizada
A figura 4.7 mostra uma secção da evolução da energia, para uma temperatura baixa,
obtidas usando o método de selecção uniforme e o método de selecção optimizada apresentado na secção 3.1.2, expondo a diferença entre as duas dinâmicas. Para o mesmo
intervalo de tempo (passos de Monte Carlo), as flutuações com a selecção optimizada
são muito superiores, permitindo uma melhor amostragem do espaço de fase. Este facto
só por si deverá contribuir para uma diminuição dos tempos de autocorrelação, quando
comparados com os medidos na secção anterior.
-2.3
-2.3
E/N
b)
E/N
a)
-2.4
-2.4
-2.5
100250
100500
100750
101000
-2.5
100250
t (MCSteps)
100500
100750
101000
t (MCSteps)
Figura 4.7: Comparação entre dinâmicas na rede quadrada - à esquerda, selecção uniforme, e à direita, selecção optimizada.
10000
a)
0.8
b)
S. Optimizada
L=8
L=16
L=24
S. Uniforme
L=8
L=16
L=24
1000
< τM >
<A>
0.6
0.4
100
10
0.2
S. Optimizada
S. Uniforme
0
0.125
0.25
0.5
T
1
2
1
0.125
0.25
0.5
1
2
T
Figura 4.8: Comparação de taxa de aceitação e tempo de autocorrelação do parâmetro
de ordem em função da temperatura.
72
4.1 Rede quadrada
Na figura 4.8a, é apresentada a melhoria em termos de taxa de aceitação devida à
utilização do método de selecção optimizada. Para além de aumentar nominalmente a taxa
de aceitação, esta deixa de diminuir com a temperatura, tendendo para um valor constante
superior a 80%. Note-se que tanto no caso de selecção uniforme como optimizada, a taxa
de aceitação praticamente não depende do tamanho do sistema. A figura 4.8b exibe o
efeito desta optimização nos tempos de autocorrelação do parâmetro de ordem, que são
uma ordem de grandeza mais baixos na região de baixas temperaturas.
Ainda assim, na região crítica o efeito desta optimização não é tão relevante, pelo que
são necessários outros métodos para diminuir os tempos de autocorrelação nesta região.
4.1.4 Parallel Tempering
O método de Parallel Tempering, descrito na secção 3.1.4, diminui ainda mais os tempos
de autocorrelação, ao permitir a mistura de cadeias de Markov a temperaturas diferentes.
A figura 4.9 mostra os tempos de autocorrelação na energia e no parâmetro de ordem com
as diferentes variantes descritas.
Metropolis
S. Optimizada (SO)
Parallel Tempering (PT)
PT + SO
1000
a)
10000
b)
1000
< τE >
< τM >
100
100
10
10
1
0.125
0.25
0.5
T
1
2
1
0.125
0.25
0.5
1
2
T
Figura 4.9: Comparação entre as diferentes dinâmicas, para L=24.
Se compararmos o método de selecção optimizada (linhas vermelhas na figura 4.9), com
o método de Parallel Tempering (linhas verdes), verificamos que este último leva a tempos
de autocorrelação mais baixos na região crítica, mas à medida que a temperatura diminui
é a selecção optimizada que produz melhores resultados. A combinação dos dois métodos
(linhas azuis) leva aos melhores resultados a qualquer temperatura, com diminuições dos
tempos de autocorrelação que podem chegar a duas ordens de grandeza, pelo que será
este o método a utilizar para estudar o comportamento crítico do sistema.
73
4 Redes regulares de dipolos pontuais
4.1.5 Expoentes críticos
Para estimar os expoentes críticos, é necessário, em primeiro lugar, determinar a temperatura crítica, Tc . Para tal, usaremos o cumulante de Binder
2
hm2st i
,
U =1−
3 hm4st i
(4.7)
cujo valor em T = Tc deverá ser aproximadamente independente do tamanho do sistema,
como vimos no capítulo anterior. Na figura 4.10, podemos encontrar o cumulante de
Binder em função da temperatura para os tamanhos L = 16 a 64, e, na magnificação,
desprezando os tamanhos mais pequenos, verifica-se que a Tc é aproximadamente 0.58.
L=16
L=24
L=32
L=40
L=48
L=56
L=64
0.7
0.6
0.68
U
0.66
0.5
Tc ~ 0.58
0.64
0.62
0.4
0.6
0.58
0.55 0.56 0.57 0.58 0.59 0.6 0.61
0.3
0.3
T
0.4
0.6
0.5
0.7
T
Figura 4.10: Cumulante de Binder em função da temperatura para redes quadradas de
dipolos pontuais com L = 16 a 64.
Se definirmos uma temperatura reduzida como uma medida da distância à temperatura
crítica
T − Tc
(4.8)
t=
Tc
então podemos definir os expoentes críticos ν, γ, α e β através do comportamento, na
região crítica e no limite termodinâmico, do comprimento de correlação
ξ ∼ |t|−ν ,
(4.9)
susceptibilidade
γ
χ ∼ |t|−γ = ξ ν ,
74
(4.10)
4.1 Rede quadrada
calor específico
C ∼ |t|−α = ξ ν
α
(4.11)
β
(4.12)
e magnetização
m ∼ |t|β = ξ − ν .
Num sistema finito, o comprimento de correlação nunca chega de facto a divergir, não
podendo ser maior do que o tamanho L do sistema, pelo que o comportamento destas
grandezas na região em que ξ seria maior do que L depende do tamanho do sistema (e.g.
Fisher e Barber [132]). Isto pode ser expresso à custa de funções de scaling, tal que, para
um função termodinâmica F (t), a sua dependência com o tamanho do sistema é dada por
ρ
1
F (t, L) = L ν F̃ (L ν t),
(4.13)
onde a função F̃ , adimensional e de uma única variável, não tem qualquer outra dependência em L para além da que é exibida explicitamente nesta equação, e ρ é o expoente
crítico de F (t). Se tentarmos medir esta função através de simulações de Monte Carlo
com sistemas de tamanhos diferentes, o resultado deverá ser independente do tamanho do
sistema, desde que usemos os valores correctos dos expoentes críticos e da temperatura
crítica, pelo que estes podem ser estimados a partir da tentativa de colapso das curvas
medidas para diferentes tamanhos do sistema. Estes colapsos, bem como os valores de Tc
e dos expoentes que lhes deram origem, são exibidos nas figuras 4.11.
ν = 1.2; Tc = 0.58
0.7
ν = 1.2; β = 0.125; Tc = 0.58
a)
c)
b)
24
32
40
48
56
64
24
32
40
48
56
64
1
L
χst
−γ/ν
L
β/ν
0.5
24
32
40
48
56
64
0.1
< mst >
0.6
Ust
ν = 1.2; γ = 2; Tc = 0.58
0.5
0.05
0.4
0.3
-4
-2
0
1/ν
L t
2
4
0
-4
-2
0
1/ν
L t
2
4
0
-4
-2
0
1/ν
2
4
L t
Figura 4.11: Colapsos das curvas de a) cumulante de Binder, b) magnetização e c) susceptibilidade para L = 24 a 64.
75
4 Redes regulares de dipolos pontuais
Os colapsos foram obtidos com os expoentes ν = 2, β = 0.125, γ = 2 e com a temperatura crítica Tc = 0.58. Estes valores estão razoavelmente de acordo com os apresentados
por Tomita [128], tendo em conta os limites desta forma de análise de tamanho finito e os
tamanhos considerados. Os expoentes encontrados nesse trabalho são ν = 1.19, β = 0.104
e Tc = 0.581, e não foi apresentado nenhum valor para γ. No entanto, o parâmetro de
ordem considerado é diferente - enquanto que o usado neste trabalho não distingue entre
o contínuo de estados do tipo micro-vórtice com diferentes ângulos θ, o parâmetro considerado por Tomita pretende descrever a selecção dos estados alinhados com os eixos da
rede. Para além isso, nesse trabalho é utilizada uma função de scaling “não convencional”
proposta por Campbell et al. [133], em alternativa à da eq. 4.13, que consiste em usar
como temperatura reduzida, em vez de t = (T − Tc )/Tc , o parâmetro t0 = (T − Tc )/T , e
a função de scaling
√ ρ/ν √ 1/ν G t0 L T
.
(4.14)
G(T, L) = L T
A motivação apresentada é que esta forma de scaling, derivada a partir da forma estrutural de expansões de alta temperatura, permitirá o colapso das curvas numa gama
mais alargada de temperaturas, não só próximo da região crítica, resultando nos mesmos
expoentes críticos com um erro inferior. Para permitir a comparação, efectuámos também
a análise com esta forma não convencional, e dentro da precisão deste procedimento não
encontrámos diferenças significativas.
4.2 Cadeia unidimensional
Como vimos no início deste capítulo, a uma dimensão o decaimento da interacção dipolar
é demasiado forte para que seja possível o estabelecimento de ordem de longo alcance a
temperatura finita [113]. As medições do parâmetro de ordem (neste caso, a magnetização
ao longo da direcção da cadeia) por simulação de Monte Carlo exibem um comportamento
semelhante ao parâmetro de ordem da rede quadrada (figura 4.12a), mas a análise do
cumulante de Binder revela a ausência de um ponto crítico, dado que a temperatura a
que as curvas se cruzam diminui sucessivamente com o tamanho do sistema (figura 4.12b),
sugerindo que a temperatura crítica tende para zero, como seria de esperar.
No entanto, a medição dos tempos de autocorrelação na energia e na magnetização
revela dificuldades de convergência que nem mesmo a combinação de selecção optimizada com o método de Parallel Tempering consegue ultrapassar (figura 4.13). Com estes
tempos de autocorrelação, seriam necessárias simulações bastante mais longas do que as
efectuadas para tornar possível uma análise semelhante à que fizemos para a rede quadrada.
76
4.2 Cadeia unidimensional
1
a)
b)
L=64
L=256
L=576
0.8
L=64
L=256
L=576
0.6
0.6
0.4
U
<m>
0.5
0.3
0.4
0.2
0.2
0.1
0
0.125
0.25
0.5
1
0
2
0.125
0.25
T
0.5
1
2
T
Figura 4.12: Magnetização e cumulante de Binder para uma cadeia unidimensional de
dipolos pontuais, usando a combinação de selecção optimizada com o método de Parallel
Tempering.
1000
1e+05
a)
b)
L=64
L=256
L=576
L=64
L=256
L=576
10000
100
< τE >
< τM >
1000
100
10
10
1
1
0.25
0.5
T
1
2
0.25
0.5
1
2
T
Figura 4.13: Tempos de autocorrelação na energia e na magnetização para uma cadeia
unidimensional de dipolos pontuais. Mesmo com a combinação de selecção optimizada
e Parallel Tempering, os tempos de autocorrelação tornam-se demasiado grandes para
medir com o tempo de simulação utilizado (107 passos de Monte Carlo).
Quanto à origem destes tempos de autocorrelação elevados, a taxa de aceitação, com as
optimizações utilizadas, continua a ser alta (da ordem de 85%), pelo que não será essa a
causa das dificuldades de convergência. O comportamento dos tempos de autocorrelação
sugere que a baixas temperaturas, os estados visitados não diferem muito na energia e
magnetização, podendo corresponder simplesmente ao movimento de paredes de domínio,
pelo que este comportamento deverá ser devido à utilização de uma dinâmica de single
spin flip.
77
4 Redes regulares de dipolos pontuais
4.3 Conclusões
Neste capítulo, aplicámos os métodos de simulação expostos no capítulo anterior a dois
sistemas ordenados de dipolos pontuais. Na rede quadrada, as dificuldades de convergência foram ultrapassadas com uma combinação de selecção optimizada com o método de
Parallel Tempering, com reduções de uma a duas ordens de grandeza nos tempos de autocorrelação. Estas optimizações tornaram possível a caracterização do comportamento
crítico do sistema, embora seja necessário simular sistemas maiores. Já na cadeia unidimensional, foi identificado um comportamento patológico a baixas temperaturas que
sugere a necessidade de utilização de algoritmos de cluster para permitir uma exploração
eficiente do espaço de fase.
78
5 Plano desordenado de dipolos
pontuais
Para além das redes ordenadas consideradas no capítulo anterior, é relevante considerar
também o caso de sistemas com desordem posicional, muito comuns entre os sistemas
magnéticos experimentais. São conhecidos relatos de “ferromagnetismo dipolar” (ordem
ferromagnética devida às interacções dipolares e não às interacções de troca) em diversas
condições (e.g. Zhang et al. [134], Kechrakos et al. [135], Takzei et al. [136], Denisov et
al. [137, 138, 139], Held et al. [140], Yamamoto et al. [141]). No entanto, esta ordem está
relacionada com realizações específicas da desordem, existência de anisotropia uniaxial e
elevados tempos de relaxação de estados meta-estáveis. Apesar de alguns destes trabalhos
incluírem análises de campo médio que parecem indicar a possibilidade de ordem de longo
alcance a temperatura finita, se fizermos simulações com médias sobre a desordem de um
sistema de dipolos pontuais uniformemente distribuídos e com acoplamento puramente
dipolar, essa ordem não se verifica.
Mesmo sem a existência de ordem de longo alcance, em sistemas desordenados usados como sensores graças ao efeito de magneto-resistência gigante (GMR) ou magnetoresistência de túnel (TMR), as correlações magnéticas devidas às interacções entre as
partículas têm um efeito substancial na resistência eléctrica da amostra em que estão
inseridas (e.g. Lopes et al. [142]). Neste capítulo, apresentamos resultados da influência
da concentração de partículas e da temperatura nessas correlações.
5.1 Modelo
Para medir as correlações entre momentos magnéticos num sistema desordenado em função do campo aplicado, foram geradas pequenas amostras circulares (figura 5.1) de partículas (esferas uniformemente magnetizadas), com uma partícula no centro e as restantes
partículas colocadas aleatoriamente à volta da primeira. As partículas não se podem
sobrepor, ou seja, para cada par de partículas i e j
(xi − xj )2 + (yi − yj )2 > D2
(5.1)
79
5 Plano desordenado de dipolos pontuais
onde D é o diâmetro das partículas. O raio da amostra é dado por
s
Ra =
N D2
4C
(5.2)
onde N é o número de partículas e C é a concentração planar de partículas, que foi variada
entre 10 e 30%.
Figura 5.1: Representação esquemática de cada amostra desordenada.
O facto de estarmos a lidar com um sistema desordenado obriga-nos a fazer médias
sobre a desordem, o que volta a ser bastante exigente do ponto de vista computacional.
A figura 5.2 mostra a média sobre 10000 amostras de 50 partículas cada, com uma concentração de 30%, da densidade de centros de partículas em função da posição relativa à
partícula central.
Figura 5.2: Exemplo da distribuição de partículas - média sobre 10000 amostras de 50
partículas cada, com uma concentração de 30%. Em todas as amostras existe uma partícula no centro, que não é exibida no gráfico, e o centro das outras partículas não pode
estar a menos de um diâmetro D de distância do centro.
80
5.2 Efeitos de tamanho finito
A energia do sistema é dada pela energia de interacção entre cada uma das partículas
de cada amostra mais o termo de Zeeman devido ao campo aplicado H, ou seja,
E=−
X χ
µk H χ −
k
1 X χλ χ λ
U µ µ ,
2 k,l kl k l
(5.3)
onde, mais uma vez, a matriz de interacção é dada por
Uklχλ = δ kl
3uχkl uλkl − δχλ
.
3
rkl
(5.4)
Dado que o sistema é desordenado, não vamos usar o método de réplicas periódicas
descrito no capítulo anterior, pelo que é necessário tratar de outra forma a questão do
tamanho finito da amostra.
5.2 Efeitos de tamanho finito
Como podemos ver na a distribuição espacial da magnetização (figura 5.3), o tamanho
finito da amostra provoca uma deformação da magnetização média no interior da amostra.
Junto à fronteira da amostra, a magnetização decresce significativamente.
Figura 5.3: Exemplo da distribuição da magnetização com condições de fronteira abertas.
Para ultrapassar este problema, foi gerado um plano com Np N partículas, que
inclui a amostra de simulação, com N partículas, no centro (figura 5.4). A diferença
entre as partículas que estão dentro e fora da amostra de simulação é que as partículas
que estão fora vão ter todas a mesma magnetização, calculada de forma auto-consistente.
Isto permite calcular uma matriz de interacção, Lχλ
k , que, para um determinado valor
da magnetização externa mλL , produz um campo local, em cada uma das partículas no
81
5 Plano desordenado de dipolos pontuais
interior da amostra, dado por
χ
λ
HL,k
= −Lχλ
k mL .
(5.5)
Este campo local é simplesmente adicionado ao campo externo, e a energia será então
dada por
X χ
1 X χλ χ λ
χ
(5.6)
U µ µ .
E=−
µk (H χ + HL,k
)−
2 k,l kl k l
k
Figura 5.4: Representação esquemática de cada amostra desordenada inserida num plano
de partículas uniformemente magnetizadas.
O número de partículas no exterior da amostra deve ser tal que o campo criado por
esta distribuição de partículas uniformemente magnetizadas, HL , deixe de depender desse
número. A figura 5.5 mostra a variação da componente x desde campo, ao longo do eixo
x e em função da razão Np /N , onde se verifica que é necessário chegar a um factor da
ordem de 100 para eliminar a dependência de HL com essa razão.
0.8
Np = 2 N
Np = 10 N
Np = 50 N
Np = 100 N
HL
0.6
0.4
0.2
0
-6
-4
-2
0
2
4
6
x/D
Figura 5.5: Variação do campo criado pela distribuição de partículas uniformemente
magnetizadas no exterior da amostra com a razão entre o número de partículas total e o
tamanho da amostra.
82
5.3 Simulações
A magnetização das partículas exteriores é definida de forma auto-consistente. Inicialmente, a magnetização das partículas que se encontram no exterior da amostra é colocada
a zero, e é calculada a magnetização média, por Monte Carlo, do interior da amostra. A
magnetização das partículas exteriores é então igualada à magnetização média do interior, e o procedimento é repetido até a diferença entre as magnetizações no interior e no
exterior ser inferior a 1%.
Figura 5.6: Exemplo da distribuição da magnetização paralela ao campo com magnetização constante e não nula no exterior da amostra.
Com este esquema, a magnetização da amostra pode aumentar, devido à magnetização
no exterior da amostra, e o perfil de magnetização no interior da amostra passa a ser mais
uniforme (figura 5.6), diminuindo dessa forma os efeitos de tamanho finito da amostra.
Para cada uma das amostras, foi calculada a aproximação de altas temperaturas, até
segunda ordem, da magnetização média de cada partícula e da correlação média de cada
partícula com a partícula central. Essas grandezas são também calculadas através de
simulações de Monte Carlo usando o algoritmo de Metropolis e a optimização de taxas
de aceitação referida anteriormente. No final, foram feitas médias destas grandezas sobre
todas as amostras em função da posição de cada partícula na amostra.
5.3 Simulações
A existência de um campo aplicado facilita a convergência das simulações, pelo que não
é necessário o uso do método de Parallel Tempering. No entanto, a taxa de aceitação a
campos altos pode ser demasiado baixa, se a proposta for uniforme, o que nos levou a
utilizar uma optimização semelhante à usada no capítulo anterior. A figura 5.7a mostra
o decaimento da taxa de aceitação, quando a proposta é uniforme, à medida que o campo
aumenta, devido ao custo energético de propostas que fariam os momentos desviar-se
83
5 Plano desordenado de dipolos pontuais
significativamente da direcção do campo.
1
1
a)
b)
S. Optimizada
S. Optimizada
(com campo externo e dipolar)
0.9
(com campo externo)
0.6
<A>
<A>
0.8
0.4
0.8
S. Optimizada
(com campo externo)
0.7
0.2
0.6
S. Uniforme
0
0.01
S. Uniforme
β=1
β=1
0.1
1
10
βH
100
0.5
0.01
0.1
1
βH
10
100
Figura 5.7: Exemplos de taxa de aceitação quando a proposta é uniforme, optimizada com
inclusão do campo externo e optimizada com inclusão do campo externo e da componente
planar do campo dipolar.
A introdução do campo externo na probabilidade de selecção, como descrito na secção 3.1.2, permite evitar este problema. Como podemos ver na figura 5.7a, esta optimização, incluindo o termo proporcional ao campo externo em
Ef − Ei = −H I,k · (mk,f − mk,i ) − Hext (cos θk,f − cos θk,i ).
(5.7)
na probabilidade de selecção,
Sf i ∝ eβHext cos θk,f e Sif ∝ eβHext cos θk,i
faz com que a taxa de aceitação tenda para 100% a campos altos, enquanto que anteriormente tendia para zero. Ainda assim, à medida que baixamos a temperatura, a taxa de
aceitação baixa também, devido ao termo dipolar que deixámos de fora.
Para melhorar a taxa de aceitação a campos fracos e baixas temperaturas, podemos
voltar a introduzir a componente planar dos campos locais na probabilidade de selecção,
k
k
Sf i ∝ eβHk cos θk,f e Sif ∝ eβHk cos θ̃k,i
e
84
5.4 Magnetização
k
onde θe é o ângulo que o momento faz com a componente planar do campo local H k =
k
H ext + H I,k , como descrito na secção 3.1.2. Como podemos ver na figura 5.7b, esta
alteração melhora significativamente a taxa de aceitação em toda a gama de parâmetros
em que estamos interessados. Os resultados que se seguem foram obtidos utilizando este
método.
5.4 Magnetização
Para partículas livres em que o momento magnético tem três componentes cartesianas
(apêndice A), a magnetização total na direcção do campo aplicado é descrita pela função
de Langevin,
1 2π
D
µk
E
0
u eβHu dφdu
1
= coth(βH) −
≡ L(βH),
= −11 0 2π
βHu dφdu
βH
e
−1 0
(5.8)
o que corresponde à aproximação de ordem zero da expansão de altas temperaturas. A
temperaturas elevadas espera-se que o comportamento da magnetização seja bem descrito
por esta função, para qualquer valor do campo aplicado, e que comecem a ser necessárias
correcções à medida que baixamos a temperatura, como se pode ver nas figuras 5.8 e5.9.
C = 30%
β = 0.1
β = 0.5
β=1
β = 1.5
1
Ordem 0
Ordem 1
Ordem 2
Sim.
Mx - L(βH)
0.8
0.6
0.4
0.2
0
0.01
0.1
1
βH
10
0.01
100
0.1
1
βH
10
0.01
100 0.1
1
βH
10
0.01
100
0.1
1
βH
10
100
Figura 5.8: Comparação da magnetização na direcção do campo aplicado, em função da
magnitude do mesmo. A concentração foi fixada em 30% e a temperatura diminui da
esquerda para a direita. O resultado da ordem zero da expansão de altas temperaturas é
exibido a preto, até primeira ordem a vermelho, até segunda ordem a verde e os resultados
da simulação a azul.
85
5 Plano desordenado de dipolos pontuais
C = 30%
β = 0.1
β = 0.5
β=1
0.14
Ordem 1
Ordem 2
Sim.
0.12
Mx - L(βH)
β = 1.5
0.1
0.08
0.06
0.04
0.02
0
0.01
0.1
1
βH
10
0.01
0.1
1
βH
10
0.01
0.1
1
βH
10
0.01
0.1
1
βH
10
100
Figura 5.9: Comparação da diferença entre a magnetização e a função de Langevin, em
função do campo aplicado. A concentração foi fixada em 30% e a temperatura diminui
da esquerda para a direita. O resultado da expansão de altas temperaturas até primeira
ordem é exibido a vermelho, até segunda ordem a verde e os resultados da simulação a
azul.
H = 1/β
C = 0.2
C = 0.1
C = 0.3
0.49
0.48
Ordem 0
Ordem 1
Ordem 2
Sim.
0.47
Mx
0.46
0.45
0.44
0.43
0.42
0
0.5
β
1
1.5 0
0.5
β
1
1.5 0
0.5
β
1
1.5
Figura 5.10: Magnetização paralela ao campo para diferentes temperaturas e H = 1/β, e
concentração C = 10% a 30%, com as diferentes ordens da expansão (até primeira ordem
a vermelho, até segunda ordem a verde) e os resultados da simulação (a azul).
86
5.5 Correlações magnéticas
Repare-se que a aproximação de altas temperaturas não se aproxima do resultado da
simulação de forma monótona. Comparando a aproximação de ordem zero (linha preta)
com a de primeira ordem (linha vermelha) e o resultado da simulação (linha azul), verificamos que correcção de primeira ordem estima a magnetização por excesso, o que depois
é corrigido pelo termo de segunda ordem (linha verde).
A concentração afecta também a magnitude das correcções, ao tornar as interacções
mais relevantes. A figura 5.10 mostra a magnetização paralela ao campo em função da
temperatura, para H = 1/β, e concentrações C = 10% a 30%.
À medida que baixamos a temperatura (aumentamos β) ou aumentamos a concentração
C, as interacções tornam-se mais relevantes e aumentam a magnetização ao longo do
campo. Note-se, mais uma vez, que a expansão estima esta correcção por excesso, e que
o desvio aumenta com o aumento da concentração e a diminuição da temperatura.
5.5 Correlações magnéticas
Para partículas livres, a correlação entre os momentos magnéticos de partículas diferentes,
definida como
D
E
D E
Cijαβ = µαi µβj − hµαi i µβj
(5.9)
é sempre nula, como vimos no capítulo 2, pelo que só iremos apresentar as correcções de
primeira e segunda ordem, bem como o resultado das simulações. Para cada partícula,
foi medida a correlação do seu momento magnético com o da partícula central, e esta
correlação foi mapeada em função da posição relativa ao centro (figura 5.11). A correlação
entre as diferentes componentes dos momentos magnéticos depende essencialmente da
posição relativa das partículas, como se vê na figura.
Figura 5.11: Exemplo da distribuição da correlação com a partícula central das componentes paralela e perpendicular da magnetização. Note-se a importância da relação entre
as componentes do momento magnético e a posição relativa das partículas.
87
5 Plano desordenado de dipolos pontuais
C = 30%
β = 0.1
β = 0.5
β=1
β = 1.5
0.005
Ordem 1
Ordem 2
Sim.
0.004
Ci0
xx
0.003
0.002
0.001
0
0.01
0.1
1
βH
10
0.01
0.1
1
βH
10
0.01
0.1
1
βH
10
0.01
0.1
1
βH
10
100
Figura 5.12: Comparação da correlação na direcção do campo, em função do campo, para
diferentes temperaturas e concentração C = 30%, com as diferentes ordens da expansão
(primeira ordem a vermelho, até segunda ordem a verde) e os resultados da simulação (a
azul).
H = 1/β
C = 0.1
C = 0.2
C = 0.3
0.002
Ordem 1
Ordem 2
Sim.
xx
Ci0
0.0015
0.001
0.0005
0
0
0.5
β
1
1.5 0
0.5
β
1
1.5 0
0.5
1
β
1.5
2
Figura 5.13: Magnetização paralela ao campo para diferentes temperaturas e H = 1/β, e
concentração C = 10% a 30%, com as diferentes ordens da expansão (primeira ordem a
vermelho, até segunda ordem a verde) e os resultados da simulação (a azul).
88
5.6 Conclusões
A figura 5.12 mostra a correlação na direcção paralela ao campo, integrada sobre toda a
amostra, à semelhança do que fizemos com a magnetização. Esta análise permite comparar
os valores numéricos obtidos com as diferentes aproximações. A correlação integrada
também aumenta com β e com C, como podemos ver, para H = 1/β, na figura 5.13.
No entanto, verificamos que para temperaturas baixas e/ou concentrações altas, o termo
de segunda ordem da expansão já não é suficiente para descrever o comportamento do
sistema.
5.6 Conclusões
Foi desenvolvida uma aplicação de simulações de Monte Carlo de um plano desordenado
de dipolos pontuais com médias sobre a desordem e com o cálculo, para cada amostra,
da expansão de altas temperaturas até segunda ordem da magnetização e da correlação
média com a partícula central. Isto permite verificar a validade das diferentes ordens
da expansão de altas temperaturas, em função da temperatura e da concentração. Em
particular, verificamos que a aproximação de primeira ordem começa a descrever o efeito
das interacções, quando comparada com a aproximação de ordem zero, mas estima por
excesso a magnetização e a correlação magnética, quando comparadas com os resultados
das simulações. O termo de segunda ordem tipicamente melhora a aproximação, desde
que a concentração não seja demasiado alta (inferior a 30%). Estes resultados para as
propriedades magnéticas estão a ser introduzidos em modelos de transporte para obter as
consequências em termos de magneto-resistência de sistemas constituídos por partículas
magnéticas em substratos metálicos e isoladores. Esta tarefa permitirá aplicações práticas
dos resultados apresentados.
89
5 Plano desordenado de dipolos pontuais
90
6 Partículas de tamanho finito
Nos capítulos anteriores, utilizámos a aproximação de dipolos pontuais para descrever as
partículas que constituem os sistemas nano-estruturados e as interacções entre elas. Para
ter em conta efeitos de tamanho e forma das partículas, é necessário, em primeiro lugar,
saber calcular, no regime clássico, a energia magnetostática de uma partícula magnética
(e.g. Aharoni [143]). Esta energia não é mais do que a interacção da sua magnetização
M (r) com o campo magnético H(r) criado por essa magnetização, ou seja
µ0
Em = −
2
M (r) · H(r)dr
(6.1)
V
(onde µ0 = 4π × 10−7 N/A2 é a permeabilidade magnética do vácuo e o integral é feito
sobre o volume da partícula). Para avaliar a energia de um sistema de partículas, é
normalmente usado o teorema de reciprocidade (e.g. Jackson [28]), que diz que a energia
de interacção de uma distribuição de magnetização M 1 (r) com o campo magnético H 2 (r)
criado por uma distribuição de magnetização M 2 (r) é igual à energia de interacção desta
com o campo magnético H 1 (r), ou seja
M 1 (r) · H 2 (r)dr =
V
M 2 (r) · H 1 (r)dr.
(6.2)
V
Figura 6.1: Representação esquemática do teorema da reciprocidade.
Para calcular esta energia de interacção, é necessário calcular o campo magnético produzido por uma determinada distribuição de magnetização, como veremos de seguida.
91
6 Partículas de tamanho finito
6.1 Função de forma
Genericamente, o cálculo de energias de energias magnetostáticas directamente a partir
da definição não é tão simples como possa parecer. No que se segue, iremos usar um
formalismo no espaço de Fourier, referido por Aharoni [143] e mais recentemente sistematizado por Beleggia et al. [144, 145, 146, 147], que simplifica em grande medida esse
cálculo. Para tal, vamos começar por definir uma função de forma
D(r) =


1
dentro da partícula

0
fora da partícula
(6.3)
para extender os integrais sobre o volume a integrais sobre todo o espaço
f (r)dr =
D(r)f (r)dr.
(6.4)
V
0
1
Figura 6.2: Representação esquemática da função de forma.
Isto permite transferir a questão da forma das partículas para esta função de forma,
nomeadamente para o cálculo da transformada de Fourier da função de forma, designada
por amplitude de forma,
D(k) =
D(r)e
−ik·r
dr =
e−ik·r dr.
(6.5)
V
Este último integral é o único ponto neste formalismo onde a informação sobre a forma
é usada nos limites de integração (no apêndice B são calculadas as amplitudes de forma
para os casos particulares de formas esféricas e cilíndricas). Se M (r) incluir o factor de
92
6.1 Função de forma
forma, e.g.
M (r) = M (r)D(r)m̂(r),
(6.6)
onde M (r) é a magnitude da magnetização e m̂(r) a sua direcção, a energia magnetostática fica então
µ0
M (r) · H(r)dr,
(6.7)
Em = −
2
com o integral extendido a todo o espaço em vez de confinado ao volume da partícula.
Figura 6.3: Representação esquemática de um corpo com magnetização não uniforme.
Para calcular H(r), começamos por usar o conhecido facto (e.g. [28]) de que o potencial
vector magnético devido à magnetização da partícula é dado por
µ0
A(r) =
4π
M (r 0 ) ×
r − r0
dr 0 ,
|r − r 0 |3
(6.8)
e pode ser escrito, com o auxílio do teorema da convolução e a linearidade do produto vectorial (e representando por F o operador transformada de Fourier, F[f (r)] =
f (r)e−ik·r dr), como
A(k) = F [A(r)]
r
µ0
=
F [M (r)] × F 3
4π
r
iµ0
= − 2 M (k) × k,
k
(6.9)
o que reduz o cálculo do potencial vector a um produto vectorial, se for possível calcular
a transformada de Fourier da magnetização. O potencial vector permite-nos calcular a
93
6 Partículas de tamanho finito
indução magnética B(r) = ∇ × A(r) através da sua transformada de Fourier
B(k) = −ik × A(k)
µ0
= 2 k × M (k) × k
k
(6.10)
o que, usando a identidade vectorial k ×M (k)×k = M (k)k 2 −k [k · M (k)], nos permite
escrever
)
(
k [k · M (k)]
.
(6.11)
B(k) = µ0 M (k) −
k2
Relacionando o campo magnético H com a indução B através da relação comum B =
µ0 (M + H), identificamos a grandeza
H(k) = −
k [k · M (k)]
k2
(6.12)
com a transformada de Fourier do campo desmagnetizante H(r), que pode então ser
escrito, usando a transformada inversa
F
−1
1
[f (k)] = 3
8π
f (k)eik·r dk = f (r),
como
1
H(r) =
8π 3
(6.13)
H(k)eik·r dk.
Escrevendo a equação 6.7 com recurso a esta transformada inversa, obtemos a expressão
para a energia magnetostática em termos da transformada de Fourier acima definida
Em
µ0
= −
2
1
M (r) ·
8π 3
(
)
H(k)e
ik·r
dk dr,
(6.14)
o que, substituindo H(k) pela equação 6.12 e reconhecendo no integral em dr a transformada de Fourier M (−k), pode ser simplificado para
µ0
Em =
16π 3
[k · M (−k)] [k · M (k)]
dk.
k2
(6.15)
Esta é a expressão mais geral para a energia magnetostática de um sistema magnético.
Na secção 6.2, vamos introduzir a simplificação de considerar a magnetização uniforme
em todas as regiões do espaço onde está definida.
94
6.2 Magnetização uniforme
6.2 Magnetização uniforme
Para o caso mais simples de um corpo uniformemente magnetizado (figura 6.4), a transformada de Fourier da magnetização torna-se simplesmente
M (k) = M D(k)m̂,
(6.16)
onde m̂ é o versor unitário na direcção da magnetização, e a energia passa a ser dada por
µ0 M 2
Em =
16π 3
|D(k)|2
(m̂ · k)2 dk.
2
k
(6.17)
Figura 6.4: Representação esquemática de um corpo com magnetização uniforme.
Para exemplificar o uso deste formalismo, são considerados no Apêndice B algumas
formas particulares como esferas (Osborn [148]) e cilindros (Joseph e Schlomann [149])
uniformemente magnetizados, neste último caso em duas configurações distintas.
6.2.1 Tensor desmagnetizante local
No caso de corpos elipsoidais uniformemente magnetizados, o campo desmagnetizante é
também uniforme, e a energia magnetostática pode ser expressa através de um tensor
desmagnetizante global. Se a forma for diferente, isto já não se verifica, mas podemos definir, por analogia, um tensor desmagnetizante local N αβ (r), que relaciona a magnetização
M (r) com o campo H(r) produzido pela mesma,
H α (r) = −
X
N αβ (r)M β (r).
(6.18)
β
95
6 Partículas de tamanho finito
Comparando com a expressão 6.12, podemos identificar o termo
D(k)
kαkβ
k2
(6.19)
com a transformada de Fourier do tensor desmagnetizante,
kαkβ
D(k) 2
k
"
N
αβ
(r) = F
−1
#
(6.20)
que, usando o teorema da convolução, pode ser escrito como
"
N
αβ
(r) = D(r) ⊗ F
onde a função
−1
kαkβ
,
k2
#
(6.21)
f (r) ⊗ g(r) ≡
f (r 0 )g(r 0 − r)dr 0
(6.22)
é a convolução das funções f e g. O segundo termo desta convolução,
"
F
−1
kαkβ
k2
#
(6.23)
é o tensor de interacção entre dipolos pontuais, que iremos designar aqui simplesmente
por tensor dipolar, Dαβ (r). Isto permite olhar para o tensor desmagnetizante como a
convolução entre a função de forma e o tensor dipolar
N αβ (r) = D(r) ⊗ Dαβ (r),
(6.24)
isto é, o tensor desmagnetizante local é obtido através do efeito do tensor dipolar a partir
de todos os pontos da partícula. No caso da partícula ser de facto um dipolo pontual, a
função de forma é uma função delta e o tensor desmagnetizante é igual ao tensor dipolar.
É importante notar que, para um sistema magnético uniformemente magnetizado, toda a
informação está contida nesta expressão. Em todo o caso, no final deste capítulo vamos
abordar também o caso de magnetização não uniforme, para o qual isto deixa de se
verificar.
6.2.2 Interacção entre partículas
Até agora, temos tratado apenas o caso de uma única partícula, mas não há nada que nos
impeça de considerar que a magnetização está distribuída por diferentes regiões do espaço
96
6.2 Magnetização uniforme
(figura 6.5). Vamos considerar então duas partículas magnetizadas uniformemente,
M (r) = Mi Di (r − r i )m̂i + Mj Dj (r − r j )m̂j .
(6.25)
Figura 6.5: Representação esquemática da magnetização distribuída por diferentes regiões
do espaço.
A transformada de Fourier desta magnetização é dada por
M (k) = Mi Di (k)e−ik·ri m̂i + Mj Dj (k)e−ik·rj m̂j ,
(6.26)
que pode ser substituída na equação 6.15 resultando nos dois termos das energias magnetostáticas de cada partícula mais um termo de interacção
Mi Mj µ0
EI =
8π 3
Di (k)Dj (−k)eik·rij
(m̂i · k) (m̂j · k)
dk,
k2
(6.27)
onde r ij = r j − r i é a posição relativa das duas partículas e onde contribui apenas a parte
real do integrando. Este integral corresponde a uma transformada de Fourier inversa,
relativamente a r ij , pelo que a energia de interacção pode ser escrita como
"
EI =
µ0 mαi mβj Fr−1
ij
kαkβ
Di (k)Dj (−k) 2
k
#
(6.28)
e, usando mais uma vez o teorema da convolução,
"
EI =
µ0 mαi mβj Fr−1
ij
[Di (k)Dj (−k)] ⊗ Fr−1
ij
kαkβ
.
k2
#
(6.29)
O segundo termo desta convolução é, como já vimos, o tensor dipolar Dαβ (r ij ), enquanto
que o primeiro termo corresponde a uma correlação cruzada
C(r) = Di (r) ⊗ Dj (−r),
(6.30)
97
6 Partículas de tamanho finito
ou seja
EI = µ0 mα1 mβ2 C(r ij ) ⊗ Dαβ (r ij ).
(6.31)
O aspecto mais interessante desta expressão é que fornece uma forma geral de calcular
o tensor de interacção
Uijαβ = C(r ij ) ⊗ Dαβ (r ij )
entre duas partículas de forma arbitrária. Dado que os métodos analíticos e numéricos
apresentados no capítulo anterior não dependem da forma particular do tensor de interacção, a introdução deste tensor, uma vez calculado, é a única alteração necessária para
tratar sistemas constituídos por partículas de tamanho finito uniformemente magnetizadas.
6.2.3 Sistemas periódicos
No caso de um sistema periódico de elementos idênticos (com a mesma forma, tamanho
e distribuição de magnetização),
M (r) =
X
m(r − r i ),
(6.32)
i
onde r i é a posição de cada ponto da rede e m(r −r i ) é a magnetização de cada partícula,
incluindo o seu factor de forma D(r − r i ). A transformada de Fourier desta magnetização
é dada por
M (k) =
=
M (r)e−ik·r dr
X
(6.33)
m(r − r i )e−ik·r dr.
i
Dada a periodicidade de m(r), fazemos a mudança de variável r 0 = r − r i para escrever
M (k) =
X
−ik·r 0
m(r )e
0
i
=
X
i
98
m(k)e−ik·ri ,
!
dr
0
e−ik·ri
(6.34)
6.3 Rede de discos
onde m(k) = m(r)e−ik·r dr é a transformada de Fourier da magnetização de uma única
partícula. A energia de interacção por partícula é então dada por
Em =
µ0
16π 3
h
[k · m(−k)] k ·
−ik·r i
i m(k)e
P
k2
i
dk,
(6.35)
onde o somatório sobre a rede só não será nulo se k = g, sendo g um vector da rede
recíproca, resultado este que iremos usar de seguida para o caso particular de uma rede
de discos (cilindros em configuração planar).
6.3 Rede de discos
Recentemente, Kakazei et al. [150] encontraram experimentalmente uma anisotropia de
quarta ordem no espectro de ressonância ferromagnética (FMR) de um sistema constituído
por uma rede quadrada de discos (figura 6.6).
Figura 6.6: Representação esquemática de uma rede quadrada, com período a, de discos
com diâmetro D e espessura t.
Na experiência, a amostra é sujeita a um campo magnético suficientemente forte para
manter a magnetização próxima a saturação, no plano da rede e das faces dos discos, e
a anisotropia é encontrada à medida que é variada a direcção do campo aplicado relativamente aos eixos da rede. O efeito é mais forte quando os discos estão próximos do
contacto entre si e desaparece à medida que se aumenta o período da rede relativamente
ao diâmetro dos discos, pelo que deverá ser devido às interacções entre discos. Esta manifestação explícita dos efeitos da interacção magnetostática é interessante tanto do ponto
de vista fundamental como das aplicações, pelo que a iremos estudar com recurso aos
métodos anteriormente expostos neste capítulo.
99
6 Partículas de tamanho finito
6.3.1 Resultados experimentais
A amostra experimental é constituída por discos de Permalloy com D = 1 µm de diâmetro
e t = 50 nm de espessura, fabricados por litografia de feixe de electrões e técnicas de liftoff, dispostos em redes quadradas com espaçamento a entre 1.1 e 2.5 µm. Estas dimensões
foram confirmadas por imagens microscópicas de microscopia de força atómica e de efeito
de túnel.
Anisotropia de segunda ordem
Anisotropia de quarta ordem
95
95
Hr (kA/m)
a=1.1µm
87,17 + 0.35 cos(2φH)
87,17 + 0.35 cos(2φH) + 1.94 cos(4φH)
90
90
85
85
a=2.5µm
89,88 + 0.38 cos(2φH)
0
π/2
π
φH
3π/2
0
π/2
π
φH
3π/2
2π
Figura 6.7: Dependência experimental do campo de ressonância Hr em função do ângulo φH , para parâmetro de rede a = 2.5 µm (a preto, à esquerda), ajustada por uma
anisotropia uniaxial e a = 1.1 µm (a vermelho, à direita), ajustada por uma sobreposição de anisotropia de quarta ordem e a anisotropia uniaxial, exibida separadamente em
pontilhado.
A experiência de ressonância ferromagnética (FMR) foi realizada à temperatura ambiente aplicando um campo magnético constante H, bastante forte, no plano da amostra
e fazendo um ângulo φH com um eixo da rede, e um (fraco) campo alternado de alta
frequência (9.8 GHz). O campo de ressonância Hr é a magnitude do campo H que maximiza a perda de energia na cavidade, ou seja, a que faz com que a frequência própria de
precessão dos momentos da amostra seja igual à frequência do campo alternado. O facto
100
6.3 Rede de discos
desta frequência ser bastante elevada faz com que o campo de ressonância seja superior
ao campo de saturação dos discos, evitando assim a formação de domínios ou vórtices.
91
4
a)
b)
90
89
H4 (kA/m)
Hr,av (kA/m)
3
88
2
1
87
86
0
0.2
0.4
(D/a)
0.6
0.8
1
0
0
0.1
0.2
2
0.3
0.4
(D/a)
0.5
0.6
4
Figura 6.8: Dependência experimental de a) Hr,av e b) H4 com o parâmetro de rede a.
Hr,av é inversamente proporcional a a2 e H4 é inversamente proporcional a a4 .
As dependências do campo de ressonância Hr com o ângulo φH para os casos de maior
e menor parâmetro da rede são apresentadas na figura 6.7. No caso do maior parâmetro
de rede, a = 2.5 µm, verifica-se a presença de uma anisotropia uniaxial descrita por
Hr = Hr,av + H2 cos 2φH .
(6.36)
A pequena anisotropia uniaxial H2 é aproximadamente constante em todas as amostras,
e o alinhamento com um dos eixos da rede sugere que seja devida a um pequeno desvio
da simetria da rede em relação a uma rede quadrada.
Para a amostra com parâmetro de rede a = 1.1 µm verificamos uma diminuição do valor
médio Hr,av e, para além da anisotropia uniaxial já referida (linha pontilhada vermelha
na figura 6.7), encontramos uma anisotropia de quarta ordem que se reflecte nos máximos
de Hr na direcção dos eixos da rede (geometria [10]) e mínimos nas direcções diagonais
(geometria [11]). Neste caso, Hr (φH ) é bem descrito por
Hr = Hr,av + H2 cos 2φH + H4 cos 4φH .
(6.37)
A variação de Hr,av e H4 com o parâmetro de rede a é exibida na figura 6.8.
O valor médio do campo de ressonância, Hr,av é inversamente proporcional a a2 , en-
101
6 Partículas de tamanho finito
quanto que a anisotropia de quarta ordem H4 é inversamente proporcional a a4 e anula-se
no mesmo limite.
6.3.2 Modelo teórico
Se considerarmos então esta rede quadrada de lado a no plano xy, formada por discos
de raio R e espessura t, e que a magnetização M , para além de não ter componente
segundo a direcção z, também não depende desta coordenada [151], podemos escrever a
transformada de Fourier da magnetização de um disco como
m(k) =
0
=
m(r 0 )e−ik·r dr0
(6.38)
m(ρ)e−iκ·ρ e−iqz dρdz,
onde, mais uma vez, mudámos para coordenadas cilíndricas tanto no espaço real, r =
ρ + z = (ρ cos θ, ρ sin θ, z), como no espaço de Fourier, k = κ + q = (κ cos φ, κ sin φ, q).
A integração em z pode ser feita como no apêndice B, de onde resulta
m(k) =
2 sin (qt/2)
m(κ).
q
(6.39)
Substituindo na equação 6.35, temos a energia magnetostática por partícula e por unidade
de espessura t
µ0
Em =
16π 3 t
2 sin (qt/2)
q
!2
[κ · m(−κ)] κ · i m(κ)e−iκ·ri
dκdq
κ2 + q 2
P
(6.40)
e usando o resultado da integração em q (eq. B.11), chegamos a
Em
µ0
=
8π 2
[κ · m(−κ)] κ ·
f (κt)
κ2
P
i
m(κ)e−iκ·ri
dκ,
(6.41)
onde f (x) = (e−x − 1 + x) /x. O somatório sobre os pontos da rede ri só não é nulo se κ
for um vector da rede recíproca, κ = g,
X
i
e−iκ·ri f n(κ)dκ =
2π
a
2 X
f n(g)
g
pelo que a energia pode ser escrita como um somatório sobre a rede recíproca,
102
(6.42)
6.3 Rede de discos
Em =
[g · m(−g)] [g · m(g)]
µ0 1 X
f
(gt)
.
2 a2 g
g2
(6.43)
De seguida, vamos começar por assumir uma magnetização uniforme na direcção do
campo.
Magnetização uniforme
Se considerarmos que a magnetização é uniforme e paralela ao campo aplicado, que vamos
manter ao longo do eixo x, então
R
2π
m (g) = M
ei g r cos θ rdrdθ = 2πRM
x
0
0
J1 (gR)
g
(6.44)
onde Jα (x) é a função cilíndrica de Bessel, e my,z (g) = 0. A energia magnetostática é
então dada por
Em
2π 2 R2 M 2 µ0 X
gx
=
f
(gt)
a2
g
g
!2
J1 (gR)
g
!2
.
(6.45)
A variação com o ângulo φH entre a direcção do campo e os eixos da rede pode ser
obtida numericamente mantendo fixa a direcção do campo e rodando a rede recíproca, ou
seja,
2π
(n1 cos φH − n2 sin φH , n1 sin φH + n2 cos φH ) ,
(6.46)
g=
a
verificando-se que a energia de uma rede quadrada de discos uniformemente magnetizados
no plano da rede não depende da direcção da magnetização, pelo que não é suficiente
para explicar os resultados experimentais. No entanto, a curva de absorção medida na
experiência está relacionada com o campo magnético total sentido por cada momento dos
discos. Este campo é constituído não só pelos campos aplicados mas também pelo campo
desmagnetizante devido à forma da partícula e devido à presença de outras partículas. O
primeiro é independente da direcção do campo em relação aos eixos da rede e da distância
entre discos, pelo que será necessário considerar a contribuição para o campo local devida
à presença dos outros discos da rede.
103
6 Partículas de tamanho finito
Campo magnetostático
O campo magnetostático no interior de um dos discos da rede pode ser obtido combinando
as equações 6.13 e 6.34,
1
H(r) = − 3
8π
h
k k·
−ik·r i
i m(k)e
P
k2
i
eik·r dk
(6.47)
e integrando em coordenadas cilíndricas no espaço de Fourier. As componentes do campo
local, integrando em coordenadas cilíndricas e fazendo a média sobre a espessura do disco
(apêndice B), serão dadas por, para α, β = x, y,
gαgβ β
1 X
f
(gt)
m (g) cos(g · ρ),
a2 β,g
g2
(6.48)
1 X
[1 − f (gt)] mz (g) cos(g · ρ).
a2 g
(6.49)
H α (ρ) = −
H z (ρ) = −
Supondo uma magnetização próxima da saturação na direcção do campo aplicado,
admitindo na equação 6.44 as amplitudes, infinitesimais e uniformes, de precessão µy e
µz , ou seja, m(ρ) = (M, µy , µz ), e calculando as transformadas de Fourier de cada uma das
componentes da magnetização, podemos identificar os factores de proporcionalidade entre
as componentes da magnetização e do campo com os elementos do tensor desmagnetizante
(secção 6.2.1),
N
αβ
g α g β J1 (gR)
2πR X
(ρ) = 2
f (gt) 2
cos(g · ρ)
a
g
g
g
(6.50)
2πR X
J1 (gR)
[1 − f (gt)]
cos(g · ρ),
2
a
g
g
(6.51)
N zz (ρ) =
sendo nulos os elementos N zx = N xz = N zy = N yz .
Segundo a teoria clássica de ressonância ferromagnética proposta por Kittel [27]1 , a
condição de ressonância é dada por
s
Hr (ρ) =
1
H02 + M 2
[N zz (ρ) − N yy (ρ)]2
N zz (ρ) + N yy (ρ) − 2N xx (ρ)
−M
4
2
(6.52)
A teoria de Kittel assume que o tensor desmagnetizante é diagonal e que a variação da componente
da magnetização paralela ao campo interno é desprezável. Neste caso, as equações de movimento
têm solução analítica, resultando numa divergência na susceptibilidade relativa ao campo alternado
quando a frequência própria de precessão, que depende tanto do campo aplicado como do campo
desmagnetizante, é igual à frequência do campo alternado.
104
6.3 Rede de discos
onde H0 = ω/γ, sendo ω a frequência do campo alternado aplicado e γ é o factor giromagnético do material. O campo de ressonância medido experimentalmente corresponde
ao máximo da absorção em toda a amostra, que iremos aproximar por
δ (Hext − Hr (ρ)) dρ,
I(Hext ) ∝
(6.53)
ρ<R
onde Hext é o campo aplicado. As curvas de absorção calculadas numericamente, usando
as equações 6.53, 6.52, 6.51 e 6.50, são apresentadas na figura 6.9.
a = 1.1 µm
a)
a = 2.5 µm
b)
[10]
[11]
u. a.
u. a.
[10]
[11]
60
80
H (kA/m)
100
120
60
80
100
120
H (kA/m)
Figura 6.9: Intensidade de absorção em função do campo aplicado Hext para a) espaçamento mínimo (a = 1.1 µm) e b) espaçamento máximo (a = 2.5 µm) e geometrias [10]
(φH = 0, a preto) e [11] (φH = π/4, a vermelho). O integral (eq. 6.53) foi aproximado pela
soma sobre 500x500 elementos do disco e a soma na rede recíproca até g = 500 × (2π/a).
Estes resultados, obtidos usando a aproximação de discos uniformemente magnetizados,
exibem já uma anisotropia em relação à direcção do campo aplicado. Na geometria [10]
a curva é mais larga e deslocada para valores mais elevados do campo aplicado do que
na geometria [11]. No entanto, a forma das curvas exibe comportamentos peculiares que
não são observados na experiência e a magnitude da anisotropia é mais pequena do que
a observada experimentalmente.
Estes aspectos devem ser devidos à aproximação de considerar magnetização uniforme
em todo o disco e apenas os termos diagonais do tensor desmagnetizante. O termo N yx
é responsável por um campo H y = −N yx M x , que é perpendicular ao campo aplicado
mas proporcional à magnetização na direcção do campo, o que induz uma deformação na
distribuição da magnetização dentro do disco. De seguida é apresentado um procedimento
variacional que permite estimar essa deformação.
105
6 Partículas de tamanho finito
Magnetização não uniforme
Mantendo a condição de magnetização planar e com magnitude constante em todo o disco,
m(ρ) = M (cos θ(ρ), sin θ(ρ), 0),
(6.54)
a deformação pode ser completamente descrita pelo ângulo θ(ρ), tal que a sua variação
arbitrária e infinitesimal produz uma correspondente variação de magnetização
δm(ρ) = ẑ × m(ρ)δθ(ρ)
(6.55)
onde ẑ é o vector unitário perpendicular ao plano, ou pela sua transformada de Fourier,
na forma da convolução
δm(g) = ẑ ×
X
m(g − g 0 )δθ(g 0 ).
(6.56)
g0
A condição de equilíbrio para esta deformação vai resultar da competição entre a energia
de Zeeman, devido à presença de um campo externo, e a energia magnetostática dentro
de cada partícula e entre partículas, ou seja, a energia total é dada por
Em = −µ0 H ext · m0 +
[g · m(g)] [g · m(−g)]
µ0 X
f (gt)
2
2a g
g2
(6.57)
onde m0 = m(g = 0) é a magnetização total do sistema e H ext é o campo aplicado.
Usando um tratamento variacional, esta energia pode ser minimizada substituindo m(g)
por m(g) + δm(g) e escrevendo os coeficientes de cada δθ(g 0 ) na condição δE = 0, o que,
desprezando os termos de segunda ordem em 1/Hext , leva ao sistema de equações
h
[g · m(g)] g · ẑ ×
1 X
H ext · (ẑ × m(−g 0 )) = 2
f (gt)
a g
g2
P
g0
i
m(g − g 0 )
(6.58)
ou, usando as propriedades do produto triplo,
(H ext × m(−g 0 )) · ẑ =
[g · m(g)] [(g × m(g − g 0 )) · ẑ]
1 X
f
(gt)
.
a2 g
g2
(6.59)
Este cálculo é simplificado se supusermos que o campo está sempre aplicado na direcção
do eixo x, e rodando a rede para estudar a anisotropia em função do ângulo que o campo
faz com os eixos da rede. Com o campo aplicado na direcção x, é esta também a maior
componente da magnetização, e a deformação é descrita pela componente y
106
6.3 Rede de discos
my (g) =
1
X
Hext a2
g 0 6=0
f (g 0 t)
[m(g 0 ) · g 0 ] [(m(g − g 0 ) × g0 ) · ẑ]
g 02
(6.60)
(onde trocámos os índices g e g 0 ). Esta expressão pode ser resolvida de forma iterativa,
calculando a iteração n a partir da iteração n − 1,
m(n)
y (g) =
h
1
Hext
X
a2
f (g 0 t)
m(n−1) (g 0 ) · g 0
i h
m(n−1) (g − g 0 ) × g0 · ẑ
i
g 02
g0
.
(6.61)
Começamos por notar que, para campos suficientemente fortes para saturar a magnetização, esta seria dada, como já vimos, por
m(0)
x (g) = 2πM R
J1 (gR)
e m(0)
y (g) = 0,
g
(6.62)
onde o índice zero corresponde à condição inicial da iteração auto-consistente. Sendo
assim, a primeira iteração da equação resulta
m(1)
y (g)
0 0
0
0
4π 2 M 2 R2 X
0 gx gy J1 (g R) J1 ((g − g )R)
=−
f
(g
t)
Hext a2 g0
g 02
g0
g − g0
(6.63)
onde já podemos encontrar uma fonte de anisotropia no termo gx0 gy0 , que não é invariante face a uma rotação da rede. A magnetização no espaço real é obtida através da
transformada de Fourier inversa, resultando em
m(1)
y (ρ) = −Θ (R − ρ)
gx gy
2πM 2 R2 X
f
(gt)
J1 (gR) cos (g · ρ)
Hext a2 g
g3
(6.64)
e a componente x pode ser calculada através da condição de normalização mx (ρ) =
q
M 2 − m2y (ρ). Somando sobre os vectores da rede recíproca
g = (2π/a)(n1 cos φH − n2 sin φH , n1 sin φH + n2 cos φH )
(6.65)
para φH = 0 e φH = π/4, é possível verificar que a deformação é substancialmente menor
no caso da orientação φH = π/4 ([11]) do que no caso φH = 0 [10] (figura 6.10), o que
está qualitativamente de acordo com os resultados experimentais, nomeadamente o facto
de a largura da linha de absorção ser maior no caso [10] do que no caso [11].
Para além disso, no caso [11], a deformação é convexa perto do centro do disco, e côncava
perto da periferia, enquanto que no caso [10] é sempre côncava, como no caso de um disco
isolado. Este efeito deverá ser devido a uma competição entre o campo desmagnetizante
107
6 Partículas de tamanho finito
0.1
[10]
[11]
0.2
0
0.1
my/M
my/M
-0.1
0
-0.2
-0.1
r = 0.3
r = 0.45
-0.3
-0.4
0
-0.2
0.1
0.2
r
0.3
0.4
0.5
0
π/4
π/2
θ
3π/4
π
Figura 6.10: Variação radial (a), ao longo da direcção de deformação máxima, e angular
(b), para r = 0.3 (linha sólida) e r = 0.45 (linha tracejada), da componente y da magnetização (eq. 6.64), para as geometrias [10] (a preto) e [11] (a vermelho), com espaçamento
entre discos a = 1.1 µm. Note-se que a magnitude da deformação é sempre maior no caso
[10] do que [11], tendo sinais opostos na zona central e coincidentes junto à periferia do
disco.
devido à forma da partícula, que produz sempre uma deformação dirigida para o interior
do disco, e o campo devido aos outros discos da rede, que depende da orientação do campo
externo relativamente aos eixos da rede. Este comportamento foi também verificado nas
simulações micro-magnéticas apresentadas por Kakazei et al. [150], e não pode ser descrito
por modelos de um único parâmetro como o que foi apresentado por Metlov [152].
6.4 Conclusões
Neste capítulo, foi abandonada a aproximação de dipolos pontuais e apresentado um
procedimento geral de introdução da forma das partículas no cálculo de campos e energias magnetostáticas. Foram verificados alguns resultados conhecidos para partículas
com magnetização uniforme e o procedimento foi generalizado para o caso de sistemas
periódicos. No caso particular de uma rede de discos uniformemente magnetizados, foi
calculada a distribuição do campo magnético no interior de cada disco e desenvolvido um
tratamento de dinâmicas de precessão magnética quase uniforme para esta distribuição
dos campos internos. A diferença entre as distribuições de campos de ressonância locais
em duas geometrias características permite explicar a anisotropia verificada em experiências de ressonância ferromagnética. Foi ainda introduzido um procedimento variacional
iterativo para calcular deformações na magnetização de partículas com forma de discos
devido tanto a esta forma como à interacção com outras partículas idênticas, deforma-
108
6.4 Conclusões
ção esta que deverá contribuir para o aumento da anisotropia relativamente à verificada
quando considerámos a magnetização uniforme. A introdução desta deformação torna
necessário o abandono da aproximação de Kittel à condição de ressonância, pelo que deverá ser necessária a integração numérica das equações de movimento para reproduzir
quantitativamente os resultados experimentais.
109
6 Partículas de tamanho finito
110
7 Considerações finais
Esta dissertação reflecte alguns dos aspectos mais relevantes do trabalho científico levado
a cabo pelo autor durante o período de Doutoramento. Segue-se um resumo dos principais
resultados.
• Foi apresentado um método geral de expansão de altas temperaturas que permite
a validação nesse regime de simulações de Monte Carlo para sistemas de momentos
magnéticos com interacção arbitrária, e foi proposta uma forma diagramática que
pode permitir levar esta expansão a ordens superiores.
• Dados os problemas de convergência de simulações de Monte Carlo em sistemas
dipolares, foram aplicados diversos métodos de simulação com vista a ultrapassar
estes problemas. Nesta dissertação, optou-se por uma combinação do método de Parallel Tempering com uma optimização específica da taxa de aceitação que permitiu
uma redução significativa dos tempos de autocorrelação e consequente melhoria da
precisão das simulações.
• Estes métodos permitiram caracterizar o comportamento crítico de redes regulares
de dipolos pontuais e as correlações magnéticas em sistemas desordenados, contribuindo para um conhecimento mais completo dos efeitos colectivos com aplicações
em diversas áreas da nanotecnologia.
• No sentido de descrever melhor os sistemas experimentais, foi levantada a aproximação de dipolos pontuais. Combinando um método geral de introdução da forma
das partículas no cálculo dos campos magnetostáticos, foi calculada a distribuição
de campos no interior de discos dispostos numa rede quadrada, em função do espaçamento entre discos e da magnitude e orientação do campo aplicado, assumindo
discos uniformemente magnetizados, o que permitiu explicar a anisotropia encontrada em experiências de ressonância ferromagnética. Utilizando um procedimento
variacional, foi ainda calculada a deformação da magnetização no interior dos discos, o que mostrou a existência de uma competição entre o campo desmagnetizante
devido à forma das partículas e o campo de interacção com os outros discos da rede.
111
7 Considerações finais
Naturalmente, estes resultados levantaram outras questões que ficaram em aberto. Algumas formas de continuar este trabalho seriam:
• Automatização do cálculo da expansão de altas temperaturas para ordens superiores
e para outras grandezas, de forma a poder validar, no regime de altas temperaturas,
mais resultados das simulações de Monte Carlo.
• Optimização das simulações de Parallel Tempering, através da maximização do número de viagens de ida-e-volta nas temperaturas e/ou através da utilização de algoritmos de cluster, de forma a permitir a simulação de sistemas maiores.
• Aplicação destes métodos ao estudo de diferentes redes ordenadas de dipolos pontuais, e introdução gradual de desordem posicional nessas redes.
• Modificação da interacção entre partículas para ter em conta as correcções de tamanho finito das partículas.
• Tratamento completo da dinâmica magnética na rede quadrada de discos, abandonando a aproximação de Kittel e incluindo tanto os elementos não-diagonais do
tensor desmagnetizante como a deformação da magnetização no interior dos discos.
Para além dos resultados científicos, resultaram também destes trabalhos contribuições
técnicas para a capacidade computacional do Centro de Física do Porto, como a implementação e administração de clusters para computação científica, e o aprofundamento de
técnicas de programação, optimização e paralelização e algoritmos de computação científica. Também nestes aspectos mais técnicos, muitos aspectos podem ser melhorados,
entre eles:
• Reformulação do código, tendo em conta metodologias de programação orientada
por objectos como os padrões de design, com vista a criar uma framework de simulação que permita experimentar de forma mais ágil diferentes algoritmos de simulação.
• Utilização de formatos de dados mais apropriados à representação de séries temporais e campos escalares e vectoriais, incluindo mais meta-dados relativos à simulação.
• Paralelização híbrida (tanto em memória partilhada como distribuída) das simulações, com vista à simulação de maiores tamanhos de rede.
• Aceleração por hardware, com recurso a processadores gráficos, da rotina de actualização de campos (a mais intensiva computacionalmente), com vista à simulação
de maiores tamanhos de rede.
112
Apêndices
113
7 Considerações finais
114
A Médias livres
Para calcular médias num sistema com interacções à custa de médias num sistema sem
interacções, é necessário calcular exactamente as médias livres
dµ O e−βHZ
hOi0 = −βH
dµ e
Z
(A.1)
e as suas derivadas em ordem aos campos locais. Para tal vamos escrever o campo em cada
partícula como uma componente constante, o campo externo, mais pequenas variações
em torno desse campo,
H i = H + hi
Figura A.1: Ângulo entre o momento e o campo externo
Se definirmos o ângulo θHµ como o ângulo que o momento µi faz com o campo externo
H (figura A.1), o produto escalar no Hamiltoniano de Zeeman pode escrever-se, em
qualquer sistema de coordenadas, como
µi · H i = µi H cos θHµ + µi · hi
e a exponencial
eβµi ·H i = eβµi H cos θHµ eβµi ·hi
115
A Médias livres
pode ser expandida, para hαi H, e escrever-se
eβµi H cos θHµ (1 + βµi · hi + ...)
Substituindo em A.1
hOi i0,H+h '
dµ Oi eβµi H cos θHµ + β
dµ eβµi H cos θHµ + β
dµ Oi µi eβµi H cos θHµ · hi
dµ µi eβµi H cos θHµ · hi
.
Dado que
a bc − ad
a+b·h
' +
·h
c+d·h
c
c2
podemos escrever, em primeira ordem,
hOi i0,H+h ' hOi i0 + βhαi {hOi µαi i0 − hOi i0 hµαi i0 } .
A derivada em ordem ao campo, no limite em que as variações tendem para zero, é
dada então por
∂
hAi i0,h→0 ' β {hAi µαi i0 − hAi i0 hµαi i0 } .
α
∂hi
As derivadas que encontrámos na expansão da energia livre até segunda ordem podem
então ser escritas como
∂
κ α
hµκk i0 ≡ δik ∂α mκi = δik β (mκα
i − mi mi )
∂hαi
∂ D κ λE
κλ
κλα
κλ α
m
µ
µ
≡
δ
∂
m
=
δ
β
m
−
m
ik
α
ik
i
i
i
i .
k k 0
∂hαi
Estes integrais vão depender do grau de liberdade dos momentos, isto é, se estão confinados a um eixo (Ising), a um plano (XY) ou livres para rodar no espaço (Heisenberg).
Ao longo deste trabalho, considerámos sempre momentos livres para rodar no espaço.
Escolhendo coordenadas esféricas com inclinação θ relativamente à direcção do campo e
azimute φ no plano perpendicular a essa direcção, a média livre de qualquer observável
de uma única partícula (sabendo que podemos sempre separar médias livres em médias
de uma única partícula) é sempre dada por
116
π 2π
hOi i0 =
Oi eβhi cos θ sin θdθdφ
π 0 2π
0
0
0
eβhi cos θ sin θdθdφ
(A.2)
1 2π
Oi eβhi u dφdu
−1 0
1 2π
eβhi u dφdu
−1 0
=
onde fizemos a mudança de variável u = cos θ.
Quando, como nos casos que nos interessam, a observável O depende apenas de combinações de componentes dos momentos, que se escrevem à custa de senos e cossenos de θ e
φ, estes integrais têm sempre solução analítica. Em particular, até ao termo de segunda
ordem é necessário calcular
1 2π
k
µi
0
D
E
u eβhi u dφdu
1
≡ L(βhi )
= −11 0 2π
= coth(βhi ) −
βhi u dφdu
βh
i
e
−1 0
1 2π
D
E
µ⊥
i 0
=
−1
0
cos φeβhi u dφdu
1 2π
−1
1 2π
=
−1
0
0
sin φeβhi u dφdu
1 2π
−1
eβhi u dφdu
0
eβhi u dφdu
= 0
k 2
µi
1 2π
0
=
=
u2 eβhi u dφdu
−1 0
1 2π
−1 0
eβhi u dφdu
L(βhi )
1−2
βhi
!
117
A Médias livres
2
µ⊥
i
1 2π
=
0
−1
10
−1
2π
0
1 2π
=
cos2 φ eβhi u dφdu
−1
sin2 φ eβhi u dφdu
10 2π
−1
eβhi u dφdu
0
eβhi u dφdu
L(βhi )
βhi
=
e assim sucessivamente. As expressões para as médias livres envolvendo produtos de
uma, duas e três componentes podem ser resumidas da seguinte forma:
Uma componente
• Média livre da componente paralela ao campo
k
D
µi
E
0
= L(βH)
• Média livre da componente perpendicular ao campo
D
µ⊥
i
E
=0
0
Produto de duas componentes
• Média livre do quadrado da componente paralela ao campo
k 2
µi
0
=1−2
L(βH)
βH
• Média livre do quadrado da componente perpendicular ao campo
µ⊥
i
2 0
=
L(βH)
βH
• Termos cruzados
D
k
µi µ⊥
i
E
0
=0
Produto de três componentes
• Média livre do cubo da componente paralela ao campo
118
k 3
µi
0
=
−2βH + (6 + H 2 β 2 ) L(βH)
β 2H 2
• Média livre do produto da componente paralela com o quadrado de uma componente
perpendicular
k
µi
2
µ⊥
i
0
=
Hβ − 3L(βH)
β 2H 2
• Média livre do produto do quadrado da componente paralela com uma componente
perpendicular
k 2
µi
µ⊥
i
0
=0
• Em todos os restantes casos, em que não existe nenhuma componente paralela ao
plano, o resultado é nulo.
Genericamente, estes integrais podem escrever-se como
2π
=
0
k n
µi
m
1
µ⊥
i
(cos φ)m (sin φ)l dφ
2π
1
−1
l
2
µ⊥
i
0
=
m+l
un (1 − u2 )
eβHu du
2 sinh (βH) / (βH)
1
2
onde µ⊥
e µ⊥
são duas componentes ortogonais no plano perpendicular ao campo aplii
i
cado.
119
A Médias livres
120
B Amplitudes de forma
Para exemplificar o formalismo apresentado no capítulo 6, calculamos aqui as amplitudes
de forma de uma esfera e de um cilindro, bem como as respectivas energias magnetostáticas
no caso de corpos uniformemente magnetizados.
Esfera
Figura B.1: Representação esquemática de uma esfera uniformemente magnetizada
A amplitude de forma de uma esfera de raio R (figura B.1) é obtida integrando
D(k) =
e−ik·r dr
(B.1)
V
em coordenadas esféricas, resultando em
D(k) =
4πR2
j1 (kR),
k
(B.2)
onde jn (x) é a função esférica de Bessel, relacionada com a mais comum função cilíndrica
de Bessel Jn (x) por
r
π
jn (x) =
Jn+1/2 (x)
(B.3)
2x
121
B Amplitudes de forma
A energia magnetostática de uma esfera uniformemente magnetizada resulta de substituir a amplitude de forma correspondente na equação 6.17 e integrar mais uma vez em
coordenadas esféricas,
2π
µ0 M 2 R 3 .
(B.4)
Em =
9
O mesmo formalismo permite mostrar que o campo no exterior de uma esfera uniformemente magnetizada corresponde exactamente ao campo produzido por um dipolo pontual
[147].
Cilindro
Já se a partícula for de forma cilíndrica de altura t e raio R , a sua amplitude de forma é
dada por
D(k) =
e−ik·r dr
V
! t/2
=
e−iqz dz
!
e−ig·ρ dρ
(B.5)
−t/2
= 4πR
sin
q
t
q
2
J1 (gR)
,
g
onde mudámos para coordenadas cilíndricas tanto no espaço real, r = (ρ cos θ, ρ sin θ, z),
como no espaço de Fourier, k = (g cos φ, g sin φ, q).
a)
b)
Figura B.2: Representação esquemática de um cilindro uniformemente magnetizado em
a) configuração axial e b) configuração planar.
122
Neste caso, a energia magnetostática
µ0 M 2
Em =
16π 3
|D(k)|2
(m̂ · k)2 dk
2
k
(B.6)
depende da orientação da magnetização, através do termo (m̂ · k)2 , pelo que vamos considerar dois casos em separado: magnetização paralela ou perpendicular ao eixo do cilindro
(figura B.2).
Configuração axial
No caso de magnetização paralela ao eixo do cilindro (figura B.2a), a que iremos chamar
configuração axial, o termo (m̂ · k)2 é dado simplesmente por q 2 e o integral em q escrevese
!
∞
πt 1 − e−gt
sin2 (qt/2)
.
(B.7)
dq =
2
2
2
gt
−∞ (g + q )
Neste caso, a energia magnetostática é dada por
µ0 M 2 2
R (8R + 3πt) + ,
6 #
"
"
2 #!
2
R
R
2
3
2
3
− 4R t + t K −4
,
+ −4R t + t E −4
t
t
axial
Em
=
(B.8)
onde K é o integral elíptico completo de primeira ordem,
∞
(2n − 1)!!
πX
K[x] =
2 n=0
2n!!
!2
(B.9)
x2n
e E o integral elíptico completo de segunda ordem,


!2
∞
X
(2n − 1)!!
x2n 
π
E[x] =
1−
.
2
2n!!
2n − 1 
n=1
(B.10)
Configuração planar
No caso de magnetização perpendicular ao eixo do cilindro (figura B.2b), a que iremos
chamar configuração planar (no plano das faces do cilindro), o integral em q resulta
∞
−∞
sin2 (qt/2)
πt
1 − e−gt
dq
=
1
−
q 2 (g 2 + q 2 )
2g 2
gt
!
(B.11)
123
B Amplitudes de forma
e a energia magnetostática é dada por
µ0 M 2 3
8R +
# 12
planar
Em
=−
+ −4R t + t
2
3
"
R
E −4
t
2
− 4R t + t
2
3
(B.12)
"
K −4
R
t
2 #!
o que permite verificar, numericamente, que para t . 1.81R, a configuração planar tem
uma energia menor à da configuração axial.
124
C Lista de publicações
O resultado visível, em termos de publicações, do trabalho científico levado a cabo durante
o período de Doutoramento, incluindo colaborações em trabalhos para além dos que estão
descritos nesta dissertação, pode ser encontrado nos seguintes artigos1 :
Métodos de Monte Carlo
Optimized multicanonical simulations: A proposal based on classical
fluctuation theory
• Autores: Lopes, JV; Costa, MD; Lopes dos Santos, JMB; Toral, R
• Publicação: Physical Review E 74, 046702 (2006)
Abstract: “We propose a recursive procedure to estimate the microcanonical density of
states in multicanonical Monte Carlo simulations which relies only on measurements of
moments of the energy distribution, avoiding entirely the need for energy histograms.
This method yields directly a piecewise analytical approximation to the microcanonical
inverse temperature β(E) and allows improved control over the statistics and efficiency of
the simulations. We demonstrate its utility in connection with recently proposed schemes
for improving the efficiency of multicanonical sampling, either with adjustment of the
asymptotic energy distribution or with the replacement of single spin flip dynamics with
collective updates.“
Analytical study of tunneling times in flat histogram Monte Carlo
• Autores: Costa, MD; Lopes, JV; Lopes dos Santos, JMB
• Publicação: Europhysics Letters 72, 5, 802-808 (2005)
1
A lista actualizada de publicações pode ser encontrada aqui: http://www.researcherid.com/rid/
A-6968-2008
125
C Lista de publicações
Abstract: “We present a model for the dynamics in energy space of multicanonical simulation methods that lends itself to a rather complete analytic characterization. The
dynamics is completely determined by the density of states. In the ±J 2D spin glass the
transitions between the ground state level and the first excited one control the long time
dynamics. We are able to calculate the distribution of tunneling times and relate it to the
equilibration time of a starting probability distribution. In this model, and possibly in
any model in which entering and exiting regions with low density of states are the slowest
processes in the simulations, tunneling time can be much larger (by a factor of O(N))
than the equilibration time of the probability distribution. We find that these features
also hold for the energy projection of single spin flip dynamics.“
Modelos com Interacção Dipolar
Apparent phase transition in a chain of magnetic dipoles?
• Autores: Pogorelov, YG; Costa, MD
• Publicação: Journal Of Magnetism And Magnetic Materials 272, E979-E980 (2004)
Abstract: “Considering chains of classical spins coupled by long-range interactions ∝ r−σ ,
we show a qualitative difference between the critical behaviour of systems with isotropic
and anisotropic interactions, as seen from the analysis of the Binder cumulant by Monte
Carlo simulations. Unlike the known absence of long range order in isotropic case for
sv>2, we found indications of finite critical temperatures in the anisotropic case even for
sv as high as 3, related to dipolar coupling.”
Continuum model for dipolar coupled planar lattices
• Autores: Costa, MD; Pogorelov, YG
• Publicação: Journal Of Magnetism And Magnetic Materials 258, 32-34 (2003)
Abstract: “In an effective continuum approach alike the phenomenological Landau theory,
we study low energy excitations in a square lattice of dipolar coupled magnetic moments
µ, over continuously degenerate microvortex (MV) ground states defined by an arbitrary
angle 0 < θ < π/2. We consider two vector order parameters: the MV vector v =
µ(cos θ, sin θ) and the ferromagnetic (FM) vector f = 21 (∂y vx , −∂x vy ). The excitation
energy density ∼ f 2 leads to a non-linear Euler equation. It allows, besides common linear
waves of small amplitude, also non-linear excitations with unlimited (but slow) variation of
126
θ(r). For plane wave excitations θ(r) = θ(n · r) propagating along n = (cos φ, sin φ), exact
integrals of Euler equation are found. The density of excitation states turns anisotropic
in θ, conforming to the enhanced occurrence of MV-like states with θ close to 0 or π/2 in
our Monte Carlo simulations of this system at low excitation energies.“
Criteria for long-range magnetic order in planar lattices of dipolar
coupled magnetic nanoparticles
• Autores: Costa, MD; Pogorelov, YG
• Publicação: Physica Status Solidi A-Applied Research 189, 3, 923-927 (2002)
Abstract: “The conditions are sought for the dipolar interactions in a planar lattice of
separate magnetic nanogranules to bring this system from the initially frustrated ground
state to a long-range ferromagnetic (FM) order. This is promoted by lowering the symmetry: either of the lattice (e.g., from square to rectangular (a > b)) for point-like or
spherical granules, or of a finite-size granule (e.g., from spherical to rod-like or to disk-like)
on square lattice. The FM order turns possible after some critical values of asymmetry
parameters, though the system energy may behave non-analytically in these parameters.
The comparison is done with the available experimental data.”
Interpretação de Resultados Experimentais
Collective dynamics and ferromagnetic order in random planar arrays
of magnetic granules
• Autores: Pogorelov, YG; Kakazei, GN; Costa, MD; Sousa, JB
• Publicação: Journal Of Applied Physics 103, 07B723 (2008)
Abstract: “A dynamical study is done on existence and stability of ferromagnetically ordered ground state in a positionally disordered planar array of magnetic moments coupled
only by dipolar forces. Starting from almost aligned ground state under a strong enough
applied field, the excitation energy spectrum and related eigenmodes are found, permitting to develop a mean-field analysis of the static magnetization in function of magnetic
field and temperature. In the limit of zero applied field, the stability conditions are obtained for the onset of in-plane spontaneous magnetization, manifesting a specific ’order
from disorder’ mechanism.”
127
C Lista de publicações
Probing arrays of circular magnetic microdots by ferromagnetic
resonance
• Autores: Kakazei, GN; Mewes, T; Wigen, PE; Hammel, PC; Slavin, AN; Pogorelov,
YG; Costa, MD; Golub, VO; Guslienko, KYu; Novosad, V
• Publicação: Journal Of Nanoscience And Nanotechnology 8, 6, 2811-2826 (2008)
Abstract: “X-band ferromagnetic resonance (FMR) was used to characterize in-plane
magnetic anisotropies in rectangular and square arrays of circular nickel and Permalloy
microdots. In the case of a rectangular lattice, as interdot distances in one direction
decrease, the in-plane uniaxial anisotropy field increases, in good agreement with a simple theory of magnetostatically interacting uniformly magnetized dots. In the case of a
square lattice a four-fold anisotropy of the in-plane FMR field H(r) was found when the
interdot distance a gets comparable to the dot diameter D. This anisotropy, not expected
in the case of uniformly magnetized dots, was explained by a non-uniform magnetization
m(r) in a dot in response to dipolar forces in the patterned magnetic structure. It is
well described by an iterative solution of a continuous variation procedure. In the case
of perpendicular magnetization multiple sharp resonance peaks were observed below the
main FMR peak in all the samples, and the relative positions of these peaks were independent of the interdot separations. Quantitative description of the observed multiresonance
FMR spectra was given using the dipole-exchange spin wave dispersion equation for a
perpendicularly magnetized film where in-plane wave vector is quantized due to the finite
dot radius, and the inhomogenetiy of the intradot static demagnetization field in the nonellipsoidal dot is taken into account. It was demonstrated that ferromagnetic resonance
force microscopy (FMRFM) can be used to determine both local and global properties of
patterned submicron ferromagnetic samples. Local spectroscopy together with the possibility to vary the tip-sample spacing enables the separation of those two contributions to
a FMRFM spectrum. The global FMR properties of circular submicron dots determined
using magnetic resonance force microscopy are in a good agreement with results obtained
using conventional FMR and with theoretical descriptions.“
Origin of fourfold anisotropy in square lattices of circular
ferromagnetic dots
• Autores: Kakazei, GN; Pogorelov, YG; Costa, MD; Mewes, T; Wigen, PE; Hammel,
PC; Golub, VO; Okuno, T; Novosad, V
• Publicação: Physical Review B 74 060406(R) (2006)
128
Abstract: “We discuss the fourfold anisotropy of the in-plane ferromagnetic resonance
field Hr, found in a square lattice of circular Permalloy dots when the interdot distance
a becomes comparable to the dot diameter d. The minimum Hr along the lattice h11i
axes and the maximum along the h10i axes differ by ~50 Oe at a/d=1.1. This anisotropy,
not expected in uniformly magnetized dots, is explained by a mechanism of nonuniform
magnetization m(r) in a dot in response to dipolar forces in the patterned magnetic
structure under strong enough applied field. It is well described by an iterative solution
of a continuous variational procedure.”
Interlayer dipolar interactions in multilayered granular films
• Autores: Kakazei, GN; Pogorelov, YG; Costa, MD; Golub, VO; Sousa, JB; Freitas,
PP; Cardoso, S; Wigen, PE
• Publicação: Journal Of Applied Physics 97, 10A723-10A723-3 (2005)
Abstract: “Using the ferromagnetic resonance (FMR) technique, the interlayer coupling
is studied in granular multilayered system (CoFe/Al2O3)n with varying number of layers
n=1,...,8. The main difference between the cases of n=1 and n>=3 is a notable splitting
of FMR line under external field normal to layers. This is explained by an interlayer
dipolar coupling, only possible for discontinuous layers. The relative magnitudes of two
absorption peaks and distance between them are described by a simple model of planar
square lattices of magnetic dipoles.“
129
C Lista de publicações
130
Bibliografia
[1] R. P. Cowburn. Property variation with shape in magnetic nanoelements. Journal
of Physics D: Applied Physics, 33(1):R1–R16, 2000.
[2] K. Yu. Guslienko. Magnetostatic interdot coupling in two-dimensional magnetic dot
arrays. Applied Physics Letters, 75(3):394–396, July 1999.
[3] Philip Moriarty.
64(3):297, 2001.
Nanostructured materials.
Reports on Progress in Physics,
[4] S.D. Bader. Magnetism in low dimensionality. Surface Science, 500(1-3):172–188,
March 2002.
[5] S. D. Bader. Colloquium: Opportunities in nanomagnetism. Reviews of Modern
Physics, 78(1):1–15, 2006.
[6] R. Skomski. Nanomagnetics. Journal of Physics: Condensed Matter, 15(20):R841,
2003.
[7] Gary A. Prinz. Magnetoelectronics. Science, 282(5394):1660–1663, November 1998.
[8] Ca Ross. Patterned magnetic recording media. Annual Review of Materials Research, 31(1):203–235, 2001.
[9] Andreas Moser, Kentaro Takano, David T Margulies, Manfred Albrecht, Yoshiaki
Sonobe, Yoshihiro Ikeda, Shouheng Sun, and Eric E Fullerton. Magnetic recording:
advancing into the future. Journal of Physics D: Applied Physics, 35(19):R157,
2002.
[10] A O Adeyeye and N. Singh. Large area patterned magnetic nanostructures. Journal
of Physics D: Applied Physics, 41(15):153001, 2008.
[11] C.L. Chien, F.Q. Zhu, and J.G. Zhu. Patterned nanomagnets. Physics Today,
60(6):40–45, June 2007.
131
Bibliografia
[12] S. Tehrani, E. Chen, M. Durlam, M. DeHerrera, J. M. Slaughter, J. Shi, and
G. Kerszykowski. High density submicron magnetoresistive random access memory
(invited). In J. Appl. Phys., volume 85, pages 5822–5827. AIP, April 1999.
[13] S. Tehrani, J.M. Slaughter, M. Deherrera, B.N. Engel, N.D. Rizzo, J. Salter, M. Durlam, R.W. Dave, J. Janesky, B. Butcher, K. Smith, and G. Grynkewich. Magnetoresistive random access memory using magnetic tunnel junctions. Proceedings of
the IEEE, 91(5):703–714, 2003.
[14] R. P. Cowburn and M. E. Welland. Room temperature magnetic quantum cellular
automata. Science, 287(5457):1466–1468, February 2000.
[15] G. Csaba, A. Imre, G.H. Bernstein, W. Porod, and V. Metlushko. Nanocomputing
by field-coupled nanomagnets. Nanotechnology, IEEE Transactions on, 1(4):209–
213, 2002.
[16] D. A. Allwood, Gang Xiong, M. D. Cooke, C. C. Faulkner, D. Atkinson, N. Vernier,
and R. P. Cowburn. Submicrometer ferromagnetic NOT gate and shift register.
Science, 296(5575):2003–2006, June 2002.
[17] A. Imre, G. Csaba, L. Ji, A. Orlov, G. H. Bernstein, and W. Porod. Majority logic
gate for magnetic Quantum-Dot cellular automata. Science, 311(5758):205–208,
2006.
[18] Briefing
2:
Nanotechnology
and
http://www.foresight.org/updates/Briefing2.html.
enabling
technologies.
[19] A. E. Berkowitz, J. R. Mitchell, M. J. Carey, A. P. Young, S. Zhang, F. E. Spada,
F. T. Parker, A. Hutten, and G. Thomas. Giant magnetoresistance in heterogeneous
Cu-Co alloys. Physical Review Letters, 68(25):3745, June 1992.
[20] M. N. Baibich, J. M. Broto, A. Fert, F. Nguyen Van Dau, F. Petroff, P. Etienne, G. Creuzet, A. Friederich, and J. Chazelas. Giant magnetoresistance of
(001)Fe/(001)Cr magnetic superlattices. Physical Review Letters, 61(21):2472, November 1988. Copyright (C) 2009 The American Physical Society; Please report
any problems to [email protected].
[21] Richard P. Feynman. There’s plenty of room at the bottom. Engineering and
Science, 23(5), 1960.
132
Bibliografia
[22] K. Eric Drexler. Molecular engineering: An approach to the development of general
capabilities for molecular manipulation. Proceedings of the National Academy of
Sciences of the United States of America, 78(9):5275–5278, 1981.
[23] G. Binnig, H. Rohrer, Ch. Gerber, and E. Weibel. Surface studies by scanning
tunneling microscopy. Physical Review Letters, 49(1):57, July 1982.
[24] G. Binnig, C. F. Quate, and Ch. Gerber. Atomic force microscope. Physical Review
Letters, 56(9):930, March 1986.
[25] Y. Martin and H. K. Wickramasinghe. Magnetic imaging by “force microscopy” with
1000 [A-ring] resolution. Applied Physics Letters, 50(20):1455–1457, May 1987.
[26] J. H. E. Griffiths. Anomalous high-frequency resistance of ferromagnetic metals.
Nature, 158(4019):670–671, 1946.
[27] Charles Kittel. On the theory of ferromagnetic resonance absorption. Physical
Review, 73(2):155, 1948.
[28] John David Jackson. Classical Electrodynamics Third Edition. Wiley, 3 edition,
August 1998.
[29] Ralph Skomski. Simple models of magnetism. Oxford University Press, 2008.
[30] J. M. Luttinger and L. Tisza. Theory of dipole interaction in crystals. Physical
Review, 70(11-12):954, December 1946.
[31] E. J. S Lage. Física Estatística. Manuais universitários. Fundação Calouste Gulbenkian, Lisboa, 1995.
[32] Ryogo Kubo. Generalized cumulant expansion method. Journal of the Physical
Society of Japan, 17:1100–1120, 1962.
[33] R. A. Fisher and J. Wishart. The derivation of the pattern formulae of Two-Way
partitions from those of simpler patterns. Proceedings of the London Mathematical
Society, 2(1):195, 1932.
[34] Donald L. Kreher and Douglas Robert Stinson. Combinatorial algorithms. CRC
Press, 1999.
[35] Noboru Fukushima. A new method of the high temperature series expansion. Journal of Statistical Physics, 111(5):1049–1090, June 2003.
133
Bibliografia
[36] Faà di Bruno. Sullo sviluppo delle funzioni. Annali di Scienze Matematiche e
Fisiche, 6:479–480, 1855.
[37] Mark E. J. Newman and G. T. Barkema. Monte Carlo methods in statistical physics.
Oxford University Press, 1999.
[38] Nicholas Metropolis, Arianna W. Rosenbluth, Marshall N. Rosenbluth, Augusta H.
Teller, and Edward Teller. Equation of state calculations by fast computing machines. The Journal of Chemical Physics, 21(6):1087–1092, June 1953.
[39] G. M. Torrie and J. P. Valleau. Nonphysical sampling distributions in monte carlo
free-energy estimation: Umbrella sampling. Journal of Computational Physics,
23(2):187–199, February 1977.
[40] Jooyoung Lee. New monte carlo algorithm: Entropic sampling. Physical Review
Letters, 71(2):211, July 1993.
[41] Bernd A. Berg and Tarik Celik. New approach to spin-glass simulations. Physical
Review Letters, 69(15):2292, October 1992.
[42] Bernd A. Berg and Thomas Neuhaus. Multicanonical ensemble: A new approach
to simulate first-order phase transitions. Physical Review Letters, 68(1):9, 1992.
[43] Fugao Wang and D. P. Landau. Efficient, Multiple-Range random walk algorithm
to calculate the density of states. Physical Review Letters, 86(10):2050, March 2001.
[44] Miguel Dias Costa. Estados magnéticos de sistemas com interacção dipolar baseados
em redes planares. PhD thesis, Departamento de Física da FCUP, 2001. Supervisor:
Yuri G. Pogorelov.
[45] Robert H. Swendsen and Jian-Sheng Wang. Replica monte carlo simulation of SpinGlasses. Physical Review Letters, 57(21):2607, November 1986.
[46] E. Marinari and G. Parisi. Simulated tempering: a new monte carlo scheme. Europhys. Lett, 19(6):451–458, 1992.
[47] A. P. Lyubartsev, A. A. Martsinovski, S. V. Shevkunov, and P. N. VorontsovVelyaminov. New approach to monte carlo calculation of the free energy: Method of
expanded ensembles. The Journal of Chemical Physics, 96(3):1776–1783, February
1992.
134
Bibliografia
[48] Koji Hukushima and Koji Nemoto. Exchange monte carlo method and application
to spin glass simulations. Journal of the Physical Society of Japan, 65:1604–1608,
1996.
[49] Elmar Bittner, Andreas Nussbaumer, and Wolfhard Janke. Make life simple: Unleash the full power of the parallel tempering algorithm. Physical Review Letters,
101(13):130603–4, 2008.
[50] Joao Manuel Viana Parente Lopes. Métodos de Monte Carlo para sistemas com
desordem e interacção de longo alcance. Tese de Doutoramento. 2006.
[51] Helmut G Katzgraber, Simon Trebst, David A Huse, and Matthias Troyer.
Feedback-optimized parallel tempering monte carlo. cond-mat/0602085, February
2006. J. Stat. Mech. P03018 (2006).
[52] Robert H. Swendsen and Jian-Sheng Wang. Nonuniversal critical dynamics in monte
carlo simulations. Physical Review Letters, 58(2):86, 1987.
[53] Ulli Wolff. Collective monte carlo updating for spin systems. Physical Review
Letters, 62(4):361, 1989.
[54] Kouki Fukui and Synge Todo. Order-N cluster monte carlo method for spin systems
with long-range interactions. Journal of Computational Physics, 228(7):2629–2642,
April 2009.
[55] Kurt Binder and Dieter W. Heermann. Monte Carlo Simulation in Statistical Physics. Springer, 4th, enlarged ed. edition, August 2002.
[56] H. G Katzgraber. Scientific software engineering in a nutshell. Imprint, 2009.
[57] Free software foundation. http://www.fsf.org/.
[58] Eclipse.org. http://www.eclipse.org/.
[59] KDevelop. http://www.kdevelop.org/.
[60] Anjuta. http://projects.gnome.org/anjuta/index.shtml.
[61] Subversion. http://subversion.tigris.org/.
[62] Git. http://git-scm.com/.
[63] Mercurial. http://mercurial.selenic.com/wiki/.
135
Bibliografia
[64] Redmine. http://www.redmine.org/.
[65] The trac project. http://trac.edgewall.org/.
[66] GDB: the GNU project debugger. http://www.gnu.org/software/gdb/.
[67] Valgrind home. http://valgrind.org/.
[68] GNU gprof. http://www.cs.utah.edu/dept/old/texinfo/as/gprof_toc.html.
[69] KCachegrind. http://kcachegrind.sourceforge.net/html/Home.html.
[70] Autoconf. http://www.gnu.org/software/autoconf/.
[71] SCons: a software construction tool. http://www.scons.org/.
[72] GCC, the GNU compiler collection. http://gcc.gnu.org/.
[73] Intel® compilers. http://software.intel.com/en-us/intel-compilers/.
[74] GSL - GNU scientific library. http://www.gnu.org/software/gsl/.
[75] Intel® MKL. http://software.intel.com/en-us/intel-mkl/.
[76] AMD core math library. http://developer.amd.com/cpu/Libraries/acml/Pages/default.aspx.
[77] Message passing interface. http://www.mcs.anl.gov/research/projects/mpi/.
[78] Open MPI: open source high performance computing. http://www.open-mpi.org/.
[79] OpenMP. http://openmp.org/wp/.
[80] CUDA zone. http://www.nvidia.com/object/cuda_home.html.
[81] Advanced micro devices, AMD. http://ati.amd.com/technology/streamcomputing/.
[82] The community ENTerprise operating system. http://www.centos.org/.
[83] Cluster software portal. http://www.perceus.org/portal/.
[84] xCAT - extreme cluster administration toolkit. http://xcat.sourceforge.net/.
[85] Sun grid engine. http://gridengine.sunsource.net/.
[86] Cluster resources. http://www.clusterresources.com/products/torque/.
[87] Maui cluster scheduler. http://www.clusterresources.com/products/maui-clusterscheduler.php/.
136
Bibliografia
[88] Ganglia monitoring system. http://ganglia.sourceforge.net/.
[89] Nagios. http://www.nagios.org/.
[90] The multi router traffic grapher. http://oss.oetiker.ch/mrtg/.
[91] NetCDF (network common data form). http://www.unidata.ucar.edu/software/netcdf/.
[92] HDF group - HDF5. http://www.hdfgroup.org/HDF5/.
[93] Grace. http://plasma-gate.weizmann.ac.il/Grace/.
[94] Gnuplot. http://www.gnuplot.info/.
[95] matplotlib. http://matplotlib.sourceforge.net/.
[96] VTK - the visualization toolkit. http://www.vtk.org/.
[97] The MayaVi data visualizer. http://mayavi.sourceforge.net/.
[98] Inkscape. http://www.inkscape.org/.
[99] SciPy. http://www.scipy.org/.
[100] Enthought, inc. :: Scientific computing solutions. http://www.enthought.com/.
[101] Wolfram research:
Mathematica,
http://www.wolfram.com/.
technical
and
scientific
software.
[102] Sage: Open source mathematics software. http://www.sagemath.org/.
[103] Doxygen. http://www.stack.nl/~dimitri/doxygen/.
[104] LyX - the document processor. http://www.lyx.org/.
[105] Zotero. http://www.zotero.org/.
[106] PI Belobrov, RS Gehkt, and VA Ignatchenko. Ground-state on systems with dipole
interactions. Zhurnal Eksperimentalnoi I Teoreticheskoi Fiziki, 84(3):1097–1108,
1983.
[107] PI Belobrov, VA Voevodin, and VA Ignatchenko. Ground-state of a dipole system in a planar rhombic lattice. Zhurnal Eksperimentalnoi I Teoreticheskoi Fiziki,
88(3):889–893, 1985.
137
Bibliografia
[108] J. G. Brankov and D. M. Danchev. Ground state of an infinite two-dimensional
system of dipoles on a lattice with arbitrary rhombicity angle. Physica A: Statistical
and Theoretical Physics, 144(1):128–139, July 1987.
[109] George O. Zimmerman, A. K. Ibrahim, and F. Y. Wu. Planar classical dipolar
system on a honeycomb lattice. Physical Review B, 37(4):2059, February 1988.
[110] Sona Prakash and Christopher L. Henley. Ordering due to disorder in dipolar
magnets on two-dimensional lattices. Physical Review B, 42(10):6574, October 1990.
[111] Freeman J. Dyson. Existence of a phase-transition in a one-dimensional ising ferromagnet. Communications in Mathematical Physics, 12(2):91–107, June 1969.
[112] N. D. Mermin and H. Wagner. Absence of ferromagnetism or antiferromagnetism
in one- or Two-Dimensional isotropic heisenberg models. Physical Review Letters,
17(22):1133, November 1966.
[113] P. Bruno. Absence of spontaneous magnetic order at nonzero temperature in oneand Two-Dimensional heisenberg and XY systems with Long-Range interactions.
Physical Review Letters, 87(13):137203, 2001.
[114] Melvin Lax. Dipoles on a lattice : the spherical model. The Journal of Chemical
Physics, 20(9):1351–1359, 1952.
[115] S. Romano. Computer simulation study of a two-dimensional dipolar lattice. Il
Nuovo Cimento D, 9(4):409–430, April 1987.
[116] S. Romano. Computer-simulation study of a three-dimensional lattice-spin model
with dipolar-type interactions. Physical Review B, 49(17):12287, May 1994.
[117] E. Rastelli and A. Tassi. Absence of long-range order in three-dimensional heisenberg models. Physical Review B, 40(7):5282, 1989.
[118] E. Rastelli, A. Tassi, A. Pimpinelli, and S. Sedazzari. Triangular planar antiferromagnet in an external magnetic field. Physical Review B, 45(14):7936, April 1992.
[119] E. Rastelli, A. Carbognani, S. Regina, and A. Tassi. Pseudodipolar anisotropy in
the square rotator model. In J. Appl. Phys., volume 87, pages 5902–5904. AIP, May
2000.
[120] E. Rastelli, S. Regina, and A. Tassi. Planar triangular model with long-range interactions. Physical Review B, 66(5):054431, 2002.
138
Bibliografia
[121] E. Rastelli, S. Regina, and A. Tassi. Phase diagram of the square planar model
with long range isotropic antiferromagnetic and dipolar interactions. physica status
solidi (a), 189(2):555–558, 2002.
[122] E. Rastelli, S. Regina, and A. Tassi. Short-range exchange and long-range dipole
interactions in a triangular planar model. Physical Review B, 67(9):094429, March
2003.
[123] E. Rastelli, S. Regina, and A. Tassi. Monte carlo simulation for square planar model
with a small fourfold symmetry-breaking field. Physical Review B, 70(17):174447,
November 2004.
[124] E. Rastelli, S. Regina, and A. Tassi. Monte carlo simulations on a triangular ising
antiferromagnet with nearest and next-nearest interactions. Physical Review B,
71(17):174406, May 2005.
[125] E. Rastelli, S. Regina, and A. Tassi. Phase transitions in a square ising model
with exchange and dipole interactions. Physical Review B (Condensed Matter and
Materials Physics), 73(14):144418–11, April 2006.
[126] K. De’Bell, A. B. MacIsaac, I. N. Booth, and J. P. Whitehead. Dipolar-induced
planar anisotropy in ultrathin magnetic films. Physical Review B, 55(22):15108,
June 1997. Copyright (C) 2009 The American Physical Society; Please report any
problems to [email protected].
[127] K. De Bell, A. B. MacIsaac, and J. P. Whitehead. Dipolar effects in magnetic thin
films and quasi-two-dimensional systems. Reviews of Modern Physics, 72(1):225,
2000.
[128] Yusuke Tomita. Monte carlo study of Two-Dimensional heisenberg dipolar lattices.
Journal of the Physical Society of Japan, 78:114004, 2009.
[129] Katsuyoshi Matsushita, Ryoko Sugano, Akiyoshi Kuroda, Yusuke Tomita, and Hajime Takayama. Peculiar ‘from-Edge-to-Interior’ spin freezing in a magnetic dipolar
cube. Journal of the Physical Society of Japan, 74:2651–2654, 2005.
[130] Ryoko Sugano, Katsuyoshi Matsushita, Akiyoshi Kuroda, Yusuke Tomita, and Hajime Takayama. Magnetic properties of Two-Dimensional dipolar squares: Boundary geometry dependence. Journal of the Physical Society of Japan, 76:044705,
2007.
139
Bibliografia
[131] Neal Madras and Alan D. Sokal. The pivot algorithm: A highly efficient monte
carlo method for the self-avoiding walk. Journal of Statistical Physics, 50(1):109–
186, 1988.
[132] Michael E. Fisher and Michael N. Barber. Scaling theory for Finite-Size effects in
the critical region. Physical Review Letters, 28(23):1516, June 1972.
[133] I. A. Campbell, K. Hukushima, and H. Takayama. Extended scaling scheme for
critically divergent quantities in ferromagnets and spin glasses. Physical Review
Letters, 97(11):117202, 2006.
[134] H. Zhang and M. Widom. Spontaneous magnetic order in random dipolar solids.
Physical Review B, 51(14):8951, April 1995.
[135] D. Kechrakos and K. N. Trohidou. Magnetic properties of dipolar interacting singledomain particles. Physical Review B, 58(18):12169, November 1998.
[136] G. Takzei, L. Gun’ko, I. Sych, A. Surzhenko, S. Cherepov, Yu. Troshchenkov, and
I. Mirebeau. Onset of long-range ferromagnetic order in a system of ferromagnetic
particles with giant magnetic moments. Journal of Experimental and Theoretical
Physics, 87(5):1003–1008, November 1998.
[137] S. Denisov. Long-range order and magnetic relaxation in a system of single-domain
particles. Physics of the Solid State, 41(10):1672–1677, October 1999.
[138] S. I. Denisov, V. F. Nefedchenko, and K. N. Trohidou. Dipolar ferromagnetism
in nanoparticle ensembles. Journal of Physics: Condensed Matter, 12:7111–7115,
2000.
[139] S. I. Denisov and K. N. Trohidou. Fluctuation theory of magnetic relaxation for
two-dimensional ensembles of dipolar interacting nanoparticles. Physical Review B,
64(18):184433, October 2001.
[140] G. A. Held, G. Grinstein, H. Doyle, Shouheng Sun, and C. B. Murray. Competing
interactions in dispersions of superparamagnetic nanoparticles. Physical Review B,
64(1):012408, June 2001.
[141] Kazuo Yamamoto, Sara A. Majetich, Martha R. McCartney, Madhur Sachan, Saeki
Yamamuro, and Tsukasa Hirayama. Direct visualization of dipolar ferromagnetic
domain structures in co nanoparticle monolayers by electron holography. Applied
Physics Letters, 93(8):082502–3, 2008.
140
Bibliografia
[142] J. Viana Lopes, J. M. B. Lopes dos Santos, and Yu. G. Pogorelov. Dipolar interactions and anisotropic magnetoresistance in metallic granular systems. Physical
Review B, 66(6):064416, 2002.
[143] A. Aharoni. Magnetostatic energy calculations. Magnetics, IEEE Transactions on,
27(4):3539–3547, 1991.
[144] M. Beleggia, S. Tandon, Y. Zhu, and M. De Graef. On the magnetostatic interactions
between nanoparticles of arbitrary shape. Journal of Magnetism and Magnetic
Materials, 278(1-2):270–284, July 2004.
[145] M. Beleggia and M. De Graef. General magnetostatic shape-shape interactions.
Journal of Magnetism and Magnetic Materials, 285(1-2):L1–L10, 2005.
[146] Marco Beleggia, Shakul Tandon, Yimei Zhu, and Marc De Graef. On the computation of the demagnetization tensor for particles of arbitrary shape. Journal
of Magnetism and Magnetic Materials, 272-276(Supplement 1):E1197–E1199, May
2004.
[147] M. Beleggia and M. De Graef. On the computation of the demagnetization tensor
field for an arbitrary particle shape using a fourier space approach. Journal of
Magnetism and Magnetic Materials, 263(1-2):L1–L9, July 2003.
[148] J. A. Osborn. Demagnetizing factors of the general ellipsoid. Physical Review,
67(11-12):351, June 1945.
[149] R. I. Joseph and E. Schlomann. Demagnetizing field in nonellipsoidal bodies. Journal of Applied Physics, 36(5):1579–1593, May 1965.
[150] G. N. Kakazei, Yu. G. Pogorelov, M. D. Costa, T. Mewes, P. E. Wigen, P. C.
Hammel, V. O. Golub, T. Okuno, and V. Novosad. Origin of fourfold anisotropy in
square lattices of circular ferromagnetic dots. Physical Review B, 74(6), 2006.
[151] K. Yu. Guslienko. Magnetic anisotropy in two-dimensional dot arrays induced by
magnetostatic interdot coupling. Physics Letters A, 278(5):293–298, 2001.
[152] Konstantin L. Metlov. Quasiuniform In-Plane magnetization state of thin cylindrical dots in a square array and related anisotropy. Physical Review Letters,
97(12):127205–4, 2006.
141