Laboratório Nacional de Computação Cientı́fica
Programa de Pós Graduação em Modelagem Computacional
Simulação e busca automatizada de arcos gravitacionais
Por
Carlos Henrique Brandt
PETRÓPOLIS, RJ - BRASIL
ABRIL DE 2012
SIMULAÇÃO E BUSCA AUTOMATIZADA DE ARCOS
GRAVITACIONAIS
Carlos Henrique Brandt
DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO LABORATÓRIO
NACIONAL DE COMPUTAÇÃO CIENTÍFICA COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM
CIÊNCIAS EM MODELAGEM COMPUTACIONAL
Aprovada por:
Prof. Martı́n Makler, D.Sc
(Presidente)
Prof. Fabio Porto, D.Sc.
Prof. Marcelo Albuquerque, D.Sc.
PETRÓPOLIS, RJ - BRASIL
ABRIL DE 2012
Brandt, Carlos Henrique
XXXX
Simulação e busca automatizada de arcos gravitacionais / Carlos Henrique Brandt. Petropólis, RJ. : Laboratório Nacional de Computação Cientı́fica,
2012.
xx, yy p. : il.; 29 cm
Orientadore(s): Martı́n Makler e Gilson Antônio Giraldi
Dissertação (M.Sc.) – Laboratório Nacional de Computação Cientı́fica,
2012.
1. ASSUNTO. 2. arcos gravitacionais. 3. simulação. 4. detecção.
Makler, Martı́n. II. LNCC/MCTI. III. Tı́tulo.
CDD XXX.XXX
I.
“Calm seas don’t make skillful sailors.”
Autor desconhecido
iv
Especialmente pra você.
v
Agradecimentos
Começo os agradecimentos como sempre, pela minha famı́lia. Meus pais,
Dona Junara e Seu Brandt e meus irmãos, Ana Maria, Carlos Frederico e Ana
Paula, pelo companheirismo e aprendizado ao longo de todos os tempos. As minhas
palavras de agradecimento estão no amor que sinto por eles.
Um agradecimento muito importante vai aos meus orientadores, Martı́n Makler (CBPF) e Gilson Giraldi (LNCC). A contribuição de ambos foi essencial para o
término desta dissertação, além de muito mais ter aprendido do que simplesmente
fı́sica, matemática ou computação; a motivação e os ensinamentos que pude pegar
no dia-a-dia com Gilson e Martı́n valem muito para mim e para este trabalho.
Algumas instituições foram fundamentais para a realização deste trabalho
e devem receber meus agradecimentos: o LNCC pela maravilhosa casa oferecida
nestes últimos três anos; o ICRA/CBPF por me receberem sempre tão bem e me
oferecem um segunda casa, também maravilhosa; a CAT/CBPF por todo suporte
e parceria no dia-a-dia da administração de um cluster, e os cafézinhos no meio
da tarde; o CNPq, Capes, INCT-MACC e Ministério de Ciência e Tecnologia e
Inovação pelo fomento a pesquisa e tecnologia deste paı́s, em particular, desta
dissertação; o LIneA pela possibilidade de trabalhar com ótimos profissionais em
um projeto de ponta e escala internacional.
Agradeço aos colegas e amigos de mestrado por todas as experiências trocadas, entre festa e trabalho, pizzas e uma computação muito se aprendeu. Um muito
obrigado a todos, do LNCC ao CBPF, passando pelo ON, que puderam compartilhar parte de seu tempo durante estes anos. Em particular, gostaria de fazer um
agradecimento ao grupo de Strong Lensing do CBPF, este trabalho contou com
vi
o esforço e colaboração de todo o grupo de SL. Um obrigado especial a Gabriel
Caminha, Pedro Ferreira, Habib Dumet, Cristina Furlanetto, Maria Elidaiana e
Angelo Fausti pela conhecimento e parceria compartilhados ao longo destes anos e
que possibilitaram este trabalho.
Por fim, agradeço aos amigos da vida, do dia-a-dia, do Rio ou do Sul, pessoas
que estão sempre presentes, perto ou longe, e que são as várias peças que fazem a
engrenagem toda funcionar. É impossı́vel eu citar nomes aqui, mesmo porquê eu
tenho certeza de que estas pessoas sabem quem são. Muito obrigado a todos.
vii
Resumo da Dissertação apresentada ao LNCC/MCTI como parte dos requisitos
necessários para a obtenção do grau de Mestre em Ciências (M.Sc.)
SIMULAÇÃO E BUSCA AUTOMATIZADA DE ARCOS
GRAVITACIONAIS
Carlos Henrique Brandt
Abril , 2012
Orientador: Martı́n Makler, D.Sc
Co-orientador: Gilson Antônio Giraldi, D.Sc.
Arcos gravitacionais são sistemas de grande importância para a cosmologia e
astrofı́sica, sendo utilizados para restringir parâmetros cosmológicos e obter informações sobre a estrutura de galáxias e aglomerados de galáxias. No entanto estes
objetos são raros e de difı́cil detecção. Levantamentos fotométricos de grande área
e com boa qualidade de imagem, como o Dark Energy Survey (DES), aumentarão
em cerca de uma ordem de grandeza o número de sistemas com arcos. Algoritmos
para a detecção automatizada de arcos (buscadores de arcos) são absolutamente
necessários, uma vez que o volume de dados trabalhados já ultrapassa a capacidade
humana. Além disso são necessários métodos objetivos que gerem resultados reprodutı́veis. É fundamental, também, a realização de simulações realistas de arcos
de modo a testar ferramentas de análise, tanto os buscadores de arcos quanto as
que extraem informações fı́sicas a partir destes objetos. A principal contribuição
deste trabalho foi o desenvolvimento de um simulador de arcos gravitacionais para
a inclusão destes nas simulações realizadas pelo projeto DES denominado AddArcs.
O simulador busca reproduzir arcos utilizando-se de dados de simulações cosmológicas de N-corpos e parâmetros de dados reais. Efeitos observacionais podem
ser adicionados de acordo com propriedades da instrumentação que pretendemos
simular. Com relação à detecção automatizada de arcos, realizou-se a revisão de
viii
um algoritmo conhecido da literatura, com o ajuste de parâmetros e teste em diferentes tipos de imagens. Alguns métodos de processamento de imagens utilizados
no processo de identificação de objetos em dados astronômicos foram também revisados como parte deste estudo. Tanto os métodos de simulação quanto os de
processamento de imagens foram integrados em uma biblioteca de ferramentas
para processamento de dados astronômicos denominada SLtools. Com o simulador de arcos gravitacionais fomos capazes de reproduzir arcos com considerável
grau de realismo e incluı́-los nas imagens e catálogos produzidos nos ciclos de simulação do DES. A partir dos resultados do simulador, pudemos também estimar
a abundância de arcos que o Dark Energy Survey deverá observar.
ix
Abstract of Dissertation presented to LNCC/MCTI as a partial fulfillment of the
requirements for the degree of Master of Sciences (M.Sc.)
SIMULATION AND AUTOMATED DETECTION OF
GRAVITATIONAL ARCS
Carlos Henrique Brandt
April, 2012
Advisor: Martı́n Makler, D.Sc
Co-advisor: Gilson Antônio Giraldi, D.Sc.
Gravitational arcs provide important tools for cosmology and astrophysics,
and have been used to constrain cosmological parameters and the structure of
galaxies and galaxy clusters. However, these objects are rare and challenging to
detect. Wide field imaging surveys with good imaging quality, such as the Dark
Energy Survey (DES), will increase the current number of known arc systems by
about an order of magnitude. Algorithms for automated detection (arc-finders)
are absolutely necessary since currently available data volumes are already beyond
human capabilities. Besides, it is necessary to have objective methods capable of
generating reprodutible results. Furthermore, it is essential to perform realistic
arc simulations to test the analysis tools, both arc-finders as well as those aimed
to extract physical information from these objects. The main contribution of this
work was the development of a gravitational arc simulator for the DES project,
named AddArcs. The simulator generates arcs based on N-body simulations and
parameters derived from observational data. Observational e↵ects can be added
according to the properties of the instrument. Regarding the automated detection
of arcs, we review an algorithm from the literature and apply it to a set of images,
tuning its parameters for each set. Some image processing methods often used for
the identification of astronomical objects were also reviewed. Both the methods
x
for simulation and image processing were integrated into a library of tools for
astronomical data processing named SLtools. The AddArcs simulator enabled the
inclusion of fairly realistic gravitational arcs on the DES simulated images and
catalogs. It also lead to an estimate of the abundance of arcs expected to be
observed by DES.
xi
Sumário
1 Introdução
1
1.1
O Dark Energy Survey . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2
DES e os Desafios dos dados
. . . . . . . . . . . . . . . . . . . . .
7
1.3
Fundamentos de Lenteamento Gravitacional . . . . . . . . . . . . .
8
1.3.1
Aproximação de lente fina . . . . . . . . . . . . . . . . . . .
9
1.3.2
Mapeamento Fonte-Imagem . . . . . . . . . . . . . . . . . .
14
1.3.3
O modelo da lente . . . . . . . . . . . . . . . . . . . . . . .
18
1.3.4
O modelo da fonte . . . . . . . . . . . . . . . . . . . . . . .
19
Efeitos observacionais . . . . . . . . . . . . . . . . . . . . . . . . . .
20
1.4.1
Ruı́do nas imagens . . . . . . . . . . . . . . . . . . . . . . .
20
1.4.2
Função de espalhamento . . . . . . . . . . . . . . . . . . . .
21
1.4
2 Simulação de arcos gravitacionais
2.1
23
Algoritmo de simulação . . . . . . . . . . . . . . . . . . . . . . . . .
23
2.1.1
Configuração das lentes . . . . . . . . . . . . . . . . . . . . .
23
2.1.2
Seleção de fontes . . . . . . . . . . . . . . . . . . . . . . . .
30
2.1.3
Lenteamento Fonte-Imagem . . . . . . . . . . . . . . . . . .
35
2.1.4
Efeitos observacionais . . . . . . . . . . . . . . . . . . . . . .
36
2.1.5
Co-adição de imagens . . . . . . . . . . . . . . . . . . . . . .
38
2.2
Implementação Computacional
. . . . . . . . . . . . . . . . . . . .
39
2.3
Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
xii
3 Ferramentas para dados astronômicos
50
3.1
Documentação de códigos . . . . . . . . . . . . . . . . . . . . . . .
51
3.2
Linguagens de programação . . . . . . . . . . . . . . . . . . . . . .
52
3.3
Herança de mensagens . . . . . . . . . . . . . . . . . . . . . . . . .
54
3.4
Controle de versão . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
3.5
Empacotamento e Instalação . . . . . . . . . . . . . . . . . . . . . .
55
3.6
Usabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
4 Análise da busca de arcos gravitacionais
4.1
4.2
4.3
57
Inspeção visual . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
4.1.1
Procedimento de seleção manual . . . . . . . . . . . . . . . .
58
4.1.2
Propriedades dos candidatos a arcos
. . . . . . . . . . . . .
60
Algoritmo de Lenzen et al. . . . . . . . . . . . . . . . . . . . . . . .
62
4.2.1
Modificação de histograma . . . . . . . . . . . . . . . . . . .
63
4.2.2
Filtragem anisotrópica . . . . . . . . . . . . . . . . . . . . .
65
4.2.3
Detecção de objetos . . . . . . . . . . . . . . . . . . . . . . .
66
4.2.4
Seleção dos arcos . . . . . . . . . . . . . . . . . . . . . . . .
67
4.2.5
Análise de parâmetros . . . . . . . . . . . . . . . . . . . . .
68
4.2.6
Conjunto de parâmetros “bons” . . . . . . . . . . . . . . . .
76
4.2.7
Teste de parâmetros ajustados . . . . . . . . . . . . . . . . .
77
Detecção de arcos em aglomerado de galáxias . . . . . . . . . . . .
82
5 Conclusão e perspectivas futuras
85
Referências Bibliográficas
88
Apêndice
A Processamento de imagens astronômicas
92
A.1 Pré-processamento e Filtragem de imagens . . . . . . . . . . . . . .
92
A.1.1 Mudança de brilho . . . . . . . . . . . . . . . . . . . . . . .
93
xiii
A.1.2 Limiarização . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
A.1.3 Filtragem . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
A.2 Identificação de objetos . . . . . . . . . . . . . . . . . . . . . . . . . 107
A.2.1 Crescimento de regiões . . . . . . . . . . . . . . . . . . . . . 107
A.2.2 Limiarização . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
A.2.3 Parâmetros morfológicos . . . . . . . . . . . . . . . . . . . . 109
xiv
Lista de Figuras
Figura
1.1
Arcos gravitacionais em aglomerados galáxias . . . . . . . . . . . .
2
1.2
Aproximação de lente-fina . . . . . . . . . . . . . . . . . . . . . . .
10
1.3
Anel de Einstein em torno de uma galáxia . . . . . . . . . . . . . .
13
1.4
Perfil de brilho de Sérsic, n = 0.5. . . . . . . . . . . . . . . . . . . .
19
1.5
Perfil de brilho de Sérsic, n = 2. . . . . . . . . . . . . . . . . . . . .
20
1.6
Perfil de Sérsic e ruı́do de Poisson . . . . . . . . . . . . . . . . . . .
21
1.7
Perfil de Sérsic e PSF gaussiana . . . . . . . . . . . . . . . . . . . .
22
2.1
Etapas do simulador AddArcs . . . . . . . . . . . . . . . . . . . . .
24
2.2
Catálogo de halos DES, DCv2.13, massa e redshift . . . . . . . . . .
26
2.3
Halos selecionados para simulação . . . . . . . . . . . . . . . . . . .
27
2.4
Sorteio de fontes pontuais . . . . . . . . . . . . . . . . . . . . . . .
34
2.5
Arcos simulados para três lentes . . . . . . . . . . . . . . . . . . . .
36
2.6
Arcos simulados convoluidos com PSF . . . . . . . . . . . . . . . .
37
2.7
Arcos simulados com ruı́do de Poisson . . . . . . . . . . . . . . . .
37
2.8
Resultado de simulação de arco para o DC4 . . . . . . . . . . . . .
39
2.9
Fluxo de paralelizacao, threads e arquivos
. . . . . . . . . . . . . .
42
2.10 Aglomerado de Abell 383 . . . . . . . . . . . . . . . . . . . . . . . .
43
2.11 Arquivo de propriedades para a execução do AddArcs . . . . . . . .
44
2.12 Simulação de arcos para o aglomerado de Abell 383 . . . . . . . . .
45
2.13 Simulação de arcos coloridos com o DC5 (1) . . . . . . . . . . . . .
48
2.14 Simulação de arcos coloridos com o DC5 (2) . . . . . . . . . . . . .
49
xv
3.1
Documentação de código-fonte (docstrings) . . . . . . . . . . . . . .
53
3.2
Estrutura do repositório da SLtools . . . . . . . . . . . . . . . . .
55
4.1
Aglomerado de Abell 383, busca manual . . . . . . . . . . . . . . .
60
4.2
Arcos do A383 assinalados em “tabela-verdade” . . . . . . . . . . .
61
4.3
Arco selecionado para revisão do buscador de Lenzen et al. . . . . .
62
4.4
Limiarização de intensidades . . . . . . . . . . . . . . . . . . . . . .
64
4.5
Distribuição e pontos de corte de intensidades . . . . . . . . . . . .
64
4.6
Suavização por difusão anisotrópica . . . . . . . . . . . . . . . . . .
65
4.7
Regiões segmentadas . . . . . . . . . . . . . . . . . . . . . . . . . .
66
4.8
Detecção de arco . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
4.9
Arcos para testes de parâmetros do buscador . . . . . . . . . . . . .
69
4.10 Variação de valores para corte de intensidades . . . . . . . . . . . .
72
4.11 Variação de suavização gaussiana . . . . . . . . . . . . . . . . . . .
73
4.12 Variação da sensibilidade anisotrópica (K) . . . . . . . . . . . . . .
74
4.13 Variação da suavização direcional (⌧ ) . . . . . . . . . . . . . . . . .
75
4.14 Objetos segmentados com parâmetros “bons” . . . . . . . . . . . . .
77
4.15 Aglomerado 209 com arco simulado, DC6 . . . . . . . . . . . . . . .
78
4.16 Resultados dos parâmetros “bons” sobre arco simulado . . . . . . .
79
4.17 Resultado final sobre arco simulado . . . . . . . . . . . . . . . . . .
79
4.18 Arco do CFHT para teste de processamento . . . . . . . . . . . . .
80
4.19 Resultados parciais da segmentação do arco do CFHT . . . . . . . .
81
4.20 Resultado final sobre arco do CFHT
. . . . . . . . . . . . . . . . .
81
4.21 Resultados parciais sobre o aglomerado A383 . . . . . . . . . . . . .
83
4.22 Resultado final sobre aglomerado A383 . . . . . . . . . . . . . . . .
84
A.1 Imagem de arco (Hubble) utilizada como exemplo . . . . . . . . . .
92
A.2 Funções de re-escalonamento de intensidades . . . . . . . . . . . . .
94
A.3 Imagens re-escalonadas por tanh()
. . . . . . . . . . . . . . . . . .
95
A.4 Imagens re-escalonadas por log() . . . . . . . . . . . . . . . . . . .
96
xvi
A.5 Equalização de histograma . . . . . . . . . . . . . . . . . . . . . . .
98
A.6 Histograma de uma imagem astronômica . . . . . . . . . . . . . . .
99
A.7 Resı́duo de filtragem para o ruı́do . . . . . . . . . . . . . . . . . . .
99
A.8 Suavização com filtro da média . . . . . . . . . . . . . . . . . . . . 100
A.9 Suavização com filtro da mediana . . . . . . . . . . . . . . . . . . . 101
A.10 Suavização com filtros gaussianos . . . . . . . . . . . . . . . . . . . 102
A.11 Janela de aplicação do filtro direcional . . . . . . . . . . . . . . . . 103
A.12 Suavização direcional . . . . . . . . . . . . . . . . . . . . . . . . . . 104
A.13 Filtragem por difusão anisotrópica . . . . . . . . . . . . . . . . . . 107
A.14 Segmentação com region growing . . . . . . . . . . . . . . . . . . . 109
A.15 Limiarização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
xvii
Lista de Tabelas
Tabela
2.1
Halos selecionados para simulação . . . . . . . . . . . . . . . . . . .
26
2.2
Parâmetros de concentração e de escala dos aglomerados . . . . . .
29
2.3
Convergência caracterı́stica para combinações lente-fonte . . . . . .
31
2.4
Propriedades dos arcos simulados com o AddArcs . . . . . . . . . .
35
2.5
Propriedades dos arcos simulados para o aglomerado de Abell 383 .
44
4.1
Segmentação de arcos para inspeção visual . . . . . . . . . . . . . .
61
4.2
Parâmetros de saı́do do buscador de arcos . . . . . . . . . . . . . .
68
4.3
Objetos detectados com parâmetros “bons” (HST) . . . . . . . . . .
77
4.4
Objetos detectados com parâmetros “bons” (DC6) . . . . . . . . . .
80
4.5
Objetos detectados com parâmetros “bons” (CFHT) . . . . . . . . .
81
4.6
Arcos detectados no aglomerado de Abell 383 . . . . . . . . . . . .
82
A.1 Janela 5x5 do filtro da média . . . . . . . . . . . . . . . . . . . . . 100
A.2 Janela 5x5 de um filtro gaussiano . . . . . . . . . . . . . . . . . . . 101
xviii
Glossário
• Astrometria: ramo da astronomia que estabelece métodos de medidas e
precisão de instrumentos de posicionamento dos objetos astronômicos. O
termo é utilizado no processamento de dados astronômicos para calibração
dos dados com base em dados bem conhecidos (tabelas-verdade).
• Bag-of-tasks: Modelo de processamento computacional distribuı́do em que
um pacote de processos (seriais) é executado de maneira independente de
comunicação com demais processos.
• Banda: utilizado muitas vezes como sinônimo para “filtro fotométrico”,
indica uma janela do espectro eletromagnético observada por um equipamento astronômico (telescópio/câmera).
• CCD: do inglês Charge Coupled Device, é o dispositivo utilizado pelas
câmeras digitais (nos telescópios) para detecção dos fótons provenientes
de uma determinada região do céu, em determinado comprimento de onda
(ou banda).
• Catálogo: tabela de dados estruturados em arquivos digitais, tipicamente
arquivos no formato FITS.
• Dec (ver RA): abreviação para Declinação (em inglês, Declination). Uma
das duas coordenadas celeste para um objeto astronômico na esfera celeste.
Medida em graus, entre
90 e +90 , a partir do plano equatorial.
• FITS: Flexible Image Transport System é um formato de arquivo digital
para armazenamento de imagens e catálogos, bem como os meta-dados
xix
necessários para caracterizar os dados astronômicos transmitidos.
• Fotometria: ramo da astronomia dedicado à medida de intensidade (ou
fluxo) de objetos astronômicos.
• Halo: estrutura massiva composta por matérias bariônica e escura que
caracterizam galáxias e aglomerados de galáxias. Tipicamente o termo é
utilizado para referenciar “halo de matéria-escura” em cosmologia.
• Magnitude: medida de brilho (ou luminância) de um objeto astronômico
em escala logaritmica em determinada frequência ou banda do espectro
eletromagnético.
• RA (ver Dec): abreviação para Ascensão Reta (em inglês, Right Ascension). Uma das duas coordenadas celeste para um objeto astronômico na
esfera celeste. Medida em graus, entre 0 e 360 , no sentido horário, a
partir do primeiro ponto de Áries.
• Seeing: efeito observacional causado pela atmosfera e instrumentação que
causa o borramento dos objetos nas imagens captadas.
• z: redshift, ou desvio para o vermelho, em português, é uma medida de afastamento de um objeto em relação ao observador. Em cosmologia trabalhase com redshift cosmológico, causado pela expansão do universo, para objetos muito distantes.
xx
Capı́tulo 1
Introdução
Lenteamento Gravitacional é o nome dado ao fenômeno fı́sico que deflete a luz
de um objeto distante ao passar por uma região muito massiva no seu trajeto até
nós, observadores. Este fenômeno pode ser dividido em dois regimes: forte e fraco.
O efeito fraco de lenteamento manifesta-se em regiões periféricas do aglomerado
através de pequenas distorções causadas na morfologia das galáxias do entorno.
Para a percepção, ou medida, do efeito de lenteamento no regime fraco é necessário
um estudo estatı́stico na morfologia de todos os objetos da área para análise do
efeito. O efeito forte manifesta-se através de imagens múltiplas de um mesmo
objeto e grandes distorções (arcos ou anéis) no entorno de aglomerados de galáxias,
principalmente.
Neste trabalho estudaremos arcos gravitacionais gerados pelo efeito forte
de lentes. Vamos, ao longo desta dissertação, discutir métodos de estudo destes
objetos através de simulações e algoritmos de processamento de dados astronômicos
para a análise de imagens e identificação de objetos. Os arcos gravitacionais são
objetos tênues cujo padrão de intensidade se confunde com o brilho dos objetos
vizinhos. Portanto, o seu estudo apresenta diversos desafios do ponto de vista da
análise de imagens. Na figura 1.1 podemos ver dois bons exemplos de arcos no
entorno de aglomerados de galáxias, observados pelos telescópios Canada-FranceHawaii (CFHT) e Hubble (HST).
O entendimento do lenteamento gravitacional baseia-se na teoria da Relati-
1
Figura 1.1: Aglomerados contendo arcos gravitacionais em demonstração do fenômeno de lenteamento gravitacional forte: objetos distorcidos nas regiões demarcadas no entorno dos aglomerados de galáxias. À esquerda, imagem do aglomerado
SDSS J015824.78-003959.3, obtida com o CFHT pelo projeto CS82 (em andamento). À direita, imagem do aglomerado Abell 383, obtida com o HST (Smith
et al., 2001).
vidade Geral de Einstein, segundo a qual um fóton descreve sempre uma geodésica
entre dois pontos no espaço-tempo, que é curvo na presença de uma massa e faz
com que o raio de luz seja defletido. O nome relacionado com a ótica — lenteamento — remete à idéia de que a massa — o aglomerado — funciona como uma
lente ao desviar os raios de luz como se fosse um meio com ı́ndice de refração
superior ao ı́ndice médio do Universo.
O estudo de lentemaneto gravitacional forte é motivado pelas várias aplicações em cosmologia e astrofı́sica. O efeito pode funcionar como “telescópio gravitacional”, permitindo a observação de objetos muito distantes, que do contrário
não poderiam ser observados (Marshall et al., 2007). Além disso, visto que o efeito
depende das distâncias cosmológicas e da estrutura da lente, ele pode ser utilizado para restringir parâmetros cosmológicos e obter limites sobre a distribuição
de massa da lente (Bartelmann et al., 1998; Meneghetti et al., 2005; Cooray, 1998;
Comerford e P. Natarajan, 2007). É importante salientar que o efeito depende
apenas da distribuição total de matéria (bariônica e escura) (Narayan e M. Bar-
2
telmann, 1996). Assim, as lentes gravitacionais podem ser úteis para determinar a
distribuição de massa de galáxias e aglomerados de galáxias.
Uma dificudade para o estudo dos arcos está na sua raridade, tendo sido
detectados apenas algumas centenas deles até hoje. Contudo, este cenário está
mudando com os levantamentos de grande área (ou surveys), como o Dark Energy
Survey (DES), que estima observar da ordem de 103 destes objetos (Allam et al.,
2009). Na seção 1.1, é feita uma breve apresentação deste projeto e da participação
brasileira.
A detecção de arcos gravitacionais é um processo difı́cil, visto que os mesmos
possuem geralmente baixa razão sinal-ruı́do (SNR); além da própria raridade do
fenômeno. Quando o volume de dados (imagens) em análise é pequeno, regiões com
algumas centenas de objetos, este procedimento pode ser realizado visualmente.
Mas este não é o caso dos levantamentos de grande área, em que são observados
da ordem de centenas de milhões de objetos, e procedimentos automatizados para
a identificação dos arcos são absolutamente necessários. Recursos computacionais
e algoritmos para busca e identificação destes objetos são essenciais para que os
grandes volumes de imagens trabalhados sejam processados de maneira eficiente
e estável, de maneira que os resultados possam ser reproduzidos e parâmetros de
seleção possam ser avaliados.
Alguns algoritmos para detecção de arcos podem ser encontrados na literatura (Lenzen et al., 2004; Horesh et al., 2005; Seidel e M. Bartelmann, 2007; Alard,
2006; Estrada et al., 2007; More et al., 2011), implementando diferentes técnicas
de processamento de imagens para sua detecção. Os buscadores de arcos, como
são chamados, são algoritmos encarregados de segmentar, medir e classificar os
objetos em uma imagem em busca de arcos gravitacionais. Tais algoritmos ainda
são muito sensı́veis à qualidade dos dados e parâmetros dados pelo usuário.
O estudo dos arcos gravitacionais é abordado neste trabalho através de simulações destes objetos e detecção através de técnicas de processamento de imagens.
O simulador de arcos gravitacionais, denominado AddArcs, foi desenvolvido
3
como parte desta dissertação e é descrito no capı́tulo 2. A simulação de arcos
gravitacionais permite gerar dados de nosso interesse para que possamos testar os
métodos de processamento e modelagem estudados pelo grupo1 . Com o AddArcs
podemos simular imagens de arcos gravitacionais com um bom grau de realismo,
e com flexibilidade para que possamos variar parâmetros da modelagem fı́sica e
instrumental das imagens e objetos simulados.
No capı́tulo 4 desta dissertação é feita uma revisão do procedimento de busca
de arcos gravitacionais, e no apêndice “A” alguns métodos de processamento de
imagens envolvidos na busca automatizada são apresentados. Todos os métodos de
processamento de imagem discutidos no apêndice foram implementados em python
e constituem parte de uma biblioteca para processamento de dados, denominada
SLtools, apresentada no capı́tulo 3.
A SLtools é uma biblioteca de métodos e funções para o processamento de
imagens e catálogos astronômicos. Ela foi desenhada e implementada ao longo
deste mestrado com o intuito de padronizar e centralizar o ferramental produzido
pelo grupo de Lenteamento Gravitacional Forte (Strong Lensing—SL) do Centro
Brasileiro de Pesquisas Fı́sicas (CBPF). A SLtools tem suas origens no simulador
de arcos gravitacionais – o AddArcs – onde notamos a necessidade de organizar o
desenvolvimento de software do grupo de SL.
O AddArcs foi desenvolvido com foco nos ciclos de simulações do Dark Energy
Survey (DES)2 – um projeto de mapeamento do céu, apresentado na seção 1.1.
O contexto das simulações é um ponto forte do DES, que realiza periodicamente
ciclos de simulações denominados Desafios dos dados (Data Challenges—DCs).
Nos DCs são geradas imagens e catálogos à partir de simulações dos objetos que
espera-se observar quando iniciarem as operações do telescópio. Portanto, ser
capaz de adicionar um ingrediente das observações astronômicas às simulações – os
arcos gravitacionais – é de grande importância para a colaboração, e um resultado
importante deste trabalho. Nas seções que seguem (1.1 e 1.2) apresento o projeto
1
2
Grupo (de SL) refere-se ao grupo de lenteamento gravitacional forte do CBPF/MCT
http://www.darkenergysurvey.org/
4
observacional DES e a estrutura das simulações, que contextualizam e motivam
parte desta dissertação.
A dissertação está organizada da seguinte forma. Ainda neste capı́tulo, na
seção 1.3, apresento uma introdução à teoria de lenteamento gravitacional forte,
os principais conceitos envolvidos e a modelagem fı́sica que utilizaremos no simulador de arcos gravitacionais. No capı́tulo 2 apresento o próprio simulador de
arcos gravitacionais desenvolvido, juntamente com alguns resultados no contexto
do DES. No capı́tulo 3, os principais pontos abordados na implementação da biblioteca de métodos computacionais para processamento de dados astronômicos. No
capı́tulo 4 reviso o processo tı́pico de busca de arcos em imagens e, em particular,
um algoritmo para a busca automatizada de arcos, além de alguns resultados do
processamento e detecção dos arcos. Por fim, no capı́tulo 5 são apresentadas as
conclusões e perspectivas futuras. No apêndice A são discutidos alguns aspectos
dos métodos de processamento de imagens estudados para entendimento da área.
1.1
O Dark Energy Survey
O DES é um projeto formado pela colaboração internacional de diversas
instituições dos EUA, Inglaterra, Espanha, Brasil e Alemanha, que compartilham
o interesse nos dados e ciência do projeto e dividem responsabilidades. A partir
de 2012, o projeto irá obter imagens cobrindo uma área equivalente a um octante
do céu catalogando objetos em busca de dados para suporte aos estudos nas mais
diversas áreas da cosmologia e astrofı́sica, em particular da Energia Escura. Para
alcançar este objetivo, o DES desenvolveu uma câmera de cerca de 500 megapixels
e toda uma infra-estrutura de armazenamento e redução de dados, constantemente
aprimorada através de simulações em preparação para quando do recebimento dos
dados reais.
A câmera, DECam (Dark Energy Camera), é composta por 64 CCDs altamente sensı́veis no vermelho e será instalada no telescópio Blanco, no Cerro Tololo
International Observatory (CTIO), Chile. Esta instrumentação irá captar imagens
5
em um campo de visão de 2.2 , com resolução espacial de 0.27 arcsec/pixel, em
cinco bandas diferentes (g, r, i, z, Y ). Ao longo dos cinco anos de observações
do projeto, 5000
2
e centenas de milhões de objetos serão catalogados gerando al-
guns petabytes de dados – 1.8 terabyte/noite –, tornando o DES o maior projeto
observacional em operação à sua época.
Para o desenvolvimento da ciência e infra-estrutura do projeto, foram criados
11 grupos de trabalho no DES. Entre eles, os grupos de lenteamento gravitacional
forte (SL) e simulações são de especial interesse nesta dissertação, pois motivaram
diretamente o desenvolvimento do trabalho aqui apresentado.
A participação do Brasil no DES se dá através de um consórcio de pesquisadores de algumas unidades de pesquisa do Ministério de Ciência Técnologia
e Inovação (MCTI) e universidades denominado DES-Brazil 3 . Constituem este
consórcio o Laboratório Nacional de Computação Cientı́fica (LNCC), o Centro
Brasileiro de Pesquisas Fı́sicas (CBPF), o Observatório Nacional (ON), e pesquisadores das universidades do Rio Grande do Sul (UFRGS) e de São Paulo (USP e
UNESP). Este consórcio é gerido por uma associação entre as intituições do MCTI,
denominado Laboratório Interinstitucional de e-Astronomia (LIneA)4 .
A contribuição do DES-Brazil à colaboração internacional se faz através de
desenvolvimento e suporte à infra-estrutura computacional e cientı́fica do projeto,
sendo a principal contribuição um portal cientı́fico, que tem por objetivo fornecer uma interface de acesso comum para o acesso e processamento dos dados do
projeto. O portal disponibiliza ao cientista um ambiente para processamento e armazenamento de resultados. Nele é possı́vel manter históricos de processamento,
bem como compartilhar resultados entre grupos de trabalho. Além de apresentar
uma interface simples ao cientista para manuseio de seus dados, o portal abstrai
a camada de recursos computacionais, hardware e software, necessária e escalável
para a crescente demanda do projeto ao longo dos próximos anos.
Como contribuição deste trabalho, o AddArcs, bem como a SLtools, fazem
3
4
http://des-brazil.linea.gov.br/
http://www.linea.gov.br/
6
parte do conjunto de softwares que ficarão disponı́veis através do portal para a
colaboração internacional.
1.2
DES e os Desafios dos dados
Os Desafios dos dados, ou Data Challenges (DC), são ciclos de simulações
de objetos astronômicos em imagens e catálogos com intuito de gerar o que se
espera obter das observações realizadas pelo projeto, quando iniciarem as operações em 2012. As imagens são geradas com caracterı́sticas realistas dos efeitos
observacionais, tanto da instrumentação, como defeitos de CCDs e sensibilidade
dos filtros, quanto naturais, como o “borramento” (seeing) causado pelas camadas
de ar atmosféricas.
Estas simulações possuem dois objetivos: (i) testar o sistema de processamento e armazenamento de dados, das imagens captadas no Chile; e (ii) testar e
aprimorar as ferramentas de análise dos dados, desenvolvidas pelos grupos envolvidos.
As simulações são realizadas aumentando o realismo a cada novo ciclo, de
acordo com o avanço e necessidades dos grupos de trabalho. Há quatro nı́veis no
processo de simulações:
(1) são elaborados catálogos com propriedades astrométricas (posições), fotométricas (magnitudes) e morfológicas de estrelas e galáxias e – em parte
graças a este trabalho – arcos gravitacionais;
(2) os catálogos são, então, utilizados para gerar imagens correspondentes ao
esperado nas observações, considerando as dimensões dos CCDs e efeitos
instrumentais;
(3) redução das imagens brutas, geradas na simulação, para remoção dos efeitos intrumentais;
(4) geração de catálogos com propriedades dos objetos simulados e apresentados nas imagens.
7
A base da distribuição de galáxias utilizada no nı́vel (1) é dada por simulações cosmológicas de N-corpos (Carmen — Large Suite of Dark Matter Simulations,
LasDamas5 ). De acordo com as propriedades atribuı́das às galáxias (e.g., magnitudes), a morfologia destas é obtida a partir de catálogos de um levantamento com
dados reais obtidos pelo Telescópio Espacial Hubble (HST), o Cosmic Evolution
Survey (Faure et al., 2008).
Após todo o processo de redução, as imagens são combinadas e separadas
em regiões quadradas, com área equivalente de 0.723
2
e são então gravadas em
arquivos para distribuição à colaboração. Estes dados são disponibilidados por
instituições dos EUA (NCSA6 e Fermilab7 ), e do Brasil (através do LIneA).
O ciclo de simulações mais recente à data deste trabalho é o de número 6
(DC6), iniciado no final do primeiro semestre de 2011. Desde o Data Challenge
de número 5 (DC5), realizado em 2010, o projeto conta com arcos gravitacionais
simulados pelo AddArcs.
1.3
Fundamentos de Lenteamento Gravitacional
Nesta seção apresento alguns fundamentos teóricos para a modelagem de
lentes gravitacionais, que depois serão utilizados no simulador de arcos (seção 2.1).
Os quatro componentes básicos do lenteamento gravitacional são listados
abaixo:
• O observador (O): detector envolvido na observação do fenômeno. Para
todos efeitos, “nós” observadores através de imagens de telescópios.
• A lente (L): concentração de matéria entre observador e fonte que atua
como defletor da luz – um aglomerado de galáxias, por exemplo.
• A fonte (S ): objeto fı́sico que emite a luz posicionado atrás da lente.
Tipicamente uma galáxia (também chamada de galáxia de fundo).
5
6
7
http://lss.phy.vanderbilt.edu/lasdamas/simulations.html
http://www.ncsa.illinois.edu/
http://www.fnal.gov/
8
• A cosmologia, subentendida na modelagem fı́sica do fenômeno, define a
métrica de espaço-tempo para propagação da luz no universo.
O modelo da lente contempla um sistema isolado, com apenas os componentes supra-citados. No caso de interesse para esta dissertação — lenteamento por
galáxias ou aglomerados de galáxias —, as distâncias observador-lente-fonte (OLS )
são da ordem de 103 vezes superiores às dimensões da lente. Uma consequência é
que o tamanho angular da lente e, de fato, os ângulos envolvidos são pequenos o
suficiente para podermos fazer sen(✓) ⇡ ✓; já que estaremos interessados em fontes
próximas ao centro da lente. Esta aproximação será utilizada implicitamente em
todo o trabalho.
A teoria da Relatividade Geral prevê a deflexão de um raio de luz devido
à deformação gerada no espaço-tempo pelo campo gravitacional. Na prática, podemos pensar na deflexão sofrida pela luz como se o ı́ndice de refração do vácuo
(universo) diferisse da unidade quando sob influência de um campo gravitacional
(Binney e M. Merrifield, 1998). O ı́ndice de refração de um meio vazio (vácuo) sob
influência de um campo gravitacional
é dado por
n=1+
2| |
,
c2
(1.1)
onde foi utilizada a aproximação de campo fraco: | | ⌧ c2 .
1.3.1
Aproximação de lente fina
Uma aproximação utilizada nos estudos de lenteamento gravitacional é a
aproximação de lente fina: uma vez que as distâncias entre observador-lente-fonte
são muito grandes (⇡ 109 pc) comparado ao tamanho da lente (⇡ 103
106 pc).
Dessa forma, a deflexão da luz pode ser considerada como ocorrendo em um único
ponto, sendo que no resto da trajetória a luz segue em linha reta8 . É usual
na área de lenteamento utilizar os termos “plano da fonte” e “plano da lente” (ou
8
Isso no caso de um universo plano; no caso com curvatura, segue uma geodésica no espaço
homogêneo subjacente.
9
“plano das imagens”) para referenciar os pontos onde fonte e lente estão localizados,
respectivamente, ao longo da linha de visada.
A figura 1.2, apresenta o esquema geométrico de lenteamento gravitacional
na aproximação de lente fina que será utilizado ao longo deste trabalho.
Figura 1.2: Esquema das quantidades envolvidas na aproximação de lente fina.
A fonte está localizada na posição ⌘ no plano da fonte, enquanto sua imagem
(lenteada) encontra-se na posição ⇠ no plano da lente (Ferreira (2010)).
O ângulo de deflexão (↵) é relacionado com o ı́ndice de refração (n), conforme
equação 1.1, da seguinte forma:
↵
~=
Z
O
S
rn ds ,
(1.2)
onde O e S localizam observador e fonte, respectivamente, e ds é o elemento de
linha em um meio de ı́ndice n de refração.
O ângulo de deflexão pode ser obtido a partir da equação 1.2 em função do
10
potencial projetado no plano da lente
2,
4G
r
c2
~ =
↵
~ (⇠)
~ ,
2 (⇠)
onde ⇠~ é o parâmetro de impacto do raio de luz (na lente) e
(1.3)
2
relaciona-se com a
densidade de massa ⇢(~x) por
~
2 (⇠) =
Z
1
(⇠~ ⇠~0 ) 2 ~0
d⇠ ,
|(⇠~ ⇠~0 )|2
⌃(⇠~0 )
0
(1.4)
e ⌃(⇠~0 ) é a densidade de matéria ⇢(~x) projetada,
~ =
⌃(⇠)
Z
1
~ z) dz .
⇢(⇠,
(1.5)
1
As equações acima para o ângulo de deflexão têm uma interpretação simples:
a deflexão da luz é dada pelo gradiente do potencial gravitacional projetado, que
é gerado pela densidade de matéria projetada. Esta, por sua vez, é simplesmente
a integral da densidade de matéria ao longo da linha de visada.
Para os próximos passos que vamos discutir considere a figura 1.2. O que
queremos a seguir é relacionar as posições da imagem (✓) com a da fonte ( ):
⇠ = DOL ✓ ,
(1.6)
⌘ = DOS ,
(1.7)
onde DOL é a distância de diâmetro angular (Raine e E. G. Thomas, 2001) entre
observador e lente, DOS é a distância entre observador e fonte; DLS é a distância
entre lente e fonte.
Com isso obtemos a equação da lente,
=✓
DLS
↵(✓) ,
DOS
(1.8)
que relaciona as posições da imagem (✓, no plano da lente) e da fonte ( ) de
11
acordo com a deflexão ↵(✓) provocada pela lente. O ângulo de deflexão ↵(✓) é
obtido substituindo ⇠ (1.6) em (1.3 - 1.5).
1.3.1.1
Raio de Einstein e Lente pontual
Um exemplo simples de lente gravitacional é dado por lentes com simetria
axial. Neste caso é possı́vel mostrar que o ângulo de deflexão é dado por (Binney
e M. Merrifield, 1998):
↵=
4GMo
.
c2 ⇠
(1.9)
onde Mo é a massa contida dentro do raio ⇠ em torno do eixo OL.
Combinando esta distribuição de massa com uma configuração de perfeito
alinhamento entre observador, lente e fonte chega-se ao caso em que a fonte é
projetada como um anel em torno da lente no plano das imagens, denominada
anel de Einstein (ver figura 1.3). O raio do anel de Einstein é dado por:
rE =
r
4GMo DOL DLS
,
c2
DOS
(1.10)
onde Mo é calculado no valor de ⇠ correspondente a ⌘ = 0 ( = 0). O tamanho
angular correspondente a rE é dado por (✓E = rE /DOL ):
✓E =
r
4GMo DLS
.
c2 DOL DOS
(1.11)
O raio de Einstein depende das posições “OLS” ao longo da linha de visada
e da massa da lente e fornece uma escala tı́pica para o regime de lenteamento
gravitacional forte, onde os arcos gravitacionais são formados.
No caso de uma lente pontual, Mo não depende de ⇠ (ou ✓) e, das equações
(1.8) e (1.11), é possı́vel escrever a equação da lente apenas em função de ✓ e ✓E :
=✓
✓E
,
✓
(1.12)
relacionando diretamente a posição da fonte com a posição da imagem e o raio de
12
Figura 1.3: Anel de Einstein observado pelo Sloan Digital Sky Survey (SDSS):
SDSS J162746.44-005357.5. Imagem obtida dos arquivos públicos da NASA.
Einstein.
A solução da equação acima para ✓ é dada por
1
✓± =
2
✓
±
q
2
+ 4✓E2
◆
,
(1.13)
indicando que para cada ponto da fonte, temos dois pontos (ou imagens) correspondentes no plano da lente. Assim, temos equacionado em nossa modelagem o efeito
de imagens múltiplas observado em alguns sistemas de lenteamento gravitacional.
O raio de Einstein define um limite importante na modelagem do lenteamento
gravitacional, onde as formas de tratar o fenômeno diferem, definindo os regimes
forte e fraco. As imagens que projetarem-se dentro ou próximas do raio de Einstein,
estarão sob o regime de lentamento gravitacional forte, enquanto as imagens que
estiverem bem além de ✓E estarão sob o regime fraco. Este trabalho, vale lembrar,
dará atenção à modelagem do efeito forte quando necessário particularizar ao longo
desta dissertação.
13
1.3.1.2
Densidade Superficial Crı́tica e Convergência
Vamos agora definir uma quantidade para nos auxiliar nas expressões do
lenteamento gravitacional, a densidade superficial crı́tica:
⌃crit =
DOS c2
.
DOL DLS 4G
(1.14)
A densidade superficial crı́tica é uma quantidade geométrica, que depende
das distâncias relativas OLS, e define uma escala caracterı́stica para o sistema
p
sendo trabalhado. O raio de Einstein pode ser escrito como rE = Mo /⌃crit .
1
Note que, para uma massa fixa, rE / ⌃crit
.
A equação da lente pode ser re-escrita em termos da densidade crı́tica como
=✓
ou
=✓
Z
1
r
⌃crit
2
,
⌃(⇠~0 ) (⇠~ ⇠~0 ) 2 ~0
d⇠ ,
⌃crit |(⇠~ ⇠~0 )|2
(1.15)
(1.16)
onde utilizamos a equação (1.4) para o potencial projetado.
Por fim, definimos uma quantidade chamada convergência por:
~ =
(⇠)
~
⌃(⇠)
,
⌃crit
(1.17)
~ no
que exprime o poder de deflexão de um raio de luz em determinada posição (⇠)
plano da lente.
1.3.2
Mapeamento Fonte-Imagem
A transformação de coordenadas entre os planos da fonte e da lente definida
pela equação da lente (1.8) é o processo-chave do lenteamento. O mapeamento
entre os planos – a transformação das coordenadas – é descrito localmente através
14
do Jacobiano da transformação de coordenadas:
✓
@~
@ ~
J=
=
✓
@ ✓~
@ ✓~
DLS
↵
~ (✓)
DOS
◆
.
(1.18)
Colocando em termos matriciais, os termos de J ficam explı́citos nas componentes:
Jij =
onde utilizou-se a definição ~a =
i = j, e 0 se i 6= j), ou seja,
DLS
↵
~
DOS
0
B 1
J =@
@ai
,
@✓j
ij
e
ij
@a1
@✓1
(1.19)
é a delta de Kronecker (
@a1
@✓2
@a2
@✓1
@a2
@✓2
1
ij
= 1, se
1
C
A.
A seguir vamos definir uma quantidade chamada cisalhamento que contabiliza dispersão dos raios de luz em cada ponto no plano da lente, bem como re-definir
convergência, agora em termos do jacobiano.
A partir do jacobiano, então, definem-se as componentes do cisalhamento
( ) por
1
1
=
2
2
✓
@a1
@✓1
@a2
@✓2
◆
,
(1.20)
=
@a1
@a2
=
,
@✓2
@✓1
(1.21)
=
q
(1.22)
de módulo,
e a convergência () por
1
=
2
✓
2
1
+
2
2
,
@a1 @a2
+
@✓1
@✓2
◆
.
(1.23)
É fácil mostrar que a convergência definida pela equação (1.23) é idêntica à dada
na equação (1.17).
15
1.3.2.1
Magnificação
Um dos efeitos do lenteamento é a magnificação do brilho do objeto no plano
da imagem relativo ao plano da fonte.
Como o efeito da gravitação é apenas defletir os fótons, tem-se que a intensidade (I) emitida no plano da fonte (IS⌫ ) deve ser conservada quando defletida no
plano da lente (IL⌫ ),
IS⌫ = IL⌫ ,
(1.24)
onde ⌫ é a frequência da luz. Mas, visto que o efeito é acromático, podemos
simplificar: I ⌫ = I.
Em termos do fluxo, definido como energia por unidade de tempo (i.e, intensidade) por unidade de área, temos as seguinte relações:
IS = FS · dAS = IL = FL · dAL .
(1.25)
A magnificação (µ) de uma imagem é definida como a razão dos fluxos no
plano da lente e da fonte:
µ=
FL
dAS
=
,
FS
dAL
(1.26)
equivalente a contabilizar a razão entre as áreas compreendidas pelo objeto no
plano da fonte e no plano da lente.
Em termos de
e ✓, a magnificação é dada pelo determinante do Jacobiano
de ✓( ):
@ ✓~
@~
µ = det
!
= det J
1
.
(1.27)
Combinando as equações (1.19 - 1.23) podemos mostrar que:
µ=
✓
1
1

◆✓
16
1
1
+
◆
.
(1.28)
Definimos finalmente as magnificações tangencial (µt ) e radial (µr ):
µt =
✓
µr =
✓
1
1

◆
,
(1.29)
1
1
+
◆
,
(1.30)
em que µt define a magnificação na direção tangencial à lente e µr a magnificação
na direção radial. É fácil mostrar que µt e µr são os autovalores de J
1
.
Dependendo das distâncias OLS e da distribuição de massa da lente, pode
haver pontos em que 1  ± = 0, de modo que as magnificações divergem formalmente (µt , µr ! ±1). Os pontos do espaço que fazem com que as magnificações
divirjam formam curvas de especial interesse.
No plano das fontes, os pontos ( ~ ) que levam à divergência da magnificação µt
(µr ) formam a curva denominada cáustica tangencial (radial). No plano da lente,
~ formam a curva denominada curva crı́tica tangencial (radial).
estes pontos ( ~ ! ✓)
Ou seja, de acordo com nossa descrição, uma fonte pontual situada sobre um ponto
da cáustica será mapeada para o plano da lente com magnificação infinita.
Considerando um fonte circular infinitesimal situada próxima a uma dessas
curvas (cáusticas), esta será mapeada no plano das imagens próxima à curva crı́tica
correspondente. A proximidade com os pontos de divergência (tangencial ou radial)
faz com que a imagem projetada da fonte seja altamente distorcida (tangencial ou
radialmente).
A deformação da imagem de uma fonte circular infinitesimal é tipicamente
expressa em termos da razão comprimento-largura (L/W ) da imagem, e está relacionada com as magnificações por
L/W ' µt /µr .
17
(1.31)
1.3.3
O modelo da lente
Um componente fundamental para nossa modelagem é definir qual a configuração do potencial gravitacional a ser utilizada. Falamos até então em potenciais
( ) genéricos e, quando necessário, potenciais com simetria axial. No entanto, precisamos definir um modelo especı́fico de distribuição de massa para nossas lentes.
Um modelo de distribuição de massa para aglomerados de galáxias largamente utilizado hoje na literatura é conhecido por modelo NFW, proposto por
Navarro, Frenk e White (Navarro et al., 1995) à partir da análise de simulações
(N-corpos) de matéria escura. O modelo NFW define um perfil radial médio universal para os aglomerados de galáxias, dado pela expressão:
⇢(r) =
⇢c
,
(r/rc )(1 + r/rc )2
(1.32)
onde rc e ⇢c são a escala e densidade caracterı́sticas do halo9 , respectivamente.
Próximo ao centro da lente (r ! 0) este perfil cai com r
1
e distante da lente
rs ) este perfil cai com r 3 .
(r
O termo de convergência (⇠) para este perfil é dado por:
(x) = 2s
1
x2
F (x)
,
1
(1.33)
◆
(1.34)
em que utilizou-se x = x(⇠) = ⇠/rc , e
s =
✓
⇢c r c
⌃crit
.
O termo F (x) é dado por (Bartelmann, 1996):
F (x) =
9
8
>
>
>
>
<
p 1
1 x2
p 1
1
>
>
>
>
: 1
x2
1
p
x2
p
tanh 1 1
tan
1
,x > 1
x2 , x < 1
(1.35)
,x = 1
Halo de matéria escura é aqui utilizado como sinônimo para aglomerado de galáxias.
18
1.3.4
O modelo da fonte
Até aqui as fontes foram tratadas como regiões infinitesimais e circulares. No
entanto, precisamos utilizar um modelo de fonte finita e com distribuição de brilho
para dar caracterı́sticas mais realistas aos objetos que vamos simular. Portanto,
vamos agora descrever o modelo de fonte que vamos utilizar para gerar os arcos
gravitacionais.
O modelo de fonte que vamos utilizar tem um perfil de brilho conhecido como
perfil de Sérsic (Sérsic, 1963), comumente utilizado na literatura para descrever o
brilho de galáxias, e definido pela equação:
I = Io exp
"
b
✓
R
Re
◆1/n
1
!#
,
(1.36)
onde R é o raio projetado, Re um parâmetro de normalização, n é o ı́ndice de
Sérsic, b é um parâmetro livre de escala. Re é normalmente tomado como o raio
que envolve a metade da intensidade total projetada e n define quão rápido cai a
intensidade. Note que se n = 0.5 o perfil de Sérsic toma a forma de uma Gaussiana,
como podemos ver na figura 1.4. Já na figura 1.5 é apresentado o perfil de Sersic
com n = 2.
Figura 1.4: Perfil de Sérsic com n = 0.5.
19
Figura 1.5: Perfil de Sérsic com n = 2.
O processo de lenteamento de fontes extensas é realizado numericamente.
Alguns algoritmos podem ser encontrados na literatura (Keeton, 2001; Jullo et al.,
2007; Coe et al., 2008). Neste trabalho utilizaremos o Gravlens (Keeton, 2001),
que permite o lenteamento de fontes com perfil de Sérsic por lentes elı́pticas do tipo
NFW e pode ser utilizado a partir da linha de comando de maneira automatizada.
1.4
Efeitos observacionais
1.4.1
Ruı́do nas imagens
Devido à natureza discreta do processo de observação – em que fótons são
coletados por um CCD durante uma janela de tempo (t) – existe um erro associado ao valor das contagens e modelado por uma distribuição de Poisson. Este
erro aparece como ruı́do nas imagens astronômicas, prejudicando a definição dos
objetos, gerando, inclusive, falsos sinais (estruturas) na luz difusa de objetos mais
brilhantes. O ruı́do de Poisson é especialmente prejudicial para os objetos mais
tênues, com contagens próximas do ruı́do de fundo do céu.
A distribuição de Poisson modela a probabilidade de um evento com média
de
ocorrências (num dado intervalo de tempo), ocorra k vezes. A probabilidade
20
dada pela distribuição de Poisson segue a seguinte regra:
k
P (y = k) =
k!
e
.
(1.37)
Na figura 1.6 podemos observar o efeito do ruı́do de poisson (à direita) sobre
o perfil de intensidades utilizado (à esquerda).
(a)
(b)
Figura 1.6: Perfil de Sérsic, n = 2 (a) adicionado de ruı́do poissônico (b).
1.4.2
Função de espalhamento
A função de espalhamanento de ponto (Point Spread Function—PSF) é uma
função que modela o “borramento” presente nas imagens de telescópios, devido a
efeitos atmosféricos e à própria instrumentação. A PSF pode ser ajustada por uma
curva Gaussiana. Portanto, a imagem que observamos é modelada, em geral, como
sendo o resultado de uma convolução gaussiana.
A “largura a meia altura” (F W HM ) de uma gaussiana é a quantidade utilizada na definição da PSF e relaciona-se com o desvio padrão,
da seguinte
maneira:
F W HM = 2
p
2 ln(2)
⇡ 2.35
(1.38)
Na figura 1.7 é apresentado um exemplo do espalhamento de uma fonte
(quase) pontual. Na figura da esquerda (a) temos um perfil de Sérsic com n = 8,
e na figura da direita (b) temos o resultado de (a) convoluı́da com uma PSF
(gaussiana) de largura F W HM = 2 pixels.
21
(a)
(b)
Figura 1.7: Perfil de Sérsic com n = 8 (a) convoluı́do com uma PSF gaussiana com
F W HM = 2 pixels (b).
22
Capı́tulo 2
Simulação de arcos gravitacionais
Neste capı́tulo descrevo o desenvolvimento e utilização do algoritmo para simulação de arcos gravitacionais, denominado AddArcs. O objetivo do algoritmo
é simular arcos gravitacionais, ou seja, objetos fortemente deformados pelo efeito
de lentamento gravitacional forte, com L/W
1. Para isso vamos utilizar um
código de lenteamento gravitacional — Gravlens (Keeton, 2001) — e catálogos realistas, tanto para fontes quanto para lentes, como base para incorporar os modelos
apresentados no capı́tulo anterior.
A figura 2.1 apresenta o fluxo de processamento do AddArcs que iremos
construir ao longo deste capı́tulo. À medida que o algoritmo for sendo montado,
vamos visualizar as etapas e resultados parciais do algoritmo como um exemplo do
workflow. Logo, precisaremos de alguns dados de entrada que serão apresentados
conforme necessário. Parâmetros de controle e configuração do AddArcs — dispostos, portanto, no arquivo de configuração — serão indicados quando necessário.
2.1
Algoritmo de simulação
2.1.1
Configuração das lentes
A primeira etapa do algoritmo de simulação de arcos é configurar as lentes que
serão utilizadas. A configuração de uma lente consiste em posicionar uma massa
ML , a um redshift zL , com densidade distribuı́da de acordo com um perfil NFW
elı́ptico. Portanto, neste primeiro momento, precisamos dos seguintes parâmetros
23
Figura 2.1: Fluxo de trabalho do AddArcs. O programa inicia com um arquivo
de configurações e, opcionalmente, uma imagem de céu contendo aglomerados de
galáxias para serem utilizados como lentes. Inicialmente, o algoritmo configura
as lentes baseado nos halos dentro da região definida por RA e Dec e com massa
superior a um valor Mcorte . No segundo bloco são configuradas as fontes (galáxias)
para o lenteamento. No terceiro bloco, após o lenteamento, são incorporadas caracterı́sticas instrumentais e, opcionalmente, a combinação das imagens de arcos
com a imagem de céu, além da geração de catálogos. Os passos em laranja indicam pontos opcionais, apenas quando uma imagem com aglomerados é dada de
entrada.
24
da lente:
• Massa: ML ;
• Redshift da lente: zL ;
• Elipticidade: eL ;
• Escala caracterı́stica do modelo NFW: xs ;
• Redshift da fonte: zS .
Vamos também orientar a lente de um ângulo ✓L e posicioná-la nas coordenadas
RA e Dec.
Parte destes parâmetros, como posição (RA, Dec, zL ) e massa ML são obtidos
de um catálogo de halos de matéria escura – ou aglomerados de galáxias. Neste
trabalho utilizaremos um catálogo de halos1 produzido por simulações N-corpos
de matéria escura (LasDamas2 ). Tais catálogos são produzidos pelo DES como
parte dos ciclos de simulações (DCs).
O catálogo utilizado, DCv2.13, contém 206951 halos simulados com redshifts
0.0144 < z < 1.3740 e massas 5 ⇥ 1012 < ML < 8.8 ⇥ 1015 h 1 M . A figura 2.2
apresenta dois histogramas apresentando a distribuição de massa e redshift deste
catálogo.
Como o número de objetos é muito grande (⇠ 105 ) e porquê queremos otimizar o processo, o passo que segue é a seleção dos halos mais capazes de gerar arcos.
Sabendo que a eficiência da lente é proporcional a sua massa, vamos selecionar os
objetos mais massivos do nosso catálogo. Outro filtro que aplicamos — este não
tem relação com a eficiência da lente — é na posição dos halos: podemos restringir
as simulações a uma particular região (RA, Dec).
A seguir, vamos ilustrar os passos do método através de um exemplo especı́fico, a saber uma rodada no catálogo DCv2.13 mencionado acima. Neste exemplo
1
2
Em particular, será utilizado o catálogo de halos versão 2.13 (DES_Mock_v2.13_halos.fit)
http://lss.phy.vanderbilt.edu/lasdamas/simulations.html
25
(a)
(b)
Figura 2.2: Distribuição de massa (a) e redshift (b) dos aglomerados (halos) do
catálogo DCv2.13.
vamos selecionar os halos que sejam mais massivos que Mcorte = 5 ⇥ 1014 M , correspondendo aos 9 halos mais à direita do histograma de massas (figura 2.2). Não
vamos restringir a região do céu.
A figura 2.3 apresenta o gráfico com as posições dos halos selecionados. A
tabela 2.1 lista as informações (propriedades) lidas do catálogo e que utilizaremos
ao longo do exemplo para configuração da lente.
HaloID
4
8
0
27
15
14
9
16
12
RA
25.924
13.990
12.719
19.487
19.559
28.799
14.238
11.790
14.995
Dec
45.289
37.498
36.056
39.736
38.299
47.935
35.548
43.925
35.419
zL
0.1629
0.2701
0.2530
0.9919
0.1860
0.2701
0.3361
0.4885
0.4355
ML (1014 h 1 M )
8.823
7.913
7.126
5.607
5.519
5.388
5.375
5.342
5.063
Tabela 2.1: Halos selecionados a partir do catálogo, propriedades básicas para a
simulação do exemplo. A primeira coluna apresenta números de identificação para
cada halo obtido do próprio catá logo; Ascenção Reta e Declinação são dadas nas
colunas seguintes, respectivamente; As duas últimas colunas, zL e ML , correspondem ao redshift e massa dos halos (lentes).
A elipticidade é fixa em eL = 0.5 e a orientação é escolhida aleatoriamente
(em 0  ✓L < ⇡). Esse valor da elipticidade foi escolhido com base em simulações de N-corpos, correspondendo ao máximo da distribuição de elipticidades dos
26
Figura 2.3: Os cı́rculos (verdes) marcam as posições dos 9 aglomerados utilizados
como exemplo. O tamanho dos cı́rculos indica (em escala própria) a massa dos
aglomerados.
aglomerados (Oguri et al., 2003).
Os parâmetros s e xs são obtidos a partir do modelo (NFW) da lente,
conforme descrito a seguir.
2.1.1.1
Modelo da lente
Os parâmetros s e xs , do modelo NFW, conforme apresentado na seção
(1.3.3), são dados por (Caminha, 2009):
4
s = 7.3624 ⇥ 10 C200
✓
IOL ILS
IOS
◆
xs =
(200E 2 (zL ))
1 + zL
rs
DOL
2/3
✓
ML h
1014 M
◆1/3
(2.1)
(2.2)
onde rs é a escala caracterı́stica do aglomerado. Na expressão (2.1), C200 é o
parâmetro de concentração (Neto et al., 2007). O termo E(z) representa a função
27
de Hubble adimensional:
2
E (z) =
✓
H(z)
Ho
◆2
= [⌦m (1 + z) + (1
⌦⇤
⌦m )] (1 + z)2 + ⌦⇤ .
(2.3)
As quantidades IOL , ILS , IOS são proporcionais às distâncias de diâmetro angular:
IOL = Ho (1 + zL )DOL ,
ILS = Ho (1 + zL )DLS ,
IOS = Ho (1 + zL )DOS .
Portanto, para cálculo de s e xs , precisamos de:
• C200
• DOL , DLS , DOS
• zL
• ML
• ⌦m , ⌦⇤
Desta lista de parâmetros, os únicos que ainda não temos são ⌦m , ⌦⇤ , C200 e
as distâncias à(s) fonte(s) DLS , DOS . Para as densidades de matéria e de energia
escura (⌦m e ⌦⇤ ) vamos utilizar os mesmos valores das simulações de halos LasDamas: 0.3 e 0.7, respectivamente. Estes parâmetros caracterizam a cosmologia
que utilizaremos nas simulações e são dados como entrada através do arquivo de
configurações do AddArcs. O parâmetro C200 é obtido de uma distribuição de probabilidades P (C200 |M, z) ajustada a partir de simulações com alta resolução (Neto
et al., 2007), visto que as simulações utilizadas pelo DES não possuem resolução
suficiente para que se possa medir o parâmetro de concentração.
O parâmetro de concentração é calculado por um código implementado por
Angelo F. Neto (Neto et al., 2007). Já para os parâmetros s e xs um código
28
implementado por Gabriel Caminha (Caminha, 2009) é responsável pelos cálculos.
A tabela 2.2 apresenta os valores calculados para xs e C200 para o nosso exemplo.
HaloID
4
8
0
27
15
14
9
16
12
ML (1014 h 1 M )
8.823
7.913
7.126
5.607
5.519
5.388
5.375
5.342
5.063
zL
0.1629
0.2701
0.2530
0.9919
0.1860
0.2701
0.3361
0.4885
0.4355
✓L (deg)
1.18
69.49
29.20
130.24
154.54
130.72
40.80
94.43
59.06
C200
5.272975
5.142314
5.246680
4.995095
5.565525
5.407800
5.275544
4.982585
5.118645
xs
2.386856
1.537011
1.535091
0.550174
1.723390
1.285811
1.104900
0.878246
0.914476
Tabela 2.2: Parâmetros de concentração e de escala dos aglomerados. As três
primeiras colunas são identicas às já apresentadas na tabela 2.1; os halos estão
ordenados em ordem decrescente de massa. ✓L apresenta os valores de orientação
(em graus) sorteados para cada lente (eL = 0.5). Nas últimas colunas são dados
os valores calculados para o parâmetro de concentração C200 e escala da lente xs .
Apesar de as posições das fontes (zS ) não terem sido escolhidas ainda, o valor
de s já pode ser computado neste momento devido a uma estratégia adotada para
o posicionamento das fontes baseada em planos pré-estabelecidos a partir do desvio
para o vermelho (redshift) da lente.
2.1.1.2
Planos das fontes
A convergência caracterı́stica (s ) depende das distâncias envolvidas no sistema de lenteamento. Logo, o redshift zS da fonte é necessário para que finalizemos
a determinação dos parâmetros da lente fina.
Ao invés de considerar o zS de cada fonte, dividimos o plano das fontes em intervalos, de modo que a solução da equação da lente possa ser preparada numericamente pelo Gravlens para esses planos, aumentando a eficiência dos cálculos de lenteamento; do contrário, seria necessário obter a solução da lente para cada valor de
zS . O intervalo em zS para posicionamento das fontes (zS > zL ) é dividido em quatro faixas de largura
z = 0.5 zL e centrados nos pontos 1.5 zL , 2 zL , 2.5 zL , 3 zL .
Estes pontos definem (4) planos zp , os quais concentram as fontes que forem posicionadas (seção 2.1.2.2) em seus domı́nios
29
zp = [zp
0.25zL : zp + 0.25zL ]. Assim,
as fontes ocuparão posições pré-definidas ao longo da linha de visada projetando-as
em quatro planos linearmente espaçados. Isso possibilita-nos calcular os valores de
s para cada plano zp , finalizando, assim, com a etapa de configuração da lente.
As curvas crı́ticas podem, então, ser desenhadas.
Esta estratégia de “quantizar” as posições proporciona um bom ganho de
desempenho. Como veremos na seção (2.1.2), uma quantidade expressiva (⇠ 102 )
de fontes é sorteada para cada lente na simulação, na tentativa de obter um arco,
e o processo de lenteamento é relativamente caro (computacionalmente). Esta
estratégia otimiza parte do processo de lenteamento envolvido com a seleção de
fontes “boas” para a geração de arcos (seção 2.1.2).
Na tabela 2.3 são dispostos os valores de s do exemplo em questão juntamente com os valores de zS estipulados pela nossa aproximação de planos das
fontes.
Com isso encerramos com a configuração das lentes. Temos todos os parâmetros necessários para o modelo (NFW) de lentes, com algumas aproximações
para a implementação do modelo computacional.
2.1.2
Seleção de fontes
Na consideração das fontes para a simulação queremos ser capazes de utilizar
objetos dispostos em uma grande faixa de distâncias ao longo da linha de visada,
e que as propriedades das fontes (morfologia e brilho) sejam as mais realistas possı́veis. Cobrir uma faixa extensa de posições em z é interessante, pois a eficiência
das lentes depende da distância lente-fonte (✓E / DLS ), o que nos permite simular
arcos com maior probabilidade. Para as fontes utilizadas, temos de associar propriedades morfológicas e luminosas, como raio, elipticidade e magnitude, além do
redshift em z e posição no plano das fontes (RA, Dec).
As propriedades das fontes que vamos utilizar para modelar as galáxias de
fundo para o lenteamento foram obtidas a partir de observações de campo profundo realizadas pelo Telescópio Espacial Hubble (HST). O Hubble Ultra Deep
30
HaloID
4
ML (1014 h 1 M )
8.823
zL
0.1629
zS
0.2443
0.3258
0.4072
0.4887
s
0.069581
0.104263
0.124993
0.138754
8
7.913
0.2701
0.4051
0.5402
0.6752
0.8103
0.100388
0.150227
0.179896
0.199517
0
7.126
0.2530
0.3795
0.5060
0.6325
0.7590
0.094184
0.140974
0.168845
0.187287
27
5.607
0.9919
1.4878
1.9838
2.4797
2.9757
0.230831
0.344160
0.411508
0.456258
15
5.519
0.1860
0.2790
0.3720
0.4650
0.5580
0.071726
0.107449
0.128782
0.142931
14
5.388
0.2701
0.4051
0.5402
0.6752
0.8103
0.094244
0.141033
0.168886
0.187306
9
5.375
0.3361
0.5041
0.6722
0.8402
1.0083
0.109098
0.163125
0.195217
0.216404
16
5.342
0.4885
0.7327
0.9770
1.2212
1.4655
0.135623
0.202450
0.242015
0.268100
12
5.063
0.4355
0.6532
0.8710
1.0887
1.3065
0.126253
0.18856
0.225480
0.249823
Tabela 2.3: Convergência caracterı́stica as combinações de cada lente os planos das
fontes. Os planos das fontes (zS ) estão espaçadas de 0.5 zL .
31
Field (Coe et al., 2006; Pereira, 2009), doravante UDF, é o mais profundo levantamento existente no ótico, com objetos até z ⇡ 5 e com uma ótima resolução
espacial (0.03 arcsec/pixel). Quanto melhor a resolução, melhor definidos estão os
objetos, o que permite bons ajustes das propriedades observadas e contribui com
a qualidade do modelo das fontes (galáxias de fundo).
O catálogo de fontes (UDF) que utilizamos contém informações de fotometria
e desvio para o vermelho (zS ), além de parâmetros morfológicos para cada objeto
obtidos a partir de ajustes da distribuição de brilho das galáxias por um perfil de
Sérsic.
A quantidade de fontes que vamos utilizar para a simulação é definida pela
densidade de fontes do catálogo UDF e a área do céu que estamos simulando, de
forma que possamos ter uma estimativa realista quanto ao número de galáxias
simuladas.
Na seção a seguir apresento a questão da quantidade de fontes utilizadas na
simulação de acordo com a densidade de objetos no catálogo.
2.1.2.1
Densidade de fontes
Tendo dividido o intervalo para posicionamento (z) das fontes, um número
associado à quantidade de fontes em cada plano zp está subentendido: a densidade
de fontes em cada intervalo
zp (ou plano zp ). Esta é calculada contando o número
de fontes em cada intervalo e dividindo pela área coberta pelo catálogo UDF. A
densidade de fontes será necessária para distribuir as fontes nos planos.
Neste passo, como mecanismo para aumentar (ou diminuir) o número de
fontes a simular, a implementação deste algoritmo – o AddArcs – permite que o
usuário passe ao programa um fator multiplicativo, que será utilizado para modificar a densidade efetiva de fontes. Este é um parâmetro livre do nosso algoritmo
para que possamos averiguar a eficiência da geração de arcos para um dado conjunto de lentes.
32
2.1.2.2
Sorteio das fontes
Após as fontes terem sido devidamente associadas aos planos das fontes zp ,
é necessário distribuı́-las em torno do eixo observador-lente, em seus respectivos
planos. Após termos feito isso, estaremos prontos para simular o lenteamento das
mesmas.
Também como mecanismo de otimização do algoritmo, as fontes posicionadas
fora das regiões de alta magnificação são descartadas, visto que queremos objetos
com alta razão L/W . Esta filtragem é feita utilizando fontes pontuais, também
por motivos de desempenho, uma vez que o mapeamento de fontes pontuais é
consideravelmente mais rápido e as magnificações são definidas para cada ponto
(seção 1.3.2.1).
O que vamos fazer a seguir, então, é (i) definir uma região em torno da lente
para popular com fontes (pontuais), (ii) sortear aleatoriamente as posições nesta
região e (iii) selecionar as fontes que estejam em posições de alta distorção.
Para isso, precisamos, antes de mais nada, saber quais são os pontos que
definem as curvas crı́ticas (CC). Este cálculo é realizado com o Gravlens (Keeton,
2001); a função que realiza esta interface com o Gravlens (Ferreira, 2010) e decide
quais fontes são boas para a simulação foi implementada por Pedro Ferreira. Lembrando que as CC dependem tanto de zL quando de zS ; portanto a computação
das CC é realizada para cada plano de fontes zp de maneira independente.
Uma vez definidas as CC podemos definir a região na qual sortearemos as
fontes. A região que definiu-se para posicionamento das fontes é consideravelmente
superior a área interna às CC, de maneira que possamos dar espaço suficiente às
fontes para uma correta avaliação das boas candidatas a arco. Para isso aumentamos artificialmente a região englobada pelas CC e definimos um retângulo a partir
dos limites (x,y) desta região (CC) aumentada.3
É sorteado, então, um conjunto de posições para as fontes pontuais. O número de pontos sorteados é dado pela área do retângulo multiplicado pela densidade
3
Esta “região aumentada” não será utilizada em outro momento senão neste sorteio de pontos.
33
de fontes do catálogo em cada plano zp . A figura 2.4 exemplifica o sorteio de posições de um conjunto de fontes no retângulo definido através das CC (em vermelho).
Em seguida estas posições serão avaliadas quanto a seu poder de magnificação.
Figura 2.4: Posições sorteadas para as fontes, a serem avaliadas quanto a magnificação. Os pontos vermelhos representam a cáustica tangencial, onde a magnificação
é máxima. O losango azul define a região na qual as fontes pontuais serão avaliadas
e os pontos verdes simbolizam as fontes com alta magnificação selecionadas. Fonte:
(Ferreira, 2010)
Cada um dos pontos sorteados é avaliado quanto a sua magnificação µt /µr
(seção 1.3.2.1), desejamos escolher pontos que estejam em regiões de alta deformação. As fontes que estiverem sobre um ponto com µt /µr > µcorte são selecionadas
para seguirem ao passo de lenteamento de fontes extensas que se segue. As posições das fontes (pontuais) aqui selecionadas serão utilizados como centro das fontes
extensas na simulação.
Como valor padrão para o parâmetro de corte para magnificação (pontual)
utilizamos o valor µcorte = 5 através do arquivo de configuração. As posições das
fontes que passarem no corte de magnificação serão utilizados como centro das
fontes extensas no processo de lenteamento que segue.
2.1.2.3
Fontes extensas
Por fim, para podermos de fato simular o lenteamento de uma galáxia de
fundo (fonte) por um aglomerado de galáxias (lente), vamos configurar fontes ex34
tensas, posicionadas nos pontos filtrados pelo passo anterior.
Por fontes extensas denotamos o modelo de galáxias utilizado no lenteamento. Vamos utilizar agora fontes com raio, elipticidade, orientação, perfil de
luminosidade (Sérsic) obtidos a partir de dados observacionais. O catálogo UDF
carrega as propriedades morfológicas e fotométricas das galáxias observadas no
levantamento, incluindo a sua magnitude em 5 bandas.
Para cada fonte vamos atribuir um conjunto de propriedades lidas do catálogo
UDF. O conjunto de propriedades é sorteado do catálogo tomando o cuidado de
sortear um galáxia que esteja nos intervalos
zp (seção 2.1.1.2). Os parâmetros
que caracterizam as entradas do catálogo sorteadas são utilizados para modelar a
fonte (extensa).
2.1.3
Lenteamento Fonte-Imagem
Este é o ponto do nosso algoritmo em que simulamos o lenteamento de uma
galáxia de fundo por um aglomerado de galáxias.
O processo de mapeamento (seção 1.3.2) dos objetos do plano das fontes
ao plano das imagens (lente) é realizado pelo software Gravlens (Keeton, 2001).
Após modelar o sistema fı́sico, o conjunto de parâmetros do modelo é passado
ao Gravlens para que este compute a matriz jacobiana e seus auto-valores para
cada ponto dos planos fonte/lente. Como resultado do processo de lenteamento o
software retorna as imagens das fontes lenteadas – os arcos gravitacionais.
Dos 9 aglomerados utilizados para a simulação (tabela 2.1), 3 foram capazes
de gerar um arco cada. A figura 2.5 apresenta os arcos simulados neste exemplo.
As coordenadas dos arcos são dadas na tabela 2.4:
HaloID
12
16
27
zL
RA
Dec
0.4356 14.995 35.419
0.4886 11.790 43.925
0.9919 19.487 39.736
ArcID
A
B
C
zS
RA
Dec
1.3068 14.083 36.149
1.4657 17.275 44.400
2.9757 27.767 46.286
L/W
40.1
11.2
16.1
Tabela 2.4: Propriedades dos arcos simulados com o AddArcs: RA, Dec são as
coordenadas, L/W a razão comprimento-largura e zS o redshift das fontes que
geraram os arcos.
35
(A)
(B)
(C)
Figura 2.5: Arcos simulados pelos alglomerados com ID 12 (A), 16 (B) e 27 (C),
parâmetros apresentados na tabela 2.1. O centro de cada lente utilizada está
representado através dos “X” em vermelho. O tamanho dos painéis representa, em
escala arbitrária, o tamanho relativo dos planos de imagens para cada sistema.
2.1.4
2.1.4.1
Efeitos observacionais
Convolução com a PSF
Conforme vimos na seção (1.4.2), o borramento presente nas imagens de
telescópios são modelados por uma função de espalhamento de ponto (PSF) que
tem a forma de uma gaussiana. Esta função gaussiana tem uma largura à meia
altura (F W HM ) associada ao parâmetro
da gaussiana conforme equação (1.38).
Para aplicar este efeito de borramento aos arcos simulados é preciso convoluir
as imagens dos arcos com uma gaussiana com a largura, no caso, tı́pica do DES. A
largura à meia-altura das imagens simuladas do DES é de 0.8 arcsec. Em termos
de pixels, o desvio padrão
=
é dado por:
1
0.800
⇥
⇡ 1.26 pixel .
2.3548 0.2700 /pixel
(2.4)
Onde 0.2700 /pixel é a resolução da DECam. Utilizando uma gaussiana normalizada
com largura acima temos as imagens apresentadas na figura 2.6.
36
Figura 2.6: Arcos convoluı́dos com a PSF utilizada nas simulações do DES, gaussiana com = 1.26 pixels.
2.1.4.2
Adição de ruı́do às imagens
Para concluir a simulação dos arcos com ingredientes observacionais, nos falta
apenas adicionar o ruı́do de Poisson às imagens simuladas. O ruı́do poissônico
é incorporado sorteando para cada pixel da imagem um novo valor baseado na
distribuição (equação 1.37). Isso é feito sobre as imagens já convoluı́das com a
PSF. A figura 2.7 apresenta o resultado da incorporação de ruı́do nas simulações.
Figura 2.7: Arcos adicionados de ruı́do de Poisson, após convolução.
37
2.1.4.3
Calibração de bandas
Para simular arcos em diferentes bandas, utilizamos o fato do processo de
lenteamento ser independente da frequência da luz – acromático – e apenas escalonamos as intensidades dos arcos simulados para diferentes filtros (ou bandas).
O AddArcs simula arcos em uma banda, chamada banda de referência; tipicamente a banda i. Para atingir o brilho correspondente em diferentes bandas
uma transformação do tipo:
log10 (Km ) =
2
mref
5
mref
(mnew
mnew )
(2.5)
é utilizada, onde o fator Km é o fator aplicado a cada pixel da imagem “ref ” para
que tenhamos as novas intensidades, em “new”. Os parâmetros mref e mnew são as
magnitudes de ponto-zero nas respectivas bandas, obtidas a partir da documentação de um instrumento (i.e, telescópio) ou simulação (e.g, Data Challenge).
O catálogo UDF provê parâmetros fotométricos em quatro bandas (ou filtros)
0
0
diferentes: B (4350 Å), V (6060 Å), i (7750 Å), z (8500 Å). O DES irá observar
em cinco bandas (ou filtros) diferentes: g (4750 Å), r (6220 Å), i (7630 Å), z
(9050 Å). Assim, visto que o foco primário deste trabalho é o de produzir imagens
simuladas para o DES, queremos ser capazes de produzir imagens condizentes com
os filtros da DECam. Para isso – e visto que os comprimentos de onda centrais
0
0
são parecidos – faremos a seguinte associação: B ! g, V ! r, i ! i, z ! z
(Ferreira, 2010).
2.1.5
Co-adição de imagens
Ao final, caso uma imagem (de céu: contendo estrelas, galáxias, etc.) tenha
sido dada na entrada como referência para a posição dos aglomerados, as imagens
dos arcos simulados devem ser sobrepostas a esta imagem base. Isto é feito correlacionando o centro da lente modelada e utilizada na simulação dos arcos e o
centro do respectivo aglomerado na imagem.
38
A figura 2.8 apresenta um exemplo do resultado final da simulação de um
arco gravitacional adicionado a uma imagem do DES. Esta imagem tem um sentido
especial para esta dissertação, pois, além de ser um bom exemplo de resultado final,
ela foi o primeiro resultado do algoritmo quando totalmente automatizado. Esta
é uma imagem do ciclo de simulações de número 4 (DC4) e o arco simulado tem
ótimas propriedades visuais. Esta imagem foi utilizada para apresentarmos ao
grupo internacional de lenteamento gravitacional forte (SLWG 4 ) as possibilidades
do nosso algoritmo, que foi então aceito pela colaboração, e seu desenvolvimento
incentivado.
Figura 2.8: Imagem utilizada para demonstrar o resultado final da simulação de
arcos sobre aglomerados em imagens simuladas. À esquerda temos a imagem original, com o “X” em vermelho marcando o centro do aglomerado. Em cima à direita,
o arco simulado. Na imagem inferior o resultado final: o arco adicionado sobre a
imagem do aglomerado utilizado como lente. Esta provem do ciclo de simulações
DC4.
2.2
Implementação Computacional
O AddArcs é um programa escrito essencialmente em Python, com algumas
funções escritas em C e C++. O código é dividido em três grandes blocos de processamento, indicados na figura 2.1 através dos quadrados grandes: (i) inicialização e
4
DES Strong Lensing Working Group
39
configuração da lente, (ii ) seleção e lenteamento de fontes, (iii) pós-processamento
das imagens e finalização. O simulador utiliza um arquivo de configuração para os
parâmetros livres do algoritmo, permite a utilização modular do código através de
arquivos de propriedades e permite também o registro do passo-a-passo do processo
em um arquivo de log.
A primeira versão do AddArcs, ainda de testes, era monolı́tica e serial. Este
desenho teve de ser modificado devido ao baixo desempenho apresentado pelo
programa quando os testes com números expressivos de aglomerados (⇠ 102
103 )
foram realizados: o tempo de processamento para a simulação de ⇠ 3500 halos
estava em torno de 35 horas utilizando um núcleo de um Intel Core2 Quad Q8300
(2.5GHz) com 4GB de memória RAM disponı́vel. A solução implementada foi a
paralelização do código.
A versão atual do AddArcs foi paralelizada na etapa de lenteamento das fontes, para cada lente configurada. Visto que as simulações dos arcos podem ser
tomadas como tarefas independentes – para cada lente em separado – um modelo
do tipo bag-of-tasks (“saco-de-tarefas”) foi implementado. Com a paralelização do
código no trecho de lenteamento e seleção das fontes, o mais custoso computacionalmente (em tempo), o ganho de desempenho foi essencialmente linear. Após as
modificações, o tempo necessário para simulação de arcos nos ⇠ 3500 halos utilizando os 4 núcleos da mesma máquina (processador Intel Core2 Quad Q8300) caiu
para pouco mais que 9 horas, resultando em um ganho de ⇡ 4 vezes no tempo de
processamento.
A estruturação do código nos três blocos citados tem dois objetivos. O
primeiro deles é separar os trechos seriais (i) e (iii) do trecho paralelizado (ii ),
de maneira que o bloco (ii) possa ser processado em um ambiente de memória
distribuı́da. O segundo, objetiva oferecer maior flexibilidade de uso do código.
Isto é possı́vel, pois cada bloco pode ser executado individualmente, de acordo
com os dados e arquivos de entrada em posse do usuário.
A figura 2.9 e o “help” do programa “AddArcs.py -h”, abaixo, nos auxiliam
40
a visualizar a estrutura em blocos implementadas no AddArcs e seu uso.
Usage:
AddArcs.py
-c <config_file> [-f <pipe_file.ini>]
[options]
Options:
-h, --help
show this help message and exit
-d, --dump
Dump default configuration file to stdout
-q, --quiet
Make the running quiet, just log file created
-c CONFIGFILE, --config=CONFIGFILE
AddArcs configuration file. Mandatory argument
-f PIPEFILE, --file=PIPEFILE
AddArcs pipeline file(s) [if (s), comma separated].
-x EXECBLOCK, --exec=EXECBLOCK
If used, execute specific code block. Options are:
’readout_halos’, option
’-c’ necessary;
’arc_simulation’, options ’-c’ and ’-f’ necessary;
’image_addition’, options ’-c’ and ’-f’ necessary.
As informações geradas ao longo do programa são armazenadas em uma
estrutura interna de dados — no primeiro bloco, “readout_halos”, esta estrutura
é inicializada e preenchida com os dados das lentes configuradas para as simulações;
no segundo bloco, “arc_simulation”, os arcos simulados são adicionados a esta
estrutura, junto com com informações adicionais das simulações; no terceiro bloco,
“image_addition”, os dados contidos nesta estrutura são combinados para geração
dos arquivos de saı́da. Caso a opção de execução por bloco (“-x”) seja utilizada,
ao final do bloco executado a estrutura interna de dados é impressa em arquivo
texto. A estes arquivos, com os dados do algoritmo, damos o nome de arquivos de
propriedades do AddArcs (figura 2.11).
O AddArcs está disponı́vel para download através do endereço eletrônico
http://che.cbpf.br/download/AddArcs-current.tgz.
Simulação em imagem real
Como exemplo de aplicação e uso da estrutura modular do AddArcs apresento
a seguir uma simulação de arcos realizada sobre uma imagem real referente ao
41
Figura 2.9: Fluxo de paralelização do AddArcs. No primeiro bloco é inicializada a
estrutura de dados interna e as lentes são configuradas. Em seguida, o paralelismo
e distribuição do trabalho de seleção e lenteamento das fontes é realizado entre os
processadores disponı́veis. No terceiro bloco os dados dos sistemas simulados são
combinados para a geração das imagens e catálogos de saı́da.
aglomerado de Abell 3835 . A imagem, apresentada na figura 2.10, foi obtida
dos arquivos públicos do Telescópio Espacial Hubble (HST), disponibilizados pelo
Instituto de Ciências do Telescópio Espacial (STScI)6 .
Conforme vimos nas seções anteriores precisamos de algumas informações do
aglomerado em questão para que o AddArcs possa modelar a lente gravitacional
para as simulações. As propriedades do aglomerado A383 necessárias foram obtidas
do trabalho de Smith et al. (2001) e são apresentadas abaixo:
• Massa: 1.82 ⇥ 1014 M
• Redshift: 0.188
• PSF (F W HM ): 0.12300
• Magnitude de ponto-zero: 31.2
• Centro do aglomerado: RA = 42.014, Dec =
5
6
3.529
Proposta de observação HST #8249, ciclo #8, PI: Jean-Paul Kneib
http://hla.stsci.edu/hlaview.html
42
Figura 2.10: Aglomerado de Abell 383, com arcos gravitacionais, observado pelo
telescópio Hubble.
Com esses dados podemos escrever o arquivo de propriedades para a execução
do AddArcs para a simulação de arcos no aglomerado A383. Vamos utilizar o
catálogo de fontes do UDF. No arquivo de configuração temos de colocar a resolução
de imagem a ser utilizada nas simulações, que no caso da câmera WFPC2 do
Hubble é de 0.03 00 /pixel. A figura 2.11 contém o arquivo de propriedades necessário
para rodar o AddArcs a partir do bloco “arc_simulation”.
Como resultado final o AddArcs simulou dois arcos gravitacionais que foram adicionados à imagem original (figura 2.10) conforme podemos ver na figura
2.12. Na tabela 2.5 são apresentados os dados referentes aos objetos simulados.
O comprimento (length) e a largura (width) são encontrados da seguinte maneira:
encontra-se os dois pontos extremos do arco P 1 e P 2 além de um terceiro ponto,
P 3, que localiza o pixel mais brilhante do mesmo objeto. O comprimento do segmento de cı́rculo que liga os três pontos P 1P 3P 2 é tomado como medida para L
43
Figura 2.11: Arquivo de propriedades para a execução do AddArcs na simulação
de arcos para a imagem do aglomerado A383.
(Length); para o cálculo da largura do arco utiliza-se a seguinte expressão:
W =
4A
,
⇡L
onde A é a área total do arco, isto é, simplesmente o número de pixels do objeto.
ArcID
A
B
RA
40.374
43.745
Dec
-4.151
-2.80
Length
235
306
W idth
33
59
L/W
7.9
5.4
zS
0.376
0.376
Tabela 2.5: Propriedades dos arcos simulados para o aglomerado de Abell 383.
Com isso mostramos a capacidade do AddArcs de simular arcos gravitacionais
(artificiais) em imagens reais com a modularização implementada no simulador.
2.3
Resultados
O AddArcs foi desenhado de maneira que pudessemos simular arcos de duas
maneiras diferentes, de acordo com os dados de entrada:
• modo catálogo: a partir de coordenadas de Ascensão Reta (RA) e Declinação (Dec) que definem uma região no plano do céu, o programa seleciona
(de um catálogo) aglomerados com massa M > Mcorte para a simulação de
44
Figura 2.12: Simulação de arcos para o aglomerado de Abell 383. A letras “A” e
“B” indicam os arcos adicionados.
arcos “puros”. A saı́da são imagens contendo somente arcos e o catálogo
de propriedades associadas a cada objeto.
• modo imagem: as coordenadas que definem uma região do céu são obtidas
a partir de uma imagem do céu de entrada. A simulação ocorre então da
mesma maneira que no modo catálogo com o acréscimo de adicionar as
imagens dos arcos simulados, adicionados de ruı́do e convoluı́dos com a
PSF, à imagem do céu dada. A saı́da, então, é composta pelas imagens
dos arcos e catálogo de propriedades, e as imagens combinadas.
Modo catálogo
A aplicação modo catálogo é capaz de simular arcos gravitacionais em uma
grande área, tão grande quanto a área do catálogo utilizado. Esta aplicação é
particularmente útil para realizarmos previsões de abundância de arcos.
45
2
Realizamos uma rodada de simulações numa área de 300 , correspondendo
a área total do catálogo de halos do DES (versão 2.00c), com halos de massa
superior a 5 ⇥ 1013 h 1 M , totalizando 3402 aglomerados. Estes catálogos são
tabelas que contêm nas colunas as propriedades dos halos dispostos nas linhas. Em
particular, utilizamos as colunas com informações de massa, RA, Dec e redshift
destes objetos. Escolhemos o pixel com mesma resolução da camêra do projeto
DECam (0.27 arcsec/px), parâmetros cosmológicos ⌦M = 0.3 e ⌦⇤ = 0.7 (modelo
⇤CDM ) e lentes com elipticidade fixa em 0.5. Utilizamos o catálogo de fontes
UDF e parâmetro de seleção das fontes extensas dado por µt /µr > 5.
Dos 3402 aglomerados, 51 geraram arcos (1.5% do total), sendo que apenas 2
geraram 2 arcos cada. Isto nos permite estimar o número de arcos que o DES deverá
2
observar. Fazendo a razão entre a área total de mapeamento do projeto (5000 )
2
com a área do catálogo utilizado, chegamos ao número de (5000 /300
2
⇥ 51)
⇡ 850 arcos gravitacionais. Esta estimativa está em acordo com outro estudo
(Allam et al., 2009) em que foram utilizados outros levantamentos (CFHTLS e
RCS-2), levando em conta área e profundidade, obtendo-se números entre 102 e
103 para a abundância de arcos.
Algumas decisões tomadas no nosso modelo computacional, sabemos, subestimam o número de arcos estimado: (i) as fontes utilizadas possuem no máximo
redshift zS = 3.25 zL , excluindo todas as fontes com zS > 3.25 zL , (ii) as lentes
possuem simetria elı́ptica, e sem subestruturas, enquanto a presença de subestruturas aumenta a seção de choque e beneficia a geração de arcos e (iii) lentes que
poderiam gerar arcos são excluı́das da simulação pelo critério de corte de massa
ML > Mcorte .
Por outro lado, o número de arcos é superestimado por (i) não convoluirmos
as imagens com a PSF, que tende a borrar os arcos e diminuir a razão axial (L/W )
e (ii) supomos que os arcos simulados pelo AddArcs seriam observados pelo DES,
independente de sua magnitude.
46
Estes aspectos deverão ser considerados com mais detalhes em trabalhos
futuros para permitir uma estimativa mais confiável do número de arcos esperado.
Modo imagem
Como dito anteriormente, neste modo utilizamos uma imagem do céu como
entrada em que os limites da imagem em RA e Dec são utilizados, além dos parâmetros descritos no modo catálogo.
2
Aqui utilizamos uma imagem do DC5, que possui uma área de 0.723 . O
limite de corte em massa foi também 5 ⇥ 1013 (h 1 M ), e o catálogo de halos
manteve-se o mesmo (v-2.00c), bem como o catálogo de fontes (UDF). A diferença
aqui foi a densidade de fontes, escolhida 10 vezes maior do que a fornecida pelo
catálogo para que obtivessemos um maior número de arcos. Os arcos obtidos
foram convoluı́dos com uma PSF de F W HM = 0.800 (ou
= 1.26px, de acordo
com as equações 1.38 e 2.4) e adicionados de ruı́do de Poisson. Aqui as simulações
ocorreram em multiplas bandas: g, r, i, z, de acordo com a explicação dada na
seção (2.1.4.3).
Combinando as imagens nas bandas r, g e z – e associando a cada uma delas
uma cor, vermelho, verde e azul, respectivamente – criamos imagens coloridas das
regiões com os arcos simulados.
Nove aglomerados acima do corte de massa foram selecionados para as simulações, mas apenas dois conseguiram gerar arcos gravitacionais. Um dos aglomerados gerou 7 arcos, que podem ser vistos na figura 2.13, enquanto o outro
aglomerado gerou 2 arcos, figura 2.14. A localização dos aglomerados utilizada
está assinalada pelos cı́rculos vermelhos nas respectivas figuras.
47
Figura 2.13: Simulação de arcos em três bandas (r, g, z) apresentadas em cores.
O cı́rculo vermelho indica o centro da lente utilizada e o cı́rculo verde indica a
posição dos arcos na imagem.
Data Challenge 6
No último ciclo de simulação do DES, os arcos gerados pelo AddArcs foram
incorporados definitivamente como um componente do pipeline das simulações.
Para incorporar arcos ao DC-6 realizamos duas rodadas de simulações com
os seguintes parâmetros:
- RA = [325 : 345];
- DEC = [ 50 :
35];
- Mcorte = 5 ⇥ 1013 M h 1 ;
- Resolução = 0.27”/px;
- Enhance sources factor = 10.
48
Figura 2.14: Simulação de arcos em três bandas (r, g, z) combinadas em cores. O
cı́rculo vermelho indica o centro da lente utilizada e o cı́rculo verde indica a posição
dos arcos na imagem.
As simulações foram realizadas no cluster do Instituto de Cosmologia, Relatividade e Astrofı́sica (ICRA/CBPF), em uma máquina com 8 processadores do
tipo Intel Xeon E5430. Uma das simulações gerou 195 arcos e a outra gerou 184.
Cada rodada levou cerca de 110 minutos para ser concluı́da.
Estes (195+184) arcos foram, então, convoluı́dos com a mesma PSF das
simulações (F W HM = 0.800 ⇡ 3 px) e selecionados de acordo com sua deformação
L/W > 5. Uma seleção final ocorreu para os objetos com magnitude < 24.5, de
forma a eliminar objetos de baixa intensidade. Ao final deste processo restaram
90 arcos, que foram, então, adicionados ao último ciclo (DC6) de simulações, e que
hoje estão disponı́veis à colaboração por meio de imagens e catálogos.
49
Capı́tulo 3
Ferramentas para dados astronômicos
O AddArcs, com sua estrutura modular, motivou a criação de uma biblioteca
de ferramentas para dados astronômicos com ênfase em arcos gravitacionais. O
objetivo da biblioteca, chamada SLtools, é otimizar o desenvolvimento de software
do grupo de SL através da organização deste desenvolvimento com infra-estrutura
de documentação, versionamento e padronização para a produção de código.
A SLtools é composta majoritariamente por códigos na linguagem Python
e conta também com códigos em C e C ++ e é oferecida para os usuários através
de uma interface (API) em Python, para Linux e MacOS-X. Apesar de utilizarmos
linguagens orientadas a objetos, a SLtools é estruturada em módulos e funções
que trabalham com tipos de dados comuns à comunidade cientı́fica (arquivos FITS,
arrays multi-dimensionais, listas e dicionários) acessı́veis através de algumas bibliotecas (como Numpy, PyFits, Scipy1 ), também comuns aos usuários de Python.
A infra-estrutura e padrões de desenvolvimento implementados têm como
metas oferecer um ambiente simples aos usuários e desenvolvedores e garantir um
mı́nimo de qualidade do software desenvolvido, de maneira que a colaboração e
independência entre os desenvolvedores sejam as melhores possı́veis. Nas seções
que seguem são apresentados alguns elementos de desenvolvimento realizados na
implementação da biblioteca: (i) documentação de código, (ii ) linguagens de programação, (iii) herança de mensagens, (iv ) padronização de chamadas, (v ) controle
1
http://new.scipy.org/
50
de versão, (vi) empacotamento e distribuição, (vii) usabilidade.
A atual versão da biblioteca, v-0.1.52 , contém módulos para leitura e escrita
de catálogos astronômicos, processamento de imagens – filtragem, segmentação,
co-adição, etc. –, simulação de arcos, recursos gráficos, entre outros. Abaixo segue
a lista de módulos que compõem esta versão da SLtools.
• catalog: métodos para manipulação de catálogos ASCII e FITS
• coordinate: métodos para conversão de coordenadas celestes
• gravlens: rotinas de interface com o software Gravlens
• image: métodos para manipulação de imagens
• io: funções para verificação, entrada/saı́da e registro de dados
• lens: métodos para modelagem e simulação de lentes gravitacionais
• string: manipulação de texto e expressões regulares
3.1
Documentação de códigos
Documentação neste trabalho engloba desde a sintaxe do código-fonte (que
deve ser legı́vel e claro) até as informações de utilização das ferramentas implementadas. Visto que o desenvolvimento é realizado por um grupo pequeno de
desenvolvedores, o processo de documentar os códigos deve ser simples e objetivo.
Esta documentação deve também evoluir junto com o desenvolvimento do próprio
código.
O esquema de documentação adotado para a SLtools está baseado nos
Python PEP s3 número 287, 258, 257, 256, 8 e 7.
O Python possui um sistema de documentação elaborado para que esta seja
registrada em código e exportada ao usuário, através de seu interpretador. Este
2
3
Disponı́vel em http://che.cbpf.br/sltools/download/sltools-current.tgz
Python Enhancement Proposals, http://www.python.org/dev/peps/
51
sistema, chamado docstrings, define sintaxe e mecanismo para leitura e exportação
das informações.
Optamos por disponibilizar a documentação da biblioteca em formatos HTML
e PDF, para facilitar a consulta da mesma, distribuı́dos junto com o pacote da biblioteca (seção 3.5). Isto é feito com o auxı́lio dos softwares Doxygen4 e Doxypy5 .
No endereço eletrônico http://www.che.cbpf.br/sltools é mantida uma versão
atualizada automaticamente a cada 15 minutos com o conteúdo de documentação
do repositório da SLtools.
A figura (3.1) apresenta um exemplo da documentação do código fonte em
docstrings (a), como ela aparece ao usuário no interpretador do Python (b) —
com o auxı́lio da função help() — e como ela é exportada para HTML (c) pelo
Doxygen.
3.2
Linguagens de programação
A SLtools é composta por códigos em diferentes linguagens: quase a tota-
lidade dos métodos é escrita em Python, enquanto algumas funções de integração
numérica utilizam C e C++. A interface de programação (API) é oferecida em
Python. Para os códigos escritos em C/C++ fizemos “bindings” (“conversores”)
para que estes pudessem ser compilados e utilizados através do Python, que é uma
linguagem interpretada.
Para construção dos bindings, utilizamos um programa chamado SWIG 6
que auxilia no acesso a esta API para comunicação com códigos compilados.
Assim conseguimos realizar a integração entre códigos em diferentes linguagens na SLtools, aliando o desempenho de linguagens compiladas (C/C++) com
o alto-nı́vel do Python.
4
5
6
http://www.doxygen.org
http://code.foosel.org/doxypy
http://www.swig.org/
52
(a)
(b)
(c)
Figura 3.1: Formatação da documentação dos métodos em código, (a) docstrings,
(b) como ela é apresentada no interpretador do Python e (c) como ela é apresentada
em HTML pelo Doxygen.
53
3.3
Herança de mensagens
Um aspecto interessante da SLtools é a herança de mensagens (logging)
entre suas funções. Com o mecanismo de logging podemos gravar mensagens do
estado do programa ao longo do processamento para posterior consulta. No sistema
de logging, as informações são coletadas e apresentadas de acordo com o tipo e
importância delas: error, debug, warning ou apenas informative.
Para atingir o objetivo de ter um sistema de mensagens na SLtools, o módulo
logging 7 do Python foi utilizado nos códigos da biblioteca, de maneira que o usuário
tenha controle de alguns aspectos das mensagens. Isto é feito por meio do módulo
“io” da biblioteca.
3.4
Controle de versão
Visto que a biblioteca é desenvolvida de maneira colaborativa, um meca-
nismo para lidar com a edição assı́ncrona de códigos é necessário para manter a
integridade do desenvolvimento. Também é importante manter o histórico de todas as modificações, permitindo consultar versões anteriores e voltar atrás se for
preciso.
Softwares para controle de versão (Software Control Management-SCM) de
códigos são utilizados para (i) manter o histórico de desenvolvimento e (ii ) permitir
que o mesmo seja consistente quando realizado em colaboração. À estrutura de
arquivos e diretórios administrada pelo SCM dá-se o nome repositório, e o SCM
que administra os códigos da SLtools é o Git8 .
No endereço web http://che.cbpf.br/git/sltools é disponibilizada uma
interface para que os desenvolvedores possam acompanhar o histórico de modificações no repositório.
7
8
Descrito na PEP-282: http://www.python.org/dev/peps/pep-0282/
http://git-scm.com/
54
3.5
Empacotamento e Instalação
Uma vez que um software é dado como estável e desejamos disponibilizar para
um grupo de usuários, é necessário um sistema de empacotamento e instalação (ou
build ) do software. O sistema de build é responsável por compilar um pacote
com os códigos para distribuição e, do lado do usuário, realizar a instalação da
biblioteca. O processo de instalação realiza a compilação dos códigos em C/C++,
além de configurar os caminhos e variáveis no sistema do usuário. Para que este
empacotamento seja devidamente realizado, os códigos devem estar organizados
dentro do repositório da biblioteca de acordo com o tipo de linguagem e método
implementado. A figura (3.2) apresenta a estrutura do repositório utilizado para
nossa biblioteca, com os arquivos necessários para o build assinalados.
Figura 3.2: Estrutura base do repositório e componentes do build da SLtools.
No repositório de códigos (“sltools”) temos um conjunto de diretórios (vermelho)
com os códigos python; abaixo da linha pontilhada expresso a estrutura de arquivos
(C/C++) que devem entrar no build. Ao lado, em System files estão os arquivos
obrigatórios no pacote final.
Estrutura do repositório
A estrutura do repositório é como os arquivos são arranjados dentro da árvore
de diretórios que compoem a biblioteca. Na SLtools o repositório foi organizado de
55
acordo com a categoria do método implementado (horizontalmente) e as diferentes
linguagens utilizadas (verticalmente).
Arquivos e diretórios no repositório respeitam a seguinte organização:
• Nı́vel 0 : Diretório raiz da sltools/, apenas arquivos de sistema e diretórios de códigos (packages) divididos por aplicação;
• Nı́vel 1 : Diretórios contendo códigos python somente, e sub-diretórios com
conteúdo especı́fico para códigos de outras linguagens;
• Nı́vel 2 : Códigos C, C++ com Makefile e arquivos de apoio para compilação.
Desta maneira mantemos códigos escritos em python e demais linguagens
organizados. Isto é importante especialmente para automação do sistema de empacotamento, que procura até um certo nı́vel (1 ) da biblioteca por códigos em
python e depois por arquivos de makefile com rotinas pré-definidas para a compilação e exportação para Python.
3.6
Usabilidade
No intuito de extender o uso da biblioteca a usuários que não sejam progra-
madores em Python, decidimos oferecer algumas ferramentas através de arquivos
executáveis. Assim, quando a SLtools é instalada, além da API oferecida diretamente através do interpretador Python, um conjunto de códigos é também
oferecido ao usuário através de arquivos executáveis na shell.
56
Capı́tulo 4
Análise da busca de arcos gravitacionais
A busca por arcos gravitacionais em imagens astronômicas é uma tarefa complexa, essencialmente porque os arcos possuem baixa razão sinal/ruı́do (SNR) e
pela contaminação devido à luz difusa de galáxias brilhantes presentes no centro
dos aglomerados de galáxias, onde os arcos são tipicamente encontrados. Esta
busca é tipicamente realizada através de um processo de inspeção visual; esta
ainda é a maneira mais confiável de buscar por arcos. No entanto, os volumes de
imagens manipulados atualmente atingem valores muito elevados, sobre-humanos
realmente (⇠ P etaBytes). Assim, como alternativa à busca manual, a comunidade
astronômica conta com alguns algoritmos computacionais para auxı́lio no reconhecimento dos arcos. Contudo, a eficiência desses algoritmos depende da escolha de
um conjunto de parâmetros, o que não é uma tarefa trivial.
Alguns algoritmos com diferentes estratégias para a busca automatizada de
arcos podem ser encontrados na literatura; desde estratégias simples, como a segmentação iterativa dos objetos seguida de filtragens sucessivas até que apenas os
objetos de interesse sejam destacados, aplicada por Horesh et al. (2005), procedimentos com algum refinamento para a detecção de objetos tênues e distorcidos
(Lenzen et al., 2004), até abordagens finas e exaustivas para o reconhecimento de
estruturas alongadas e curvilı́neas em pequena escala, como o algoritmo de células
interagentes de Seidel e M. Bartelmann (2007).
Ao longo deste capı́tulo será apresentado o procedimento manual de seleção
57
de arcos, bem como um algoritmo de busca automatizada de arcos (Lenzen et al.,
2004). O procedimento manual é importante para visualizarmos os passos chave
tipicamente realizados na busca destes objetos e a construção de tabelas-verdade
para arcos gravitacionais. O algoritmo de detecção nos vai servir para compreender
como um algoritmo para a tarefa aborda este processamento, suas diferentes etapas
e os parâmetros relevantes.
4.1
Inspeção visual
O processo de inspeção visual consiste em procurar em imagens astronômicas
por arcos em torno de galáxias ou aglomerados de galáxias, olhando objeto por
objeto e selecionando os candidatos a arco. Por exemplo, este procedimento pode
custar em torno de uma hora para um olho treinado para cobrir uma única imagem
de 21Kx21K pixels.
Para o processo de inspeção visual é necessário o suporte de um programa
capaz de apresentar os arquivos das imagens e permitir que o usuário faça notas e
marcações sobre a imagem apresentada para que este processo tenha um mı́nimo de
eficiência. O programa utilizado para este propósito foi o DS9 (Joye e E. Mandel,
2003), desenvolvido pelo Smithsonian Astrophysical Observatory (SAO) é a principal ferramenta de visualização de imagens utilizado pela comunidade astronômica.
O DS9 permite ao usuário adicionar marcações (cı́rculos, retângulos, pontos, etc)
sobre a imagem e armazenar estes registros em arquivos texto separados do arquivo
da imagem, estes arquivos são chamados de arquivos de regiões.
Para complementar o uso do DS9, foram incorporadas à SLtools algumas
funções para ler/escrever os arquivos de saı́da/entrada do DS9. Assim, o usuário
pode alternar facilmente entre o ambiente de visualização de imagens do software
do SAO e os métodos de processamento de imagens e catálogos da nossa biblioteca.
4.1.1
Procedimento de seleção manual
A inspeção visual das imagens utiliza os seguintes passos:
58
(1) Classificação dos candidatos a arco. Devido à incerteza e subjetividade
na seleção (visual) dos objetos — particularmente em imagens monocromáticas — é interessante classificar os candidatos a arco quanto ao grau
de certeza para a seleção: neste trabalho utilizamos três nı́veis para esta
qualificação: ótimos candidatos, candidatos bons/regulares e candidatos
ambı́guos ou ruins;
(2) Segmentação dos objetos. Com o propósito de computar os parâmetros
morfológicos dos candidatos é necessário a segmentação e extração das
propriedades de cada objeto.
Para cada um destes passos foram desenvolvidos scripts em python para suporte ao
procedimento, bem como foram estabelecidos alguns padrões abaixo apresentados.
A figura 4.1 representa uma imagem que será utilizada como exemplo para
a seleção visual (manual) de arcos. Esta é uma imagem observada pelo telescópio
espacial Hubble (HST). Utilizando o DS9 a imagem é visualizada e marcada onde
os arcos gravitacionais, ou candidatos a arcos, são identificados. A figura 4.2
apresenta o resultado das marcações sobre a imagem.
As cores utilizadas nas marcações (cı́rculos) têm significado especial:
• Vermelho: arco, com certeza: objeto com grande curvatura, alta razão
comprimento/largura (fino e alongado), próximo ou circundante de um
aglomerado ou galáxia;
• Azul: bom candidato a arco: objeto com alta elongação e leve curvatura,
baixo brilho superficial, próximo a uma galáxia ou aglomerado, radial ou
tangencialmente orientado com relação ao objeto central;
• Magenta: fraco candidato a arco: objeto alongado com baixo brilho superficial, mas sem aparente distorção e próximo de uma lente gravitacional
(ou seja, um aglomerado que já teve outros arcos identificados).
59
Figura 4.1: Aglomerado de Abell 383 para inspeção visual de arcos. Imagem
observada pelo telescópio espacial Hubble. (imagem obtida dos arquivos públicos
da NASA)
4.1.2
Propriedades dos candidatos a arcos
Uma vez marcadas as regiões (x,y) de cada arco, ou candidato, desejamos
segmentar a imagem a fim de obtermos as propriedades de cada objeto.
A segmentação da imagem e cálculo das propriedades morfológicas dos objetos é realizada com o auxı́lio do programa Sextractor (Bertin e S. Arnouts, 1996).
As propriedades destes objetos são apresentadas na tabela (4.1).
Com isso temos algumas propriedades de interesse referentes a morfologia
dos arcos: centróide, excentricidade e elongação para cada objeto, por exemplo.
Podemos notar pela tabela (4.1) que os objetos marcados em vermelho (A1, A2,
D) na inspeção visual apresentam valores para excentricidade e elongação bem
distintos dos demais, bons e possı́veis candidatos a arcos. Nas seções (4.2.7.1
e 4.2.7.2) discutimos sobre como estas propriedades podem ser melhor avaliadas
60
Figura 4.2: Marcações dos candidatos a arco. Em vermelho, ótimos candidatos a
arco; em azul, bons candidatos; em magenta, canditatos ambı́guos. Os identificadores correspondem aos da tabela 4.1.
ID
A2
A1
D
6
9
8
7
C
B
X
563
526
633
171
537
520
287
601
632
Y
458
561
406
338
386
622
423
531
537
elongação
9.503
7.795
6.234
3.092
1.801
1.291
1.240
1.120
1.110
excentricidade
0.894
0.871
0.839
0.676
0.445
0.225
0.193
0.107
0.099
Tabela 4.1: Propriedades morfológicas dos candidatos a arcos obtidas a partir do
aplicativo SExtractor, ordenados por elongação.
para a seleção de arcos.
61
4.2
Algoritmo de Lenzen et al.
Nesta seção, apresento o buscador de arcos desenvolvido por Lenzen et al.
(2004). O algoritmo de Lenzen et al. (LSS) é revisado utilizando a imagem de um
arco do Hubble, marcado como objeto A1 na figura 4.2, apresentado na figura 4.3.
O algoritmo LSS é composto por quatro etapas: realce de objetos, suavização de
ruı́do, segmentação e seleção dos arcos.
Figura 4.3: Arco do Hubble — A1 da figura 4.2 — selecionado para revisão do
algoritmo de Lenzen et al.
O algoritmo realiza os seguintes passos para o processamento de uma imagem
em busca de arcos:
• Filtragem e Suavização:
Limiarização: com o objetivo de eliminar parte do ruı́do e realçar objetos, uma faixa de intensidades é selecionada para o restante do processamento (ver seção A.1.2);
Filtragem anisotrópica: com objetivo de suavizar o ruı́do e realçar as
bordas dos objetos é aplicado um filtro de difusão anisotrópica (ver seção
A.1.3.5);
• Detecção de objetos:
Segmentação: o método de crescimento de regiões é utilizado para
identificação de objetos (ver seção A.2.1);
62
• Seleção de objetos:
Morfologia: elipticidade e largura dos objetos detectados são calculadas
para a seleção e classificação de objetos (ver seção A.2.3).
Abaixo são apresentados os métodos aplicados em cada etapa do algoritmo
em maiores detalhes. Na seção (4.2.5) são realizados alguns testes e análises de
resultados parciais para diferentes conjuntos de parâmetros do programa, a fim de
visualizar os efeitos dos parâmetros e etapas do algoritmo.
4.2.1
Modificação de histograma
Nesta primeira etapa o objetivo principal é definir uma faixa de intensidade
da imagem para trabalhar no restante do processamento. A faixa de intensidades
definida deve conter os objetos de interesse – arcos – e excluir, dentro do possı́vel,
as intensidades caracterı́sticas do ruı́do de fundo. Para isso, vamos estabelecer dois
valores de intensidade – limite superior e inferior – para utilizarmos à diante.
Os limites de intensidade para o corte (ulim , u+
lim ) podem ser definidos manual
ou automaticamente no código LSS. No caso automático, o limite inferior é tomado
como o valor da moda 1 da distribuição de intensidades da imagem, e o limite
superior é estimado de forma a excluir aproximadamente 10% dos pixels de maior
intensidade. Na seção (A.1.2) apresento mais detalhes sobre limiarização.
O segundo passo desta primeira etapa, após a limiarização, é a normalização
da imagem. Durante a normalização, a escala de intensidades pode ser modificada
por uma transformação matemática, conforme discutimos na seção (A.1.1).
Neste processo, os valores de intensidade abaixo do limite inferior (neste
exemplo, 46.9) são redefinidos para este valor, assim como os valores de intensidade
acima do limite superior são redefinidos para este valor (54.8).
A figura 4.4 apresenta os efeitos da seleção de intensidades. As intensidades
são re-escalonadas conforme a equação (A.1), onde utilizamos Ia = Ic = 0, Ib =
54.8 e Id = 1. A figura 4.5 apresenta o histograma da imagem (a) com os valores
1
Moda é o valor do domı́nio que localiza o máximo da distribuição.
63
(a)
(b)
Figura 4.4: As imagens acima apresentam resultados da etapa de limiarização e
re-escala aplicadas pelo código LSS. Em (a), a imagem original. O corte inferior
em (b) corresponde à moda do histograma (intensidade 46.9), e o corte superior
(54.8) é tal que exclui 10% dos pixels mais intensos. O negativo da imagem original
(figura 4.3) é apresentado para melhor visualização.
de corte inferior e superior utilizados em (b).
Figura 4.5: Histograma de intensidades da figura 4.4 a. As linhas verticais, vermelhas, marcam as intensidades utilizadas para a limiarização vista na figura 4.4
b. Os valores limite estão marcados na figura: ulim = 46.9 , u+
lim = 54.8.
Escolhendo a intensidade mais numerosa do histograma – a moda da distribuição –, assim como o limite superior para remoção dos pixels de valores muito
64
intensos, removemos boa parte do ruı́do de fundo, e podemos notar o realce obtido.
4.2.2
Filtragem anisotrópica
O ruı́do da imagem é tratado através de um procedimento de suavização
anisotrópica. Esta etapa de suavização no algoritmo LSS é dividida em dois passos: (i) uma pré-filtragem com kernel gaussiano (seção A.1.3.3), seguida de (ii)
aplicação de um filtro de difusão anisotrópica (seção A.1.3.5). O filtro gaussiano
tem o propósito de suavizar o campo de intensidades da imagem para aplicação do
filtro anisotrópico, que utiliza o campo gradiente de intensidades (equação A.19).
No filtro gaussiano, o parâmetro , utilizado na pré-filtragem para o processo
de difusão, é a largura do kernel.
Na filtragem anisotrópica, o termo de difusão (equação A.21) é modelado no
kernel do filtro através dos seguintes parâmetros:
• K: controla a sensibilidade da anisotropia ao gradiente no ponto. Quanto
menor este valor, maior a anisotropia do kernel ;
• ⌧ : parâmetro de largura do kernel, controla a largura da suavização aplicada.
(a)
(b)
Figura 4.6: Em (b), a imagem de (a) suavizada com o filtro anisotrópico. Foram
utilizados os valores ⌧ = 10, K = 10 5 e = 1.
A figura 4.6 mostra um exemplo da suavização realizada com a difusão anisotrópica. Podemos notar as bordas como são preservadas além de realçadas.
65
4.2.3
Detecção de objetos
Nesta etapa é realizada a detecção de objetos2 – ou melhor, candidatos a
arcos – através de um algoritmo de crescimento de regiões (seção A.2.1). Esta
técnica define regiões de pixels contiguos que satisfaçam algumas propriedades
em conjunto. O algoritmo de crescimento de regiões é inicializado em um ponto
(semente) da imagem e adiciona os primeiros vizinhos – que satisfaçam dadas regras
de vizinhança – a cada iteração.
No algoritmo LSS as condições para que pixels adjacentes façam parte da região (R) são: (i) intensidade superior a um valor cthresh definido automaticamente
pelo algoritmo para cada semente e (ii) intensidade inferior à média da região no
passo anterior. A primeira condição define um limiar para distinguir entre objetos
e fundo da imagem. A segunda funciona como mecanismo de distinção de objetos
(deblending).
A figura 4.7 mostra o resultado do algoritmo de segmentação por crescimento de regiões aplicado pelo LSS. Note que além do objeto de interesse – o arco
gravitacional – outras 12 regiões são detectadas devido ao ruı́do e estruturas que
destacam-se do fundo da imagem.
Figura 4.7: As regiões em vermelho marcam os pixels detectados no algoritmo de
crescimento de regiões.
2
Define-se por objeto, aqui, regiões de pixels contiguos que destacam-se do fundo da imagem.
66
As sementes, por onde as regiões são inicializadas, são definidas a partir
dos máximos locais da imagem. Os máximos locais são procurados através da
avaliação da intensidade de cada pixel (i, j) e seus primeiros vizinhos: o pixel que
não apresentar vizinho(s) de valor superior é marcado como um máximo local.
Este procedimento de segmentação é realizado sobre a imagem suavizada
pela etapa de filtragem anisotrópica.
4.2.4
Seleção dos arcos
Por fim, cada região (candidato a objeto) detectada no processo de segmentação é avaliado quanto à excentricidade e largura. Neste ponto do algoritmo
pretende-se selecionar os arcos com base na morfologia dos objetos: objetos alongados e com alta excentricidade serão definidos como arcos.
O algoritmo utiliza os autovalores do segundo momento (seção A.2.3) de cada
região segmentada para computar a excentricidade de cada objeto e estimar sua
largura. Sendo
1
2
os autovalores do segundo momento, a excentricidade é
dada pela equação (A.26), transcrita abaixo:
2
ecc = 1
.
(4.1)
1
Dois parâmetros de corte, ecc e
• ecc
•
2
2,
são utilizados para selecionar os arcos:
cecc
 cthick
onde cecc e cthick são valores definidos pelo usuário. Os valores padrão utilizados
para cecc e cthick são 0.7 e 10, respectivamente.
A figura 4.8 apresenta o resultado final do algoritmo para este exemplo.
Podemos notar que a detecção do arco foi bem sucedida.
Algumas propriedades do arcos detectados são dadas ao final do processamento. Informações de posição e morfologia dos objetos são apresentadas em forma
de tabela com a apresentada na tabela 4.2, em relação a figura 4.8.
67
Figura 4.8: Arco detectado pelo algoritmo de Lenzen et al. Regiões com excentricidade inferior a 0.7 foram excluı́das.
xo
46
yo
39
ecc
0.98
1
180.045
2
2.549
A
37.952
B
4.516
✓
-0.946
size
259
Tabela 4.2: Parâmetros de saı́da calculados para o arco detectado. A e B são os
semi-eixos maior e menor, respectivamente, ✓ é a orientação do semi-eixo maior
(radianos) em relação ao eixo horizontal (x) da imagem, e size é a área do objeto.
Os parâmetros morfológicos apresentado na tabela, A, B, size (área) são
apresentados na seção A.2.3, calculados a partir dos 1 e 2 momentos de cada
região segmentada.
Na seção que segue analisamos alguns parâmetros do algoritmo afim de visualizarmos seus efeitos na busca de arcos.
4.2.5
Análise de parâmetros
Abaixo, apresento alguns resultados do buscador LSS para diferentes configurações de parâmetros do algoritmo. Os parâmetros serão analisados com o
objetivo de encontrarmos um conjunto de valores adequado para a aplicação em
imagens com diferentes propriedades. O objetivo deste conjunto é que seja um
bom ponto de partida na busca por arcos em diferentes imagens e que a partir dele
os parâmetros e resultados possam ser refinados.
Utilizaremos uma imagem do Hubble (HST, figura 4.9-a) para o ajuste dos
68
parâmetros, seguido de testes em imagens do DES (DC6, figura 4.9-b) e do telescópio Canada-France-Hawaii (CFHT, figura 4.9-c).
Portanto, a análise e primeiros testes dos parâmetros do LSS serão realizados
sobre a imagem do Hubble, arco “A” do painel 4.9, a mesma imagem utilizada na
seção anterior. A imagem do Hubble possui melhor resolução (0.09 00 /pixel) e assim
podemos observar melhor os efeitos dos diferentes parâmetros, afim de estudá-los e
ajustar o conjunto “bom” de parâmetros. As imagens do DC6 e CFHT, também de
arcos individuais, serão utilizadas como testes dos parâmetros ajustados. O arco
do DC6 (B) é um teste sobre uma imagem simulada, com ruı́do simulado elevado
e resolução de 0.27 00 /pixel. A imagem do CFHT (C), por outro lado, é o exemplo
de uma imagem real, de um telescópio terrestre, com resolução intermediária às
demais, 0.18 00 /pixel.
É importante salientar que o arco da imagem simulada foi gerado pelo AddArcs
para o ciclo de simulações de número 6 do DES, o Data Challenge 6.
(A)
(B)
(C)
Figura 4.9: Imagens de arcos obtidas com (A) Hubble, (B) DC6 — arco simulado
com o AddArcs e adicionada ao ciclo de simulações DC6 — e (C) CFHT (More
et al., 2011).
Cada parâmetro é variado individualmente neste primeiro momento para
que possamos analisar seu efeito no processamento e resultado das imagens. Um
conjunto de parâmetros padrão foi definido a partir do qual as variações em cada
parâmetro partiram (enquanto os demais mantiveram-se constantes). Os valores
de cada parâmetro utilizados nos testes abaixo foram escolhidos em acordo com a
documentação do algoritmo (Lenzen et al., 2004).
69
O conjunto de valores padrão para os parâmetros é dado abaixo:
• Limiarização e normalização
Valores de limiarização (ulim , u+
lim ) auto-computados com normalização
realizada por uma transformação linear, como explicado na seção (4.2.1);
• Suavização
Largura do filtro gaussiano:
= 1 pixels;
Parâmetro do filtro anisotrópico: K = 10
5
e ⌧ = 10;
• Detecção
Parâmetros para seleção morfológica: eccmin = 0.3 e cthick = 30 pixels.
Os parâmetros para a seleção (final) morfológica foram relaxados dos valores padrão eccmin = 0.7, cthick = 10, usados na seção 4.2.4, para que possamos
visualizar os resultados parciais, incluindo objetos que não admitimos como arcos.
Limiarização
Começamos por analisar os efeitos dos parâmetros de limiarização. Os valores
apresentados abaixo (ulim ) serão utilizados ora como limite superior (u+
lim ), ora
como limite inferior (ulim ) para que visualizemos a importância de cada valor na
imagem. É importante recordar o histograma de intensidades apresentado na figura
4.5 para compreender melhor os efeitos da figura 4.10.
Para os valores de corte utilizados temos as seguintes informações:
• ulim = 0: valor de intensidade mı́nima na imagem
• ulim = 47: valor correspondente a moda do histograma
• ulim = 55: valor que exclui aproximadamente 1% dos pixels de maior
intensidade
• ulim = 254: valor de intensidade máxima na imagem
70
• ulim = 50: valor que exclui aproximadamente 50% dos pixels de maior
intensidade
No processo de limiarização podemos notar facilmente o efeito resultante dos
cortes. Visivelmente os cortes realizados correspondendo ao painéis (c), (d) e (e)
da figura 4.10 não foram boas opções uma vez que o objeto de interesse não foi
detectado. Em (c) observamos que a faixa escolhida exclui o objeto de interesse e
mantém apenas o ruı́do de fundo. Em (d) apenas os pixels mais brilhantes foram
realçados, não alcançando o objetivo. Em (e), tivemos o ruı́do realçado devido ao
corte muito restrito, prejudicando o destaque do objeto.
Podemos selecionar, neste primeiro instante, os resultados que englobam
quase a totalidade dos pixels do arco, (a) e (b). Em particular, o exemplo (a),
o qual detectou diversas partes do objeto.
Suavização
Nesta seção vamos variar os parâmetros de suavização do algoritmo:
,⌧ e
K. Novamente, cada parâmetro foi variado individualmente para facilitar nosso
entendimento. As figuras (4.11), (4.12) e (4.13) apresentam os testes para , K e
⌧ conforme listado abaixo:
•
= 1, 2, 3, 5. A largura do kernel gaussiano variada entre valores tı́picos,
com “5” sendo tomado como limite superior aceitável, afim de visualizarmos
o efeito da pré-filtragem (figura 4.11).
• K = 10 5 , 10 3 , 1, 10. O parâmetro de sensibilidade – ou anisotropia – do
kernel para dois valores sugeridos no artigo e outros dois valores elevados
(1, 10) para visualizarmos a importância de K no realce de bordas (figura
4.12)
• ⌧ = 1, 5, 15. O valor de ⌧ que nos dá a largura máxima – no eixo
perpendicular às bordas – que o filtro anisotrópico pode ter (figura 4.13).
Faixa de valores que compreende os utilizados no artigo.
71
(a) ulim = 47, u+
lim = 55
(b) ulim = 0, u+
lim = 55
(c) ulim = 0, u+
lim = 47
(d) ulim = 47, u+
lim = 254
(e) ulim = 47, u+
lim = 50
Figura 4.10: Resultados para diferentes valores limites da seleção de intensidades.
À esquerda temos os valores inferior (ulim ) e superior (u+
lim ) para os limites da
limiarização, ao centro o resultado do processo de limiarização para os limites
dados, e à direita são apresentados os resultados da detecção do buscador.
72
(a)
=1
(b)
=2
(c)
=3
(d)
=5
Figura 4.11: Resultados da suavização (ao centro) e detecção (à direita) do algoritmo sobre a imagem do Hubble para diferentes valores de (esquerda).
73
O parâmetro de largura do filtro gaussiano, , não apresenta nestes exemplos
um impacto significativo na qualidade da detecção: o objeto central foi detectado
corretamente, à menos de alguns objetos espúrios. Podemos observar um notável
alargamento do objeto em (c), com o kernel de largura 5. Quanto a este alargamento devemos tomar cuidado, pois ele pode fazer com que o objeto não seja
selecionado como arco.
(a) K = 10
5
(b) K = 10
3
(c) K = 1
(d) K = 10
Figura 4.12: Resultados da difusão anisotrópica (ao centro) e da detecção final (à
direita) para diferentes valores de K (esquerda).
74
Com relação ao processo de difusão anisotrópica, os valores baixos para K,
apresentados nos painéis (4.12-a) e (4.12-b), geram um visı́vel realce do arco, ao
contrário de valores próximos ou da ordem de ⌧ (painéis c e d). Um efeito colateral
de utilizar baixos valores para K é o realce também do ruı́do de fundo. No entanto,
mesmo realçando também o ruı́do, um valor baixo para K (a) atinge o resultado
desejado; além da suavização, o realce dos objetos.
O poder de suavização do filtro é regulado pelo termo temporal do kernel
anisotrópico através dos parâmetros ⌧ . O parâmetro ⌧ controla o tamanho de cada
passo da parte temporal na solução numérica (seção A.1.3.5).
(a) ⌧ = 1
(b) ⌧ = 5
(c) ⌧ = 15
Figura 4.13: Resultados da difusão anisotrópica (ao centro) e da detecção (à direita) para diferentes valores de ⌧ (à esquerda).
Podemos notar na figura 4.13-a que um valor pequeno para este parâmetro
gera pouca suavização. Se quisermos suavizar mais a imagem, no intuito de realçar
75
o máximo da extensão do objeto temos de utilizar valores maiores para ⌧ como
vemos nos painéis 4.13 b e c.
Com isso terminamos a nossa análise de parâmetros do LSS. Podemos perceber melhor os efeitos de cada etapa do buscador e selecionar valores para as
configurações do algoritmo que melhor satisfaçam s resultados desejados. Na próxima seção sugerimos um conjunto de parâmetros bons para uma detecção confiável
de arcos em diferentes imagens.
4.2.6
Conjunto de parâmetros “bons”
Baseado nos testes que fizemos na seção anterior, escolhemos um conjunto de
parâmetros que parecem compor uma boa configuração para a imagem utilizada.
Este conjunto é disposto abaixo e o resultado sobre a imagem do Hubble de exemplo
da figura 4.9-a pode ser visto na figura 4.14.
• ulim = automático, moda (47, neste caso)
• u+
lim = automático, exclusão de 10% dos pixels (55, neste caso)
•
=2
• K = 10
5
• T = 15
Os parâmetros calculados pelo algoritmo para estes objetos são dados na tabela 4.3, estes parâmetros são calculados após a definição das regiões segmentadas.
O área de cada objeto, em pixels, é dada pelo parâmetro size. Os parâmetros A e
B são medidas de comprimento e largura (semi-eixos maior e menor), respectivamente. Estes são calculados a partir do momento de ordem 2, como apresentado
nas equações (A.27) e (A.28).
76
Figura 4.14: Resultado da detecção com conjunto de parâmetros “bons”. À esquerda, a imagem do arco de exemplo, à direita o resultado final da detecção.
objid
1
2
3
4
5
6
7
8
9
X
50
46
86
10
14
30
89
35
83
Y
47
9
38
49
35
2
31
41
54
ecc
0.985
0.980
0.906
0.880
0.819
0.768
0.734
0.679
0.654
A
70.198
6.672
3.749
6.110
5.005
4.094
4.799
5.163
2.844
B
8.589
0.940
1.144
2.115
2.124
1.971
2.473
2.921
1.671
size
718
17
15
19
20
13
16
23
11
Tabela 4.3: Propriedades dos objetos segmentados e apresentados na figura 4.14. A
primeira linha, realçada, corresponde ao arco da imagem em questão. As primeiras
três colunas identificam os“objetos”segmentados; ecc, A, B, size são os parâmetros
morfológicos – execntricidade, semi-eixos maior e menor e área, respectivamente –
calculados a partir dos momentos de cada região.
4.2.7
Teste de parâmetros ajustados
Agora, vamos tomar o conjunto de parâmetros testado e ajustado sobre o
arco do Hubble na seção anterior e aplicar nas outras duas imagens, do DC6 e
CFHT.
4.2.7.1
Teste em imagem de arco simulada
Inicialmente, vamos ver se os parâmetros escolhidos geram bons resultados
sobre uma imagem do DC6. A imagem da figura 4.15 contém um dos arcos simulados pelo AddArcs e adicionados a esse ciclo de simulações. Esta é uma imagem
77
interessante para o nosso trabalho uma vez que testa o buscador, e os parâmetros
escolhidos, sobre um arco gerado pelo AddArcs e adicionado ao Desafio do Dados.
A resolução instrumental das imagens simualadas pelo DES tem 0.27 00 /pixel e com
uma PSF de largura 0.8 00 .
Figura 4.15: Imagem do DC6 com arco simulado pelo AddArcs. O aglomerado
nesta imagem é o de número 209 no catálogo DES Mock v2.13.
Aplicando o algoritmo de LSS na imagem do arco simulado, em destaque na
figura 4.15, com as configurações obtidas na seção 4.2.6, obtemos o resultado apresentado nas figuras 4.16 e 4.17. Podemos notar que o arco simulado foi detectado,
além de alguns outros artefatos formados a partir do ruı́do de fundo. Na figura
4.17 podemos visualizar o resultado final da detecção. As propriedades dos objetos
detectados estão dispostas na tabela 4.4.
Note que vários artefatos fram detectados pelo buscador junto com o arco
da imagem, todos com alta elipticidade e finos. O objeto de interesse destaca-se,
contudo, dos demais “objetos” pelo seu tamanho.
78
(a)
(b)
(c)
(d)
Figura 4.16: Etapas da detecção do algoritmo LSS sobre o arco simulado: (a) a
imagem re-escalonada, (b) suavização anisotrópica, (c) regiões segmentadas, (d)
objetos selecionados.
Figura 4.17: Resultado final com as regiões detectadas.
4.2.7.2
Teste em imagem de arco real
Vamos aplicar o algoritmo LSS com os parâmetros ajustados sobre uma imagem real com caracterı́sticas próximas do que será obtido com a instrumentação do
79
X
54
16
83
91
18
44
16
28
71
26
4
93
Y
54
77
4
50
17
63
88
9
17
51
32
78
ecc
0.970
0.959
0.935
0.900
0.892
0.885
0.867
0.862
0.826
0.820
0.812
0.812
A
32.931
8.598
5.975
5.657
5.357
6.529
10.351
12.244
17.089
6.152
4.335
3.253
B
5.640
1.732
1.519
1.787
1.754
2.207
3.772
4.544
7.126
2.603
1.875
1.408
size
277
24
20
16
20
24
42
48
115
26
15
13
Tabela 4.4: Propriedades dos objetos detectados e apresentados na figura 4.14. A
primeira linha, realçada, corresponde ao objeto (arco) de nosso interesse.
DES. A imagem que vamos utilizar agora (figura 4.18) foi obtida com o telescópio
terrestre CFHT, de 3.6 metros, com a câmera Megacam que possui resolução de
0.187 00 /pixel. Nesta imagem a F W HM da PSF é 0.7 00 . (cedida por Anupreeta
More, do trabalho More et al. (2011))
Figura 4.18: Arco observado com o telescópio CFHT.
Aplicamos o algoritmo LSS a esta imagem com os parâmetros discutidos na
seção 4.2.6. Os resultados parciais de cada etapa do algoritmo podem ser vistos
nas figuras 4.19 e 4.20.
Os parâmetros morfológicos calculados pelo algoritmo para o arco detectado
estão dispostos na tabela 4.5.
Neste caso tivemos a detecção correta realizada pelo buscador de arcos. Os
demais objetos segmentados na imagem foram excluı́das da seleção final.
80
(a)
(b)
(c)
(d)
Figura 4.19: Etapas da detecção sobre o arco do CFHT: (a) imagem re-escalonada,
(b) suavização anisotrópica, (c) regiões segmentadas, (d) objeto detectado.
Figura 4.20: Resultado final da detecção.
X
29
Y
31
ecc
0.896
A
28.406
B
9.144
size
211
Tabela 4.5: Parâmetros morfológicos para o arco do CFHT.
Assim temos os testes com imagens reais e simuladas realizados, com os objetos de interesse em cada teste sendo corretamente detectados. Notamos que nas
imagens do Hubble e do DC6 tivemos várias detecções espúrias, quando são considerados apenas os parâmetros de excentricidade e largura. Mas podemos notar
também uma considerável distinção no tamanho das detecções correspondentes aos
arcos nas imagens: estes são da ordem de 10 vezes maiores que os artefatos gerados
no processamento.
81
4.3
Detecção de arcos em aglomerado de galáxias
Com os parâmetros do algoritmo LSS regulados e testados para arcos indivi-
duais em diferentes tipos de imagens, vamos aplicar o buscador de arcos na imagem
do aglomerado de Abell A383 (figura 4.1). O intuito é verificar se o algoritmo desempenha bem a detecção dos arcos na imagem completa, com todos os demais
objetos e correlacionar o resultado gerado com a tabela-verdade que criamos na
seção 4.1 (tabela 4.1), no processo de inspeção visual.
O painel 4.21 apresenta os resultados parciais do buscador de Lenzen et al.
sobre a imagem do aglomerado de Abell 383. Na figura 4.22 temos a imagem
binária com o resultado final da detecção dos objetos da imagem 4.1. Note que
nesta figura 4.22 foram adicionadas as marcações para candidatos a arcos realizadas
na seção 4.1, figura 4.2.
As regiões pretas (objetos) da imagem 4.22 correspondem às regiões coloridas
da imagem 4.21 (d). Na tabela 4.6 temos as propriedades dos objetos detectados
pelo algoritmo e que concordam com as posições marcadas no procedimento de
inspeção visual.
Xtt
512
478
484
119
591
474
Ytt
396
507
336
292
368
571
ID
A2
A1
9
6
D
8
X
513
476
487
121
583
470
Y
408
511
336
288
356
572
ecc
0.992
0.987
0.956
0.889
0.874
0.822
A
B
size
45.941 3.980 235
51.524 5.815 406
22.355 4.688 128
11.717 3.888 83
11.136 3.952 60
8.114 3.419 42
Tabela 4.6: Arcos detectados no aglomerado de Abell 383 e marcados na “tabelaverdade” (tabela 4.1). Os objetos B, C, 7, marcados na tabela-verdade, não foram
detectados.
Dos 9 objetos marcados no procedimento de inspeção visual (seção 4.1), 6
foram detectados pelo buscador, o que é satisfatório para uma abordagem inicial
na aplicação do buscador. É interessante visualizarmos em que etapa os objetos
— IDs: B, C e 7, figura 4.2 — foram perdidos no processo de detecção.
Os objetos identificados como B, C e 7 encontram-se bem próximos de galáxias
82
(a)
(b)
(c)
(d)
Figura 4.21: Etapas da detecção de objetos na imagem do aglomerado de Abell
A383: (a) imagem re-escalonada, (b) suavização anisotrópica, (c) regiões segmentadas, (d) objetos detectados.
brilhantes. Na primeira etapa do buscador, quando é realizado o re-escalonamento
das intensidades da imagem (figura 4.21-a) estes objetos ficam perdidos em meio
ao brilho difuso das galáxias próximas. Com a suavização direcional (figura 4.21b) nota-se que as bordas dos objetos ficaram mais bem definidas, apesar de não
ser suficiente para distinguir os objetos. Temos que um ponto a ser melhorado
frente aos parâmetros do buscador poderia ser no processo inicial de ajuste das
intensidades dos objetos.
83
Figura 4.22: Resultado final da imagem do aglomerado de Abell A383.
Os parâmetros de seleção do algoritmo de Lenzen et al., excentricidade e
largura parecem selecionar bem os arcos, ou candidatos a arcos. Note que o parâmetro de excentricidade ecc = 0.7, que seleciona objetos finos, detecta a maioria
dos objetos de nosso interesse. Porém, este parâmetro sozinho não é suficiente para
filtrar os artefatos detectados, sugerindo que outro parâmetro, por exemplo size,
deva ser utilizado em conjunto.
Assim finalizamos esta revisão e análise de parâmetros do buscador de arcos
de Lenzen et al. Está claro que alguns ajustes podem ser feitos para a melhoria da
detecção nos casos particulares, contudo chegamos a uma conjunto de parâmetros
razoáveis para a detecção da maior parte dos arcos gravitacionais selecionados
visualmente. A análise dos parâmetros realizada neste capı́tulo resultou em um
conjunto de configurações que pode ser um bom inı́cio para utilização do algoritmo
LSS na busca de arcos em diversos conjuntos de imagens.
84
Capı́tulo 5
Conclusão e perspectivas futuras
Ao longo deste trabalho foram estudados e implementados métodos computacionais para a simulação de arcos gravitacionais e processamento de imagens astronômicas visando a detecção automatizada dos arcos. Além disso, foi implementado um ambiente para o desenvolvimento colaborativo de software para organizar
a produção de códigos do grupo de lenteamento gravitacional do LIneA/CBPF.
Desenvolvemos um simulador de arcos gravitacionais que, a partir de propriedades básicas de aglomerados de galáxias (lentes) e galáxias de fundo (fontes),
juntamente com propriedades da instrumentação de interesse e a cosmologia subjacente, é capaz de gerar imagens de arcos com algum grau de realismo.
O código AddArcs foi desenvolvido para ser executado em um ambiente paralelo e distribuı́do e, assim, ser capaz de gerar um grande número de arcos de
maneira eficiente. Com o simulador foi possı́vel (i) simular arcos em toda área de
mapeamento do projeto, (ii) estimar o número de arcos que o DES deverá observar, (iii) adicionar estes objetos em imagens de aglomerados (reais ou simuladas),
(iv ) produzir imagens realistas, com efeitos de instrumentação compatı́veis com
imagens observadas, que podem ser utilizados como tabelas-verdade para testar
buscadores de arcos e métodos de inversão (que utilizam os arcos para determinar
a distribuição de matéria na lente).
Estudamos o processamento de imagens astronômicas e as dificuldades envolvidas na segmentação de arcos gravitacionais devido a sua baixa razão sinal-ruı́do.
85
Utilizamos o algoritmo de Lenzen et al., disponı́vel na literatura, o qual foi aplicado a imagens simuladas do DES, além de imagens de arcos reais de diferentes
resoluções. Por fim, aplicamos o algoritmo de busca em uma imagem real de um
aglomerado de galáxias para que pudessemos observar os resultados de maneira
mais ampla. Os parâmetros que controlam o algoritmo foram ajustados de maneira que o mesmo possa operar com diferentes tipos de imagens. Os resultados
obtidos são satisfatórios uma vez que os objetos de interesse, em sua maioria são
detectados com eficiência, colocando o conjunto de parâmetros escolhidos para o
algoritmo como um bom ponto de partida para testes e possı́veis refinamentos de
acordo com o tipo e caracterı́sticas dos objetos presentes nas imagens.
Ainda como resultado desta dissertação, foi desenvolvida uma biblioteca de
métodos para a simulação e processamento de dados astronômicos. A SLtools1
foi desenhada com a preocupação de disponibilizar códigos com qualidade e clareza, dentro da filosofia de ambiente colaborativo de código aberto. Para isso, uma
série de padrões foi estipulada dentro do grupo de desenvolvedores, além da implementação de infra-estrutura necessária composta por sistema de versionamento de
código, documentação, sistema de empacotamento e instalação.
Como trabalhos futuros, em relação à modelagem fı́sica do lenteamento gravitacional, é necessário que modelos de lentes mais realistas, com sub-estruturas,
sejam implementados no código do simulador. Seria interessante também utilizarmos simulações de halos de matéria escura com maior resolução para que possamos
calcular o valor do parâmetro de concentração e, assim, restringir melhor nosso modelo.
Para o simulador, do ponto-de-vista computacional, seria interessante colocar
mais um nı́vel de paralelismo no AddArcs, no nı́vel do lenteamento das fontes,
após avaliar e otimizar seu desempenho. É importante, também, substituir o atual
código que realiza o lenteamento das fontes, feito através do Gravlens, para que
possamos controlar o processo como um todo.
1
http://che.cbpf.br/sltools
86
Quanto à SLtools, seria interessante integrá-la com outros projetos de Python
para ferramentas de astronomia, como por exemplo, o projeto AstroPy2 , que busca
unificar as bibliotecas existentes (PyWCS, APLpy, AstroLib). Isto daria motivação
extra ao trabalho do grupo, além de contribuir em uma escala maior e integrada
com os métodos computacionais úteis à comunidade astronômica.
Para os buscadores de arcos é importante um comparativo entre os diferentes
algoritmos da literatura, e assim ser capaz de otimizar o processo de busca dos
arcos além de estabelecer métricas de avaliação das detecções. Para a classificação
dos objetos, uma possibilidade interessante seria utilizar algoritmos baseados em
treinamento, como Redes Neurais ou Máquinas de Vetor de Suporte (SVM).
2
http://astropy.wikispaces.com/
87
Referências Bibliográficas
C. Alard. Automated detection of gravitational arcs. ArXiv Astrophysics e-prints,
astro-ph/0606757, 2006.
S. Allam, J. Annis, M. B. Bayliss, S. Bridle, E. Buckley-Geer, G. Caminha, F. J.
Castander, E. Cypriano, S. Desai, H. T. Diehl, H Dumet, J. Estrada, S. Farrens,
P. Ferreira, J. A. Frieman A, C. Furlanetto, M. D. Gladders, D. McGinnis,
L King, C. Kochanek, J. Kubo, D. Kubik, H. Lin, M. Makler, P., W. Merritt,
E. Rozo, B. Santiago, V. Scarpine, R. K. Sheth, J. Thaler, D. Tucker. DES
Strong Lensing White Paper. Internal collaboration document, 2009.
M. Bartelmann. Arcs from a Universal Dark-Matter Halo Profile. Astronomy and
Astrophysics, 313:697, 1996.
M. Bartelmann, A. Huss, J. M. Colberg, A. Jenkins, F. R. Pearce. Arc statistics
with realistic cluster potentials. Astronomy and Astrophysics, 330:1, 1998.
E. Bertin e S. Arnouts. SExtractor: Software for source extraction. Astronomy
and Astrophysics, 117:393, 1996.
J. Binney e M. Merrifield. Gravitational Lensing. In: Galactic Astronomy. página 62, Princeton Series in Astrophysics, 1998.
G. Caminha. Cálculo da Abundância de Arcos Gravitacionais em Aglomerados de
Galáxias. Dissertação de Mestardo, Centro Brasileiro de Pesquisas Fı́sicas, 2009.
D. Coe, N. Benı́tez, S. F. Sánchez, M. Jee, R. Bouwens, H. Ford. Galaxies in the
Hubble Ultra Deep Field. The Astronomical Journal, 132:926, 2006.
88
D. Coe, E. Fuselier, N. Benitez, T. Broadhurst, B. Frye, H. Ford. LensPerfect:
Gravitational Lens Mass-map Reconstructions Yielding Exact Reproduction of
All Multiple Images. The Astrophysical Journal, 681:814, 2008.
J. M. Comerford e P. Natarajan. The observed concentration-mass relation for
galaxy clusters. Monthly Notices of the Royal Astronomical Society, 379:190,
2007.
A. R. Cooray.
Cosmology with Galaxy Clusters: III. Gravitationally Lensed
Arc Statistics as a Cosmological Probe. ArXiv Astrophysics e-prints, astroph/9807148, 1998.
J. Estrada, J. Annis, H. T. Diehl, P. B. Hall, T. Las, H. Lin, M. Makler, K. W.
Merritt, V. Scarpine, S. Allam, D. Tucker. A systematic search for high surface brightness giante arcs in a Sloan Digital Sky Survey cluster sample. The
Astrophysical Journal, 660:1176, 2007.
C. Faure, J. P. Kneib, G. Covone, L. Tasca, A. Leauthaud, P. Capak, K. Jahnke,
V. Smolcic, S. de la Torre, R. Ellis, A. Finoguenov, A. Koekemoer, O. Le Fevre, R. Massey, Y. Mellier, A. Refregier, J. Rhodes, N. Scoville, E. Schinnerer,
J. Taylor, L. Van Waerbeke, J. Walcher. First Catalog of Strong Lens Candidates
in the COSMOS Field. Astrophysical Journal Series, 176:19, 2008.
P. Ferreira. Simulações de arcos gravitacionais em imagens e estudo de sua razão
axial. Dissertação de Mestardo, Universidade Federal do Rio de Janeiro, 2010.
A. Horesh, E. Ofek, D. Maoz, M. Bartelmann, M. Meneghetti, H. Rix. The Lensed Arc Production Efficiency of Galaxy Clusters: A Comparison of Matched
Observed and Simulated Samples. The Astrophysical Journal, 633:768, 2005.
A. K. Jain P. W. Duin. Statistical pattern recognition: a review. IEEE Transactions
on Pattern Analysis and Machine Intelligence, 22:4, 2000.
W. A. Joye e E. Mandel. New Features of SAOImage DS9. In: H. E. Payne,
R. I. Jedrzejewski, R. N. Hook (editores), Astronomical Data Analysis Software
89
and Systems XII, volume 295 of Astronomical Society of the Pacific Conference
Series, 2003.
E. Jullo, J. P. Kneib, M. Limousin, A. Elı́asdóttir, P. Marshall, T. Verdugo. A
Bayesian approach to strong lensing modelling of galaxy clusters. New Journal
of Physics, 9:447, 2007.
C. R. Keeton. Computational Methods for Gravitational Lensing. ArXiv Astrophysics e-prints, astro-ph/0102340, 2001.
F. Lenzen, S. Schindler, O. Scherzer. Automatic detection of arcs and arclets
formed by gravitational lensing. Astronomy and Astrophysics, 416:391, 2004.
P. J. Marshall, T. Treu, J. Melbourne, P. Gavazzi, K. Bundy, S. M. Ammons, A. S.
Bolton, S. Burles, J. E. Larkin, D. Le Mignant, D. C. Koo, L. V. E. Koopmans,
C. E. Max, L. A. Moustakas, E. Steinbring, S. A. Wright. Superresolving Distant
Galaxies with Gravitational Telescopes: Keck Laser Guide Star Adaptive Optics
and Hubble Space Telescope imaging of the Lens System SDSS J0737+3216. The
Astrophysical Journal, 671:1196, 2007.
M. Meneghetti, B. Jain, M. Bartelmann, K. Dolag. Constraints on dark energy
models from galaxy clusters with multiple arcs. Monthly Notices of the Royal
Astronomical Society, 362:1301, 2005.
A. More, R. Cabanac, S. More, C. Alard, M. Limousin, J. P. Kneib, R. Gavazzi,
V. Motta. The CFHTLS-Strong Lensing Legacy Survey (SL2S): Investigating
the group-scale lenses with the SARCS sample. ArXiv Astrophysics e-prints,
astro-ph/1109.1821, 2011.
R. Narayan e M. Bartelmann. Lectures on Gravitational Lensing. ArXiv Astrophysics e-prints, astro-ph/9606001, 1996.
J. F. Navarro, C. S. Frenk, S. D. M. White. The Structure of Cold Dark Matter
Halos. The Astrophysical Journal, 462:563, 1995.
90
A. F. Neto, L. Gao, P. Bett, S. Cole, J. F. Navarro, C. S. Frenk, S. D. M. White,
V. Springel, A. Jenkins. The statistics of LCDM Halo Concentrations. Monthly
Notices of the Royal Astronomical Society, 381:1450, 2007.
M. Oguri, J. Lee, Y. Suto. Arc Statistics in Triaxial Dark Matter Halos: Testing
the Collisionless Cold Dark Matter Paradigm. The Astrophysical Journal, 599:
7, 2003.
M. E. Pereira. Caracterização Empı́rica da Distribuição de Galáxias em Levantamento do Hubble Space Telescope. Dissertação de Mestardo, Universidade
Estadual do Rio de Janeiro, 2009.
D. J. Raine e E. G. Thomas. Gravitational Lensing. In: An introduction to the
science of cosmology. Institute of Physics, 2001.
G. Seidel e M. Bartelmann. Arcfinder: an algorithm for the automatic detection
of gravitational arcs. Astronomy and Astrophysics, 472:341, 2007.
J. L. Sérsic. Influence of the atmospheric and instrumental dispersion on the brightness distribution in a galaxy. Boletin de la Asociación Argentina de Astronomia,
6:41, 1963.
G. P. Smith, J. P. Kneib, H. Ebeling, O. Czoske, I. Smail. A Hubble Space Telescope
Lensing Survey of X-ray Luminous Galaxy Clusters. I. A383. The Astrophysical
Journal, 552:493, 2001.
91
Apêndice A
Processamento de imagens astronômicas
Neste capı́tulo serão descritas algumas técnicas de processamento de imagens
utilizadas nos algoritmos trabalhados ao longo desta dissertação e implementados
na biblioteca SLtools. A imagem abaixo (figura A.1) será utilizada como exemplo
para demonstrar os efeitos de cada processamento. Ela representa um arco gravitacional tı́pico, com seu formato esguio e elongado, sendo a morfologia base que
desejamos ser capazes de detectar em um procedimento de busca automatizado.
Todos os valores numéricos nas seções a seguir se referirão a essa imagem (exceto
quando for explicitamente dito o contrário).
Figura A.1: Imagem exemplo de um arco gravitacional. Esta imagem foi retirada
do banco de dados do Telescópio Espacial Hubble (HST ), e refere-se a um dos
arcos encontrados no aglomerado de Abell 383 (Smith et al., 2001).
A.1
Pré-processamento e Filtragem de imagens
O tratamento de uma imagem astronômica deve abordar o problema do
ruı́do, o que pode ser feito de duas maneiras: reduzir o nı́vel de ruı́do da imagem
92
e realçar o sinal dos objetos. Algumas destas técnicas, para melhoria do sinal e
realce dos objetos da imagem, são apresentadas nas subseções a seguir.
A.1.1
Mudança de brilho
Dentre as operações para modificar a distribuição de intensidades de uma
imagem estão as de re-escalonamento (rescaling). Estas são simples modificações
na intensidade de cada pixel da imagem individualmente, sem que informações da
vizinha ou do histograma como um todo sejam necessárias. A operação mais comum é a normalização da faixa de intensidades de uma imagem: quando desejamos
mapear uma faixa [Ia , Ib ] da imagem I em uma faixa [Ic , Id ] da nova imagem I 0 :
I 0 (x, y) =
(I(x, y) Ia )
(Id
(Ib Ia )
Ic ) + Ic
(A.1)
A nova faixa de intensidades na qual a imagem em geral é mapeada ([Ic , Id ])
é [0, 255], no caso de imagens em tons de cinza. Em astronomia, a faixa utilizada
é usualmente [0, 1].
Outras operações que apresento são as transformações por tangente hiperbólica e logaritmo:
• tangente hiperbólica:
v = tanh(↵x
I0 ) + c =
e2(↵x
e2(↵x
I0 ) 1
I0 )+1
• logaritmo:
v = log(↵x + 1) + c
Na figura A.2 são apresentadas as curvas destas transformações.
As constantes utilizadas na figura A.2 foram escolhidas apenas para exemplificar a manipulação que podemos fazer nas funções para encaixar na faixa do
domı́nio que desejarmos. Ao aplicarmos os operadores em imagens manipularemos
estas constantes de forma a realçar a faixa de intensidades que desejarmos.
93
Figura A.2: Funções de re-escalonamento de intensidades. As funções tangente
hiperbólica e logaritmo estão deslocadas da origem de acordo com os parâmetros
↵ = 1, I0 = 5, c = 1 para tangente hiperbólica e c = 0 para logaritmo.
A.1.1.1
Tangente hiperbólica
A função tangente hiperbólica foi utilizada com o intuito de realçar as intensidades dos objetos em relação ao ruı́do de fundo do céu. Conforme ilustrado
na figura A.2, a função tanh(x) possui um ponto de inflexão em x = I0 /↵, correspondendo a x = 5 no gráfico. Em torno deste ponto (4 . x . 6 na figura) os
valores da abscissa variam significativamente em um pequeno intervalo. À medida
que se distancia deste ponto a curva rapidamente atinge valores limite, o que é
interessante para separar regimes de intensidades.
Através do parâmetro ↵ a inclinação em torno do ponto de inflexão pode ser
manipulada. O objetivo de modificar esta inclinação, visto que os valores limite
(x !
inf , x ! + inf) mantém-se inalterados, está em restringir a faixa de
valores de x utilizados para separar os regimes de intensidade. Em particular, para
os arcos gravitacionais, queremos transladar o ponto de inflexão (I0 /↵) para um
valor estimado superior do ruı́do da imagem de forma a deslocar as intensidades
dos objetos para o valor limite da função à direita (x > I0 /↵).
A figura A.3 apresenta exemplos de imagens transformadas com a função
tanh() para diferentes inclinações. O valor (I0 ) para posicionar o ponto de infle94
xão foi escolhido a partir do histograma da imagem, correspondendo à moda da
distribuição de intensidades.
(a)
(b)
(c)
Figura A.3: Imagens re-escalonadas por tanh() para diferentes valores de ↵: (a)
↵ = 0.01, (b) ↵ = 0.1, (c) ↵ = 1.
O problema desta técnica é que os pixels do fundo, com valores de intensidade
tı́picos do objetos, são também realçados.
A.1.1.2
Logaritmo
A função logaritmo opera de forma a suavizar as pequenas variações de intensidade. Para analisar a insensibilidade desta função frente às variações do argumento consideremos o logaritmo de base 10. Pelas propriedades da função temos:
log10 (10n x) = log10 (10n ) + log10 (x)
(A.2)
= n log10 (10) + log10 (x)
(A.3)
= n + log10 (x) .
(A.4)
Por exemplo, para pixels com valores de intensidade distantes por uma ordem
de grandeza (n = 1; digamos, de 10 para 100) terı́amos, após aplicação desta
transformação, estes mesmos pixels distantes por apenas uma unidade.
Além de trabalhar como um suavizador, o operador log() (ver figura A.2)
tem uma inclinação acentuada nas faixas mais baixas do domı́nio (0 < x . 1) e
diminui à medida que x cresce. Essa propriedade é utilizada para realçar baixas
intensidades e suavizar regiões com valores altos.
95
A figura A.4 mostra um exemplo da transformação por logaritmo sobre a
imagem exemplo de arco.
(a)
(b)
Figura A.4: Re-escalonamento de intensidades com log10 () (b) sobre a imagem do
arco original (a)
O resultado da aplicação desta transformação não parece ter sido benéfico,
pois o ruı́do de fundo foi elevado, o que não é desejado.
A.1.1.3
Equalização de histograma
Equalização de histograma consiste na modificação da distribuição de probabilidades de maneira tal que as probabilidades sejam uniformizadas. Esta modificação tem por objetivo aumentar o contraste da imagem e assim realçar os
objetos.
Consideremos o histograma de uma imagem como sendo a densidade de probabilidades p1 (x) das intensidades de uma imagem u. No caso discreto, o histograma representa as frequências relativas de ocorrência das intensidades. O
processo conhecido por modificação de histograma consiste em transformar as
intensidades da imagem de tal maneira a satisfazer uma desejada densidade de
probabilidades p2 (x). As probabilidades de cada uma das distribuições são dadas
por,
Z
u
p1 (x)dx = F1 (u) ,
(A.5)
p2 (x)dx = F2 (v) .
(A.6)
0
Z
v
0
96
Impondo que v satisfaça a relação F2 (v) = F1 (u), obtemos:
v(u) = F2 1 (F1 (u)).
(A.7)
Então, v é a nova distribuição de intensidades em função de u, com densidade
de probabilidade p2 (x). Portanto, v é totalmente definida por p2 (x), uma vez que
p1 (x) e u são conhecidas. Dois exemplos de modificação de histograma são a
equalização e a limiarização, que serão discutidos a seguir.
Na expressão (A.7) temos a expressão geral para a modificação do histograma
de uma imagem. No caso da equalização queremos que p2 (x) seja uma função constante, ou seja, a imagem final deve ter uma distribuição de intensidades uniforme.
Supondo que 0  u  1, então p2 (x) = 1 na expressão (A.5). Isto, juntamente com a restrição F2 (v) = F1 (u), nos dá a expressão para v(u):
v(u) = F1 (u) .
(A.8)
Portanto, a equalização de histograma é realizada pela expressão acima, que aplicada sobre a imagem original nos dá uma imagem com histograma uniforme.
Na figura (A.5) temos um exemplo de aplicação do método de equalização
de histograma na imagem de arco exemplo.
Podemos notar na imagem (b) o realce que houve das regiões escuras em
(a). O arco ficou bem evidente, os extremos tênues ganharam maior definição.
No entanto tivemos também o realce do ruı́do de fundo, prejudicando bastante a
qualidade da imagem. Apesar disso, o método realça as intensidades de menor
frequência da imagem, e, assim, seleciona bem as intensidades tı́picas dos objetos.
A.1.2
Limiarização
O procedimento conhecido por limiarização — do inglês, thresholding —
remove faixas de intensidades não desejadas da imagem. Esta remoção é feita
associando novos valores (e.g., zero) para todos os pixels que originalmente tinham
97
(a)
(b)
Figura A.5: Equalização de histograma: (a) imagem de arco original e (b) imagem
equalizada.
valores na faixa indesejada. A faixa de intensidades de interesse pode ser definida
manualmente ou através de algum processo automatizado sobre a distribuição de
intensidades da imagem.
O Thresholding tem sido aplicado nas imagens astronômicas como ferramenta
para redução do ruı́do. A figura A.6 apresenta um histograma tı́pico de uma
imagem astronômica na qual a maior parte dos pixels corresponde ao fundo do céu.
Portanto, o pico de contagens observado na figura A.6 corresponde às contagens
do ruı́do de fundo. Neste procedimento de limiarização, o ruı́do de fundo é o que
queremos remover ou diminuir, além de aumentar o contraste da imagem. O ponto
de corte para a limiarização do ruı́do é indicado pela linha vermelha que passa pelo
pico do histograma da figura. A linha vermelha à esquerda indica o ponto de corte
superior para a remoção de intensidades muito elevadas. Neste exemplo, os pontos
de corte para a limiarização são dados pelas intensidades de valor 46.9 e 68.7.
A.1.3
Filtragem
Filtragem, em processamento de imagens, é um conjunto de operações com
intuito de suavizar ou realçar os detalhes da imagem, bem como minimizar o ruı́do
e eliminar defeitos. Na figura A.7 apresento o efeito da redução do ruı́do através de
um filtro gaussiano (seção A.1.3.3), o resı́duo gerado pela suavização é apresentado
em um dos painéis a tı́tulo de demonstração do efeito de filtragem. Nas seções
que seguem são apresentados alguns filtros passa-baixa (média, gaussiana), para
98
Figura A.6: Histograma caracterı́stico de uma imagem astronômica e o ponto de
corte (linha vermelha esquerda) utilizado para redução do ruı́do.
o tratamento de ruı́do nas imagens, bem como a filtragem anisotrópica (A.1.3.5),
para realce de bordas dos objetos.
Figura A.7: Resı́duo de filtragem gaussiana. À esquerda temos a imagem original e
ao centro, a mesma imagem porém agora filtrada com um kernel gaussiano (3 ⇥ 3).
O resı́duo, dado pela diferença das imagens original-filtrada, é apresentado no
painel da direita, representando o ruı́do sobressalente ao sinal da imagem.
A.1.3.1
Filtro da média
O filtro da média é uma operação que calcula o valor médio dos pixels dentro
de uma vizinhança e associa o resultado ao pixel central sendo avaliado. Um
exemplo deste tipo de filtro, utilizando uma vizinhança 5 ⇥ 5, é apresentado na
tabela (A.1). Esta matriz, ou máscara, é utilizada para definir os pesos de cada
99
ponto e seu entorno, para o cálculo da média e atualização do valor.
A equação abaixo define a operação de média aplicada no ponto (k, l):
i=2,j=2
X
1
v(k, l) =
u(k
25 i= 2,j= 2
i, l
j)
(A.9)
onde u é a imagem original, (k, l) é o pixel sendo avaliado, i e j estão variando em
torno do centro da janela, em que a vizinhança é definida. A nova imagem v é a
imagem média de u.
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
1
25
Tabela A.1: Janela 5x5 do filtro da média.
A figura A.8 mostra o resultado do filtro aplicado sobre a imagem da figura
(A.1).
Figura A.8: Suavização com filtro da média com uma janela 5 ⇥ 5.
A.1.3.2
Filtro da mediana
O filtro da mediana é muito próximo do anterior, da média, porém ao invés de
associar o valor médio de uma região ao pixel central, este é atualizado com o valor
da mediana da região. Como a mediana é o valor que separa a distribuição em dois
conjuntos de mesmo tamanho esta operação não suaviza a imagem tanto quanto
o filtro da média, mas preserva melhor a informação de bordas e caracterı́sticas
100
dos objetos. A figura (A.9) apresenta o resultado da aplicação deste filtro para
compararmos com o filtro da média na seção anterior.
Figura A.9: Suavização com filtro da mediana com uma janela 5 ⇥ 5.
A.1.3.3
Filtro Gaussiano
O filtro gaussiano é um operador que utiliza uma função gaussiana discretizada para montagem de um kernel e aplicá-lo via convolução sobre a imagem de
interesse. A função gaussiana é dada pela expressão:
G(x, y;
x,
y) =
2⇡
p
Utilizando um valor apropriado para
1
2
x
e
2
+
x,
x2
2
2 x
y2
2
2 y
(A.10)
y
y
e as dimensões do operador temos
uma matriz como a apresentada na tabela (A.2) e que pode ser convoluı́da com a
imagem.
1
36
1
36
1
36
1
36
1
36
1
36
1
18
1
18
1
18
1
36
1
36
1
18
1
9
1
18
1
36
1
36
1
18
1
18
1
18
1
36
1
36
1
36
1
36
1
36
1
36
Tabela A.2: Janela 5x5 do filtro gaussiano, com x = y = 1. Os valores da janela
foram normalizados (soma = 1) para que o brilho da imagem não seja alterado.
A imagem resultante, suavizada, é dada pela operação de convolução, defi-
101
nida pela seguinte expressão:
v(k, l) = G(k, l) ⇤ u(k, l) =
j=2
i=2 X
X
G(k
i)(l
j)u(i, j) ,
(A.11)
i= 2 j= 2
onde u é a imagem original, (k, l) é o pixel sendo avaliado, i e j estão variando em
torno do centro da janela.
A figura A.10 apresenta alguns exemplos de aplicação da filtragem gaussiana
com diferentes valores de
x,
y.
Figura A.10: Suavização com diferentes filtros gaussianos: (superior-esquerdo)
(1, 1), (superior-direito) (1, 3), (inferior-esquerdo) (3, 1), (inferior-direito)
(3, 3).
A.1.3.4
Suavização Direcional
O método de suavização direcional aplica o filtro da média em uma particular
direção para cada ponto da imagem. A figura A.11 mostra os elementos básicos
desta técnica. Observamos uma janela em torno do pixel (m, n) da imagem orientada segundo um ângulo ✓ com a direção horizontal. Para cada ângulo ✓ escolhido,
o método calcula a intensidade média no interior da janela, dada pela expressão
v(m, n; ✓) =
1
NW ✓
X
k,l2NW✓
102
u(m
k, n
l) ,
(A.12)
onde NW✓ é o número de pixels da janela e u é a imagem original.
Finalmente é resolvido o seguinte problema de otimização:
✓⇤ = arg min |u(m, n)
✓
v(m, n; ✓)|
v(m, n) = v(m, n; ✓⇤ ) ,
(A.13)
(A.14)
obtendo-se, assim, o novo valor v(m, n) para o pixel avaliado.
A suavização em uma direção particular tem por objetivo preservar a borda
dos objetos juntamente com o processo de suavização do ruı́do da imagem. Para
tanto, a suavização deve ser realizada na direção paralela à borda dos objetos, que
corresponde à direção ✓⇤ da equação (A.13).
A figura (A.11) nos auxilia a visualizar a configuração deste filtro. Na figura A.12 são apresentados os resultados da aplicação deste filtro para janelas de
tamanhos distintos (3 ⇥ 1 e 15 ⇥ 1) e ângulos ✓ = 0 , 45 , 90 , 135 .
Figura A.11: Janela de aplicação do filtro direcional
103
(a)
(b)
Figura A.12: Suavização direcional sobre a figura (A.1) com janelas (a) 3 ⇥ 1, e
(b) 15 ⇥ 1.
A.1.3.5
Difusão anisotrópica
O filtro de difusão anisotrópica é outra técnica de suavização utilizada no
tratamento de ruı́do das imagens. A idéia principal deste filtro é suavizar a imagem
— fundo e objetos — preservando a informação das bordas dos objetos.
A difusão anisotrópica é definida pela equação
@I(x, y, t)
= div(D(x, y, t; I, rI)rI) ,
@t
(A.15)
onde I é a imagem sobre a qual o filtro opera.
O coeficiente “D(·)” define o grau de suavização a ser aplicado em cada ponto
da imagem e depende das caracterı́sticas da imagem no ponto. Note que se D(·) for
uma constante, independente da posição, temos o filtro gaussiano (difusão linear ).
Visto que um dos objetivos do processo de filtragem neste trabalho é realçar
bordas de objetos (arcos gravitacionais), o coeficiente de difusão deve ser função do
gradiente do campo de intensidades: no centro do objeto, onde a intensidade atinge
o máximo, o gradiente é próximo de zero, enquanto que nas bordas a variação da
intensidade é grande e, portanto, o gradiente é alto.
Vamos supor que os pontos da borda estejam orientados na direção x e que
104
o coeficiente de difusão seja função do gradiente, D(x, y, t) = g(Ix (x, y, t))1 . A
equação (A.15) torna-se:
@I(x, y, t)
@ [g(Ix (x, y, t))Ix (x, y, t)]
=
@t
@x
(A.16)
Definindo (Ix ) = g(Ix ) · Ix podemos escrever:
It =
@ (Ix )
=
@x
x (Ix )
· Ixx
(A.17)
Estamos interessados na variação temporal do gradiente de intensidades,
@Ix
,
@t
visto que esta é a quantidade resultante do processo de filtragem. Assumindo
D(x, y, t) > 0 podemos trocar a ordem das diferenciações de modo que
@Ix
=
@t
xx
2
· Ixx
+
x
· Ixxx .
(A.18)
Nas bordas temos Ixx = 0 e Ixxx < 0 visto que estes pontos são os máximos
locais do gradiente de intensidades. Então, existe uma vizinhança dos pontos da
borda em que a derivada @Ix /@t tem sinais opostos a
x (Ix ).
Se
x (Ix )
desnivel do ponto da borda diminui com o tempo. Do contrário, se
x (Ix )
> 0 o
<0a
borda torna-se mais evidente. Podemos então notar que a difusão anisotrópica é
capaz de suavizar pequenas descontinuidades e acentuar as mais fortes, realçando
assim as bordas dos objetos.
O modelo especı́fico de Lenzen et al.
Explicadas matematicamente as motivações para o uso da difusão anisotrópica no processo de filtragem, apresento abaixo o modelo especı́fico utilizado pelo
algoritmo de Lenzen et al. (2004). O filtro anisotrópico neste algoritmo é aplicado
sobre uma imagem pré-filtrada por um filtro gaussiano. A pré-filtragem da imagem
torna o cálculo de gradientes mais estável para a difusão anisotrópica.
No modelo utilizado por Lenzen et al. usa-se uma matriz de difusão dada
1
O subı́ndice “x” em Ix significa a derivada em relação a x; assim como “t”, derivada em
relação a t.
105
pela seguinte expressão:
Dµ, (ru ) =
g(|ru |2 ) 0
v1µ , v2µ
0
1
!
v1µ , v2µ
T
(A.19)
Onde u é a imagem original convoluı́da com um filtro gaussiano de largura
, v1µ e v2µ são os autovetores do tensor:
Kµ ⇤

ru
ru
T
.
(A.20)
os quais indicam as direções paralela e perpendicular, respectivamente, à borda em
cada ponto. O termo Kµ é um kernel gaussiano, com largura µ, utilizado apenas
neste ponto para estabilizar a computação dos autovetores v1µ e v2µ .
A função g(|ru |) da equação (A.19) é dado por:
"
g(|ru |) = 1 +
✓
|ru |
K
◆2 #
1
, K > 0.
(A.21)
A solução da equação A.16 é obtida através da discretização espacial pelo
método de elementos finitos e através do método de Euler implı́cito no tempo. A
solução da parte temporal é obtida discretizando o tempo total T em um número
de passos N de tamanho t (Lenzen et al., 2004).
Nas imagens abaixo são apresentados alguns resultados da suavização por
difusão anisotrópica utilizada no algoritmo do Lenzen. Nos exemplos abaixo foram
variados os valores de K da expressão (A.21). Conforme proposto por Lenzen, a
faixa de valores deste parâmetro para o seu algoritmo é [10 4 , 0.1]. Assim, são
utilizados estes limites nos exemplos abaixo.
Podemos notar nas imagens da figura A.13 a diferença deste processo de
suavização na definição das fronteiras do objeto conforme variamos K. Os objetos
filtrados com o valor de K pequeno tiveram suas bordas mais definidas e realçadas,
enquanto os objetos com maior valor de K perderam a definição da fronteira.
É importante notar a formação de pequenas estruturas (canto inferior esquerdo)
106
Figura A.13: Imagem A.1 filtrada com difusão anisotrópica utilizando K = 10
(esquerda) e K = 0.1 (direita).
4
quando utilizamos um valor baixo para o parâmetro K. Estas estruturas são
formadas quando a suavização opera sobre o ruı́do do fundo da imagem.
A.2
Identificação de objetos
Identificação de objetos em imagens astronômicas consiste em identificar re-
giões de pixels contı́guos que se destaquem do fundo das imagens por caracterı́sticas
do perfil de brilho. É comum na área de astronomia chamar esta operação de segmentação, adicionando computação de caracterı́sticas morfológicas para identificação de objetos de interesse (estrelas, galáxias, arcos gravitacionais). Nesta seção
serão descritos alguns algoritmos utilizados na segmentação de imagens astronômicas. Estes são algoritmos que identificam regiões da imagem que apresentem
caracterı́sticas, como intensidade e gradiente, condizentes com o tipo de objeto de
interesse.
A.2.1
Crescimento de regiões
Crescimento de regiões (do inglês region growing, RG) é um algoritmo iterativo para segmentação de imagens. Partindo de um ponto inicial (semente) o
algoritmo procura pelos pixels vizinhos que satisfaçam algumas propriedades e,
assim, sejam incorporados à região em crescimento. Portanto, a aplicação de um
algoritmo RG depende de (i) definir uma semente, o ponto de inicialização do
107
algoritmo, e (ii) um conjunto de regras Q para selecionar pixels para a região em
crescimento. É tı́pico utilizar como regra para a seleção dos pixels, a intensidade
do pixel e o gradiente da imagem.
Para descrever o conceito do algoritmo utilizaremos a seguinte notação. Para
um dado pixel p = (i, j) denotamos por N (p) a vizinhaça formada pelos primeiros
vizinhos, a qual podemos definir de duas formas:
• Vizinhança quatro-conectada:
N4 (p) = {(k, l) 2 N ⇥ N | |i
k| + |j
l| = 1}
(A.22)
k| + |j
l|  2}
(A.23)
• Vizinhança oito-conectada:
N8 (p) = {(k, l) 2 N ⇥ N | |i
O algoritmo que implementa este método segue abaixo((Jain Duin, 2000))
(1) Inicializa a regiao R com a semente. Define o tipo de vizinhança
(2) Escolhe um pixel p 2 R para avaliar vizinhança N (p)
(3) Se q 2 N (p) n~
ao foi visitado antes, verifica se satisfaz Q
Se sim, adiciona q a R
(4) Repete os passos 1-2 até que n~
ao hajam mais pixels para incorporar.
Na figura (A.14) é dado um exemplo de segmentação com o crescimento de
regiões. As sementes utilizadas para inicialização das regiões são apresentadas em
(A.14 (a)) e o resultado do processo é visualizado na figura (A.14 (b)). Os pixels
utilizados como semente para a segmentação são máximo locais da imagem. O
valor limite de intensidade utilizado para finalização do algoritmo foi 52.
108
(a)
(b)
Figura A.14: Resultado da segmentação com crescimento de regiões. Em (a) podemos ver as três sementes utilizadas para inicializar a segmentação resultante na
imagem (b).
A.2.2
Limiarização
O processo de segmentação por limiarização seleciona conjuntos de pixels que
apresentem valores superiores a um dado limite inferior. O processo utilizado aqui
é análogo ao apresentado na seção A.1.2, porém, neste caso, modificado para que
ao final tenhamos uma imagem (binária) com regiões que representem objetos de
interesse. Além disso, adicionamos uma restrição com relação a área das regiões
obtidas. Portanto, dois são os parâmetros que devem ser dados ao algoritmo: (i)
o limite inferior para as intensidades (ulim ) e (ii) o tamanho mı́nimo para cada
região (Nlim ). Os valores para ulim e Nlim devem ser estipulados de acordo com
o nı́vel de intensidade caracterı́stico e tamanho dos objetos desejados. Na figura
(A.15) apresento um exemplo de segmentação pelo processo de limiarização. O
valor escolhido como limiar foi também 52. Regiões de pixels com intensidade
superior ao limiar, e área superior a nove pixels, foram consideradas objetos e
marcados em preto na figura (A.15).
A.2.3
Parâmetros morfológicos
A classificação de objetos (arcos e não-arcos) detectados em imagens astronômicas é tipicamente realizada através dos valores de excentricidade e largura de
109
Figura A.15: Resultado da limiarização. O valor limite para crescimento utilizado
foi 52.
cada conjunto de pixels. Uma maneira de calcular as propriedades morfológicas
dos objetos é através dos momentos de cada conjunto de pixels. As definições de
momento (1 e 2 ) utilizadas abaixo são as mesmas definidas em Lenzen et al.
(2004).
O primeiro momento é definido da seguinte maneira:
0
1
0
1
1 X
B mc C
B
C
mc
~ =@
u(pi ) @
A=
A ,
M
2
2
o
mc
yi
i2R
1
x1i
(A.24)
onde o vetor mc
~ indica o centróide (ou “centro de massa”) do objeto, R é o conjunto
de pixels analisados e Mo é a soma de todas as intensidades dos pixels de R.
O segundo momento é definido pela matriz:
Mjk =
⇣
1 X
u(pi ) xji
Mo i2R
onde j, k = {1, 2}. Os autovalores
1
e
2
(
mcj
⌘⇣
2)
1
xki
mck
⌘
(A.25)
desta matriz são [M ] utilizados
para o cálculo da excentricidade (ecc):
ecc = 1
2
.
(A.26)
1
Os semi-eixos maior (a) e menor (b) são dados pelos termos da matriz [M ] através
110
das seguintes expressões:
2
a = 42
2
b = 42
M22 + M11 +
M22 + M11
q
q
(M22
M11 )2 + 4 (M12 )2
Area
(M22
Area
2
M11 ) + 4 (M12 )
2
3
5,
(A.27)
5,
(A.28)
3
onde Area é o momento de ordem zero, o número de pixels que compoem a região.
111
Download

Laboratório Nacional de Computaç˜ao Cient´ıfica - CS82