Laboratório Nacional de Computação Cientı́fica Programa de Pós Graduação em Modelagem Computacional Simulação e busca automatizada de arcos gravitacionais Por Carlos Henrique Brandt PETRÓPOLIS, RJ - BRASIL ABRIL DE 2012 SIMULAÇÃO E BUSCA AUTOMATIZADA DE ARCOS GRAVITACIONAIS Carlos Henrique Brandt DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO LABORATÓRIO NACIONAL DE COMPUTAÇÃO CIENTÍFICA COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM CIÊNCIAS EM MODELAGEM COMPUTACIONAL Aprovada por: Prof. Martı́n Makler, D.Sc (Presidente) Prof. Fabio Porto, D.Sc. Prof. Marcelo Albuquerque, D.Sc. PETRÓPOLIS, RJ - BRASIL ABRIL DE 2012 Brandt, Carlos Henrique XXXX Simulação e busca automatizada de arcos gravitacionais / Carlos Henrique Brandt. Petropólis, RJ. : Laboratório Nacional de Computação Cientı́fica, 2012. xx, yy p. : il.; 29 cm Orientadore(s): Martı́n Makler e Gilson Antônio Giraldi Dissertação (M.Sc.) – Laboratório Nacional de Computação Cientı́fica, 2012. 1. ASSUNTO. 2. arcos gravitacionais. 3. simulação. 4. detecção. Makler, Martı́n. II. LNCC/MCTI. III. Tı́tulo. CDD XXX.XXX I. “Calm seas don’t make skillful sailors.” Autor desconhecido iv Especialmente pra você. v Agradecimentos Começo os agradecimentos como sempre, pela minha famı́lia. Meus pais, Dona Junara e Seu Brandt e meus irmãos, Ana Maria, Carlos Frederico e Ana Paula, pelo companheirismo e aprendizado ao longo de todos os tempos. As minhas palavras de agradecimento estão no amor que sinto por eles. Um agradecimento muito importante vai aos meus orientadores, Martı́n Makler (CBPF) e Gilson Giraldi (LNCC). A contribuição de ambos foi essencial para o término desta dissertação, além de muito mais ter aprendido do que simplesmente fı́sica, matemática ou computação; a motivação e os ensinamentos que pude pegar no dia-a-dia com Gilson e Martı́n valem muito para mim e para este trabalho. Algumas instituições foram fundamentais para a realização deste trabalho e devem receber meus agradecimentos: o LNCC pela maravilhosa casa oferecida nestes últimos três anos; o ICRA/CBPF por me receberem sempre tão bem e me oferecem um segunda casa, também maravilhosa; a CAT/CBPF por todo suporte e parceria no dia-a-dia da administração de um cluster, e os cafézinhos no meio da tarde; o CNPq, Capes, INCT-MACC e Ministério de Ciência e Tecnologia e Inovação pelo fomento a pesquisa e tecnologia deste paı́s, em particular, desta dissertação; o LIneA pela possibilidade de trabalhar com ótimos profissionais em um projeto de ponta e escala internacional. Agradeço aos colegas e amigos de mestrado por todas as experiências trocadas, entre festa e trabalho, pizzas e uma computação muito se aprendeu. Um muito obrigado a todos, do LNCC ao CBPF, passando pelo ON, que puderam compartilhar parte de seu tempo durante estes anos. Em particular, gostaria de fazer um agradecimento ao grupo de Strong Lensing do CBPF, este trabalho contou com vi o esforço e colaboração de todo o grupo de SL. Um obrigado especial a Gabriel Caminha, Pedro Ferreira, Habib Dumet, Cristina Furlanetto, Maria Elidaiana e Angelo Fausti pela conhecimento e parceria compartilhados ao longo destes anos e que possibilitaram este trabalho. Por fim, agradeço aos amigos da vida, do dia-a-dia, do Rio ou do Sul, pessoas que estão sempre presentes, perto ou longe, e que são as várias peças que fazem a engrenagem toda funcionar. É impossı́vel eu citar nomes aqui, mesmo porquê eu tenho certeza de que estas pessoas sabem quem são. Muito obrigado a todos. vii Resumo da Dissertação apresentada ao LNCC/MCTI como parte dos requisitos necessários para a obtenção do grau de Mestre em Ciências (M.Sc.) SIMULAÇÃO E BUSCA AUTOMATIZADA DE ARCOS GRAVITACIONAIS Carlos Henrique Brandt Abril , 2012 Orientador: Martı́n Makler, D.Sc Co-orientador: Gilson Antônio Giraldi, D.Sc. Arcos gravitacionais são sistemas de grande importância para a cosmologia e astrofı́sica, sendo utilizados para restringir parâmetros cosmológicos e obter informações sobre a estrutura de galáxias e aglomerados de galáxias. No entanto estes objetos são raros e de difı́cil detecção. Levantamentos fotométricos de grande área e com boa qualidade de imagem, como o Dark Energy Survey (DES), aumentarão em cerca de uma ordem de grandeza o número de sistemas com arcos. Algoritmos para a detecção automatizada de arcos (buscadores de arcos) são absolutamente necessários, uma vez que o volume de dados trabalhados já ultrapassa a capacidade humana. Além disso são necessários métodos objetivos que gerem resultados reprodutı́veis. É fundamental, também, a realização de simulações realistas de arcos de modo a testar ferramentas de análise, tanto os buscadores de arcos quanto as que extraem informações fı́sicas a partir destes objetos. A principal contribuição deste trabalho foi o desenvolvimento de um simulador de arcos gravitacionais para a inclusão destes nas simulações realizadas pelo projeto DES denominado AddArcs. O simulador busca reproduzir arcos utilizando-se de dados de simulações cosmológicas de N-corpos e parâmetros de dados reais. Efeitos observacionais podem ser adicionados de acordo com propriedades da instrumentação que pretendemos simular. Com relação à detecção automatizada de arcos, realizou-se a revisão de viii um algoritmo conhecido da literatura, com o ajuste de parâmetros e teste em diferentes tipos de imagens. Alguns métodos de processamento de imagens utilizados no processo de identificação de objetos em dados astronômicos foram também revisados como parte deste estudo. Tanto os métodos de simulação quanto os de processamento de imagens foram integrados em uma biblioteca de ferramentas para processamento de dados astronômicos denominada SLtools. Com o simulador de arcos gravitacionais fomos capazes de reproduzir arcos com considerável grau de realismo e incluı́-los nas imagens e catálogos produzidos nos ciclos de simulação do DES. A partir dos resultados do simulador, pudemos também estimar a abundância de arcos que o Dark Energy Survey deverá observar. ix Abstract of Dissertation presented to LNCC/MCTI as a partial fulfillment of the requirements for the degree of Master of Sciences (M.Sc.) SIMULATION AND AUTOMATED DETECTION OF GRAVITATIONAL ARCS Carlos Henrique Brandt April, 2012 Advisor: Martı́n Makler, D.Sc Co-advisor: Gilson Antônio Giraldi, D.Sc. Gravitational arcs provide important tools for cosmology and astrophysics, and have been used to constrain cosmological parameters and the structure of galaxies and galaxy clusters. However, these objects are rare and challenging to detect. Wide field imaging surveys with good imaging quality, such as the Dark Energy Survey (DES), will increase the current number of known arc systems by about an order of magnitude. Algorithms for automated detection (arc-finders) are absolutely necessary since currently available data volumes are already beyond human capabilities. Besides, it is necessary to have objective methods capable of generating reprodutible results. Furthermore, it is essential to perform realistic arc simulations to test the analysis tools, both arc-finders as well as those aimed to extract physical information from these objects. The main contribution of this work was the development of a gravitational arc simulator for the DES project, named AddArcs. The simulator generates arcs based on N-body simulations and parameters derived from observational data. Observational e↵ects can be added according to the properties of the instrument. Regarding the automated detection of arcs, we review an algorithm from the literature and apply it to a set of images, tuning its parameters for each set. Some image processing methods often used for the identification of astronomical objects were also reviewed. Both the methods x for simulation and image processing were integrated into a library of tools for astronomical data processing named SLtools. The AddArcs simulator enabled the inclusion of fairly realistic gravitational arcs on the DES simulated images and catalogs. It also lead to an estimate of the abundance of arcs expected to be observed by DES. xi Sumário 1 Introdução 1 1.1 O Dark Energy Survey . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 DES e os Desafios dos dados . . . . . . . . . . . . . . . . . . . . . 7 1.3 Fundamentos de Lenteamento Gravitacional . . . . . . . . . . . . . 8 1.3.1 Aproximação de lente fina . . . . . . . . . . . . . . . . . . . 9 1.3.2 Mapeamento Fonte-Imagem . . . . . . . . . . . . . . . . . . 14 1.3.3 O modelo da lente . . . . . . . . . . . . . . . . . . . . . . . 18 1.3.4 O modelo da fonte . . . . . . . . . . . . . . . . . . . . . . . 19 Efeitos observacionais . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.4.1 Ruı́do nas imagens . . . . . . . . . . . . . . . . . . . . . . . 20 1.4.2 Função de espalhamento . . . . . . . . . . . . . . . . . . . . 21 1.4 2 Simulação de arcos gravitacionais 2.1 23 Algoritmo de simulação . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1.1 Configuração das lentes . . . . . . . . . . . . . . . . . . . . . 23 2.1.2 Seleção de fontes . . . . . . . . . . . . . . . . . . . . . . . . 30 2.1.3 Lenteamento Fonte-Imagem . . . . . . . . . . . . . . . . . . 35 2.1.4 Efeitos observacionais . . . . . . . . . . . . . . . . . . . . . . 36 2.1.5 Co-adição de imagens . . . . . . . . . . . . . . . . . . . . . . 38 2.2 Implementação Computacional . . . . . . . . . . . . . . . . . . . . 39 2.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 xii 3 Ferramentas para dados astronômicos 50 3.1 Documentação de códigos . . . . . . . . . . . . . . . . . . . . . . . 51 3.2 Linguagens de programação . . . . . . . . . . . . . . . . . . . . . . 52 3.3 Herança de mensagens . . . . . . . . . . . . . . . . . . . . . . . . . 54 3.4 Controle de versão . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 3.5 Empacotamento e Instalação . . . . . . . . . . . . . . . . . . . . . . 55 3.6 Usabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4 Análise da busca de arcos gravitacionais 4.1 4.2 4.3 57 Inspeção visual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.1.1 Procedimento de seleção manual . . . . . . . . . . . . . . . . 58 4.1.2 Propriedades dos candidatos a arcos . . . . . . . . . . . . . 60 Algoritmo de Lenzen et al. . . . . . . . . . . . . . . . . . . . . . . . 62 4.2.1 Modificação de histograma . . . . . . . . . . . . . . . . . . . 63 4.2.2 Filtragem anisotrópica . . . . . . . . . . . . . . . . . . . . . 65 4.2.3 Detecção de objetos . . . . . . . . . . . . . . . . . . . . . . . 66 4.2.4 Seleção dos arcos . . . . . . . . . . . . . . . . . . . . . . . . 67 4.2.5 Análise de parâmetros . . . . . . . . . . . . . . . . . . . . . 68 4.2.6 Conjunto de parâmetros “bons” . . . . . . . . . . . . . . . . 76 4.2.7 Teste de parâmetros ajustados . . . . . . . . . . . . . . . . . 77 Detecção de arcos em aglomerado de galáxias . . . . . . . . . . . . 82 5 Conclusão e perspectivas futuras 85 Referências Bibliográficas 88 Apêndice A Processamento de imagens astronômicas 92 A.1 Pré-processamento e Filtragem de imagens . . . . . . . . . . . . . . 92 A.1.1 Mudança de brilho . . . . . . . . . . . . . . . . . . . . . . . 93 xiii A.1.2 Limiarização . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 A.1.3 Filtragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 A.2 Identificação de objetos . . . . . . . . . . . . . . . . . . . . . . . . . 107 A.2.1 Crescimento de regiões . . . . . . . . . . . . . . . . . . . . . 107 A.2.2 Limiarização . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 A.2.3 Parâmetros morfológicos . . . . . . . . . . . . . . . . . . . . 109 xiv Lista de Figuras Figura 1.1 Arcos gravitacionais em aglomerados galáxias . . . . . . . . . . . . 2 1.2 Aproximação de lente-fina . . . . . . . . . . . . . . . . . . . . . . . 10 1.3 Anel de Einstein em torno de uma galáxia . . . . . . . . . . . . . . 13 1.4 Perfil de brilho de Sérsic, n = 0.5. . . . . . . . . . . . . . . . . . . . 19 1.5 Perfil de brilho de Sérsic, n = 2. . . . . . . . . . . . . . . . . . . . . 20 1.6 Perfil de Sérsic e ruı́do de Poisson . . . . . . . . . . . . . . . . . . . 21 1.7 Perfil de Sérsic e PSF gaussiana . . . . . . . . . . . . . . . . . . . . 22 2.1 Etapas do simulador AddArcs . . . . . . . . . . . . . . . . . . . . . 24 2.2 Catálogo de halos DES, DCv2.13, massa e redshift . . . . . . . . . . 26 2.3 Halos selecionados para simulação . . . . . . . . . . . . . . . . . . . 27 2.4 Sorteio de fontes pontuais . . . . . . . . . . . . . . . . . . . . . . . 34 2.5 Arcos simulados para três lentes . . . . . . . . . . . . . . . . . . . . 36 2.6 Arcos simulados convoluidos com PSF . . . . . . . . . . . . . . . . 37 2.7 Arcos simulados com ruı́do de Poisson . . . . . . . . . . . . . . . . 37 2.8 Resultado de simulação de arco para o DC4 . . . . . . . . . . . . . 39 2.9 Fluxo de paralelizacao, threads e arquivos . . . . . . . . . . . . . . 42 2.10 Aglomerado de Abell 383 . . . . . . . . . . . . . . . . . . . . . . . . 43 2.11 Arquivo de propriedades para a execução do AddArcs . . . . . . . . 44 2.12 Simulação de arcos para o aglomerado de Abell 383 . . . . . . . . . 45 2.13 Simulação de arcos coloridos com o DC5 (1) . . . . . . . . . . . . . 48 2.14 Simulação de arcos coloridos com o DC5 (2) . . . . . . . . . . . . . 49 xv 3.1 Documentação de código-fonte (docstrings) . . . . . . . . . . . . . . 53 3.2 Estrutura do repositório da SLtools . . . . . . . . . . . . . . . . . 55 4.1 Aglomerado de Abell 383, busca manual . . . . . . . . . . . . . . . 60 4.2 Arcos do A383 assinalados em “tabela-verdade” . . . . . . . . . . . 61 4.3 Arco selecionado para revisão do buscador de Lenzen et al. . . . . . 62 4.4 Limiarização de intensidades . . . . . . . . . . . . . . . . . . . . . . 64 4.5 Distribuição e pontos de corte de intensidades . . . . . . . . . . . . 64 4.6 Suavização por difusão anisotrópica . . . . . . . . . . . . . . . . . . 65 4.7 Regiões segmentadas . . . . . . . . . . . . . . . . . . . . . . . . . . 66 4.8 Detecção de arco . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.9 Arcos para testes de parâmetros do buscador . . . . . . . . . . . . . 69 4.10 Variação de valores para corte de intensidades . . . . . . . . . . . . 72 4.11 Variação de suavização gaussiana . . . . . . . . . . . . . . . . . . . 73 4.12 Variação da sensibilidade anisotrópica (K) . . . . . . . . . . . . . . 74 4.13 Variação da suavização direcional (⌧ ) . . . . . . . . . . . . . . . . . 75 4.14 Objetos segmentados com parâmetros “bons” . . . . . . . . . . . . . 77 4.15 Aglomerado 209 com arco simulado, DC6 . . . . . . . . . . . . . . . 78 4.16 Resultados dos parâmetros “bons” sobre arco simulado . . . . . . . 79 4.17 Resultado final sobre arco simulado . . . . . . . . . . . . . . . . . . 79 4.18 Arco do CFHT para teste de processamento . . . . . . . . . . . . . 80 4.19 Resultados parciais da segmentação do arco do CFHT . . . . . . . . 81 4.20 Resultado final sobre arco do CFHT . . . . . . . . . . . . . . . . . 81 4.21 Resultados parciais sobre o aglomerado A383 . . . . . . . . . . . . . 83 4.22 Resultado final sobre aglomerado A383 . . . . . . . . . . . . . . . . 84 A.1 Imagem de arco (Hubble) utilizada como exemplo . . . . . . . . . . 92 A.2 Funções de re-escalonamento de intensidades . . . . . . . . . . . . . 94 A.3 Imagens re-escalonadas por tanh() . . . . . . . . . . . . . . . . . . 95 A.4 Imagens re-escalonadas por log() . . . . . . . . . . . . . . . . . . . 96 xvi A.5 Equalização de histograma . . . . . . . . . . . . . . . . . . . . . . . 98 A.6 Histograma de uma imagem astronômica . . . . . . . . . . . . . . . 99 A.7 Resı́duo de filtragem para o ruı́do . . . . . . . . . . . . . . . . . . . 99 A.8 Suavização com filtro da média . . . . . . . . . . . . . . . . . . . . 100 A.9 Suavização com filtro da mediana . . . . . . . . . . . . . . . . . . . 101 A.10 Suavização com filtros gaussianos . . . . . . . . . . . . . . . . . . . 102 A.11 Janela de aplicação do filtro direcional . . . . . . . . . . . . . . . . 103 A.12 Suavização direcional . . . . . . . . . . . . . . . . . . . . . . . . . . 104 A.13 Filtragem por difusão anisotrópica . . . . . . . . . . . . . . . . . . 107 A.14 Segmentação com region growing . . . . . . . . . . . . . . . . . . . 109 A.15 Limiarização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 xvii Lista de Tabelas Tabela 2.1 Halos selecionados para simulação . . . . . . . . . . . . . . . . . . . 26 2.2 Parâmetros de concentração e de escala dos aglomerados . . . . . . 29 2.3 Convergência caracterı́stica para combinações lente-fonte . . . . . . 31 2.4 Propriedades dos arcos simulados com o AddArcs . . . . . . . . . . 35 2.5 Propriedades dos arcos simulados para o aglomerado de Abell 383 . 44 4.1 Segmentação de arcos para inspeção visual . . . . . . . . . . . . . . 61 4.2 Parâmetros de saı́do do buscador de arcos . . . . . . . . . . . . . . 68 4.3 Objetos detectados com parâmetros “bons” (HST) . . . . . . . . . . 77 4.4 Objetos detectados com parâmetros “bons” (DC6) . . . . . . . . . . 80 4.5 Objetos detectados com parâmetros “bons” (CFHT) . . . . . . . . . 81 4.6 Arcos detectados no aglomerado de Abell 383 . . . . . . . . . . . . 82 A.1 Janela 5x5 do filtro da média . . . . . . . . . . . . . . . . . . . . . 100 A.2 Janela 5x5 de um filtro gaussiano . . . . . . . . . . . . . . . . . . . 101 xviii Glossário • Astrometria: ramo da astronomia que estabelece métodos de medidas e precisão de instrumentos de posicionamento dos objetos astronômicos. O termo é utilizado no processamento de dados astronômicos para calibração dos dados com base em dados bem conhecidos (tabelas-verdade). • Bag-of-tasks: Modelo de processamento computacional distribuı́do em que um pacote de processos (seriais) é executado de maneira independente de comunicação com demais processos. • Banda: utilizado muitas vezes como sinônimo para “filtro fotométrico”, indica uma janela do espectro eletromagnético observada por um equipamento astronômico (telescópio/câmera). • CCD: do inglês Charge Coupled Device, é o dispositivo utilizado pelas câmeras digitais (nos telescópios) para detecção dos fótons provenientes de uma determinada região do céu, em determinado comprimento de onda (ou banda). • Catálogo: tabela de dados estruturados em arquivos digitais, tipicamente arquivos no formato FITS. • Dec (ver RA): abreviação para Declinação (em inglês, Declination). Uma das duas coordenadas celeste para um objeto astronômico na esfera celeste. Medida em graus, entre 90 e +90 , a partir do plano equatorial. • FITS: Flexible Image Transport System é um formato de arquivo digital para armazenamento de imagens e catálogos, bem como os meta-dados xix necessários para caracterizar os dados astronômicos transmitidos. • Fotometria: ramo da astronomia dedicado à medida de intensidade (ou fluxo) de objetos astronômicos. • Halo: estrutura massiva composta por matérias bariônica e escura que caracterizam galáxias e aglomerados de galáxias. Tipicamente o termo é utilizado para referenciar “halo de matéria-escura” em cosmologia. • Magnitude: medida de brilho (ou luminância) de um objeto astronômico em escala logaritmica em determinada frequência ou banda do espectro eletromagnético. • RA (ver Dec): abreviação para Ascensão Reta (em inglês, Right Ascension). Uma das duas coordenadas celeste para um objeto astronômico na esfera celeste. Medida em graus, entre 0 e 360 , no sentido horário, a partir do primeiro ponto de Áries. • Seeing: efeito observacional causado pela atmosfera e instrumentação que causa o borramento dos objetos nas imagens captadas. • z: redshift, ou desvio para o vermelho, em português, é uma medida de afastamento de um objeto em relação ao observador. Em cosmologia trabalhase com redshift cosmológico, causado pela expansão do universo, para objetos muito distantes. xx Capı́tulo 1 Introdução Lenteamento Gravitacional é o nome dado ao fenômeno fı́sico que deflete a luz de um objeto distante ao passar por uma região muito massiva no seu trajeto até nós, observadores. Este fenômeno pode ser dividido em dois regimes: forte e fraco. O efeito fraco de lenteamento manifesta-se em regiões periféricas do aglomerado através de pequenas distorções causadas na morfologia das galáxias do entorno. Para a percepção, ou medida, do efeito de lenteamento no regime fraco é necessário um estudo estatı́stico na morfologia de todos os objetos da área para análise do efeito. O efeito forte manifesta-se através de imagens múltiplas de um mesmo objeto e grandes distorções (arcos ou anéis) no entorno de aglomerados de galáxias, principalmente. Neste trabalho estudaremos arcos gravitacionais gerados pelo efeito forte de lentes. Vamos, ao longo desta dissertação, discutir métodos de estudo destes objetos através de simulações e algoritmos de processamento de dados astronômicos para a análise de imagens e identificação de objetos. Os arcos gravitacionais são objetos tênues cujo padrão de intensidade se confunde com o brilho dos objetos vizinhos. Portanto, o seu estudo apresenta diversos desafios do ponto de vista da análise de imagens. Na figura 1.1 podemos ver dois bons exemplos de arcos no entorno de aglomerados de galáxias, observados pelos telescópios Canada-FranceHawaii (CFHT) e Hubble (HST). O entendimento do lenteamento gravitacional baseia-se na teoria da Relati- 1 Figura 1.1: Aglomerados contendo arcos gravitacionais em demonstração do fenômeno de lenteamento gravitacional forte: objetos distorcidos nas regiões demarcadas no entorno dos aglomerados de galáxias. À esquerda, imagem do aglomerado SDSS J015824.78-003959.3, obtida com o CFHT pelo projeto CS82 (em andamento). À direita, imagem do aglomerado Abell 383, obtida com o HST (Smith et al., 2001). vidade Geral de Einstein, segundo a qual um fóton descreve sempre uma geodésica entre dois pontos no espaço-tempo, que é curvo na presença de uma massa e faz com que o raio de luz seja defletido. O nome relacionado com a ótica — lenteamento — remete à idéia de que a massa — o aglomerado — funciona como uma lente ao desviar os raios de luz como se fosse um meio com ı́ndice de refração superior ao ı́ndice médio do Universo. O estudo de lentemaneto gravitacional forte é motivado pelas várias aplicações em cosmologia e astrofı́sica. O efeito pode funcionar como “telescópio gravitacional”, permitindo a observação de objetos muito distantes, que do contrário não poderiam ser observados (Marshall et al., 2007). Além disso, visto que o efeito depende das distâncias cosmológicas e da estrutura da lente, ele pode ser utilizado para restringir parâmetros cosmológicos e obter limites sobre a distribuição de massa da lente (Bartelmann et al., 1998; Meneghetti et al., 2005; Cooray, 1998; Comerford e P. Natarajan, 2007). É importante salientar que o efeito depende apenas da distribuição total de matéria (bariônica e escura) (Narayan e M. Bar- 2 telmann, 1996). Assim, as lentes gravitacionais podem ser úteis para determinar a distribuição de massa de galáxias e aglomerados de galáxias. Uma dificudade para o estudo dos arcos está na sua raridade, tendo sido detectados apenas algumas centenas deles até hoje. Contudo, este cenário está mudando com os levantamentos de grande área (ou surveys), como o Dark Energy Survey (DES), que estima observar da ordem de 103 destes objetos (Allam et al., 2009). Na seção 1.1, é feita uma breve apresentação deste projeto e da participação brasileira. A detecção de arcos gravitacionais é um processo difı́cil, visto que os mesmos possuem geralmente baixa razão sinal-ruı́do (SNR); além da própria raridade do fenômeno. Quando o volume de dados (imagens) em análise é pequeno, regiões com algumas centenas de objetos, este procedimento pode ser realizado visualmente. Mas este não é o caso dos levantamentos de grande área, em que são observados da ordem de centenas de milhões de objetos, e procedimentos automatizados para a identificação dos arcos são absolutamente necessários. Recursos computacionais e algoritmos para busca e identificação destes objetos são essenciais para que os grandes volumes de imagens trabalhados sejam processados de maneira eficiente e estável, de maneira que os resultados possam ser reproduzidos e parâmetros de seleção possam ser avaliados. Alguns algoritmos para detecção de arcos podem ser encontrados na literatura (Lenzen et al., 2004; Horesh et al., 2005; Seidel e M. Bartelmann, 2007; Alard, 2006; Estrada et al., 2007; More et al., 2011), implementando diferentes técnicas de processamento de imagens para sua detecção. Os buscadores de arcos, como são chamados, são algoritmos encarregados de segmentar, medir e classificar os objetos em uma imagem em busca de arcos gravitacionais. Tais algoritmos ainda são muito sensı́veis à qualidade dos dados e parâmetros dados pelo usuário. O estudo dos arcos gravitacionais é abordado neste trabalho através de simulações destes objetos e detecção através de técnicas de processamento de imagens. O simulador de arcos gravitacionais, denominado AddArcs, foi desenvolvido 3 como parte desta dissertação e é descrito no capı́tulo 2. A simulação de arcos gravitacionais permite gerar dados de nosso interesse para que possamos testar os métodos de processamento e modelagem estudados pelo grupo1 . Com o AddArcs podemos simular imagens de arcos gravitacionais com um bom grau de realismo, e com flexibilidade para que possamos variar parâmetros da modelagem fı́sica e instrumental das imagens e objetos simulados. No capı́tulo 4 desta dissertação é feita uma revisão do procedimento de busca de arcos gravitacionais, e no apêndice “A” alguns métodos de processamento de imagens envolvidos na busca automatizada são apresentados. Todos os métodos de processamento de imagem discutidos no apêndice foram implementados em python e constituem parte de uma biblioteca para processamento de dados, denominada SLtools, apresentada no capı́tulo 3. A SLtools é uma biblioteca de métodos e funções para o processamento de imagens e catálogos astronômicos. Ela foi desenhada e implementada ao longo deste mestrado com o intuito de padronizar e centralizar o ferramental produzido pelo grupo de Lenteamento Gravitacional Forte (Strong Lensing—SL) do Centro Brasileiro de Pesquisas Fı́sicas (CBPF). A SLtools tem suas origens no simulador de arcos gravitacionais – o AddArcs – onde notamos a necessidade de organizar o desenvolvimento de software do grupo de SL. O AddArcs foi desenvolvido com foco nos ciclos de simulações do Dark Energy Survey (DES)2 – um projeto de mapeamento do céu, apresentado na seção 1.1. O contexto das simulações é um ponto forte do DES, que realiza periodicamente ciclos de simulações denominados Desafios dos dados (Data Challenges—DCs). Nos DCs são geradas imagens e catálogos à partir de simulações dos objetos que espera-se observar quando iniciarem as operações do telescópio. Portanto, ser capaz de adicionar um ingrediente das observações astronômicas às simulações – os arcos gravitacionais – é de grande importância para a colaboração, e um resultado importante deste trabalho. Nas seções que seguem (1.1 e 1.2) apresento o projeto 1 2 Grupo (de SL) refere-se ao grupo de lenteamento gravitacional forte do CBPF/MCT http://www.darkenergysurvey.org/ 4 observacional DES e a estrutura das simulações, que contextualizam e motivam parte desta dissertação. A dissertação está organizada da seguinte forma. Ainda neste capı́tulo, na seção 1.3, apresento uma introdução à teoria de lenteamento gravitacional forte, os principais conceitos envolvidos e a modelagem fı́sica que utilizaremos no simulador de arcos gravitacionais. No capı́tulo 2 apresento o próprio simulador de arcos gravitacionais desenvolvido, juntamente com alguns resultados no contexto do DES. No capı́tulo 3, os principais pontos abordados na implementação da biblioteca de métodos computacionais para processamento de dados astronômicos. No capı́tulo 4 reviso o processo tı́pico de busca de arcos em imagens e, em particular, um algoritmo para a busca automatizada de arcos, além de alguns resultados do processamento e detecção dos arcos. Por fim, no capı́tulo 5 são apresentadas as conclusões e perspectivas futuras. No apêndice A são discutidos alguns aspectos dos métodos de processamento de imagens estudados para entendimento da área. 1.1 O Dark Energy Survey O DES é um projeto formado pela colaboração internacional de diversas instituições dos EUA, Inglaterra, Espanha, Brasil e Alemanha, que compartilham o interesse nos dados e ciência do projeto e dividem responsabilidades. A partir de 2012, o projeto irá obter imagens cobrindo uma área equivalente a um octante do céu catalogando objetos em busca de dados para suporte aos estudos nas mais diversas áreas da cosmologia e astrofı́sica, em particular da Energia Escura. Para alcançar este objetivo, o DES desenvolveu uma câmera de cerca de 500 megapixels e toda uma infra-estrutura de armazenamento e redução de dados, constantemente aprimorada através de simulações em preparação para quando do recebimento dos dados reais. A câmera, DECam (Dark Energy Camera), é composta por 64 CCDs altamente sensı́veis no vermelho e será instalada no telescópio Blanco, no Cerro Tololo International Observatory (CTIO), Chile. Esta instrumentação irá captar imagens 5 em um campo de visão de 2.2 , com resolução espacial de 0.27 arcsec/pixel, em cinco bandas diferentes (g, r, i, z, Y ). Ao longo dos cinco anos de observações do projeto, 5000 2 e centenas de milhões de objetos serão catalogados gerando al- guns petabytes de dados – 1.8 terabyte/noite –, tornando o DES o maior projeto observacional em operação à sua época. Para o desenvolvimento da ciência e infra-estrutura do projeto, foram criados 11 grupos de trabalho no DES. Entre eles, os grupos de lenteamento gravitacional forte (SL) e simulações são de especial interesse nesta dissertação, pois motivaram diretamente o desenvolvimento do trabalho aqui apresentado. A participação do Brasil no DES se dá através de um consórcio de pesquisadores de algumas unidades de pesquisa do Ministério de Ciência Técnologia e Inovação (MCTI) e universidades denominado DES-Brazil 3 . Constituem este consórcio o Laboratório Nacional de Computação Cientı́fica (LNCC), o Centro Brasileiro de Pesquisas Fı́sicas (CBPF), o Observatório Nacional (ON), e pesquisadores das universidades do Rio Grande do Sul (UFRGS) e de São Paulo (USP e UNESP). Este consórcio é gerido por uma associação entre as intituições do MCTI, denominado Laboratório Interinstitucional de e-Astronomia (LIneA)4 . A contribuição do DES-Brazil à colaboração internacional se faz através de desenvolvimento e suporte à infra-estrutura computacional e cientı́fica do projeto, sendo a principal contribuição um portal cientı́fico, que tem por objetivo fornecer uma interface de acesso comum para o acesso e processamento dos dados do projeto. O portal disponibiliza ao cientista um ambiente para processamento e armazenamento de resultados. Nele é possı́vel manter históricos de processamento, bem como compartilhar resultados entre grupos de trabalho. Além de apresentar uma interface simples ao cientista para manuseio de seus dados, o portal abstrai a camada de recursos computacionais, hardware e software, necessária e escalável para a crescente demanda do projeto ao longo dos próximos anos. Como contribuição deste trabalho, o AddArcs, bem como a SLtools, fazem 3 4 http://des-brazil.linea.gov.br/ http://www.linea.gov.br/ 6 parte do conjunto de softwares que ficarão disponı́veis através do portal para a colaboração internacional. 1.2 DES e os Desafios dos dados Os Desafios dos dados, ou Data Challenges (DC), são ciclos de simulações de objetos astronômicos em imagens e catálogos com intuito de gerar o que se espera obter das observações realizadas pelo projeto, quando iniciarem as operações em 2012. As imagens são geradas com caracterı́sticas realistas dos efeitos observacionais, tanto da instrumentação, como defeitos de CCDs e sensibilidade dos filtros, quanto naturais, como o “borramento” (seeing) causado pelas camadas de ar atmosféricas. Estas simulações possuem dois objetivos: (i) testar o sistema de processamento e armazenamento de dados, das imagens captadas no Chile; e (ii) testar e aprimorar as ferramentas de análise dos dados, desenvolvidas pelos grupos envolvidos. As simulações são realizadas aumentando o realismo a cada novo ciclo, de acordo com o avanço e necessidades dos grupos de trabalho. Há quatro nı́veis no processo de simulações: (1) são elaborados catálogos com propriedades astrométricas (posições), fotométricas (magnitudes) e morfológicas de estrelas e galáxias e – em parte graças a este trabalho – arcos gravitacionais; (2) os catálogos são, então, utilizados para gerar imagens correspondentes ao esperado nas observações, considerando as dimensões dos CCDs e efeitos instrumentais; (3) redução das imagens brutas, geradas na simulação, para remoção dos efeitos intrumentais; (4) geração de catálogos com propriedades dos objetos simulados e apresentados nas imagens. 7 A base da distribuição de galáxias utilizada no nı́vel (1) é dada por simulações cosmológicas de N-corpos (Carmen — Large Suite of Dark Matter Simulations, LasDamas5 ). De acordo com as propriedades atribuı́das às galáxias (e.g., magnitudes), a morfologia destas é obtida a partir de catálogos de um levantamento com dados reais obtidos pelo Telescópio Espacial Hubble (HST), o Cosmic Evolution Survey (Faure et al., 2008). Após todo o processo de redução, as imagens são combinadas e separadas em regiões quadradas, com área equivalente de 0.723 2 e são então gravadas em arquivos para distribuição à colaboração. Estes dados são disponibilidados por instituições dos EUA (NCSA6 e Fermilab7 ), e do Brasil (através do LIneA). O ciclo de simulações mais recente à data deste trabalho é o de número 6 (DC6), iniciado no final do primeiro semestre de 2011. Desde o Data Challenge de número 5 (DC5), realizado em 2010, o projeto conta com arcos gravitacionais simulados pelo AddArcs. 1.3 Fundamentos de Lenteamento Gravitacional Nesta seção apresento alguns fundamentos teóricos para a modelagem de lentes gravitacionais, que depois serão utilizados no simulador de arcos (seção 2.1). Os quatro componentes básicos do lenteamento gravitacional são listados abaixo: • O observador (O): detector envolvido na observação do fenômeno. Para todos efeitos, “nós” observadores através de imagens de telescópios. • A lente (L): concentração de matéria entre observador e fonte que atua como defletor da luz – um aglomerado de galáxias, por exemplo. • A fonte (S ): objeto fı́sico que emite a luz posicionado atrás da lente. Tipicamente uma galáxia (também chamada de galáxia de fundo). 5 6 7 http://lss.phy.vanderbilt.edu/lasdamas/simulations.html http://www.ncsa.illinois.edu/ http://www.fnal.gov/ 8 • A cosmologia, subentendida na modelagem fı́sica do fenômeno, define a métrica de espaço-tempo para propagação da luz no universo. O modelo da lente contempla um sistema isolado, com apenas os componentes supra-citados. No caso de interesse para esta dissertação — lenteamento por galáxias ou aglomerados de galáxias —, as distâncias observador-lente-fonte (OLS ) são da ordem de 103 vezes superiores às dimensões da lente. Uma consequência é que o tamanho angular da lente e, de fato, os ângulos envolvidos são pequenos o suficiente para podermos fazer sen(✓) ⇡ ✓; já que estaremos interessados em fontes próximas ao centro da lente. Esta aproximação será utilizada implicitamente em todo o trabalho. A teoria da Relatividade Geral prevê a deflexão de um raio de luz devido à deformação gerada no espaço-tempo pelo campo gravitacional. Na prática, podemos pensar na deflexão sofrida pela luz como se o ı́ndice de refração do vácuo (universo) diferisse da unidade quando sob influência de um campo gravitacional (Binney e M. Merrifield, 1998). O ı́ndice de refração de um meio vazio (vácuo) sob influência de um campo gravitacional é dado por n=1+ 2| | , c2 (1.1) onde foi utilizada a aproximação de campo fraco: | | ⌧ c2 . 1.3.1 Aproximação de lente fina Uma aproximação utilizada nos estudos de lenteamento gravitacional é a aproximação de lente fina: uma vez que as distâncias entre observador-lente-fonte são muito grandes (⇡ 109 pc) comparado ao tamanho da lente (⇡ 103 106 pc). Dessa forma, a deflexão da luz pode ser considerada como ocorrendo em um único ponto, sendo que no resto da trajetória a luz segue em linha reta8 . É usual na área de lenteamento utilizar os termos “plano da fonte” e “plano da lente” (ou 8 Isso no caso de um universo plano; no caso com curvatura, segue uma geodésica no espaço homogêneo subjacente. 9 “plano das imagens”) para referenciar os pontos onde fonte e lente estão localizados, respectivamente, ao longo da linha de visada. A figura 1.2, apresenta o esquema geométrico de lenteamento gravitacional na aproximação de lente fina que será utilizado ao longo deste trabalho. Figura 1.2: Esquema das quantidades envolvidas na aproximação de lente fina. A fonte está localizada na posição ⌘ no plano da fonte, enquanto sua imagem (lenteada) encontra-se na posição ⇠ no plano da lente (Ferreira (2010)). O ângulo de deflexão (↵) é relacionado com o ı́ndice de refração (n), conforme equação 1.1, da seguinte forma: ↵ ~= Z O S rn ds , (1.2) onde O e S localizam observador e fonte, respectivamente, e ds é o elemento de linha em um meio de ı́ndice n de refração. O ângulo de deflexão pode ser obtido a partir da equação 1.2 em função do 10 potencial projetado no plano da lente 2, 4G r c2 ~ = ↵ ~ (⇠) ~ , 2 (⇠) onde ⇠~ é o parâmetro de impacto do raio de luz (na lente) e (1.3) 2 relaciona-se com a densidade de massa ⇢(~x) por ~ 2 (⇠) = Z 1 (⇠~ ⇠~0 ) 2 ~0 d⇠ , |(⇠~ ⇠~0 )|2 ⌃(⇠~0 ) 0 (1.4) e ⌃(⇠~0 ) é a densidade de matéria ⇢(~x) projetada, ~ = ⌃(⇠) Z 1 ~ z) dz . ⇢(⇠, (1.5) 1 As equações acima para o ângulo de deflexão têm uma interpretação simples: a deflexão da luz é dada pelo gradiente do potencial gravitacional projetado, que é gerado pela densidade de matéria projetada. Esta, por sua vez, é simplesmente a integral da densidade de matéria ao longo da linha de visada. Para os próximos passos que vamos discutir considere a figura 1.2. O que queremos a seguir é relacionar as posições da imagem (✓) com a da fonte ( ): ⇠ = DOL ✓ , (1.6) ⌘ = DOS , (1.7) onde DOL é a distância de diâmetro angular (Raine e E. G. Thomas, 2001) entre observador e lente, DOS é a distância entre observador e fonte; DLS é a distância entre lente e fonte. Com isso obtemos a equação da lente, =✓ DLS ↵(✓) , DOS (1.8) que relaciona as posições da imagem (✓, no plano da lente) e da fonte ( ) de 11 acordo com a deflexão ↵(✓) provocada pela lente. O ângulo de deflexão ↵(✓) é obtido substituindo ⇠ (1.6) em (1.3 - 1.5). 1.3.1.1 Raio de Einstein e Lente pontual Um exemplo simples de lente gravitacional é dado por lentes com simetria axial. Neste caso é possı́vel mostrar que o ângulo de deflexão é dado por (Binney e M. Merrifield, 1998): ↵= 4GMo . c2 ⇠ (1.9) onde Mo é a massa contida dentro do raio ⇠ em torno do eixo OL. Combinando esta distribuição de massa com uma configuração de perfeito alinhamento entre observador, lente e fonte chega-se ao caso em que a fonte é projetada como um anel em torno da lente no plano das imagens, denominada anel de Einstein (ver figura 1.3). O raio do anel de Einstein é dado por: rE = r 4GMo DOL DLS , c2 DOS (1.10) onde Mo é calculado no valor de ⇠ correspondente a ⌘ = 0 ( = 0). O tamanho angular correspondente a rE é dado por (✓E = rE /DOL ): ✓E = r 4GMo DLS . c2 DOL DOS (1.11) O raio de Einstein depende das posições “OLS” ao longo da linha de visada e da massa da lente e fornece uma escala tı́pica para o regime de lenteamento gravitacional forte, onde os arcos gravitacionais são formados. No caso de uma lente pontual, Mo não depende de ⇠ (ou ✓) e, das equações (1.8) e (1.11), é possı́vel escrever a equação da lente apenas em função de ✓ e ✓E : =✓ ✓E , ✓ (1.12) relacionando diretamente a posição da fonte com a posição da imagem e o raio de 12 Figura 1.3: Anel de Einstein observado pelo Sloan Digital Sky Survey (SDSS): SDSS J162746.44-005357.5. Imagem obtida dos arquivos públicos da NASA. Einstein. A solução da equação acima para ✓ é dada por 1 ✓± = 2 ✓ ± q 2 + 4✓E2 ◆ , (1.13) indicando que para cada ponto da fonte, temos dois pontos (ou imagens) correspondentes no plano da lente. Assim, temos equacionado em nossa modelagem o efeito de imagens múltiplas observado em alguns sistemas de lenteamento gravitacional. O raio de Einstein define um limite importante na modelagem do lenteamento gravitacional, onde as formas de tratar o fenômeno diferem, definindo os regimes forte e fraco. As imagens que projetarem-se dentro ou próximas do raio de Einstein, estarão sob o regime de lentamento gravitacional forte, enquanto as imagens que estiverem bem além de ✓E estarão sob o regime fraco. Este trabalho, vale lembrar, dará atenção à modelagem do efeito forte quando necessário particularizar ao longo desta dissertação. 13 1.3.1.2 Densidade Superficial Crı́tica e Convergência Vamos agora definir uma quantidade para nos auxiliar nas expressões do lenteamento gravitacional, a densidade superficial crı́tica: ⌃crit = DOS c2 . DOL DLS 4G (1.14) A densidade superficial crı́tica é uma quantidade geométrica, que depende das distâncias relativas OLS, e define uma escala caracterı́stica para o sistema p sendo trabalhado. O raio de Einstein pode ser escrito como rE = Mo /⌃crit . 1 Note que, para uma massa fixa, rE / ⌃crit . A equação da lente pode ser re-escrita em termos da densidade crı́tica como =✓ ou =✓ Z 1 r ⌃crit 2 , ⌃(⇠~0 ) (⇠~ ⇠~0 ) 2 ~0 d⇠ , ⌃crit |(⇠~ ⇠~0 )|2 (1.15) (1.16) onde utilizamos a equação (1.4) para o potencial projetado. Por fim, definimos uma quantidade chamada convergência por: ~ = (⇠) ~ ⌃(⇠) , ⌃crit (1.17) ~ no que exprime o poder de deflexão de um raio de luz em determinada posição (⇠) plano da lente. 1.3.2 Mapeamento Fonte-Imagem A transformação de coordenadas entre os planos da fonte e da lente definida pela equação da lente (1.8) é o processo-chave do lenteamento. O mapeamento entre os planos – a transformação das coordenadas – é descrito localmente através 14 do Jacobiano da transformação de coordenadas: ✓ @~ @ ~ J= = ✓ @ ✓~ @ ✓~ DLS ↵ ~ (✓) DOS ◆ . (1.18) Colocando em termos matriciais, os termos de J ficam explı́citos nas componentes: Jij = onde utilizou-se a definição ~a = i = j, e 0 se i 6= j), ou seja, DLS ↵ ~ DOS 0 B 1 J =@ @ai , @✓j ij e ij @a1 @✓1 (1.19) é a delta de Kronecker ( @a1 @✓2 @a2 @✓1 @a2 @✓2 1 ij = 1, se 1 C A. A seguir vamos definir uma quantidade chamada cisalhamento que contabiliza dispersão dos raios de luz em cada ponto no plano da lente, bem como re-definir convergência, agora em termos do jacobiano. A partir do jacobiano, então, definem-se as componentes do cisalhamento ( ) por 1 1 = 2 2 ✓ @a1 @✓1 @a2 @✓2 ◆ , (1.20) = @a1 @a2 = , @✓2 @✓1 (1.21) = q (1.22) de módulo, e a convergência () por 1 = 2 ✓ 2 1 + 2 2 , @a1 @a2 + @✓1 @✓2 ◆ . (1.23) É fácil mostrar que a convergência definida pela equação (1.23) é idêntica à dada na equação (1.17). 15 1.3.2.1 Magnificação Um dos efeitos do lenteamento é a magnificação do brilho do objeto no plano da imagem relativo ao plano da fonte. Como o efeito da gravitação é apenas defletir os fótons, tem-se que a intensidade (I) emitida no plano da fonte (IS⌫ ) deve ser conservada quando defletida no plano da lente (IL⌫ ), IS⌫ = IL⌫ , (1.24) onde ⌫ é a frequência da luz. Mas, visto que o efeito é acromático, podemos simplificar: I ⌫ = I. Em termos do fluxo, definido como energia por unidade de tempo (i.e, intensidade) por unidade de área, temos as seguinte relações: IS = FS · dAS = IL = FL · dAL . (1.25) A magnificação (µ) de uma imagem é definida como a razão dos fluxos no plano da lente e da fonte: µ= FL dAS = , FS dAL (1.26) equivalente a contabilizar a razão entre as áreas compreendidas pelo objeto no plano da fonte e no plano da lente. Em termos de e ✓, a magnificação é dada pelo determinante do Jacobiano de ✓( ): @ ✓~ @~ µ = det ! = det J 1 . (1.27) Combinando as equações (1.19 - 1.23) podemos mostrar que: µ= ✓ 1 1 ◆✓ 16 1 1 + ◆ . (1.28) Definimos finalmente as magnificações tangencial (µt ) e radial (µr ): µt = ✓ µr = ✓ 1 1 ◆ , (1.29) 1 1 + ◆ , (1.30) em que µt define a magnificação na direção tangencial à lente e µr a magnificação na direção radial. É fácil mostrar que µt e µr são os autovalores de J 1 . Dependendo das distâncias OLS e da distribuição de massa da lente, pode haver pontos em que 1 ± = 0, de modo que as magnificações divergem formalmente (µt , µr ! ±1). Os pontos do espaço que fazem com que as magnificações divirjam formam curvas de especial interesse. No plano das fontes, os pontos ( ~ ) que levam à divergência da magnificação µt (µr ) formam a curva denominada cáustica tangencial (radial). No plano da lente, ~ formam a curva denominada curva crı́tica tangencial (radial). estes pontos ( ~ ! ✓) Ou seja, de acordo com nossa descrição, uma fonte pontual situada sobre um ponto da cáustica será mapeada para o plano da lente com magnificação infinita. Considerando um fonte circular infinitesimal situada próxima a uma dessas curvas (cáusticas), esta será mapeada no plano das imagens próxima à curva crı́tica correspondente. A proximidade com os pontos de divergência (tangencial ou radial) faz com que a imagem projetada da fonte seja altamente distorcida (tangencial ou radialmente). A deformação da imagem de uma fonte circular infinitesimal é tipicamente expressa em termos da razão comprimento-largura (L/W ) da imagem, e está relacionada com as magnificações por L/W ' µt /µr . 17 (1.31) 1.3.3 O modelo da lente Um componente fundamental para nossa modelagem é definir qual a configuração do potencial gravitacional a ser utilizada. Falamos até então em potenciais ( ) genéricos e, quando necessário, potenciais com simetria axial. No entanto, precisamos definir um modelo especı́fico de distribuição de massa para nossas lentes. Um modelo de distribuição de massa para aglomerados de galáxias largamente utilizado hoje na literatura é conhecido por modelo NFW, proposto por Navarro, Frenk e White (Navarro et al., 1995) à partir da análise de simulações (N-corpos) de matéria escura. O modelo NFW define um perfil radial médio universal para os aglomerados de galáxias, dado pela expressão: ⇢(r) = ⇢c , (r/rc )(1 + r/rc )2 (1.32) onde rc e ⇢c são a escala e densidade caracterı́sticas do halo9 , respectivamente. Próximo ao centro da lente (r ! 0) este perfil cai com r 1 e distante da lente rs ) este perfil cai com r 3 . (r O termo de convergência (⇠) para este perfil é dado por: (x) = 2s 1 x2 F (x) , 1 (1.33) ◆ (1.34) em que utilizou-se x = x(⇠) = ⇠/rc , e s = ✓ ⇢c r c ⌃crit . O termo F (x) é dado por (Bartelmann, 1996): F (x) = 9 8 > > > > < p 1 1 x2 p 1 1 > > > > : 1 x2 1 p x2 p tanh 1 1 tan 1 ,x > 1 x2 , x < 1 (1.35) ,x = 1 Halo de matéria escura é aqui utilizado como sinônimo para aglomerado de galáxias. 18 1.3.4 O modelo da fonte Até aqui as fontes foram tratadas como regiões infinitesimais e circulares. No entanto, precisamos utilizar um modelo de fonte finita e com distribuição de brilho para dar caracterı́sticas mais realistas aos objetos que vamos simular. Portanto, vamos agora descrever o modelo de fonte que vamos utilizar para gerar os arcos gravitacionais. O modelo de fonte que vamos utilizar tem um perfil de brilho conhecido como perfil de Sérsic (Sérsic, 1963), comumente utilizado na literatura para descrever o brilho de galáxias, e definido pela equação: I = Io exp " b ✓ R Re ◆1/n 1 !# , (1.36) onde R é o raio projetado, Re um parâmetro de normalização, n é o ı́ndice de Sérsic, b é um parâmetro livre de escala. Re é normalmente tomado como o raio que envolve a metade da intensidade total projetada e n define quão rápido cai a intensidade. Note que se n = 0.5 o perfil de Sérsic toma a forma de uma Gaussiana, como podemos ver na figura 1.4. Já na figura 1.5 é apresentado o perfil de Sersic com n = 2. Figura 1.4: Perfil de Sérsic com n = 0.5. 19 Figura 1.5: Perfil de Sérsic com n = 2. O processo de lenteamento de fontes extensas é realizado numericamente. Alguns algoritmos podem ser encontrados na literatura (Keeton, 2001; Jullo et al., 2007; Coe et al., 2008). Neste trabalho utilizaremos o Gravlens (Keeton, 2001), que permite o lenteamento de fontes com perfil de Sérsic por lentes elı́pticas do tipo NFW e pode ser utilizado a partir da linha de comando de maneira automatizada. 1.4 Efeitos observacionais 1.4.1 Ruı́do nas imagens Devido à natureza discreta do processo de observação – em que fótons são coletados por um CCD durante uma janela de tempo (t) – existe um erro associado ao valor das contagens e modelado por uma distribuição de Poisson. Este erro aparece como ruı́do nas imagens astronômicas, prejudicando a definição dos objetos, gerando, inclusive, falsos sinais (estruturas) na luz difusa de objetos mais brilhantes. O ruı́do de Poisson é especialmente prejudicial para os objetos mais tênues, com contagens próximas do ruı́do de fundo do céu. A distribuição de Poisson modela a probabilidade de um evento com média de ocorrências (num dado intervalo de tempo), ocorra k vezes. A probabilidade 20 dada pela distribuição de Poisson segue a seguinte regra: k P (y = k) = k! e . (1.37) Na figura 1.6 podemos observar o efeito do ruı́do de poisson (à direita) sobre o perfil de intensidades utilizado (à esquerda). (a) (b) Figura 1.6: Perfil de Sérsic, n = 2 (a) adicionado de ruı́do poissônico (b). 1.4.2 Função de espalhamento A função de espalhamanento de ponto (Point Spread Function—PSF) é uma função que modela o “borramento” presente nas imagens de telescópios, devido a efeitos atmosféricos e à própria instrumentação. A PSF pode ser ajustada por uma curva Gaussiana. Portanto, a imagem que observamos é modelada, em geral, como sendo o resultado de uma convolução gaussiana. A “largura a meia altura” (F W HM ) de uma gaussiana é a quantidade utilizada na definição da PSF e relaciona-se com o desvio padrão, da seguinte maneira: F W HM = 2 p 2 ln(2) ⇡ 2.35 (1.38) Na figura 1.7 é apresentado um exemplo do espalhamento de uma fonte (quase) pontual. Na figura da esquerda (a) temos um perfil de Sérsic com n = 8, e na figura da direita (b) temos o resultado de (a) convoluı́da com uma PSF (gaussiana) de largura F W HM = 2 pixels. 21 (a) (b) Figura 1.7: Perfil de Sérsic com n = 8 (a) convoluı́do com uma PSF gaussiana com F W HM = 2 pixels (b). 22 Capı́tulo 2 Simulação de arcos gravitacionais Neste capı́tulo descrevo o desenvolvimento e utilização do algoritmo para simulação de arcos gravitacionais, denominado AddArcs. O objetivo do algoritmo é simular arcos gravitacionais, ou seja, objetos fortemente deformados pelo efeito de lentamento gravitacional forte, com L/W 1. Para isso vamos utilizar um código de lenteamento gravitacional — Gravlens (Keeton, 2001) — e catálogos realistas, tanto para fontes quanto para lentes, como base para incorporar os modelos apresentados no capı́tulo anterior. A figura 2.1 apresenta o fluxo de processamento do AddArcs que iremos construir ao longo deste capı́tulo. À medida que o algoritmo for sendo montado, vamos visualizar as etapas e resultados parciais do algoritmo como um exemplo do workflow. Logo, precisaremos de alguns dados de entrada que serão apresentados conforme necessário. Parâmetros de controle e configuração do AddArcs — dispostos, portanto, no arquivo de configuração — serão indicados quando necessário. 2.1 Algoritmo de simulação 2.1.1 Configuração das lentes A primeira etapa do algoritmo de simulação de arcos é configurar as lentes que serão utilizadas. A configuração de uma lente consiste em posicionar uma massa ML , a um redshift zL , com densidade distribuı́da de acordo com um perfil NFW elı́ptico. Portanto, neste primeiro momento, precisamos dos seguintes parâmetros 23 Figura 2.1: Fluxo de trabalho do AddArcs. O programa inicia com um arquivo de configurações e, opcionalmente, uma imagem de céu contendo aglomerados de galáxias para serem utilizados como lentes. Inicialmente, o algoritmo configura as lentes baseado nos halos dentro da região definida por RA e Dec e com massa superior a um valor Mcorte . No segundo bloco são configuradas as fontes (galáxias) para o lenteamento. No terceiro bloco, após o lenteamento, são incorporadas caracterı́sticas instrumentais e, opcionalmente, a combinação das imagens de arcos com a imagem de céu, além da geração de catálogos. Os passos em laranja indicam pontos opcionais, apenas quando uma imagem com aglomerados é dada de entrada. 24 da lente: • Massa: ML ; • Redshift da lente: zL ; • Elipticidade: eL ; • Escala caracterı́stica do modelo NFW: xs ; • Redshift da fonte: zS . Vamos também orientar a lente de um ângulo ✓L e posicioná-la nas coordenadas RA e Dec. Parte destes parâmetros, como posição (RA, Dec, zL ) e massa ML são obtidos de um catálogo de halos de matéria escura – ou aglomerados de galáxias. Neste trabalho utilizaremos um catálogo de halos1 produzido por simulações N-corpos de matéria escura (LasDamas2 ). Tais catálogos são produzidos pelo DES como parte dos ciclos de simulações (DCs). O catálogo utilizado, DCv2.13, contém 206951 halos simulados com redshifts 0.0144 < z < 1.3740 e massas 5 ⇥ 1012 < ML < 8.8 ⇥ 1015 h 1 M . A figura 2.2 apresenta dois histogramas apresentando a distribuição de massa e redshift deste catálogo. Como o número de objetos é muito grande (⇠ 105 ) e porquê queremos otimizar o processo, o passo que segue é a seleção dos halos mais capazes de gerar arcos. Sabendo que a eficiência da lente é proporcional a sua massa, vamos selecionar os objetos mais massivos do nosso catálogo. Outro filtro que aplicamos — este não tem relação com a eficiência da lente — é na posição dos halos: podemos restringir as simulações a uma particular região (RA, Dec). A seguir, vamos ilustrar os passos do método através de um exemplo especı́fico, a saber uma rodada no catálogo DCv2.13 mencionado acima. Neste exemplo 1 2 Em particular, será utilizado o catálogo de halos versão 2.13 (DES_Mock_v2.13_halos.fit) http://lss.phy.vanderbilt.edu/lasdamas/simulations.html 25 (a) (b) Figura 2.2: Distribuição de massa (a) e redshift (b) dos aglomerados (halos) do catálogo DCv2.13. vamos selecionar os halos que sejam mais massivos que Mcorte = 5 ⇥ 1014 M , correspondendo aos 9 halos mais à direita do histograma de massas (figura 2.2). Não vamos restringir a região do céu. A figura 2.3 apresenta o gráfico com as posições dos halos selecionados. A tabela 2.1 lista as informações (propriedades) lidas do catálogo e que utilizaremos ao longo do exemplo para configuração da lente. HaloID 4 8 0 27 15 14 9 16 12 RA 25.924 13.990 12.719 19.487 19.559 28.799 14.238 11.790 14.995 Dec 45.289 37.498 36.056 39.736 38.299 47.935 35.548 43.925 35.419 zL 0.1629 0.2701 0.2530 0.9919 0.1860 0.2701 0.3361 0.4885 0.4355 ML (1014 h 1 M ) 8.823 7.913 7.126 5.607 5.519 5.388 5.375 5.342 5.063 Tabela 2.1: Halos selecionados a partir do catálogo, propriedades básicas para a simulação do exemplo. A primeira coluna apresenta números de identificação para cada halo obtido do próprio catá logo; Ascenção Reta e Declinação são dadas nas colunas seguintes, respectivamente; As duas últimas colunas, zL e ML , correspondem ao redshift e massa dos halos (lentes). A elipticidade é fixa em eL = 0.5 e a orientação é escolhida aleatoriamente (em 0 ✓L < ⇡). Esse valor da elipticidade foi escolhido com base em simulações de N-corpos, correspondendo ao máximo da distribuição de elipticidades dos 26 Figura 2.3: Os cı́rculos (verdes) marcam as posições dos 9 aglomerados utilizados como exemplo. O tamanho dos cı́rculos indica (em escala própria) a massa dos aglomerados. aglomerados (Oguri et al., 2003). Os parâmetros s e xs são obtidos a partir do modelo (NFW) da lente, conforme descrito a seguir. 2.1.1.1 Modelo da lente Os parâmetros s e xs , do modelo NFW, conforme apresentado na seção (1.3.3), são dados por (Caminha, 2009): 4 s = 7.3624 ⇥ 10 C200 ✓ IOL ILS IOS ◆ xs = (200E 2 (zL )) 1 + zL rs DOL 2/3 ✓ ML h 1014 M ◆1/3 (2.1) (2.2) onde rs é a escala caracterı́stica do aglomerado. Na expressão (2.1), C200 é o parâmetro de concentração (Neto et al., 2007). O termo E(z) representa a função 27 de Hubble adimensional: 2 E (z) = ✓ H(z) Ho ◆2 = [⌦m (1 + z) + (1 ⌦⇤ ⌦m )] (1 + z)2 + ⌦⇤ . (2.3) As quantidades IOL , ILS , IOS são proporcionais às distâncias de diâmetro angular: IOL = Ho (1 + zL )DOL , ILS = Ho (1 + zL )DLS , IOS = Ho (1 + zL )DOS . Portanto, para cálculo de s e xs , precisamos de: • C200 • DOL , DLS , DOS • zL • ML • ⌦m , ⌦⇤ Desta lista de parâmetros, os únicos que ainda não temos são ⌦m , ⌦⇤ , C200 e as distâncias à(s) fonte(s) DLS , DOS . Para as densidades de matéria e de energia escura (⌦m e ⌦⇤ ) vamos utilizar os mesmos valores das simulações de halos LasDamas: 0.3 e 0.7, respectivamente. Estes parâmetros caracterizam a cosmologia que utilizaremos nas simulações e são dados como entrada através do arquivo de configurações do AddArcs. O parâmetro C200 é obtido de uma distribuição de probabilidades P (C200 |M, z) ajustada a partir de simulações com alta resolução (Neto et al., 2007), visto que as simulações utilizadas pelo DES não possuem resolução suficiente para que se possa medir o parâmetro de concentração. O parâmetro de concentração é calculado por um código implementado por Angelo F. Neto (Neto et al., 2007). Já para os parâmetros s e xs um código 28 implementado por Gabriel Caminha (Caminha, 2009) é responsável pelos cálculos. A tabela 2.2 apresenta os valores calculados para xs e C200 para o nosso exemplo. HaloID 4 8 0 27 15 14 9 16 12 ML (1014 h 1 M ) 8.823 7.913 7.126 5.607 5.519 5.388 5.375 5.342 5.063 zL 0.1629 0.2701 0.2530 0.9919 0.1860 0.2701 0.3361 0.4885 0.4355 ✓L (deg) 1.18 69.49 29.20 130.24 154.54 130.72 40.80 94.43 59.06 C200 5.272975 5.142314 5.246680 4.995095 5.565525 5.407800 5.275544 4.982585 5.118645 xs 2.386856 1.537011 1.535091 0.550174 1.723390 1.285811 1.104900 0.878246 0.914476 Tabela 2.2: Parâmetros de concentração e de escala dos aglomerados. As três primeiras colunas são identicas às já apresentadas na tabela 2.1; os halos estão ordenados em ordem decrescente de massa. ✓L apresenta os valores de orientação (em graus) sorteados para cada lente (eL = 0.5). Nas últimas colunas são dados os valores calculados para o parâmetro de concentração C200 e escala da lente xs . Apesar de as posições das fontes (zS ) não terem sido escolhidas ainda, o valor de s já pode ser computado neste momento devido a uma estratégia adotada para o posicionamento das fontes baseada em planos pré-estabelecidos a partir do desvio para o vermelho (redshift) da lente. 2.1.1.2 Planos das fontes A convergência caracterı́stica (s ) depende das distâncias envolvidas no sistema de lenteamento. Logo, o redshift zS da fonte é necessário para que finalizemos a determinação dos parâmetros da lente fina. Ao invés de considerar o zS de cada fonte, dividimos o plano das fontes em intervalos, de modo que a solução da equação da lente possa ser preparada numericamente pelo Gravlens para esses planos, aumentando a eficiência dos cálculos de lenteamento; do contrário, seria necessário obter a solução da lente para cada valor de zS . O intervalo em zS para posicionamento das fontes (zS > zL ) é dividido em quatro faixas de largura z = 0.5 zL e centrados nos pontos 1.5 zL , 2 zL , 2.5 zL , 3 zL . Estes pontos definem (4) planos zp , os quais concentram as fontes que forem posicionadas (seção 2.1.2.2) em seus domı́nios 29 zp = [zp 0.25zL : zp + 0.25zL ]. Assim, as fontes ocuparão posições pré-definidas ao longo da linha de visada projetando-as em quatro planos linearmente espaçados. Isso possibilita-nos calcular os valores de s para cada plano zp , finalizando, assim, com a etapa de configuração da lente. As curvas crı́ticas podem, então, ser desenhadas. Esta estratégia de “quantizar” as posições proporciona um bom ganho de desempenho. Como veremos na seção (2.1.2), uma quantidade expressiva (⇠ 102 ) de fontes é sorteada para cada lente na simulação, na tentativa de obter um arco, e o processo de lenteamento é relativamente caro (computacionalmente). Esta estratégia otimiza parte do processo de lenteamento envolvido com a seleção de fontes “boas” para a geração de arcos (seção 2.1.2). Na tabela 2.3 são dispostos os valores de s do exemplo em questão juntamente com os valores de zS estipulados pela nossa aproximação de planos das fontes. Com isso encerramos com a configuração das lentes. Temos todos os parâmetros necessários para o modelo (NFW) de lentes, com algumas aproximações para a implementação do modelo computacional. 2.1.2 Seleção de fontes Na consideração das fontes para a simulação queremos ser capazes de utilizar objetos dispostos em uma grande faixa de distâncias ao longo da linha de visada, e que as propriedades das fontes (morfologia e brilho) sejam as mais realistas possı́veis. Cobrir uma faixa extensa de posições em z é interessante, pois a eficiência das lentes depende da distância lente-fonte (✓E / DLS ), o que nos permite simular arcos com maior probabilidade. Para as fontes utilizadas, temos de associar propriedades morfológicas e luminosas, como raio, elipticidade e magnitude, além do redshift em z e posição no plano das fontes (RA, Dec). As propriedades das fontes que vamos utilizar para modelar as galáxias de fundo para o lenteamento foram obtidas a partir de observações de campo profundo realizadas pelo Telescópio Espacial Hubble (HST). O Hubble Ultra Deep 30 HaloID 4 ML (1014 h 1 M ) 8.823 zL 0.1629 zS 0.2443 0.3258 0.4072 0.4887 s 0.069581 0.104263 0.124993 0.138754 8 7.913 0.2701 0.4051 0.5402 0.6752 0.8103 0.100388 0.150227 0.179896 0.199517 0 7.126 0.2530 0.3795 0.5060 0.6325 0.7590 0.094184 0.140974 0.168845 0.187287 27 5.607 0.9919 1.4878 1.9838 2.4797 2.9757 0.230831 0.344160 0.411508 0.456258 15 5.519 0.1860 0.2790 0.3720 0.4650 0.5580 0.071726 0.107449 0.128782 0.142931 14 5.388 0.2701 0.4051 0.5402 0.6752 0.8103 0.094244 0.141033 0.168886 0.187306 9 5.375 0.3361 0.5041 0.6722 0.8402 1.0083 0.109098 0.163125 0.195217 0.216404 16 5.342 0.4885 0.7327 0.9770 1.2212 1.4655 0.135623 0.202450 0.242015 0.268100 12 5.063 0.4355 0.6532 0.8710 1.0887 1.3065 0.126253 0.18856 0.225480 0.249823 Tabela 2.3: Convergência caracterı́stica as combinações de cada lente os planos das fontes. Os planos das fontes (zS ) estão espaçadas de 0.5 zL . 31 Field (Coe et al., 2006; Pereira, 2009), doravante UDF, é o mais profundo levantamento existente no ótico, com objetos até z ⇡ 5 e com uma ótima resolução espacial (0.03 arcsec/pixel). Quanto melhor a resolução, melhor definidos estão os objetos, o que permite bons ajustes das propriedades observadas e contribui com a qualidade do modelo das fontes (galáxias de fundo). O catálogo de fontes (UDF) que utilizamos contém informações de fotometria e desvio para o vermelho (zS ), além de parâmetros morfológicos para cada objeto obtidos a partir de ajustes da distribuição de brilho das galáxias por um perfil de Sérsic. A quantidade de fontes que vamos utilizar para a simulação é definida pela densidade de fontes do catálogo UDF e a área do céu que estamos simulando, de forma que possamos ter uma estimativa realista quanto ao número de galáxias simuladas. Na seção a seguir apresento a questão da quantidade de fontes utilizadas na simulação de acordo com a densidade de objetos no catálogo. 2.1.2.1 Densidade de fontes Tendo dividido o intervalo para posicionamento (z) das fontes, um número associado à quantidade de fontes em cada plano zp está subentendido: a densidade de fontes em cada intervalo zp (ou plano zp ). Esta é calculada contando o número de fontes em cada intervalo e dividindo pela área coberta pelo catálogo UDF. A densidade de fontes será necessária para distribuir as fontes nos planos. Neste passo, como mecanismo para aumentar (ou diminuir) o número de fontes a simular, a implementação deste algoritmo – o AddArcs – permite que o usuário passe ao programa um fator multiplicativo, que será utilizado para modificar a densidade efetiva de fontes. Este é um parâmetro livre do nosso algoritmo para que possamos averiguar a eficiência da geração de arcos para um dado conjunto de lentes. 32 2.1.2.2 Sorteio das fontes Após as fontes terem sido devidamente associadas aos planos das fontes zp , é necessário distribuı́-las em torno do eixo observador-lente, em seus respectivos planos. Após termos feito isso, estaremos prontos para simular o lenteamento das mesmas. Também como mecanismo de otimização do algoritmo, as fontes posicionadas fora das regiões de alta magnificação são descartadas, visto que queremos objetos com alta razão L/W . Esta filtragem é feita utilizando fontes pontuais, também por motivos de desempenho, uma vez que o mapeamento de fontes pontuais é consideravelmente mais rápido e as magnificações são definidas para cada ponto (seção 1.3.2.1). O que vamos fazer a seguir, então, é (i) definir uma região em torno da lente para popular com fontes (pontuais), (ii) sortear aleatoriamente as posições nesta região e (iii) selecionar as fontes que estejam em posições de alta distorção. Para isso, precisamos, antes de mais nada, saber quais são os pontos que definem as curvas crı́ticas (CC). Este cálculo é realizado com o Gravlens (Keeton, 2001); a função que realiza esta interface com o Gravlens (Ferreira, 2010) e decide quais fontes são boas para a simulação foi implementada por Pedro Ferreira. Lembrando que as CC dependem tanto de zL quando de zS ; portanto a computação das CC é realizada para cada plano de fontes zp de maneira independente. Uma vez definidas as CC podemos definir a região na qual sortearemos as fontes. A região que definiu-se para posicionamento das fontes é consideravelmente superior a área interna às CC, de maneira que possamos dar espaço suficiente às fontes para uma correta avaliação das boas candidatas a arco. Para isso aumentamos artificialmente a região englobada pelas CC e definimos um retângulo a partir dos limites (x,y) desta região (CC) aumentada.3 É sorteado, então, um conjunto de posições para as fontes pontuais. O número de pontos sorteados é dado pela área do retângulo multiplicado pela densidade 3 Esta “região aumentada” não será utilizada em outro momento senão neste sorteio de pontos. 33 de fontes do catálogo em cada plano zp . A figura 2.4 exemplifica o sorteio de posições de um conjunto de fontes no retângulo definido através das CC (em vermelho). Em seguida estas posições serão avaliadas quanto a seu poder de magnificação. Figura 2.4: Posições sorteadas para as fontes, a serem avaliadas quanto a magnificação. Os pontos vermelhos representam a cáustica tangencial, onde a magnificação é máxima. O losango azul define a região na qual as fontes pontuais serão avaliadas e os pontos verdes simbolizam as fontes com alta magnificação selecionadas. Fonte: (Ferreira, 2010) Cada um dos pontos sorteados é avaliado quanto a sua magnificação µt /µr (seção 1.3.2.1), desejamos escolher pontos que estejam em regiões de alta deformação. As fontes que estiverem sobre um ponto com µt /µr > µcorte são selecionadas para seguirem ao passo de lenteamento de fontes extensas que se segue. As posições das fontes (pontuais) aqui selecionadas serão utilizados como centro das fontes extensas na simulação. Como valor padrão para o parâmetro de corte para magnificação (pontual) utilizamos o valor µcorte = 5 através do arquivo de configuração. As posições das fontes que passarem no corte de magnificação serão utilizados como centro das fontes extensas no processo de lenteamento que segue. 2.1.2.3 Fontes extensas Por fim, para podermos de fato simular o lenteamento de uma galáxia de fundo (fonte) por um aglomerado de galáxias (lente), vamos configurar fontes ex34 tensas, posicionadas nos pontos filtrados pelo passo anterior. Por fontes extensas denotamos o modelo de galáxias utilizado no lenteamento. Vamos utilizar agora fontes com raio, elipticidade, orientação, perfil de luminosidade (Sérsic) obtidos a partir de dados observacionais. O catálogo UDF carrega as propriedades morfológicas e fotométricas das galáxias observadas no levantamento, incluindo a sua magnitude em 5 bandas. Para cada fonte vamos atribuir um conjunto de propriedades lidas do catálogo UDF. O conjunto de propriedades é sorteado do catálogo tomando o cuidado de sortear um galáxia que esteja nos intervalos zp (seção 2.1.1.2). Os parâmetros que caracterizam as entradas do catálogo sorteadas são utilizados para modelar a fonte (extensa). 2.1.3 Lenteamento Fonte-Imagem Este é o ponto do nosso algoritmo em que simulamos o lenteamento de uma galáxia de fundo por um aglomerado de galáxias. O processo de mapeamento (seção 1.3.2) dos objetos do plano das fontes ao plano das imagens (lente) é realizado pelo software Gravlens (Keeton, 2001). Após modelar o sistema fı́sico, o conjunto de parâmetros do modelo é passado ao Gravlens para que este compute a matriz jacobiana e seus auto-valores para cada ponto dos planos fonte/lente. Como resultado do processo de lenteamento o software retorna as imagens das fontes lenteadas – os arcos gravitacionais. Dos 9 aglomerados utilizados para a simulação (tabela 2.1), 3 foram capazes de gerar um arco cada. A figura 2.5 apresenta os arcos simulados neste exemplo. As coordenadas dos arcos são dadas na tabela 2.4: HaloID 12 16 27 zL RA Dec 0.4356 14.995 35.419 0.4886 11.790 43.925 0.9919 19.487 39.736 ArcID A B C zS RA Dec 1.3068 14.083 36.149 1.4657 17.275 44.400 2.9757 27.767 46.286 L/W 40.1 11.2 16.1 Tabela 2.4: Propriedades dos arcos simulados com o AddArcs: RA, Dec são as coordenadas, L/W a razão comprimento-largura e zS o redshift das fontes que geraram os arcos. 35 (A) (B) (C) Figura 2.5: Arcos simulados pelos alglomerados com ID 12 (A), 16 (B) e 27 (C), parâmetros apresentados na tabela 2.1. O centro de cada lente utilizada está representado através dos “X” em vermelho. O tamanho dos painéis representa, em escala arbitrária, o tamanho relativo dos planos de imagens para cada sistema. 2.1.4 2.1.4.1 Efeitos observacionais Convolução com a PSF Conforme vimos na seção (1.4.2), o borramento presente nas imagens de telescópios são modelados por uma função de espalhamento de ponto (PSF) que tem a forma de uma gaussiana. Esta função gaussiana tem uma largura à meia altura (F W HM ) associada ao parâmetro da gaussiana conforme equação (1.38). Para aplicar este efeito de borramento aos arcos simulados é preciso convoluir as imagens dos arcos com uma gaussiana com a largura, no caso, tı́pica do DES. A largura à meia-altura das imagens simuladas do DES é de 0.8 arcsec. Em termos de pixels, o desvio padrão = é dado por: 1 0.800 ⇥ ⇡ 1.26 pixel . 2.3548 0.2700 /pixel (2.4) Onde 0.2700 /pixel é a resolução da DECam. Utilizando uma gaussiana normalizada com largura acima temos as imagens apresentadas na figura 2.6. 36 Figura 2.6: Arcos convoluı́dos com a PSF utilizada nas simulações do DES, gaussiana com = 1.26 pixels. 2.1.4.2 Adição de ruı́do às imagens Para concluir a simulação dos arcos com ingredientes observacionais, nos falta apenas adicionar o ruı́do de Poisson às imagens simuladas. O ruı́do poissônico é incorporado sorteando para cada pixel da imagem um novo valor baseado na distribuição (equação 1.37). Isso é feito sobre as imagens já convoluı́das com a PSF. A figura 2.7 apresenta o resultado da incorporação de ruı́do nas simulações. Figura 2.7: Arcos adicionados de ruı́do de Poisson, após convolução. 37 2.1.4.3 Calibração de bandas Para simular arcos em diferentes bandas, utilizamos o fato do processo de lenteamento ser independente da frequência da luz – acromático – e apenas escalonamos as intensidades dos arcos simulados para diferentes filtros (ou bandas). O AddArcs simula arcos em uma banda, chamada banda de referência; tipicamente a banda i. Para atingir o brilho correspondente em diferentes bandas uma transformação do tipo: log10 (Km ) = 2 mref 5 mref (mnew mnew ) (2.5) é utilizada, onde o fator Km é o fator aplicado a cada pixel da imagem “ref ” para que tenhamos as novas intensidades, em “new”. Os parâmetros mref e mnew são as magnitudes de ponto-zero nas respectivas bandas, obtidas a partir da documentação de um instrumento (i.e, telescópio) ou simulação (e.g, Data Challenge). O catálogo UDF provê parâmetros fotométricos em quatro bandas (ou filtros) 0 0 diferentes: B (4350 Å), V (6060 Å), i (7750 Å), z (8500 Å). O DES irá observar em cinco bandas (ou filtros) diferentes: g (4750 Å), r (6220 Å), i (7630 Å), z (9050 Å). Assim, visto que o foco primário deste trabalho é o de produzir imagens simuladas para o DES, queremos ser capazes de produzir imagens condizentes com os filtros da DECam. Para isso – e visto que os comprimentos de onda centrais 0 0 são parecidos – faremos a seguinte associação: B ! g, V ! r, i ! i, z ! z (Ferreira, 2010). 2.1.5 Co-adição de imagens Ao final, caso uma imagem (de céu: contendo estrelas, galáxias, etc.) tenha sido dada na entrada como referência para a posição dos aglomerados, as imagens dos arcos simulados devem ser sobrepostas a esta imagem base. Isto é feito correlacionando o centro da lente modelada e utilizada na simulação dos arcos e o centro do respectivo aglomerado na imagem. 38 A figura 2.8 apresenta um exemplo do resultado final da simulação de um arco gravitacional adicionado a uma imagem do DES. Esta imagem tem um sentido especial para esta dissertação, pois, além de ser um bom exemplo de resultado final, ela foi o primeiro resultado do algoritmo quando totalmente automatizado. Esta é uma imagem do ciclo de simulações de número 4 (DC4) e o arco simulado tem ótimas propriedades visuais. Esta imagem foi utilizada para apresentarmos ao grupo internacional de lenteamento gravitacional forte (SLWG 4 ) as possibilidades do nosso algoritmo, que foi então aceito pela colaboração, e seu desenvolvimento incentivado. Figura 2.8: Imagem utilizada para demonstrar o resultado final da simulação de arcos sobre aglomerados em imagens simuladas. À esquerda temos a imagem original, com o “X” em vermelho marcando o centro do aglomerado. Em cima à direita, o arco simulado. Na imagem inferior o resultado final: o arco adicionado sobre a imagem do aglomerado utilizado como lente. Esta provem do ciclo de simulações DC4. 2.2 Implementação Computacional O AddArcs é um programa escrito essencialmente em Python, com algumas funções escritas em C e C++. O código é dividido em três grandes blocos de processamento, indicados na figura 2.1 através dos quadrados grandes: (i) inicialização e 4 DES Strong Lensing Working Group 39 configuração da lente, (ii ) seleção e lenteamento de fontes, (iii) pós-processamento das imagens e finalização. O simulador utiliza um arquivo de configuração para os parâmetros livres do algoritmo, permite a utilização modular do código através de arquivos de propriedades e permite também o registro do passo-a-passo do processo em um arquivo de log. A primeira versão do AddArcs, ainda de testes, era monolı́tica e serial. Este desenho teve de ser modificado devido ao baixo desempenho apresentado pelo programa quando os testes com números expressivos de aglomerados (⇠ 102 103 ) foram realizados: o tempo de processamento para a simulação de ⇠ 3500 halos estava em torno de 35 horas utilizando um núcleo de um Intel Core2 Quad Q8300 (2.5GHz) com 4GB de memória RAM disponı́vel. A solução implementada foi a paralelização do código. A versão atual do AddArcs foi paralelizada na etapa de lenteamento das fontes, para cada lente configurada. Visto que as simulações dos arcos podem ser tomadas como tarefas independentes – para cada lente em separado – um modelo do tipo bag-of-tasks (“saco-de-tarefas”) foi implementado. Com a paralelização do código no trecho de lenteamento e seleção das fontes, o mais custoso computacionalmente (em tempo), o ganho de desempenho foi essencialmente linear. Após as modificações, o tempo necessário para simulação de arcos nos ⇠ 3500 halos utilizando os 4 núcleos da mesma máquina (processador Intel Core2 Quad Q8300) caiu para pouco mais que 9 horas, resultando em um ganho de ⇡ 4 vezes no tempo de processamento. A estruturação do código nos três blocos citados tem dois objetivos. O primeiro deles é separar os trechos seriais (i) e (iii) do trecho paralelizado (ii ), de maneira que o bloco (ii) possa ser processado em um ambiente de memória distribuı́da. O segundo, objetiva oferecer maior flexibilidade de uso do código. Isto é possı́vel, pois cada bloco pode ser executado individualmente, de acordo com os dados e arquivos de entrada em posse do usuário. A figura 2.9 e o “help” do programa “AddArcs.py -h”, abaixo, nos auxiliam 40 a visualizar a estrutura em blocos implementadas no AddArcs e seu uso. Usage: AddArcs.py -c <config_file> [-f <pipe_file.ini>] [options] Options: -h, --help show this help message and exit -d, --dump Dump default configuration file to stdout -q, --quiet Make the running quiet, just log file created -c CONFIGFILE, --config=CONFIGFILE AddArcs configuration file. Mandatory argument -f PIPEFILE, --file=PIPEFILE AddArcs pipeline file(s) [if (s), comma separated]. -x EXECBLOCK, --exec=EXECBLOCK If used, execute specific code block. Options are: ’readout_halos’, option ’-c’ necessary; ’arc_simulation’, options ’-c’ and ’-f’ necessary; ’image_addition’, options ’-c’ and ’-f’ necessary. As informações geradas ao longo do programa são armazenadas em uma estrutura interna de dados — no primeiro bloco, “readout_halos”, esta estrutura é inicializada e preenchida com os dados das lentes configuradas para as simulações; no segundo bloco, “arc_simulation”, os arcos simulados são adicionados a esta estrutura, junto com com informações adicionais das simulações; no terceiro bloco, “image_addition”, os dados contidos nesta estrutura são combinados para geração dos arquivos de saı́da. Caso a opção de execução por bloco (“-x”) seja utilizada, ao final do bloco executado a estrutura interna de dados é impressa em arquivo texto. A estes arquivos, com os dados do algoritmo, damos o nome de arquivos de propriedades do AddArcs (figura 2.11). O AddArcs está disponı́vel para download através do endereço eletrônico http://che.cbpf.br/download/AddArcs-current.tgz. Simulação em imagem real Como exemplo de aplicação e uso da estrutura modular do AddArcs apresento a seguir uma simulação de arcos realizada sobre uma imagem real referente ao 41 Figura 2.9: Fluxo de paralelização do AddArcs. No primeiro bloco é inicializada a estrutura de dados interna e as lentes são configuradas. Em seguida, o paralelismo e distribuição do trabalho de seleção e lenteamento das fontes é realizado entre os processadores disponı́veis. No terceiro bloco os dados dos sistemas simulados são combinados para a geração das imagens e catálogos de saı́da. aglomerado de Abell 3835 . A imagem, apresentada na figura 2.10, foi obtida dos arquivos públicos do Telescópio Espacial Hubble (HST), disponibilizados pelo Instituto de Ciências do Telescópio Espacial (STScI)6 . Conforme vimos nas seções anteriores precisamos de algumas informações do aglomerado em questão para que o AddArcs possa modelar a lente gravitacional para as simulações. As propriedades do aglomerado A383 necessárias foram obtidas do trabalho de Smith et al. (2001) e são apresentadas abaixo: • Massa: 1.82 ⇥ 1014 M • Redshift: 0.188 • PSF (F W HM ): 0.12300 • Magnitude de ponto-zero: 31.2 • Centro do aglomerado: RA = 42.014, Dec = 5 6 3.529 Proposta de observação HST #8249, ciclo #8, PI: Jean-Paul Kneib http://hla.stsci.edu/hlaview.html 42 Figura 2.10: Aglomerado de Abell 383, com arcos gravitacionais, observado pelo telescópio Hubble. Com esses dados podemos escrever o arquivo de propriedades para a execução do AddArcs para a simulação de arcos no aglomerado A383. Vamos utilizar o catálogo de fontes do UDF. No arquivo de configuração temos de colocar a resolução de imagem a ser utilizada nas simulações, que no caso da câmera WFPC2 do Hubble é de 0.03 00 /pixel. A figura 2.11 contém o arquivo de propriedades necessário para rodar o AddArcs a partir do bloco “arc_simulation”. Como resultado final o AddArcs simulou dois arcos gravitacionais que foram adicionados à imagem original (figura 2.10) conforme podemos ver na figura 2.12. Na tabela 2.5 são apresentados os dados referentes aos objetos simulados. O comprimento (length) e a largura (width) são encontrados da seguinte maneira: encontra-se os dois pontos extremos do arco P 1 e P 2 além de um terceiro ponto, P 3, que localiza o pixel mais brilhante do mesmo objeto. O comprimento do segmento de cı́rculo que liga os três pontos P 1P 3P 2 é tomado como medida para L 43 Figura 2.11: Arquivo de propriedades para a execução do AddArcs na simulação de arcos para a imagem do aglomerado A383. (Length); para o cálculo da largura do arco utiliza-se a seguinte expressão: W = 4A , ⇡L onde A é a área total do arco, isto é, simplesmente o número de pixels do objeto. ArcID A B RA 40.374 43.745 Dec -4.151 -2.80 Length 235 306 W idth 33 59 L/W 7.9 5.4 zS 0.376 0.376 Tabela 2.5: Propriedades dos arcos simulados para o aglomerado de Abell 383. Com isso mostramos a capacidade do AddArcs de simular arcos gravitacionais (artificiais) em imagens reais com a modularização implementada no simulador. 2.3 Resultados O AddArcs foi desenhado de maneira que pudessemos simular arcos de duas maneiras diferentes, de acordo com os dados de entrada: • modo catálogo: a partir de coordenadas de Ascensão Reta (RA) e Declinação (Dec) que definem uma região no plano do céu, o programa seleciona (de um catálogo) aglomerados com massa M > Mcorte para a simulação de 44 Figura 2.12: Simulação de arcos para o aglomerado de Abell 383. A letras “A” e “B” indicam os arcos adicionados. arcos “puros”. A saı́da são imagens contendo somente arcos e o catálogo de propriedades associadas a cada objeto. • modo imagem: as coordenadas que definem uma região do céu são obtidas a partir de uma imagem do céu de entrada. A simulação ocorre então da mesma maneira que no modo catálogo com o acréscimo de adicionar as imagens dos arcos simulados, adicionados de ruı́do e convoluı́dos com a PSF, à imagem do céu dada. A saı́da, então, é composta pelas imagens dos arcos e catálogo de propriedades, e as imagens combinadas. Modo catálogo A aplicação modo catálogo é capaz de simular arcos gravitacionais em uma grande área, tão grande quanto a área do catálogo utilizado. Esta aplicação é particularmente útil para realizarmos previsões de abundância de arcos. 45 2 Realizamos uma rodada de simulações numa área de 300 , correspondendo a área total do catálogo de halos do DES (versão 2.00c), com halos de massa superior a 5 ⇥ 1013 h 1 M , totalizando 3402 aglomerados. Estes catálogos são tabelas que contêm nas colunas as propriedades dos halos dispostos nas linhas. Em particular, utilizamos as colunas com informações de massa, RA, Dec e redshift destes objetos. Escolhemos o pixel com mesma resolução da camêra do projeto DECam (0.27 arcsec/px), parâmetros cosmológicos ⌦M = 0.3 e ⌦⇤ = 0.7 (modelo ⇤CDM ) e lentes com elipticidade fixa em 0.5. Utilizamos o catálogo de fontes UDF e parâmetro de seleção das fontes extensas dado por µt /µr > 5. Dos 3402 aglomerados, 51 geraram arcos (1.5% do total), sendo que apenas 2 geraram 2 arcos cada. Isto nos permite estimar o número de arcos que o DES deverá 2 observar. Fazendo a razão entre a área total de mapeamento do projeto (5000 ) 2 com a área do catálogo utilizado, chegamos ao número de (5000 /300 2 ⇥ 51) ⇡ 850 arcos gravitacionais. Esta estimativa está em acordo com outro estudo (Allam et al., 2009) em que foram utilizados outros levantamentos (CFHTLS e RCS-2), levando em conta área e profundidade, obtendo-se números entre 102 e 103 para a abundância de arcos. Algumas decisões tomadas no nosso modelo computacional, sabemos, subestimam o número de arcos estimado: (i) as fontes utilizadas possuem no máximo redshift zS = 3.25 zL , excluindo todas as fontes com zS > 3.25 zL , (ii) as lentes possuem simetria elı́ptica, e sem subestruturas, enquanto a presença de subestruturas aumenta a seção de choque e beneficia a geração de arcos e (iii) lentes que poderiam gerar arcos são excluı́das da simulação pelo critério de corte de massa ML > Mcorte . Por outro lado, o número de arcos é superestimado por (i) não convoluirmos as imagens com a PSF, que tende a borrar os arcos e diminuir a razão axial (L/W ) e (ii) supomos que os arcos simulados pelo AddArcs seriam observados pelo DES, independente de sua magnitude. 46 Estes aspectos deverão ser considerados com mais detalhes em trabalhos futuros para permitir uma estimativa mais confiável do número de arcos esperado. Modo imagem Como dito anteriormente, neste modo utilizamos uma imagem do céu como entrada em que os limites da imagem em RA e Dec são utilizados, além dos parâmetros descritos no modo catálogo. 2 Aqui utilizamos uma imagem do DC5, que possui uma área de 0.723 . O limite de corte em massa foi também 5 ⇥ 1013 (h 1 M ), e o catálogo de halos manteve-se o mesmo (v-2.00c), bem como o catálogo de fontes (UDF). A diferença aqui foi a densidade de fontes, escolhida 10 vezes maior do que a fornecida pelo catálogo para que obtivessemos um maior número de arcos. Os arcos obtidos foram convoluı́dos com uma PSF de F W HM = 0.800 (ou = 1.26px, de acordo com as equações 1.38 e 2.4) e adicionados de ruı́do de Poisson. Aqui as simulações ocorreram em multiplas bandas: g, r, i, z, de acordo com a explicação dada na seção (2.1.4.3). Combinando as imagens nas bandas r, g e z – e associando a cada uma delas uma cor, vermelho, verde e azul, respectivamente – criamos imagens coloridas das regiões com os arcos simulados. Nove aglomerados acima do corte de massa foram selecionados para as simulações, mas apenas dois conseguiram gerar arcos gravitacionais. Um dos aglomerados gerou 7 arcos, que podem ser vistos na figura 2.13, enquanto o outro aglomerado gerou 2 arcos, figura 2.14. A localização dos aglomerados utilizada está assinalada pelos cı́rculos vermelhos nas respectivas figuras. 47 Figura 2.13: Simulação de arcos em três bandas (r, g, z) apresentadas em cores. O cı́rculo vermelho indica o centro da lente utilizada e o cı́rculo verde indica a posição dos arcos na imagem. Data Challenge 6 No último ciclo de simulação do DES, os arcos gerados pelo AddArcs foram incorporados definitivamente como um componente do pipeline das simulações. Para incorporar arcos ao DC-6 realizamos duas rodadas de simulações com os seguintes parâmetros: - RA = [325 : 345]; - DEC = [ 50 : 35]; - Mcorte = 5 ⇥ 1013 M h 1 ; - Resolução = 0.27”/px; - Enhance sources factor = 10. 48 Figura 2.14: Simulação de arcos em três bandas (r, g, z) combinadas em cores. O cı́rculo vermelho indica o centro da lente utilizada e o cı́rculo verde indica a posição dos arcos na imagem. As simulações foram realizadas no cluster do Instituto de Cosmologia, Relatividade e Astrofı́sica (ICRA/CBPF), em uma máquina com 8 processadores do tipo Intel Xeon E5430. Uma das simulações gerou 195 arcos e a outra gerou 184. Cada rodada levou cerca de 110 minutos para ser concluı́da. Estes (195+184) arcos foram, então, convoluı́dos com a mesma PSF das simulações (F W HM = 0.800 ⇡ 3 px) e selecionados de acordo com sua deformação L/W > 5. Uma seleção final ocorreu para os objetos com magnitude < 24.5, de forma a eliminar objetos de baixa intensidade. Ao final deste processo restaram 90 arcos, que foram, então, adicionados ao último ciclo (DC6) de simulações, e que hoje estão disponı́veis à colaboração por meio de imagens e catálogos. 49 Capı́tulo 3 Ferramentas para dados astronômicos O AddArcs, com sua estrutura modular, motivou a criação de uma biblioteca de ferramentas para dados astronômicos com ênfase em arcos gravitacionais. O objetivo da biblioteca, chamada SLtools, é otimizar o desenvolvimento de software do grupo de SL através da organização deste desenvolvimento com infra-estrutura de documentação, versionamento e padronização para a produção de código. A SLtools é composta majoritariamente por códigos na linguagem Python e conta também com códigos em C e C ++ e é oferecida para os usuários através de uma interface (API) em Python, para Linux e MacOS-X. Apesar de utilizarmos linguagens orientadas a objetos, a SLtools é estruturada em módulos e funções que trabalham com tipos de dados comuns à comunidade cientı́fica (arquivos FITS, arrays multi-dimensionais, listas e dicionários) acessı́veis através de algumas bibliotecas (como Numpy, PyFits, Scipy1 ), também comuns aos usuários de Python. A infra-estrutura e padrões de desenvolvimento implementados têm como metas oferecer um ambiente simples aos usuários e desenvolvedores e garantir um mı́nimo de qualidade do software desenvolvido, de maneira que a colaboração e independência entre os desenvolvedores sejam as melhores possı́veis. Nas seções que seguem são apresentados alguns elementos de desenvolvimento realizados na implementação da biblioteca: (i) documentação de código, (ii ) linguagens de programação, (iii) herança de mensagens, (iv ) padronização de chamadas, (v ) controle 1 http://new.scipy.org/ 50 de versão, (vi) empacotamento e distribuição, (vii) usabilidade. A atual versão da biblioteca, v-0.1.52 , contém módulos para leitura e escrita de catálogos astronômicos, processamento de imagens – filtragem, segmentação, co-adição, etc. –, simulação de arcos, recursos gráficos, entre outros. Abaixo segue a lista de módulos que compõem esta versão da SLtools. • catalog: métodos para manipulação de catálogos ASCII e FITS • coordinate: métodos para conversão de coordenadas celestes • gravlens: rotinas de interface com o software Gravlens • image: métodos para manipulação de imagens • io: funções para verificação, entrada/saı́da e registro de dados • lens: métodos para modelagem e simulação de lentes gravitacionais • string: manipulação de texto e expressões regulares 3.1 Documentação de códigos Documentação neste trabalho engloba desde a sintaxe do código-fonte (que deve ser legı́vel e claro) até as informações de utilização das ferramentas implementadas. Visto que o desenvolvimento é realizado por um grupo pequeno de desenvolvedores, o processo de documentar os códigos deve ser simples e objetivo. Esta documentação deve também evoluir junto com o desenvolvimento do próprio código. O esquema de documentação adotado para a SLtools está baseado nos Python PEP s3 número 287, 258, 257, 256, 8 e 7. O Python possui um sistema de documentação elaborado para que esta seja registrada em código e exportada ao usuário, através de seu interpretador. Este 2 3 Disponı́vel em http://che.cbpf.br/sltools/download/sltools-current.tgz Python Enhancement Proposals, http://www.python.org/dev/peps/ 51 sistema, chamado docstrings, define sintaxe e mecanismo para leitura e exportação das informações. Optamos por disponibilizar a documentação da biblioteca em formatos HTML e PDF, para facilitar a consulta da mesma, distribuı́dos junto com o pacote da biblioteca (seção 3.5). Isto é feito com o auxı́lio dos softwares Doxygen4 e Doxypy5 . No endereço eletrônico http://www.che.cbpf.br/sltools é mantida uma versão atualizada automaticamente a cada 15 minutos com o conteúdo de documentação do repositório da SLtools. A figura (3.1) apresenta um exemplo da documentação do código fonte em docstrings (a), como ela aparece ao usuário no interpretador do Python (b) — com o auxı́lio da função help() — e como ela é exportada para HTML (c) pelo Doxygen. 3.2 Linguagens de programação A SLtools é composta por códigos em diferentes linguagens: quase a tota- lidade dos métodos é escrita em Python, enquanto algumas funções de integração numérica utilizam C e C++. A interface de programação (API) é oferecida em Python. Para os códigos escritos em C/C++ fizemos “bindings” (“conversores”) para que estes pudessem ser compilados e utilizados através do Python, que é uma linguagem interpretada. Para construção dos bindings, utilizamos um programa chamado SWIG 6 que auxilia no acesso a esta API para comunicação com códigos compilados. Assim conseguimos realizar a integração entre códigos em diferentes linguagens na SLtools, aliando o desempenho de linguagens compiladas (C/C++) com o alto-nı́vel do Python. 4 5 6 http://www.doxygen.org http://code.foosel.org/doxypy http://www.swig.org/ 52 (a) (b) (c) Figura 3.1: Formatação da documentação dos métodos em código, (a) docstrings, (b) como ela é apresentada no interpretador do Python e (c) como ela é apresentada em HTML pelo Doxygen. 53 3.3 Herança de mensagens Um aspecto interessante da SLtools é a herança de mensagens (logging) entre suas funções. Com o mecanismo de logging podemos gravar mensagens do estado do programa ao longo do processamento para posterior consulta. No sistema de logging, as informações são coletadas e apresentadas de acordo com o tipo e importância delas: error, debug, warning ou apenas informative. Para atingir o objetivo de ter um sistema de mensagens na SLtools, o módulo logging 7 do Python foi utilizado nos códigos da biblioteca, de maneira que o usuário tenha controle de alguns aspectos das mensagens. Isto é feito por meio do módulo “io” da biblioteca. 3.4 Controle de versão Visto que a biblioteca é desenvolvida de maneira colaborativa, um meca- nismo para lidar com a edição assı́ncrona de códigos é necessário para manter a integridade do desenvolvimento. Também é importante manter o histórico de todas as modificações, permitindo consultar versões anteriores e voltar atrás se for preciso. Softwares para controle de versão (Software Control Management-SCM) de códigos são utilizados para (i) manter o histórico de desenvolvimento e (ii ) permitir que o mesmo seja consistente quando realizado em colaboração. À estrutura de arquivos e diretórios administrada pelo SCM dá-se o nome repositório, e o SCM que administra os códigos da SLtools é o Git8 . No endereço web http://che.cbpf.br/git/sltools é disponibilizada uma interface para que os desenvolvedores possam acompanhar o histórico de modificações no repositório. 7 8 Descrito na PEP-282: http://www.python.org/dev/peps/pep-0282/ http://git-scm.com/ 54 3.5 Empacotamento e Instalação Uma vez que um software é dado como estável e desejamos disponibilizar para um grupo de usuários, é necessário um sistema de empacotamento e instalação (ou build ) do software. O sistema de build é responsável por compilar um pacote com os códigos para distribuição e, do lado do usuário, realizar a instalação da biblioteca. O processo de instalação realiza a compilação dos códigos em C/C++, além de configurar os caminhos e variáveis no sistema do usuário. Para que este empacotamento seja devidamente realizado, os códigos devem estar organizados dentro do repositório da biblioteca de acordo com o tipo de linguagem e método implementado. A figura (3.2) apresenta a estrutura do repositório utilizado para nossa biblioteca, com os arquivos necessários para o build assinalados. Figura 3.2: Estrutura base do repositório e componentes do build da SLtools. No repositório de códigos (“sltools”) temos um conjunto de diretórios (vermelho) com os códigos python; abaixo da linha pontilhada expresso a estrutura de arquivos (C/C++) que devem entrar no build. Ao lado, em System files estão os arquivos obrigatórios no pacote final. Estrutura do repositório A estrutura do repositório é como os arquivos são arranjados dentro da árvore de diretórios que compoem a biblioteca. Na SLtools o repositório foi organizado de 55 acordo com a categoria do método implementado (horizontalmente) e as diferentes linguagens utilizadas (verticalmente). Arquivos e diretórios no repositório respeitam a seguinte organização: • Nı́vel 0 : Diretório raiz da sltools/, apenas arquivos de sistema e diretórios de códigos (packages) divididos por aplicação; • Nı́vel 1 : Diretórios contendo códigos python somente, e sub-diretórios com conteúdo especı́fico para códigos de outras linguagens; • Nı́vel 2 : Códigos C, C++ com Makefile e arquivos de apoio para compilação. Desta maneira mantemos códigos escritos em python e demais linguagens organizados. Isto é importante especialmente para automação do sistema de empacotamento, que procura até um certo nı́vel (1 ) da biblioteca por códigos em python e depois por arquivos de makefile com rotinas pré-definidas para a compilação e exportação para Python. 3.6 Usabilidade No intuito de extender o uso da biblioteca a usuários que não sejam progra- madores em Python, decidimos oferecer algumas ferramentas através de arquivos executáveis. Assim, quando a SLtools é instalada, além da API oferecida diretamente através do interpretador Python, um conjunto de códigos é também oferecido ao usuário através de arquivos executáveis na shell. 56 Capı́tulo 4 Análise da busca de arcos gravitacionais A busca por arcos gravitacionais em imagens astronômicas é uma tarefa complexa, essencialmente porque os arcos possuem baixa razão sinal/ruı́do (SNR) e pela contaminação devido à luz difusa de galáxias brilhantes presentes no centro dos aglomerados de galáxias, onde os arcos são tipicamente encontrados. Esta busca é tipicamente realizada através de um processo de inspeção visual; esta ainda é a maneira mais confiável de buscar por arcos. No entanto, os volumes de imagens manipulados atualmente atingem valores muito elevados, sobre-humanos realmente (⇠ P etaBytes). Assim, como alternativa à busca manual, a comunidade astronômica conta com alguns algoritmos computacionais para auxı́lio no reconhecimento dos arcos. Contudo, a eficiência desses algoritmos depende da escolha de um conjunto de parâmetros, o que não é uma tarefa trivial. Alguns algoritmos com diferentes estratégias para a busca automatizada de arcos podem ser encontrados na literatura; desde estratégias simples, como a segmentação iterativa dos objetos seguida de filtragens sucessivas até que apenas os objetos de interesse sejam destacados, aplicada por Horesh et al. (2005), procedimentos com algum refinamento para a detecção de objetos tênues e distorcidos (Lenzen et al., 2004), até abordagens finas e exaustivas para o reconhecimento de estruturas alongadas e curvilı́neas em pequena escala, como o algoritmo de células interagentes de Seidel e M. Bartelmann (2007). Ao longo deste capı́tulo será apresentado o procedimento manual de seleção 57 de arcos, bem como um algoritmo de busca automatizada de arcos (Lenzen et al., 2004). O procedimento manual é importante para visualizarmos os passos chave tipicamente realizados na busca destes objetos e a construção de tabelas-verdade para arcos gravitacionais. O algoritmo de detecção nos vai servir para compreender como um algoritmo para a tarefa aborda este processamento, suas diferentes etapas e os parâmetros relevantes. 4.1 Inspeção visual O processo de inspeção visual consiste em procurar em imagens astronômicas por arcos em torno de galáxias ou aglomerados de galáxias, olhando objeto por objeto e selecionando os candidatos a arco. Por exemplo, este procedimento pode custar em torno de uma hora para um olho treinado para cobrir uma única imagem de 21Kx21K pixels. Para o processo de inspeção visual é necessário o suporte de um programa capaz de apresentar os arquivos das imagens e permitir que o usuário faça notas e marcações sobre a imagem apresentada para que este processo tenha um mı́nimo de eficiência. O programa utilizado para este propósito foi o DS9 (Joye e E. Mandel, 2003), desenvolvido pelo Smithsonian Astrophysical Observatory (SAO) é a principal ferramenta de visualização de imagens utilizado pela comunidade astronômica. O DS9 permite ao usuário adicionar marcações (cı́rculos, retângulos, pontos, etc) sobre a imagem e armazenar estes registros em arquivos texto separados do arquivo da imagem, estes arquivos são chamados de arquivos de regiões. Para complementar o uso do DS9, foram incorporadas à SLtools algumas funções para ler/escrever os arquivos de saı́da/entrada do DS9. Assim, o usuário pode alternar facilmente entre o ambiente de visualização de imagens do software do SAO e os métodos de processamento de imagens e catálogos da nossa biblioteca. 4.1.1 Procedimento de seleção manual A inspeção visual das imagens utiliza os seguintes passos: 58 (1) Classificação dos candidatos a arco. Devido à incerteza e subjetividade na seleção (visual) dos objetos — particularmente em imagens monocromáticas — é interessante classificar os candidatos a arco quanto ao grau de certeza para a seleção: neste trabalho utilizamos três nı́veis para esta qualificação: ótimos candidatos, candidatos bons/regulares e candidatos ambı́guos ou ruins; (2) Segmentação dos objetos. Com o propósito de computar os parâmetros morfológicos dos candidatos é necessário a segmentação e extração das propriedades de cada objeto. Para cada um destes passos foram desenvolvidos scripts em python para suporte ao procedimento, bem como foram estabelecidos alguns padrões abaixo apresentados. A figura 4.1 representa uma imagem que será utilizada como exemplo para a seleção visual (manual) de arcos. Esta é uma imagem observada pelo telescópio espacial Hubble (HST). Utilizando o DS9 a imagem é visualizada e marcada onde os arcos gravitacionais, ou candidatos a arcos, são identificados. A figura 4.2 apresenta o resultado das marcações sobre a imagem. As cores utilizadas nas marcações (cı́rculos) têm significado especial: • Vermelho: arco, com certeza: objeto com grande curvatura, alta razão comprimento/largura (fino e alongado), próximo ou circundante de um aglomerado ou galáxia; • Azul: bom candidato a arco: objeto com alta elongação e leve curvatura, baixo brilho superficial, próximo a uma galáxia ou aglomerado, radial ou tangencialmente orientado com relação ao objeto central; • Magenta: fraco candidato a arco: objeto alongado com baixo brilho superficial, mas sem aparente distorção e próximo de uma lente gravitacional (ou seja, um aglomerado que já teve outros arcos identificados). 59 Figura 4.1: Aglomerado de Abell 383 para inspeção visual de arcos. Imagem observada pelo telescópio espacial Hubble. (imagem obtida dos arquivos públicos da NASA) 4.1.2 Propriedades dos candidatos a arcos Uma vez marcadas as regiões (x,y) de cada arco, ou candidato, desejamos segmentar a imagem a fim de obtermos as propriedades de cada objeto. A segmentação da imagem e cálculo das propriedades morfológicas dos objetos é realizada com o auxı́lio do programa Sextractor (Bertin e S. Arnouts, 1996). As propriedades destes objetos são apresentadas na tabela (4.1). Com isso temos algumas propriedades de interesse referentes a morfologia dos arcos: centróide, excentricidade e elongação para cada objeto, por exemplo. Podemos notar pela tabela (4.1) que os objetos marcados em vermelho (A1, A2, D) na inspeção visual apresentam valores para excentricidade e elongação bem distintos dos demais, bons e possı́veis candidatos a arcos. Nas seções (4.2.7.1 e 4.2.7.2) discutimos sobre como estas propriedades podem ser melhor avaliadas 60 Figura 4.2: Marcações dos candidatos a arco. Em vermelho, ótimos candidatos a arco; em azul, bons candidatos; em magenta, canditatos ambı́guos. Os identificadores correspondem aos da tabela 4.1. ID A2 A1 D 6 9 8 7 C B X 563 526 633 171 537 520 287 601 632 Y 458 561 406 338 386 622 423 531 537 elongação 9.503 7.795 6.234 3.092 1.801 1.291 1.240 1.120 1.110 excentricidade 0.894 0.871 0.839 0.676 0.445 0.225 0.193 0.107 0.099 Tabela 4.1: Propriedades morfológicas dos candidatos a arcos obtidas a partir do aplicativo SExtractor, ordenados por elongação. para a seleção de arcos. 61 4.2 Algoritmo de Lenzen et al. Nesta seção, apresento o buscador de arcos desenvolvido por Lenzen et al. (2004). O algoritmo de Lenzen et al. (LSS) é revisado utilizando a imagem de um arco do Hubble, marcado como objeto A1 na figura 4.2, apresentado na figura 4.3. O algoritmo LSS é composto por quatro etapas: realce de objetos, suavização de ruı́do, segmentação e seleção dos arcos. Figura 4.3: Arco do Hubble — A1 da figura 4.2 — selecionado para revisão do algoritmo de Lenzen et al. O algoritmo realiza os seguintes passos para o processamento de uma imagem em busca de arcos: • Filtragem e Suavização: Limiarização: com o objetivo de eliminar parte do ruı́do e realçar objetos, uma faixa de intensidades é selecionada para o restante do processamento (ver seção A.1.2); Filtragem anisotrópica: com objetivo de suavizar o ruı́do e realçar as bordas dos objetos é aplicado um filtro de difusão anisotrópica (ver seção A.1.3.5); • Detecção de objetos: Segmentação: o método de crescimento de regiões é utilizado para identificação de objetos (ver seção A.2.1); 62 • Seleção de objetos: Morfologia: elipticidade e largura dos objetos detectados são calculadas para a seleção e classificação de objetos (ver seção A.2.3). Abaixo são apresentados os métodos aplicados em cada etapa do algoritmo em maiores detalhes. Na seção (4.2.5) são realizados alguns testes e análises de resultados parciais para diferentes conjuntos de parâmetros do programa, a fim de visualizar os efeitos dos parâmetros e etapas do algoritmo. 4.2.1 Modificação de histograma Nesta primeira etapa o objetivo principal é definir uma faixa de intensidade da imagem para trabalhar no restante do processamento. A faixa de intensidades definida deve conter os objetos de interesse – arcos – e excluir, dentro do possı́vel, as intensidades caracterı́sticas do ruı́do de fundo. Para isso, vamos estabelecer dois valores de intensidade – limite superior e inferior – para utilizarmos à diante. Os limites de intensidade para o corte (ulim , u+ lim ) podem ser definidos manual ou automaticamente no código LSS. No caso automático, o limite inferior é tomado como o valor da moda 1 da distribuição de intensidades da imagem, e o limite superior é estimado de forma a excluir aproximadamente 10% dos pixels de maior intensidade. Na seção (A.1.2) apresento mais detalhes sobre limiarização. O segundo passo desta primeira etapa, após a limiarização, é a normalização da imagem. Durante a normalização, a escala de intensidades pode ser modificada por uma transformação matemática, conforme discutimos na seção (A.1.1). Neste processo, os valores de intensidade abaixo do limite inferior (neste exemplo, 46.9) são redefinidos para este valor, assim como os valores de intensidade acima do limite superior são redefinidos para este valor (54.8). A figura 4.4 apresenta os efeitos da seleção de intensidades. As intensidades são re-escalonadas conforme a equação (A.1), onde utilizamos Ia = Ic = 0, Ib = 54.8 e Id = 1. A figura 4.5 apresenta o histograma da imagem (a) com os valores 1 Moda é o valor do domı́nio que localiza o máximo da distribuição. 63 (a) (b) Figura 4.4: As imagens acima apresentam resultados da etapa de limiarização e re-escala aplicadas pelo código LSS. Em (a), a imagem original. O corte inferior em (b) corresponde à moda do histograma (intensidade 46.9), e o corte superior (54.8) é tal que exclui 10% dos pixels mais intensos. O negativo da imagem original (figura 4.3) é apresentado para melhor visualização. de corte inferior e superior utilizados em (b). Figura 4.5: Histograma de intensidades da figura 4.4 a. As linhas verticais, vermelhas, marcam as intensidades utilizadas para a limiarização vista na figura 4.4 b. Os valores limite estão marcados na figura: ulim = 46.9 , u+ lim = 54.8. Escolhendo a intensidade mais numerosa do histograma – a moda da distribuição –, assim como o limite superior para remoção dos pixels de valores muito 64 intensos, removemos boa parte do ruı́do de fundo, e podemos notar o realce obtido. 4.2.2 Filtragem anisotrópica O ruı́do da imagem é tratado através de um procedimento de suavização anisotrópica. Esta etapa de suavização no algoritmo LSS é dividida em dois passos: (i) uma pré-filtragem com kernel gaussiano (seção A.1.3.3), seguida de (ii) aplicação de um filtro de difusão anisotrópica (seção A.1.3.5). O filtro gaussiano tem o propósito de suavizar o campo de intensidades da imagem para aplicação do filtro anisotrópico, que utiliza o campo gradiente de intensidades (equação A.19). No filtro gaussiano, o parâmetro , utilizado na pré-filtragem para o processo de difusão, é a largura do kernel. Na filtragem anisotrópica, o termo de difusão (equação A.21) é modelado no kernel do filtro através dos seguintes parâmetros: • K: controla a sensibilidade da anisotropia ao gradiente no ponto. Quanto menor este valor, maior a anisotropia do kernel ; • ⌧ : parâmetro de largura do kernel, controla a largura da suavização aplicada. (a) (b) Figura 4.6: Em (b), a imagem de (a) suavizada com o filtro anisotrópico. Foram utilizados os valores ⌧ = 10, K = 10 5 e = 1. A figura 4.6 mostra um exemplo da suavização realizada com a difusão anisotrópica. Podemos notar as bordas como são preservadas além de realçadas. 65 4.2.3 Detecção de objetos Nesta etapa é realizada a detecção de objetos2 – ou melhor, candidatos a arcos – através de um algoritmo de crescimento de regiões (seção A.2.1). Esta técnica define regiões de pixels contiguos que satisfaçam algumas propriedades em conjunto. O algoritmo de crescimento de regiões é inicializado em um ponto (semente) da imagem e adiciona os primeiros vizinhos – que satisfaçam dadas regras de vizinhança – a cada iteração. No algoritmo LSS as condições para que pixels adjacentes façam parte da região (R) são: (i) intensidade superior a um valor cthresh definido automaticamente pelo algoritmo para cada semente e (ii) intensidade inferior à média da região no passo anterior. A primeira condição define um limiar para distinguir entre objetos e fundo da imagem. A segunda funciona como mecanismo de distinção de objetos (deblending). A figura 4.7 mostra o resultado do algoritmo de segmentação por crescimento de regiões aplicado pelo LSS. Note que além do objeto de interesse – o arco gravitacional – outras 12 regiões são detectadas devido ao ruı́do e estruturas que destacam-se do fundo da imagem. Figura 4.7: As regiões em vermelho marcam os pixels detectados no algoritmo de crescimento de regiões. 2 Define-se por objeto, aqui, regiões de pixels contiguos que destacam-se do fundo da imagem. 66 As sementes, por onde as regiões são inicializadas, são definidas a partir dos máximos locais da imagem. Os máximos locais são procurados através da avaliação da intensidade de cada pixel (i, j) e seus primeiros vizinhos: o pixel que não apresentar vizinho(s) de valor superior é marcado como um máximo local. Este procedimento de segmentação é realizado sobre a imagem suavizada pela etapa de filtragem anisotrópica. 4.2.4 Seleção dos arcos Por fim, cada região (candidato a objeto) detectada no processo de segmentação é avaliado quanto à excentricidade e largura. Neste ponto do algoritmo pretende-se selecionar os arcos com base na morfologia dos objetos: objetos alongados e com alta excentricidade serão definidos como arcos. O algoritmo utiliza os autovalores do segundo momento (seção A.2.3) de cada região segmentada para computar a excentricidade de cada objeto e estimar sua largura. Sendo 1 2 os autovalores do segundo momento, a excentricidade é dada pela equação (A.26), transcrita abaixo: 2 ecc = 1 . (4.1) 1 Dois parâmetros de corte, ecc e • ecc • 2 2, são utilizados para selecionar os arcos: cecc cthick onde cecc e cthick são valores definidos pelo usuário. Os valores padrão utilizados para cecc e cthick são 0.7 e 10, respectivamente. A figura 4.8 apresenta o resultado final do algoritmo para este exemplo. Podemos notar que a detecção do arco foi bem sucedida. Algumas propriedades do arcos detectados são dadas ao final do processamento. Informações de posição e morfologia dos objetos são apresentadas em forma de tabela com a apresentada na tabela 4.2, em relação a figura 4.8. 67 Figura 4.8: Arco detectado pelo algoritmo de Lenzen et al. Regiões com excentricidade inferior a 0.7 foram excluı́das. xo 46 yo 39 ecc 0.98 1 180.045 2 2.549 A 37.952 B 4.516 ✓ -0.946 size 259 Tabela 4.2: Parâmetros de saı́da calculados para o arco detectado. A e B são os semi-eixos maior e menor, respectivamente, ✓ é a orientação do semi-eixo maior (radianos) em relação ao eixo horizontal (x) da imagem, e size é a área do objeto. Os parâmetros morfológicos apresentado na tabela, A, B, size (área) são apresentados na seção A.2.3, calculados a partir dos 1 e 2 momentos de cada região segmentada. Na seção que segue analisamos alguns parâmetros do algoritmo afim de visualizarmos seus efeitos na busca de arcos. 4.2.5 Análise de parâmetros Abaixo, apresento alguns resultados do buscador LSS para diferentes configurações de parâmetros do algoritmo. Os parâmetros serão analisados com o objetivo de encontrarmos um conjunto de valores adequado para a aplicação em imagens com diferentes propriedades. O objetivo deste conjunto é que seja um bom ponto de partida na busca por arcos em diferentes imagens e que a partir dele os parâmetros e resultados possam ser refinados. Utilizaremos uma imagem do Hubble (HST, figura 4.9-a) para o ajuste dos 68 parâmetros, seguido de testes em imagens do DES (DC6, figura 4.9-b) e do telescópio Canada-France-Hawaii (CFHT, figura 4.9-c). Portanto, a análise e primeiros testes dos parâmetros do LSS serão realizados sobre a imagem do Hubble, arco “A” do painel 4.9, a mesma imagem utilizada na seção anterior. A imagem do Hubble possui melhor resolução (0.09 00 /pixel) e assim podemos observar melhor os efeitos dos diferentes parâmetros, afim de estudá-los e ajustar o conjunto “bom” de parâmetros. As imagens do DC6 e CFHT, também de arcos individuais, serão utilizadas como testes dos parâmetros ajustados. O arco do DC6 (B) é um teste sobre uma imagem simulada, com ruı́do simulado elevado e resolução de 0.27 00 /pixel. A imagem do CFHT (C), por outro lado, é o exemplo de uma imagem real, de um telescópio terrestre, com resolução intermediária às demais, 0.18 00 /pixel. É importante salientar que o arco da imagem simulada foi gerado pelo AddArcs para o ciclo de simulações de número 6 do DES, o Data Challenge 6. (A) (B) (C) Figura 4.9: Imagens de arcos obtidas com (A) Hubble, (B) DC6 — arco simulado com o AddArcs e adicionada ao ciclo de simulações DC6 — e (C) CFHT (More et al., 2011). Cada parâmetro é variado individualmente neste primeiro momento para que possamos analisar seu efeito no processamento e resultado das imagens. Um conjunto de parâmetros padrão foi definido a partir do qual as variações em cada parâmetro partiram (enquanto os demais mantiveram-se constantes). Os valores de cada parâmetro utilizados nos testes abaixo foram escolhidos em acordo com a documentação do algoritmo (Lenzen et al., 2004). 69 O conjunto de valores padrão para os parâmetros é dado abaixo: • Limiarização e normalização Valores de limiarização (ulim , u+ lim ) auto-computados com normalização realizada por uma transformação linear, como explicado na seção (4.2.1); • Suavização Largura do filtro gaussiano: = 1 pixels; Parâmetro do filtro anisotrópico: K = 10 5 e ⌧ = 10; • Detecção Parâmetros para seleção morfológica: eccmin = 0.3 e cthick = 30 pixels. Os parâmetros para a seleção (final) morfológica foram relaxados dos valores padrão eccmin = 0.7, cthick = 10, usados na seção 4.2.4, para que possamos visualizar os resultados parciais, incluindo objetos que não admitimos como arcos. Limiarização Começamos por analisar os efeitos dos parâmetros de limiarização. Os valores apresentados abaixo (ulim ) serão utilizados ora como limite superior (u+ lim ), ora como limite inferior (ulim ) para que visualizemos a importância de cada valor na imagem. É importante recordar o histograma de intensidades apresentado na figura 4.5 para compreender melhor os efeitos da figura 4.10. Para os valores de corte utilizados temos as seguintes informações: • ulim = 0: valor de intensidade mı́nima na imagem • ulim = 47: valor correspondente a moda do histograma • ulim = 55: valor que exclui aproximadamente 1% dos pixels de maior intensidade • ulim = 254: valor de intensidade máxima na imagem 70 • ulim = 50: valor que exclui aproximadamente 50% dos pixels de maior intensidade No processo de limiarização podemos notar facilmente o efeito resultante dos cortes. Visivelmente os cortes realizados correspondendo ao painéis (c), (d) e (e) da figura 4.10 não foram boas opções uma vez que o objeto de interesse não foi detectado. Em (c) observamos que a faixa escolhida exclui o objeto de interesse e mantém apenas o ruı́do de fundo. Em (d) apenas os pixels mais brilhantes foram realçados, não alcançando o objetivo. Em (e), tivemos o ruı́do realçado devido ao corte muito restrito, prejudicando o destaque do objeto. Podemos selecionar, neste primeiro instante, os resultados que englobam quase a totalidade dos pixels do arco, (a) e (b). Em particular, o exemplo (a), o qual detectou diversas partes do objeto. Suavização Nesta seção vamos variar os parâmetros de suavização do algoritmo: ,⌧ e K. Novamente, cada parâmetro foi variado individualmente para facilitar nosso entendimento. As figuras (4.11), (4.12) e (4.13) apresentam os testes para , K e ⌧ conforme listado abaixo: • = 1, 2, 3, 5. A largura do kernel gaussiano variada entre valores tı́picos, com “5” sendo tomado como limite superior aceitável, afim de visualizarmos o efeito da pré-filtragem (figura 4.11). • K = 10 5 , 10 3 , 1, 10. O parâmetro de sensibilidade – ou anisotropia – do kernel para dois valores sugeridos no artigo e outros dois valores elevados (1, 10) para visualizarmos a importância de K no realce de bordas (figura 4.12) • ⌧ = 1, 5, 15. O valor de ⌧ que nos dá a largura máxima – no eixo perpendicular às bordas – que o filtro anisotrópico pode ter (figura 4.13). Faixa de valores que compreende os utilizados no artigo. 71 (a) ulim = 47, u+ lim = 55 (b) ulim = 0, u+ lim = 55 (c) ulim = 0, u+ lim = 47 (d) ulim = 47, u+ lim = 254 (e) ulim = 47, u+ lim = 50 Figura 4.10: Resultados para diferentes valores limites da seleção de intensidades. À esquerda temos os valores inferior (ulim ) e superior (u+ lim ) para os limites da limiarização, ao centro o resultado do processo de limiarização para os limites dados, e à direita são apresentados os resultados da detecção do buscador. 72 (a) =1 (b) =2 (c) =3 (d) =5 Figura 4.11: Resultados da suavização (ao centro) e detecção (à direita) do algoritmo sobre a imagem do Hubble para diferentes valores de (esquerda). 73 O parâmetro de largura do filtro gaussiano, , não apresenta nestes exemplos um impacto significativo na qualidade da detecção: o objeto central foi detectado corretamente, à menos de alguns objetos espúrios. Podemos observar um notável alargamento do objeto em (c), com o kernel de largura 5. Quanto a este alargamento devemos tomar cuidado, pois ele pode fazer com que o objeto não seja selecionado como arco. (a) K = 10 5 (b) K = 10 3 (c) K = 1 (d) K = 10 Figura 4.12: Resultados da difusão anisotrópica (ao centro) e da detecção final (à direita) para diferentes valores de K (esquerda). 74 Com relação ao processo de difusão anisotrópica, os valores baixos para K, apresentados nos painéis (4.12-a) e (4.12-b), geram um visı́vel realce do arco, ao contrário de valores próximos ou da ordem de ⌧ (painéis c e d). Um efeito colateral de utilizar baixos valores para K é o realce também do ruı́do de fundo. No entanto, mesmo realçando também o ruı́do, um valor baixo para K (a) atinge o resultado desejado; além da suavização, o realce dos objetos. O poder de suavização do filtro é regulado pelo termo temporal do kernel anisotrópico através dos parâmetros ⌧ . O parâmetro ⌧ controla o tamanho de cada passo da parte temporal na solução numérica (seção A.1.3.5). (a) ⌧ = 1 (b) ⌧ = 5 (c) ⌧ = 15 Figura 4.13: Resultados da difusão anisotrópica (ao centro) e da detecção (à direita) para diferentes valores de ⌧ (à esquerda). Podemos notar na figura 4.13-a que um valor pequeno para este parâmetro gera pouca suavização. Se quisermos suavizar mais a imagem, no intuito de realçar 75 o máximo da extensão do objeto temos de utilizar valores maiores para ⌧ como vemos nos painéis 4.13 b e c. Com isso terminamos a nossa análise de parâmetros do LSS. Podemos perceber melhor os efeitos de cada etapa do buscador e selecionar valores para as configurações do algoritmo que melhor satisfaçam s resultados desejados. Na próxima seção sugerimos um conjunto de parâmetros bons para uma detecção confiável de arcos em diferentes imagens. 4.2.6 Conjunto de parâmetros “bons” Baseado nos testes que fizemos na seção anterior, escolhemos um conjunto de parâmetros que parecem compor uma boa configuração para a imagem utilizada. Este conjunto é disposto abaixo e o resultado sobre a imagem do Hubble de exemplo da figura 4.9-a pode ser visto na figura 4.14. • ulim = automático, moda (47, neste caso) • u+ lim = automático, exclusão de 10% dos pixels (55, neste caso) • =2 • K = 10 5 • T = 15 Os parâmetros calculados pelo algoritmo para estes objetos são dados na tabela 4.3, estes parâmetros são calculados após a definição das regiões segmentadas. O área de cada objeto, em pixels, é dada pelo parâmetro size. Os parâmetros A e B são medidas de comprimento e largura (semi-eixos maior e menor), respectivamente. Estes são calculados a partir do momento de ordem 2, como apresentado nas equações (A.27) e (A.28). 76 Figura 4.14: Resultado da detecção com conjunto de parâmetros “bons”. À esquerda, a imagem do arco de exemplo, à direita o resultado final da detecção. objid 1 2 3 4 5 6 7 8 9 X 50 46 86 10 14 30 89 35 83 Y 47 9 38 49 35 2 31 41 54 ecc 0.985 0.980 0.906 0.880 0.819 0.768 0.734 0.679 0.654 A 70.198 6.672 3.749 6.110 5.005 4.094 4.799 5.163 2.844 B 8.589 0.940 1.144 2.115 2.124 1.971 2.473 2.921 1.671 size 718 17 15 19 20 13 16 23 11 Tabela 4.3: Propriedades dos objetos segmentados e apresentados na figura 4.14. A primeira linha, realçada, corresponde ao arco da imagem em questão. As primeiras três colunas identificam os“objetos”segmentados; ecc, A, B, size são os parâmetros morfológicos – execntricidade, semi-eixos maior e menor e área, respectivamente – calculados a partir dos momentos de cada região. 4.2.7 Teste de parâmetros ajustados Agora, vamos tomar o conjunto de parâmetros testado e ajustado sobre o arco do Hubble na seção anterior e aplicar nas outras duas imagens, do DC6 e CFHT. 4.2.7.1 Teste em imagem de arco simulada Inicialmente, vamos ver se os parâmetros escolhidos geram bons resultados sobre uma imagem do DC6. A imagem da figura 4.15 contém um dos arcos simulados pelo AddArcs e adicionados a esse ciclo de simulações. Esta é uma imagem 77 interessante para o nosso trabalho uma vez que testa o buscador, e os parâmetros escolhidos, sobre um arco gerado pelo AddArcs e adicionado ao Desafio do Dados. A resolução instrumental das imagens simualadas pelo DES tem 0.27 00 /pixel e com uma PSF de largura 0.8 00 . Figura 4.15: Imagem do DC6 com arco simulado pelo AddArcs. O aglomerado nesta imagem é o de número 209 no catálogo DES Mock v2.13. Aplicando o algoritmo de LSS na imagem do arco simulado, em destaque na figura 4.15, com as configurações obtidas na seção 4.2.6, obtemos o resultado apresentado nas figuras 4.16 e 4.17. Podemos notar que o arco simulado foi detectado, além de alguns outros artefatos formados a partir do ruı́do de fundo. Na figura 4.17 podemos visualizar o resultado final da detecção. As propriedades dos objetos detectados estão dispostas na tabela 4.4. Note que vários artefatos fram detectados pelo buscador junto com o arco da imagem, todos com alta elipticidade e finos. O objeto de interesse destaca-se, contudo, dos demais “objetos” pelo seu tamanho. 78 (a) (b) (c) (d) Figura 4.16: Etapas da detecção do algoritmo LSS sobre o arco simulado: (a) a imagem re-escalonada, (b) suavização anisotrópica, (c) regiões segmentadas, (d) objetos selecionados. Figura 4.17: Resultado final com as regiões detectadas. 4.2.7.2 Teste em imagem de arco real Vamos aplicar o algoritmo LSS com os parâmetros ajustados sobre uma imagem real com caracterı́sticas próximas do que será obtido com a instrumentação do 79 X 54 16 83 91 18 44 16 28 71 26 4 93 Y 54 77 4 50 17 63 88 9 17 51 32 78 ecc 0.970 0.959 0.935 0.900 0.892 0.885 0.867 0.862 0.826 0.820 0.812 0.812 A 32.931 8.598 5.975 5.657 5.357 6.529 10.351 12.244 17.089 6.152 4.335 3.253 B 5.640 1.732 1.519 1.787 1.754 2.207 3.772 4.544 7.126 2.603 1.875 1.408 size 277 24 20 16 20 24 42 48 115 26 15 13 Tabela 4.4: Propriedades dos objetos detectados e apresentados na figura 4.14. A primeira linha, realçada, corresponde ao objeto (arco) de nosso interesse. DES. A imagem que vamos utilizar agora (figura 4.18) foi obtida com o telescópio terrestre CFHT, de 3.6 metros, com a câmera Megacam que possui resolução de 0.187 00 /pixel. Nesta imagem a F W HM da PSF é 0.7 00 . (cedida por Anupreeta More, do trabalho More et al. (2011)) Figura 4.18: Arco observado com o telescópio CFHT. Aplicamos o algoritmo LSS a esta imagem com os parâmetros discutidos na seção 4.2.6. Os resultados parciais de cada etapa do algoritmo podem ser vistos nas figuras 4.19 e 4.20. Os parâmetros morfológicos calculados pelo algoritmo para o arco detectado estão dispostos na tabela 4.5. Neste caso tivemos a detecção correta realizada pelo buscador de arcos. Os demais objetos segmentados na imagem foram excluı́das da seleção final. 80 (a) (b) (c) (d) Figura 4.19: Etapas da detecção sobre o arco do CFHT: (a) imagem re-escalonada, (b) suavização anisotrópica, (c) regiões segmentadas, (d) objeto detectado. Figura 4.20: Resultado final da detecção. X 29 Y 31 ecc 0.896 A 28.406 B 9.144 size 211 Tabela 4.5: Parâmetros morfológicos para o arco do CFHT. Assim temos os testes com imagens reais e simuladas realizados, com os objetos de interesse em cada teste sendo corretamente detectados. Notamos que nas imagens do Hubble e do DC6 tivemos várias detecções espúrias, quando são considerados apenas os parâmetros de excentricidade e largura. Mas podemos notar também uma considerável distinção no tamanho das detecções correspondentes aos arcos nas imagens: estes são da ordem de 10 vezes maiores que os artefatos gerados no processamento. 81 4.3 Detecção de arcos em aglomerado de galáxias Com os parâmetros do algoritmo LSS regulados e testados para arcos indivi- duais em diferentes tipos de imagens, vamos aplicar o buscador de arcos na imagem do aglomerado de Abell A383 (figura 4.1). O intuito é verificar se o algoritmo desempenha bem a detecção dos arcos na imagem completa, com todos os demais objetos e correlacionar o resultado gerado com a tabela-verdade que criamos na seção 4.1 (tabela 4.1), no processo de inspeção visual. O painel 4.21 apresenta os resultados parciais do buscador de Lenzen et al. sobre a imagem do aglomerado de Abell 383. Na figura 4.22 temos a imagem binária com o resultado final da detecção dos objetos da imagem 4.1. Note que nesta figura 4.22 foram adicionadas as marcações para candidatos a arcos realizadas na seção 4.1, figura 4.2. As regiões pretas (objetos) da imagem 4.22 correspondem às regiões coloridas da imagem 4.21 (d). Na tabela 4.6 temos as propriedades dos objetos detectados pelo algoritmo e que concordam com as posições marcadas no procedimento de inspeção visual. Xtt 512 478 484 119 591 474 Ytt 396 507 336 292 368 571 ID A2 A1 9 6 D 8 X 513 476 487 121 583 470 Y 408 511 336 288 356 572 ecc 0.992 0.987 0.956 0.889 0.874 0.822 A B size 45.941 3.980 235 51.524 5.815 406 22.355 4.688 128 11.717 3.888 83 11.136 3.952 60 8.114 3.419 42 Tabela 4.6: Arcos detectados no aglomerado de Abell 383 e marcados na “tabelaverdade” (tabela 4.1). Os objetos B, C, 7, marcados na tabela-verdade, não foram detectados. Dos 9 objetos marcados no procedimento de inspeção visual (seção 4.1), 6 foram detectados pelo buscador, o que é satisfatório para uma abordagem inicial na aplicação do buscador. É interessante visualizarmos em que etapa os objetos — IDs: B, C e 7, figura 4.2 — foram perdidos no processo de detecção. Os objetos identificados como B, C e 7 encontram-se bem próximos de galáxias 82 (a) (b) (c) (d) Figura 4.21: Etapas da detecção de objetos na imagem do aglomerado de Abell A383: (a) imagem re-escalonada, (b) suavização anisotrópica, (c) regiões segmentadas, (d) objetos detectados. brilhantes. Na primeira etapa do buscador, quando é realizado o re-escalonamento das intensidades da imagem (figura 4.21-a) estes objetos ficam perdidos em meio ao brilho difuso das galáxias próximas. Com a suavização direcional (figura 4.21b) nota-se que as bordas dos objetos ficaram mais bem definidas, apesar de não ser suficiente para distinguir os objetos. Temos que um ponto a ser melhorado frente aos parâmetros do buscador poderia ser no processo inicial de ajuste das intensidades dos objetos. 83 Figura 4.22: Resultado final da imagem do aglomerado de Abell A383. Os parâmetros de seleção do algoritmo de Lenzen et al., excentricidade e largura parecem selecionar bem os arcos, ou candidatos a arcos. Note que o parâmetro de excentricidade ecc = 0.7, que seleciona objetos finos, detecta a maioria dos objetos de nosso interesse. Porém, este parâmetro sozinho não é suficiente para filtrar os artefatos detectados, sugerindo que outro parâmetro, por exemplo size, deva ser utilizado em conjunto. Assim finalizamos esta revisão e análise de parâmetros do buscador de arcos de Lenzen et al. Está claro que alguns ajustes podem ser feitos para a melhoria da detecção nos casos particulares, contudo chegamos a uma conjunto de parâmetros razoáveis para a detecção da maior parte dos arcos gravitacionais selecionados visualmente. A análise dos parâmetros realizada neste capı́tulo resultou em um conjunto de configurações que pode ser um bom inı́cio para utilização do algoritmo LSS na busca de arcos em diversos conjuntos de imagens. 84 Capı́tulo 5 Conclusão e perspectivas futuras Ao longo deste trabalho foram estudados e implementados métodos computacionais para a simulação de arcos gravitacionais e processamento de imagens astronômicas visando a detecção automatizada dos arcos. Além disso, foi implementado um ambiente para o desenvolvimento colaborativo de software para organizar a produção de códigos do grupo de lenteamento gravitacional do LIneA/CBPF. Desenvolvemos um simulador de arcos gravitacionais que, a partir de propriedades básicas de aglomerados de galáxias (lentes) e galáxias de fundo (fontes), juntamente com propriedades da instrumentação de interesse e a cosmologia subjacente, é capaz de gerar imagens de arcos com algum grau de realismo. O código AddArcs foi desenvolvido para ser executado em um ambiente paralelo e distribuı́do e, assim, ser capaz de gerar um grande número de arcos de maneira eficiente. Com o simulador foi possı́vel (i) simular arcos em toda área de mapeamento do projeto, (ii) estimar o número de arcos que o DES deverá observar, (iii) adicionar estes objetos em imagens de aglomerados (reais ou simuladas), (iv ) produzir imagens realistas, com efeitos de instrumentação compatı́veis com imagens observadas, que podem ser utilizados como tabelas-verdade para testar buscadores de arcos e métodos de inversão (que utilizam os arcos para determinar a distribuição de matéria na lente). Estudamos o processamento de imagens astronômicas e as dificuldades envolvidas na segmentação de arcos gravitacionais devido a sua baixa razão sinal-ruı́do. 85 Utilizamos o algoritmo de Lenzen et al., disponı́vel na literatura, o qual foi aplicado a imagens simuladas do DES, além de imagens de arcos reais de diferentes resoluções. Por fim, aplicamos o algoritmo de busca em uma imagem real de um aglomerado de galáxias para que pudessemos observar os resultados de maneira mais ampla. Os parâmetros que controlam o algoritmo foram ajustados de maneira que o mesmo possa operar com diferentes tipos de imagens. Os resultados obtidos são satisfatórios uma vez que os objetos de interesse, em sua maioria são detectados com eficiência, colocando o conjunto de parâmetros escolhidos para o algoritmo como um bom ponto de partida para testes e possı́veis refinamentos de acordo com o tipo e caracterı́sticas dos objetos presentes nas imagens. Ainda como resultado desta dissertação, foi desenvolvida uma biblioteca de métodos para a simulação e processamento de dados astronômicos. A SLtools1 foi desenhada com a preocupação de disponibilizar códigos com qualidade e clareza, dentro da filosofia de ambiente colaborativo de código aberto. Para isso, uma série de padrões foi estipulada dentro do grupo de desenvolvedores, além da implementação de infra-estrutura necessária composta por sistema de versionamento de código, documentação, sistema de empacotamento e instalação. Como trabalhos futuros, em relação à modelagem fı́sica do lenteamento gravitacional, é necessário que modelos de lentes mais realistas, com sub-estruturas, sejam implementados no código do simulador. Seria interessante também utilizarmos simulações de halos de matéria escura com maior resolução para que possamos calcular o valor do parâmetro de concentração e, assim, restringir melhor nosso modelo. Para o simulador, do ponto-de-vista computacional, seria interessante colocar mais um nı́vel de paralelismo no AddArcs, no nı́vel do lenteamento das fontes, após avaliar e otimizar seu desempenho. É importante, também, substituir o atual código que realiza o lenteamento das fontes, feito através do Gravlens, para que possamos controlar o processo como um todo. 1 http://che.cbpf.br/sltools 86 Quanto à SLtools, seria interessante integrá-la com outros projetos de Python para ferramentas de astronomia, como por exemplo, o projeto AstroPy2 , que busca unificar as bibliotecas existentes (PyWCS, APLpy, AstroLib). Isto daria motivação extra ao trabalho do grupo, além de contribuir em uma escala maior e integrada com os métodos computacionais úteis à comunidade astronômica. Para os buscadores de arcos é importante um comparativo entre os diferentes algoritmos da literatura, e assim ser capaz de otimizar o processo de busca dos arcos além de estabelecer métricas de avaliação das detecções. Para a classificação dos objetos, uma possibilidade interessante seria utilizar algoritmos baseados em treinamento, como Redes Neurais ou Máquinas de Vetor de Suporte (SVM). 2 http://astropy.wikispaces.com/ 87 Referências Bibliográficas C. Alard. Automated detection of gravitational arcs. ArXiv Astrophysics e-prints, astro-ph/0606757, 2006. S. Allam, J. Annis, M. B. Bayliss, S. Bridle, E. Buckley-Geer, G. Caminha, F. J. Castander, E. Cypriano, S. Desai, H. T. Diehl, H Dumet, J. Estrada, S. Farrens, P. Ferreira, J. A. Frieman A, C. Furlanetto, M. D. Gladders, D. McGinnis, L King, C. Kochanek, J. Kubo, D. Kubik, H. Lin, M. Makler, P., W. Merritt, E. Rozo, B. Santiago, V. Scarpine, R. K. Sheth, J. Thaler, D. Tucker. DES Strong Lensing White Paper. Internal collaboration document, 2009. M. Bartelmann. Arcs from a Universal Dark-Matter Halo Profile. Astronomy and Astrophysics, 313:697, 1996. M. Bartelmann, A. Huss, J. M. Colberg, A. Jenkins, F. R. Pearce. Arc statistics with realistic cluster potentials. Astronomy and Astrophysics, 330:1, 1998. E. Bertin e S. Arnouts. SExtractor: Software for source extraction. Astronomy and Astrophysics, 117:393, 1996. J. Binney e M. Merrifield. Gravitational Lensing. In: Galactic Astronomy. página 62, Princeton Series in Astrophysics, 1998. G. Caminha. Cálculo da Abundância de Arcos Gravitacionais em Aglomerados de Galáxias. Dissertação de Mestardo, Centro Brasileiro de Pesquisas Fı́sicas, 2009. D. Coe, N. Benı́tez, S. F. Sánchez, M. Jee, R. Bouwens, H. Ford. Galaxies in the Hubble Ultra Deep Field. The Astronomical Journal, 132:926, 2006. 88 D. Coe, E. Fuselier, N. Benitez, T. Broadhurst, B. Frye, H. Ford. LensPerfect: Gravitational Lens Mass-map Reconstructions Yielding Exact Reproduction of All Multiple Images. The Astrophysical Journal, 681:814, 2008. J. M. Comerford e P. Natarajan. The observed concentration-mass relation for galaxy clusters. Monthly Notices of the Royal Astronomical Society, 379:190, 2007. A. R. Cooray. Cosmology with Galaxy Clusters: III. Gravitationally Lensed Arc Statistics as a Cosmological Probe. ArXiv Astrophysics e-prints, astroph/9807148, 1998. J. Estrada, J. Annis, H. T. Diehl, P. B. Hall, T. Las, H. Lin, M. Makler, K. W. Merritt, V. Scarpine, S. Allam, D. Tucker. A systematic search for high surface brightness giante arcs in a Sloan Digital Sky Survey cluster sample. The Astrophysical Journal, 660:1176, 2007. C. Faure, J. P. Kneib, G. Covone, L. Tasca, A. Leauthaud, P. Capak, K. Jahnke, V. Smolcic, S. de la Torre, R. Ellis, A. Finoguenov, A. Koekemoer, O. Le Fevre, R. Massey, Y. Mellier, A. Refregier, J. Rhodes, N. Scoville, E. Schinnerer, J. Taylor, L. Van Waerbeke, J. Walcher. First Catalog of Strong Lens Candidates in the COSMOS Field. Astrophysical Journal Series, 176:19, 2008. P. Ferreira. Simulações de arcos gravitacionais em imagens e estudo de sua razão axial. Dissertação de Mestardo, Universidade Federal do Rio de Janeiro, 2010. A. Horesh, E. Ofek, D. Maoz, M. Bartelmann, M. Meneghetti, H. Rix. The Lensed Arc Production Efficiency of Galaxy Clusters: A Comparison of Matched Observed and Simulated Samples. The Astrophysical Journal, 633:768, 2005. A. K. Jain P. W. Duin. Statistical pattern recognition: a review. IEEE Transactions on Pattern Analysis and Machine Intelligence, 22:4, 2000. W. A. Joye e E. Mandel. New Features of SAOImage DS9. In: H. E. Payne, R. I. Jedrzejewski, R. N. Hook (editores), Astronomical Data Analysis Software 89 and Systems XII, volume 295 of Astronomical Society of the Pacific Conference Series, 2003. E. Jullo, J. P. Kneib, M. Limousin, A. Elı́asdóttir, P. Marshall, T. Verdugo. A Bayesian approach to strong lensing modelling of galaxy clusters. New Journal of Physics, 9:447, 2007. C. R. Keeton. Computational Methods for Gravitational Lensing. ArXiv Astrophysics e-prints, astro-ph/0102340, 2001. F. Lenzen, S. Schindler, O. Scherzer. Automatic detection of arcs and arclets formed by gravitational lensing. Astronomy and Astrophysics, 416:391, 2004. P. J. Marshall, T. Treu, J. Melbourne, P. Gavazzi, K. Bundy, S. M. Ammons, A. S. Bolton, S. Burles, J. E. Larkin, D. Le Mignant, D. C. Koo, L. V. E. Koopmans, C. E. Max, L. A. Moustakas, E. Steinbring, S. A. Wright. Superresolving Distant Galaxies with Gravitational Telescopes: Keck Laser Guide Star Adaptive Optics and Hubble Space Telescope imaging of the Lens System SDSS J0737+3216. The Astrophysical Journal, 671:1196, 2007. M. Meneghetti, B. Jain, M. Bartelmann, K. Dolag. Constraints on dark energy models from galaxy clusters with multiple arcs. Monthly Notices of the Royal Astronomical Society, 362:1301, 2005. A. More, R. Cabanac, S. More, C. Alard, M. Limousin, J. P. Kneib, R. Gavazzi, V. Motta. The CFHTLS-Strong Lensing Legacy Survey (SL2S): Investigating the group-scale lenses with the SARCS sample. ArXiv Astrophysics e-prints, astro-ph/1109.1821, 2011. R. Narayan e M. Bartelmann. Lectures on Gravitational Lensing. ArXiv Astrophysics e-prints, astro-ph/9606001, 1996. J. F. Navarro, C. S. Frenk, S. D. M. White. The Structure of Cold Dark Matter Halos. The Astrophysical Journal, 462:563, 1995. 90 A. F. Neto, L. Gao, P. Bett, S. Cole, J. F. Navarro, C. S. Frenk, S. D. M. White, V. Springel, A. Jenkins. The statistics of LCDM Halo Concentrations. Monthly Notices of the Royal Astronomical Society, 381:1450, 2007. M. Oguri, J. Lee, Y. Suto. Arc Statistics in Triaxial Dark Matter Halos: Testing the Collisionless Cold Dark Matter Paradigm. The Astrophysical Journal, 599: 7, 2003. M. E. Pereira. Caracterização Empı́rica da Distribuição de Galáxias em Levantamento do Hubble Space Telescope. Dissertação de Mestardo, Universidade Estadual do Rio de Janeiro, 2009. D. J. Raine e E. G. Thomas. Gravitational Lensing. In: An introduction to the science of cosmology. Institute of Physics, 2001. G. Seidel e M. Bartelmann. Arcfinder: an algorithm for the automatic detection of gravitational arcs. Astronomy and Astrophysics, 472:341, 2007. J. L. Sérsic. Influence of the atmospheric and instrumental dispersion on the brightness distribution in a galaxy. Boletin de la Asociación Argentina de Astronomia, 6:41, 1963. G. P. Smith, J. P. Kneib, H. Ebeling, O. Czoske, I. Smail. A Hubble Space Telescope Lensing Survey of X-ray Luminous Galaxy Clusters. I. A383. The Astrophysical Journal, 552:493, 2001. 91 Apêndice A Processamento de imagens astronômicas Neste capı́tulo serão descritas algumas técnicas de processamento de imagens utilizadas nos algoritmos trabalhados ao longo desta dissertação e implementados na biblioteca SLtools. A imagem abaixo (figura A.1) será utilizada como exemplo para demonstrar os efeitos de cada processamento. Ela representa um arco gravitacional tı́pico, com seu formato esguio e elongado, sendo a morfologia base que desejamos ser capazes de detectar em um procedimento de busca automatizado. Todos os valores numéricos nas seções a seguir se referirão a essa imagem (exceto quando for explicitamente dito o contrário). Figura A.1: Imagem exemplo de um arco gravitacional. Esta imagem foi retirada do banco de dados do Telescópio Espacial Hubble (HST ), e refere-se a um dos arcos encontrados no aglomerado de Abell 383 (Smith et al., 2001). A.1 Pré-processamento e Filtragem de imagens O tratamento de uma imagem astronômica deve abordar o problema do ruı́do, o que pode ser feito de duas maneiras: reduzir o nı́vel de ruı́do da imagem 92 e realçar o sinal dos objetos. Algumas destas técnicas, para melhoria do sinal e realce dos objetos da imagem, são apresentadas nas subseções a seguir. A.1.1 Mudança de brilho Dentre as operações para modificar a distribuição de intensidades de uma imagem estão as de re-escalonamento (rescaling). Estas são simples modificações na intensidade de cada pixel da imagem individualmente, sem que informações da vizinha ou do histograma como um todo sejam necessárias. A operação mais comum é a normalização da faixa de intensidades de uma imagem: quando desejamos mapear uma faixa [Ia , Ib ] da imagem I em uma faixa [Ic , Id ] da nova imagem I 0 : I 0 (x, y) = (I(x, y) Ia ) (Id (Ib Ia ) Ic ) + Ic (A.1) A nova faixa de intensidades na qual a imagem em geral é mapeada ([Ic , Id ]) é [0, 255], no caso de imagens em tons de cinza. Em astronomia, a faixa utilizada é usualmente [0, 1]. Outras operações que apresento são as transformações por tangente hiperbólica e logaritmo: • tangente hiperbólica: v = tanh(↵x I0 ) + c = e2(↵x e2(↵x I0 ) 1 I0 )+1 • logaritmo: v = log(↵x + 1) + c Na figura A.2 são apresentadas as curvas destas transformações. As constantes utilizadas na figura A.2 foram escolhidas apenas para exemplificar a manipulação que podemos fazer nas funções para encaixar na faixa do domı́nio que desejarmos. Ao aplicarmos os operadores em imagens manipularemos estas constantes de forma a realçar a faixa de intensidades que desejarmos. 93 Figura A.2: Funções de re-escalonamento de intensidades. As funções tangente hiperbólica e logaritmo estão deslocadas da origem de acordo com os parâmetros ↵ = 1, I0 = 5, c = 1 para tangente hiperbólica e c = 0 para logaritmo. A.1.1.1 Tangente hiperbólica A função tangente hiperbólica foi utilizada com o intuito de realçar as intensidades dos objetos em relação ao ruı́do de fundo do céu. Conforme ilustrado na figura A.2, a função tanh(x) possui um ponto de inflexão em x = I0 /↵, correspondendo a x = 5 no gráfico. Em torno deste ponto (4 . x . 6 na figura) os valores da abscissa variam significativamente em um pequeno intervalo. À medida que se distancia deste ponto a curva rapidamente atinge valores limite, o que é interessante para separar regimes de intensidades. Através do parâmetro ↵ a inclinação em torno do ponto de inflexão pode ser manipulada. O objetivo de modificar esta inclinação, visto que os valores limite (x ! inf , x ! + inf) mantém-se inalterados, está em restringir a faixa de valores de x utilizados para separar os regimes de intensidade. Em particular, para os arcos gravitacionais, queremos transladar o ponto de inflexão (I0 /↵) para um valor estimado superior do ruı́do da imagem de forma a deslocar as intensidades dos objetos para o valor limite da função à direita (x > I0 /↵). A figura A.3 apresenta exemplos de imagens transformadas com a função tanh() para diferentes inclinações. O valor (I0 ) para posicionar o ponto de infle94 xão foi escolhido a partir do histograma da imagem, correspondendo à moda da distribuição de intensidades. (a) (b) (c) Figura A.3: Imagens re-escalonadas por tanh() para diferentes valores de ↵: (a) ↵ = 0.01, (b) ↵ = 0.1, (c) ↵ = 1. O problema desta técnica é que os pixels do fundo, com valores de intensidade tı́picos do objetos, são também realçados. A.1.1.2 Logaritmo A função logaritmo opera de forma a suavizar as pequenas variações de intensidade. Para analisar a insensibilidade desta função frente às variações do argumento consideremos o logaritmo de base 10. Pelas propriedades da função temos: log10 (10n x) = log10 (10n ) + log10 (x) (A.2) = n log10 (10) + log10 (x) (A.3) = n + log10 (x) . (A.4) Por exemplo, para pixels com valores de intensidade distantes por uma ordem de grandeza (n = 1; digamos, de 10 para 100) terı́amos, após aplicação desta transformação, estes mesmos pixels distantes por apenas uma unidade. Além de trabalhar como um suavizador, o operador log() (ver figura A.2) tem uma inclinação acentuada nas faixas mais baixas do domı́nio (0 < x . 1) e diminui à medida que x cresce. Essa propriedade é utilizada para realçar baixas intensidades e suavizar regiões com valores altos. 95 A figura A.4 mostra um exemplo da transformação por logaritmo sobre a imagem exemplo de arco. (a) (b) Figura A.4: Re-escalonamento de intensidades com log10 () (b) sobre a imagem do arco original (a) O resultado da aplicação desta transformação não parece ter sido benéfico, pois o ruı́do de fundo foi elevado, o que não é desejado. A.1.1.3 Equalização de histograma Equalização de histograma consiste na modificação da distribuição de probabilidades de maneira tal que as probabilidades sejam uniformizadas. Esta modificação tem por objetivo aumentar o contraste da imagem e assim realçar os objetos. Consideremos o histograma de uma imagem como sendo a densidade de probabilidades p1 (x) das intensidades de uma imagem u. No caso discreto, o histograma representa as frequências relativas de ocorrência das intensidades. O processo conhecido por modificação de histograma consiste em transformar as intensidades da imagem de tal maneira a satisfazer uma desejada densidade de probabilidades p2 (x). As probabilidades de cada uma das distribuições são dadas por, Z u p1 (x)dx = F1 (u) , (A.5) p2 (x)dx = F2 (v) . (A.6) 0 Z v 0 96 Impondo que v satisfaça a relação F2 (v) = F1 (u), obtemos: v(u) = F2 1 (F1 (u)). (A.7) Então, v é a nova distribuição de intensidades em função de u, com densidade de probabilidade p2 (x). Portanto, v é totalmente definida por p2 (x), uma vez que p1 (x) e u são conhecidas. Dois exemplos de modificação de histograma são a equalização e a limiarização, que serão discutidos a seguir. Na expressão (A.7) temos a expressão geral para a modificação do histograma de uma imagem. No caso da equalização queremos que p2 (x) seja uma função constante, ou seja, a imagem final deve ter uma distribuição de intensidades uniforme. Supondo que 0 u 1, então p2 (x) = 1 na expressão (A.5). Isto, juntamente com a restrição F2 (v) = F1 (u), nos dá a expressão para v(u): v(u) = F1 (u) . (A.8) Portanto, a equalização de histograma é realizada pela expressão acima, que aplicada sobre a imagem original nos dá uma imagem com histograma uniforme. Na figura (A.5) temos um exemplo de aplicação do método de equalização de histograma na imagem de arco exemplo. Podemos notar na imagem (b) o realce que houve das regiões escuras em (a). O arco ficou bem evidente, os extremos tênues ganharam maior definição. No entanto tivemos também o realce do ruı́do de fundo, prejudicando bastante a qualidade da imagem. Apesar disso, o método realça as intensidades de menor frequência da imagem, e, assim, seleciona bem as intensidades tı́picas dos objetos. A.1.2 Limiarização O procedimento conhecido por limiarização — do inglês, thresholding — remove faixas de intensidades não desejadas da imagem. Esta remoção é feita associando novos valores (e.g., zero) para todos os pixels que originalmente tinham 97 (a) (b) Figura A.5: Equalização de histograma: (a) imagem de arco original e (b) imagem equalizada. valores na faixa indesejada. A faixa de intensidades de interesse pode ser definida manualmente ou através de algum processo automatizado sobre a distribuição de intensidades da imagem. O Thresholding tem sido aplicado nas imagens astronômicas como ferramenta para redução do ruı́do. A figura A.6 apresenta um histograma tı́pico de uma imagem astronômica na qual a maior parte dos pixels corresponde ao fundo do céu. Portanto, o pico de contagens observado na figura A.6 corresponde às contagens do ruı́do de fundo. Neste procedimento de limiarização, o ruı́do de fundo é o que queremos remover ou diminuir, além de aumentar o contraste da imagem. O ponto de corte para a limiarização do ruı́do é indicado pela linha vermelha que passa pelo pico do histograma da figura. A linha vermelha à esquerda indica o ponto de corte superior para a remoção de intensidades muito elevadas. Neste exemplo, os pontos de corte para a limiarização são dados pelas intensidades de valor 46.9 e 68.7. A.1.3 Filtragem Filtragem, em processamento de imagens, é um conjunto de operações com intuito de suavizar ou realçar os detalhes da imagem, bem como minimizar o ruı́do e eliminar defeitos. Na figura A.7 apresento o efeito da redução do ruı́do através de um filtro gaussiano (seção A.1.3.3), o resı́duo gerado pela suavização é apresentado em um dos painéis a tı́tulo de demonstração do efeito de filtragem. Nas seções que seguem são apresentados alguns filtros passa-baixa (média, gaussiana), para 98 Figura A.6: Histograma caracterı́stico de uma imagem astronômica e o ponto de corte (linha vermelha esquerda) utilizado para redução do ruı́do. o tratamento de ruı́do nas imagens, bem como a filtragem anisotrópica (A.1.3.5), para realce de bordas dos objetos. Figura A.7: Resı́duo de filtragem gaussiana. À esquerda temos a imagem original e ao centro, a mesma imagem porém agora filtrada com um kernel gaussiano (3 ⇥ 3). O resı́duo, dado pela diferença das imagens original-filtrada, é apresentado no painel da direita, representando o ruı́do sobressalente ao sinal da imagem. A.1.3.1 Filtro da média O filtro da média é uma operação que calcula o valor médio dos pixels dentro de uma vizinhança e associa o resultado ao pixel central sendo avaliado. Um exemplo deste tipo de filtro, utilizando uma vizinhança 5 ⇥ 5, é apresentado na tabela (A.1). Esta matriz, ou máscara, é utilizada para definir os pesos de cada 99 ponto e seu entorno, para o cálculo da média e atualização do valor. A equação abaixo define a operação de média aplicada no ponto (k, l): i=2,j=2 X 1 v(k, l) = u(k 25 i= 2,j= 2 i, l j) (A.9) onde u é a imagem original, (k, l) é o pixel sendo avaliado, i e j estão variando em torno do centro da janela, em que a vizinhança é definida. A nova imagem v é a imagem média de u. 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 1 25 Tabela A.1: Janela 5x5 do filtro da média. A figura A.8 mostra o resultado do filtro aplicado sobre a imagem da figura (A.1). Figura A.8: Suavização com filtro da média com uma janela 5 ⇥ 5. A.1.3.2 Filtro da mediana O filtro da mediana é muito próximo do anterior, da média, porém ao invés de associar o valor médio de uma região ao pixel central, este é atualizado com o valor da mediana da região. Como a mediana é o valor que separa a distribuição em dois conjuntos de mesmo tamanho esta operação não suaviza a imagem tanto quanto o filtro da média, mas preserva melhor a informação de bordas e caracterı́sticas 100 dos objetos. A figura (A.9) apresenta o resultado da aplicação deste filtro para compararmos com o filtro da média na seção anterior. Figura A.9: Suavização com filtro da mediana com uma janela 5 ⇥ 5. A.1.3.3 Filtro Gaussiano O filtro gaussiano é um operador que utiliza uma função gaussiana discretizada para montagem de um kernel e aplicá-lo via convolução sobre a imagem de interesse. A função gaussiana é dada pela expressão: G(x, y; x, y) = 2⇡ p Utilizando um valor apropriado para 1 2 x e 2 + x, x2 2 2 x y2 2 2 y (A.10) y y e as dimensões do operador temos uma matriz como a apresentada na tabela (A.2) e que pode ser convoluı́da com a imagem. 1 36 1 36 1 36 1 36 1 36 1 36 1 18 1 18 1 18 1 36 1 36 1 18 1 9 1 18 1 36 1 36 1 18 1 18 1 18 1 36 1 36 1 36 1 36 1 36 1 36 Tabela A.2: Janela 5x5 do filtro gaussiano, com x = y = 1. Os valores da janela foram normalizados (soma = 1) para que o brilho da imagem não seja alterado. A imagem resultante, suavizada, é dada pela operação de convolução, defi- 101 nida pela seguinte expressão: v(k, l) = G(k, l) ⇤ u(k, l) = j=2 i=2 X X G(k i)(l j)u(i, j) , (A.11) i= 2 j= 2 onde u é a imagem original, (k, l) é o pixel sendo avaliado, i e j estão variando em torno do centro da janela. A figura A.10 apresenta alguns exemplos de aplicação da filtragem gaussiana com diferentes valores de x, y. Figura A.10: Suavização com diferentes filtros gaussianos: (superior-esquerdo) (1, 1), (superior-direito) (1, 3), (inferior-esquerdo) (3, 1), (inferior-direito) (3, 3). A.1.3.4 Suavização Direcional O método de suavização direcional aplica o filtro da média em uma particular direção para cada ponto da imagem. A figura A.11 mostra os elementos básicos desta técnica. Observamos uma janela em torno do pixel (m, n) da imagem orientada segundo um ângulo ✓ com a direção horizontal. Para cada ângulo ✓ escolhido, o método calcula a intensidade média no interior da janela, dada pela expressão v(m, n; ✓) = 1 NW ✓ X k,l2NW✓ 102 u(m k, n l) , (A.12) onde NW✓ é o número de pixels da janela e u é a imagem original. Finalmente é resolvido o seguinte problema de otimização: ✓⇤ = arg min |u(m, n) ✓ v(m, n; ✓)| v(m, n) = v(m, n; ✓⇤ ) , (A.13) (A.14) obtendo-se, assim, o novo valor v(m, n) para o pixel avaliado. A suavização em uma direção particular tem por objetivo preservar a borda dos objetos juntamente com o processo de suavização do ruı́do da imagem. Para tanto, a suavização deve ser realizada na direção paralela à borda dos objetos, que corresponde à direção ✓⇤ da equação (A.13). A figura (A.11) nos auxilia a visualizar a configuração deste filtro. Na figura A.12 são apresentados os resultados da aplicação deste filtro para janelas de tamanhos distintos (3 ⇥ 1 e 15 ⇥ 1) e ângulos ✓ = 0 , 45 , 90 , 135 . Figura A.11: Janela de aplicação do filtro direcional 103 (a) (b) Figura A.12: Suavização direcional sobre a figura (A.1) com janelas (a) 3 ⇥ 1, e (b) 15 ⇥ 1. A.1.3.5 Difusão anisotrópica O filtro de difusão anisotrópica é outra técnica de suavização utilizada no tratamento de ruı́do das imagens. A idéia principal deste filtro é suavizar a imagem — fundo e objetos — preservando a informação das bordas dos objetos. A difusão anisotrópica é definida pela equação @I(x, y, t) = div(D(x, y, t; I, rI)rI) , @t (A.15) onde I é a imagem sobre a qual o filtro opera. O coeficiente “D(·)” define o grau de suavização a ser aplicado em cada ponto da imagem e depende das caracterı́sticas da imagem no ponto. Note que se D(·) for uma constante, independente da posição, temos o filtro gaussiano (difusão linear ). Visto que um dos objetivos do processo de filtragem neste trabalho é realçar bordas de objetos (arcos gravitacionais), o coeficiente de difusão deve ser função do gradiente do campo de intensidades: no centro do objeto, onde a intensidade atinge o máximo, o gradiente é próximo de zero, enquanto que nas bordas a variação da intensidade é grande e, portanto, o gradiente é alto. Vamos supor que os pontos da borda estejam orientados na direção x e que 104 o coeficiente de difusão seja função do gradiente, D(x, y, t) = g(Ix (x, y, t))1 . A equação (A.15) torna-se: @I(x, y, t) @ [g(Ix (x, y, t))Ix (x, y, t)] = @t @x (A.16) Definindo (Ix ) = g(Ix ) · Ix podemos escrever: It = @ (Ix ) = @x x (Ix ) · Ixx (A.17) Estamos interessados na variação temporal do gradiente de intensidades, @Ix , @t visto que esta é a quantidade resultante do processo de filtragem. Assumindo D(x, y, t) > 0 podemos trocar a ordem das diferenciações de modo que @Ix = @t xx 2 · Ixx + x · Ixxx . (A.18) Nas bordas temos Ixx = 0 e Ixxx < 0 visto que estes pontos são os máximos locais do gradiente de intensidades. Então, existe uma vizinhança dos pontos da borda em que a derivada @Ix /@t tem sinais opostos a x (Ix ). Se x (Ix ) desnivel do ponto da borda diminui com o tempo. Do contrário, se x (Ix ) > 0 o <0a borda torna-se mais evidente. Podemos então notar que a difusão anisotrópica é capaz de suavizar pequenas descontinuidades e acentuar as mais fortes, realçando assim as bordas dos objetos. O modelo especı́fico de Lenzen et al. Explicadas matematicamente as motivações para o uso da difusão anisotrópica no processo de filtragem, apresento abaixo o modelo especı́fico utilizado pelo algoritmo de Lenzen et al. (2004). O filtro anisotrópico neste algoritmo é aplicado sobre uma imagem pré-filtrada por um filtro gaussiano. A pré-filtragem da imagem torna o cálculo de gradientes mais estável para a difusão anisotrópica. No modelo utilizado por Lenzen et al. usa-se uma matriz de difusão dada 1 O subı́ndice “x” em Ix significa a derivada em relação a x; assim como “t”, derivada em relação a t. 105 pela seguinte expressão: Dµ, (ru ) = g(|ru |2 ) 0 v1µ , v2µ 0 1 ! v1µ , v2µ T (A.19) Onde u é a imagem original convoluı́da com um filtro gaussiano de largura , v1µ e v2µ são os autovetores do tensor: Kµ ⇤ ru ru T . (A.20) os quais indicam as direções paralela e perpendicular, respectivamente, à borda em cada ponto. O termo Kµ é um kernel gaussiano, com largura µ, utilizado apenas neste ponto para estabilizar a computação dos autovetores v1µ e v2µ . A função g(|ru |) da equação (A.19) é dado por: " g(|ru |) = 1 + ✓ |ru | K ◆2 # 1 , K > 0. (A.21) A solução da equação A.16 é obtida através da discretização espacial pelo método de elementos finitos e através do método de Euler implı́cito no tempo. A solução da parte temporal é obtida discretizando o tempo total T em um número de passos N de tamanho t (Lenzen et al., 2004). Nas imagens abaixo são apresentados alguns resultados da suavização por difusão anisotrópica utilizada no algoritmo do Lenzen. Nos exemplos abaixo foram variados os valores de K da expressão (A.21). Conforme proposto por Lenzen, a faixa de valores deste parâmetro para o seu algoritmo é [10 4 , 0.1]. Assim, são utilizados estes limites nos exemplos abaixo. Podemos notar nas imagens da figura A.13 a diferença deste processo de suavização na definição das fronteiras do objeto conforme variamos K. Os objetos filtrados com o valor de K pequeno tiveram suas bordas mais definidas e realçadas, enquanto os objetos com maior valor de K perderam a definição da fronteira. É importante notar a formação de pequenas estruturas (canto inferior esquerdo) 106 Figura A.13: Imagem A.1 filtrada com difusão anisotrópica utilizando K = 10 (esquerda) e K = 0.1 (direita). 4 quando utilizamos um valor baixo para o parâmetro K. Estas estruturas são formadas quando a suavização opera sobre o ruı́do do fundo da imagem. A.2 Identificação de objetos Identificação de objetos em imagens astronômicas consiste em identificar re- giões de pixels contı́guos que se destaquem do fundo das imagens por caracterı́sticas do perfil de brilho. É comum na área de astronomia chamar esta operação de segmentação, adicionando computação de caracterı́sticas morfológicas para identificação de objetos de interesse (estrelas, galáxias, arcos gravitacionais). Nesta seção serão descritos alguns algoritmos utilizados na segmentação de imagens astronômicas. Estes são algoritmos que identificam regiões da imagem que apresentem caracterı́sticas, como intensidade e gradiente, condizentes com o tipo de objeto de interesse. A.2.1 Crescimento de regiões Crescimento de regiões (do inglês region growing, RG) é um algoritmo iterativo para segmentação de imagens. Partindo de um ponto inicial (semente) o algoritmo procura pelos pixels vizinhos que satisfaçam algumas propriedades e, assim, sejam incorporados à região em crescimento. Portanto, a aplicação de um algoritmo RG depende de (i) definir uma semente, o ponto de inicialização do 107 algoritmo, e (ii) um conjunto de regras Q para selecionar pixels para a região em crescimento. É tı́pico utilizar como regra para a seleção dos pixels, a intensidade do pixel e o gradiente da imagem. Para descrever o conceito do algoritmo utilizaremos a seguinte notação. Para um dado pixel p = (i, j) denotamos por N (p) a vizinhaça formada pelos primeiros vizinhos, a qual podemos definir de duas formas: • Vizinhança quatro-conectada: N4 (p) = {(k, l) 2 N ⇥ N | |i k| + |j l| = 1} (A.22) k| + |j l| 2} (A.23) • Vizinhança oito-conectada: N8 (p) = {(k, l) 2 N ⇥ N | |i O algoritmo que implementa este método segue abaixo((Jain Duin, 2000)) (1) Inicializa a regiao R com a semente. Define o tipo de vizinhança (2) Escolhe um pixel p 2 R para avaliar vizinhança N (p) (3) Se q 2 N (p) n~ ao foi visitado antes, verifica se satisfaz Q Se sim, adiciona q a R (4) Repete os passos 1-2 até que n~ ao hajam mais pixels para incorporar. Na figura (A.14) é dado um exemplo de segmentação com o crescimento de regiões. As sementes utilizadas para inicialização das regiões são apresentadas em (A.14 (a)) e o resultado do processo é visualizado na figura (A.14 (b)). Os pixels utilizados como semente para a segmentação são máximo locais da imagem. O valor limite de intensidade utilizado para finalização do algoritmo foi 52. 108 (a) (b) Figura A.14: Resultado da segmentação com crescimento de regiões. Em (a) podemos ver as três sementes utilizadas para inicializar a segmentação resultante na imagem (b). A.2.2 Limiarização O processo de segmentação por limiarização seleciona conjuntos de pixels que apresentem valores superiores a um dado limite inferior. O processo utilizado aqui é análogo ao apresentado na seção A.1.2, porém, neste caso, modificado para que ao final tenhamos uma imagem (binária) com regiões que representem objetos de interesse. Além disso, adicionamos uma restrição com relação a área das regiões obtidas. Portanto, dois são os parâmetros que devem ser dados ao algoritmo: (i) o limite inferior para as intensidades (ulim ) e (ii) o tamanho mı́nimo para cada região (Nlim ). Os valores para ulim e Nlim devem ser estipulados de acordo com o nı́vel de intensidade caracterı́stico e tamanho dos objetos desejados. Na figura (A.15) apresento um exemplo de segmentação pelo processo de limiarização. O valor escolhido como limiar foi também 52. Regiões de pixels com intensidade superior ao limiar, e área superior a nove pixels, foram consideradas objetos e marcados em preto na figura (A.15). A.2.3 Parâmetros morfológicos A classificação de objetos (arcos e não-arcos) detectados em imagens astronômicas é tipicamente realizada através dos valores de excentricidade e largura de 109 Figura A.15: Resultado da limiarização. O valor limite para crescimento utilizado foi 52. cada conjunto de pixels. Uma maneira de calcular as propriedades morfológicas dos objetos é através dos momentos de cada conjunto de pixels. As definições de momento (1 e 2 ) utilizadas abaixo são as mesmas definidas em Lenzen et al. (2004). O primeiro momento é definido da seguinte maneira: 0 1 0 1 1 X B mc C B C mc ~ =@ u(pi ) @ A= A , M 2 2 o mc yi i2R 1 x1i (A.24) onde o vetor mc ~ indica o centróide (ou “centro de massa”) do objeto, R é o conjunto de pixels analisados e Mo é a soma de todas as intensidades dos pixels de R. O segundo momento é definido pela matriz: Mjk = ⇣ 1 X u(pi ) xji Mo i2R onde j, k = {1, 2}. Os autovalores 1 e 2 ( mcj ⌘⇣ 2) 1 xki mck ⌘ (A.25) desta matriz são [M ] utilizados para o cálculo da excentricidade (ecc): ecc = 1 2 . (A.26) 1 Os semi-eixos maior (a) e menor (b) são dados pelos termos da matriz [M ] através 110 das seguintes expressões: 2 a = 42 2 b = 42 M22 + M11 + M22 + M11 q q (M22 M11 )2 + 4 (M12 )2 Area (M22 Area 2 M11 ) + 4 (M12 ) 2 3 5, (A.27) 5, (A.28) 3 onde Area é o momento de ordem zero, o número de pixels que compoem a região. 111