Haploview: análise e visualização de mapas e LD haplótipos Informação sobre o artigo: Autores: JC Barret, B. Fry, J. Maller e MJ Daly Respectivas filiações: Whitehead Institute for Biomedical Research Cambridge, MA 02142, EUA MIT Media Lab Cambridge, MA 02139, EUA Instituto Broad do MIT e de Harvard em Cambridge, MA, EUA Data : 23 de julho de 2004. Realizado por: Carlos Rodrigues 070316102 Liliana Mota 070307056 Haploview: análise e visualização de mapas e LD haplótipos 2012 “A tecnologia digital é a arte de criar necessidades desnecessárias mas que se tornam absolutamente imprescindíveis.” Joelmir Beting 2 Haploview: análise e visualização de mapas e LD haplótipos 2012 Índice Terminologias .......................................................................................4 Introdução............................................................................................5 Características do Haploview .................................................................6 Versões de Haploview ...........................................................................9 Conclusões .........................................................................................13 Referências ........................................................................................14 3 Haploview: análise e visualização de mapas e LD haplótipos 2012 Terminologias Alelo: Representa uma das formas alternativas para um determinado gene, no qual ocupa um locus (posição) num cromossoma. A combinação entre alelos determina as características de um determinado individuo. Cromossoma: Sequência de DNA que contém vários genes e outras sequências de nucleotídeos com funções especificas nas células dos seres vivos. Locus(plural: loci): Local fixo num determinado cromossoma aonde se localiza determinado gene ou marcador genético. Marcador genético: Característica que identifica diferenças entre dois ou mais organismos. Usados para o estudo da diversidade populacional. Desequilíbrio de ligações(LD): Associações alélicas não aleatórias que ocorrem com mais ou menos frequência que seria esperado numa determinada população. LD é influenciado com seguintes factores; ligação genética, selecção, taxa de combinação, taxa de mutação, deriva genética, combinação não aleatória de acasalamento e estrutura da população. Dados pedigree: Fornece dados probabilísticos sobre dados quantitativos no campo biológico ou estudos laboratoriais. Equilibrio de Hardy-Weinberg: É o estudo dos genes (variantes) do ponto de vista de sua distribuição na população. Esta lei afirma que de geração em geração as frequências alélicas vão se tornando constantes. transmission disequilibrium test (TDT): Testa a ligação entre um marcador e um locus de susceptibilidade doença e características quantitativas. Teste X2: Usado para comparar as frequências observadas com Frequências esperadas. 4 Haploview: análise e visualização de mapas e LD haplótipos 2012 Introdução A variação genética é elevada nas populações humanas, provém da diversidade das combinações alélicas nas recombinações transmitidas de geração em geração. Mas pode ocorrer erros nessas recombinações causando danos para o individuo. Um haplótipo é uma combinação de alelos, que se encontram em locais adjacentes (loci) no cromossoma e são transmitidos juntos na transmissão genética. No entanto pode ocorrer um desequilíbrio de ligação local (LD) num bloco causando assim determinadas doenças, tais como os diabetes, cancro, doenças cardíacas, depressão e asma são afectadas por muitos genes e factores ambientais. O estudo destas estruturas e determinação de padrões haplótipos no genoma humano tem sido muito importante para a genômica médica, medicina evolutiva , moderna e aplicações farmacêuticas. Com o decorrer do tempo e o aumento da informação levaram ao desenvolvimento de um projecto denominado HapMap que tem como objectivo desenvolver um mapa de haplótipos do genoma humano (base dados), no qual descreve os padrões comuns de variação humana na sequência de DNA. O estudo destas variantes fornece informação sobre as causas que levam ao desenvolvimento das doenças no Ser Humano. Dado ao grande número de informação contida no HapMap foi necessário o desenvolvimento de uma ferramenta para análise, interpretação e visualização de haplótipos, facilitando assim a pesquisa de vários investigadores. Foi desenvolvido assim um software que fornece dados estatísticos denominado Haploview. Tendo como objectivo fornecer uma análise rigorosa sobre haplótipos, além de gerar estatísticas de marcadores, ainda fornece informação sobre ligações LD, blocos haplótipos e frequências destes na população. Todos os recursos podem ser alterados conforme o interesse do utilizador e todos os cálculos são realizados em tempo real, mesmo para conjuntos de dados com centenas de pessoas e centenas de marcadores. 5 Haploview: análise e visualização de mapas e LD haplótipos 2012 Características de Haploview Haploview permite carregar informação em vários formatos, sendo compatível com quaisquer formatos de dados provenientes do projecto HapMap, no qual permite uma ligação directa de leitura da base de dados. Dados pedigree carregados permite ler informação de cromossomas em diferentes estados, especificar informação estrutural de cada família e ainda permite comparação de doenças com casos controle. A informação dos marcadores pode ser carregada com o nome ou localização, mas estes são carregadas separadamente. Contem um navegador gráfico para visualização do genoma em que possibilita aos utilizadores uma navegação localizada numa região específica escolhidas por eles, mostrando todos os marcadores presentes nessa região. Os marcadores dessa região tem que estar de acordo com o equilíbrio de Hardy-Weinberg, registo de erros da herança mendeliana e percentagem de indivíduos genotipados para esse marcador. Só os marcadores de interesse é que são filtrados pelo próprio programa, mas o utilizador pode ajustar os limites dependendo da sua pesquisa, adicionando ou eliminando marcadores. Todas as alterações feitas alteram de uma forma imediata análise em curso. 6 Haploview: análise e visualização de mapas e LD haplótipos 2012 Figura 1 – Exemplo do ecrã do software HaploView [1] O Haploview calcula ainda várias medidas para pares de LD que usa para criar uma representação gráfica como demonstra do na figura acima. Utilizador pode ainda usar um esquema de cores para identificar as diferentes relações LD. A medida que analise está a decorrer este mostra as variáveis e a taxa de recombinação (esquerda/cima). A direita está informação sobre haplótipos da região seleccionada. Estes haplótipos são gerados depois da selecção de marcadores escolhidos de forma automática ou manual, ainda gera as suas frequências populacionais. A figura mais a direita ainda mostra a representação em blocos, em que as linhas representam a transição entre blocos e espessura indica o grau de LD. A personalização está novamente presente, podendo exibir alelos como letras, números ou caixas coloridas. Haploview pode ainda calcular estatísticas TDT e X2 (caso/controlo), para cada marcador. Haploview é organizado em vários tab, permitindo ao utilizador analisar os dados em tempo real. As informações de cada janela podem ainda ser convertida para um arquivo PNG, podendo ser utilizado em apresentações, publicações ou ficheiros texto. O programa pode ainda ser manipulado através de uma linha de comandos, que permite ao utilizador executar todas as análises sem abrir a interface gráfica. 7 Haploview: análise e visualização de mapas e LD haplótipos 2012 As versões futuras incluirão vários haplótipos-tag métodos de selecção de SNP, bem como haplótipos baseados em testes de associação e de avaliação de significância usando o teste de permutação. Estas características finais vão permitir que o utilizador a partir de dados do genótipo explore associações genéticas através de um software de fácil utilização. Este software é escrito numa linguagem java no qual permite assim que qualquer plataforma que possua pelo menos java 1.3 pode correr esta aplicação. Neste artigo é referente a versão 2.05 de Abril de 2004, o Haploview podia ser exibido um conjunto de dados com 200 marcadores genotipados em 400 indivíduos e ajustar parâmetros sem nenhum atraso perceptível. O programa também permite o uso da linha de comandos para fazer cálculos LD em conjuntos de dados muito grandes, em quantidades pequenas de tempo. 8 Haploview: análise e visualização de mapas e LD haplótipos 2012 Versões de Haploview Como se trata de um artigo de Abril de 2004, com o passado dos anos foram sendo lançadas novas versões deste software, aqui vai-se listar todas as versões lançadas e suas melhorias. Versão 3.0 (Outubro de 2004) [2] Bugfixes for block size display, checkdata tab, allele sorting, EM missing data. Added compressed PNG output mode. Lots of new command line options. Changed batch mode input format. Re-sort out of order info files. Substantial improvement in speed and memory usage in EM. New color schemes. Added additional sample information for 2nd and 3rd HapMap plate. Fixed handling of complex pedigrees. Added proportional spacing to LD display. Added HapMap GBrowse track. Filter individuals with lots of missing genotypes. Haplotype association tests. Update checker. Versão 3.1 (Janeiro de 2005) [2] Additional HapMap info track display options. Improved parsing of complex pedigrees. Fixed bug with loading of haps style input files. Fixed bug with correctly parsing out-of-order info files. Fixed problem with association tests on datasets with no blocks. Fixed bug with exporting range of markers to LD PNG. 9 Haploview: análise e visualização de mapas e LD haplótipos 2012 Versão 3.2 (Abril de 2005) [2] added Tagger interface added custom association test input added permutation testing of association results improved memory efficiency for EM haplotype reconstruction added Perlegen sample Ids fixed bug in PNG export cutting off final marker Versao 3.3 (Maio de 2006) [2] support for X chromosome major memory usage improvements allow multiple analysis tracks and label Y axis added user defined hapmap sample option added haplotypes only permutation option added option to show different LD measures or hide them added -memory switch and changed default to 512M added minor allele to check panel added progress bar for data loading support for alphabetical (ACGT) input format added individual information dialog added check panel for phased haps files added dump tags button last popup dialog is shown at top of display added GOLD style color scheme can sort tables by clicking on headers changed case control allele order Versão 4.0 (Agosto de 2007) [2] 10 Haploview: análise e visualização de mapas e LD haplótipos 2012 dded support for HapMap PHASE format data added support for phased HapMap downloads added support for PLINK output files including plotting functionality added a number of Tagger features to coincide with the Tagger website functionality added 2-marker aggressive tagging from the command line added log file functionality to command line mode added proxy support added table sorting to Tagger configuration added numerous minor display and interface tweaks added export options for Mendel errors and male heterozygotes on x chromosome added command line HapMap info track download added case control frequencies to command line association output added ld values selection to command line image export added citation information to the "About" dialog added "Uncapture All" button to Tagger added build 36 option to HapMap info track downloads added http:// loading for files on the command line and initial load screen changed some labelling in Tagger and made pairwise the default option changed obsHet calculation to use founders only changed HW and het calculations to show as "NA" in X data with too few individuals enhanced GUI design with tabbed pane for initial loading dialog Versão 4.1 (Abril de 2008) [2] 11 Haploview: análise e visualização de mapas e LD haplótipos 2012 added support for GeneCruiser lookup added support for HapMap release 22 added -out fileroot specification to the command line added consecutive filtering to PLINK with view/add/remove filters added SVG output for LD plot and haplotype blocks display added min design scores to Tagger in GUI and command line added reset thresholds button to Tagger added exclude A/T and C/G SNPs button to Tagger upgraded graphing packages to latest version changed load screen dialog tab orientation for Mac OSX fixed bug with LD display pop-up on certain systems fixed bug with HapMap info track caching fixed bug on LD Display with MAF of .5 fixed bug where setting tagger cutoff fields to blank would generate exceptions fixed bug with PLINK View Filters dialog fixed bug with PLINK file column number mismatches Versão 4.2 (Em Setembro de 2009) [2] added support for Phase 3 HapMap added support for the latest version of GeneCruiser added GeneCruiser lookup to Region Dialog in PLINK tab added search as you type and prune table to PLINK results added "-v/-version" to option to the command line changed tab orientation for initial load screen on Mac OSX disabled Genecruiser for non HG18 Hapmap Releases Actualmente este software encontra-se em modo de “congelamento” estando a espera que alguém através de mais investigação consiga trazer melhorias futuras de forma a conseguir-se obter resultados cada vez mais eficientes. Conclusão 12 Haploview: análise e visualização de mapas e LD haplótipos 2012 Haploview consistiu uma óptima ferramenta para a pesquisa dos investigadores na área da genômica, no qual permite uma pesquisa fácil e rápida e ainda apresenta uma série de informações e cálculos estatísticos. Permite ainda ao utilizador personalizar o aspecto visual facilitando a leitura de dados. Sendo assim um software open source, intuitivo e user-friendly. Referências 13 Haploview: análise e visualização de mapas e LD haplótipos 2012 Fonte do artigo: http://bioinformatics.oxfordjournals.org/content/21/2/263.abstract [1 ] - http://bioinformatics.oxfordjournals.org/content/21/2/263/F1.large.jpg [2] - http://www.broadinstitute.org/science/programs/medical-and-population- genetics/haploview/version-history Diversas fontes: http://pt.wikipedia.org/wiki/Alelo http://es.wikipedia.org/wiki/Haplotipo http://hapmap.ncbi.nlm.nih.gov/ http://www.broadinstitute.org/scientific-community/science/programs/medical-andpopulation-genetics/haploview/haploview http://www.broadinstitute.org/science/programs/medical-and-populationgenetics/program-medical-and-population-genetics 14