Haploview: análise e visualização de mapas
e LD haplótipos
Informação sobre o artigo:
Autores: JC Barret, B. Fry, J. Maller e MJ Daly
Respectivas filiações:
Whitehead Institute for Biomedical Research Cambridge, MA 02142, EUA
MIT Media Lab Cambridge, MA 02139, EUA
Instituto Broad do MIT e de Harvard em Cambridge, MA, EUA
Data : 23 de julho de 2004.
Realizado por:
Carlos Rodrigues 070316102
Liliana Mota 070307056
Haploview: análise e visualização de mapas e LD haplótipos 2012
“A tecnologia digital é a arte de criar necessidades
desnecessárias mas que se tornam absolutamente
imprescindíveis.”
Joelmir Beting
2
Haploview: análise e visualização de mapas e LD haplótipos 2012
Índice
Terminologias .......................................................................................4
Introdução............................................................................................5
Características do Haploview .................................................................6
Versões de Haploview ...........................................................................9
Conclusões .........................................................................................13
Referências ........................................................................................14
3
Haploview: análise e visualização de mapas e LD haplótipos 2012
Terminologias
Alelo: Representa uma das formas alternativas para um determinado gene, no qual
ocupa um locus (posição) num cromossoma. A combinação entre alelos determina as
características de um determinado individuo.
Cromossoma: Sequência de DNA que contém vários genes e outras sequências de
nucleotídeos com funções especificas nas células dos seres vivos.
Locus(plural: loci): Local fixo num determinado cromossoma aonde se localiza
determinado gene ou marcador genético.
Marcador genético: Característica que identifica diferenças entre dois ou mais
organismos. Usados para o estudo da diversidade populacional.
Desequilíbrio de ligações(LD): Associações alélicas não aleatórias que ocorrem com
mais ou menos frequência que seria esperado numa determinada população. LD é
influenciado com seguintes factores; ligação genética, selecção, taxa de combinação,
taxa de mutação, deriva genética, combinação não aleatória de acasalamento e
estrutura da população.
Dados pedigree: Fornece dados probabilísticos sobre dados quantitativos no campo
biológico ou estudos laboratoriais.
Equilibrio de Hardy-Weinberg: É o estudo dos genes (variantes) do ponto de vista de
sua distribuição na população. Esta lei afirma que de geração em geração as
frequências alélicas vão se tornando constantes.
transmission disequilibrium test (TDT): Testa a ligação entre um marcador e um locus
de susceptibilidade doença e características quantitativas.
Teste X2: Usado para comparar as frequências observadas com Frequências esperadas.
4
Haploview: análise e visualização de mapas e LD haplótipos 2012
Introdução
A variação genética é elevada nas populações humanas, provém da diversidade
das combinações alélicas nas recombinações transmitidas de geração em geração. Mas
pode ocorrer erros nessas recombinações causando danos para o individuo.
Um haplótipo é uma combinação de alelos, que se encontram em locais
adjacentes (loci) no cromossoma e são transmitidos juntos na transmissão genética.
No entanto pode ocorrer um desequilíbrio de ligação local (LD) num bloco causando
assim determinadas doenças, tais como os diabetes, cancro, doenças cardíacas,
depressão e asma são afectadas por muitos genes e factores ambientais.
O estudo destas estruturas e determinação de padrões haplótipos no genoma
humano tem sido muito importante para a genômica médica, medicina evolutiva ,
moderna e aplicações farmacêuticas. Com o decorrer do tempo e o aumento da
informação levaram ao desenvolvimento de um projecto denominado HapMap que
tem como objectivo desenvolver um mapa de haplótipos do genoma humano (base
dados), no qual descreve os padrões comuns de variação humana na sequência de
DNA. O estudo destas variantes fornece informação sobre as causas que levam ao
desenvolvimento das doenças no Ser Humano.
Dado ao grande número de informação contida no HapMap foi necessário o
desenvolvimento de uma ferramenta para análise, interpretação e visualização de
haplótipos, facilitando assim a pesquisa de vários investigadores. Foi desenvolvido
assim um software que fornece dados estatísticos denominado Haploview.
Tendo como objectivo fornecer uma análise rigorosa sobre haplótipos, além de
gerar estatísticas de marcadores, ainda fornece informação sobre ligações LD, blocos
haplótipos e frequências destes na população. Todos os recursos podem ser alterados
conforme o interesse do utilizador e todos os cálculos são realizados em tempo real,
mesmo para conjuntos de dados com centenas de pessoas e centenas de marcadores.
5
Haploview: análise e visualização de mapas e LD haplótipos 2012
Características de Haploview
Haploview permite carregar informação em vários formatos, sendo compatível
com quaisquer formatos de dados provenientes do projecto HapMap, no qual permite
uma ligação directa de leitura da base de dados. Dados pedigree carregados permite
ler informação de cromossomas em diferentes estados, especificar informação
estrutural de cada família e ainda permite comparação de doenças com casos controle.
A informação dos marcadores pode ser carregada com o nome ou localização, mas
estes são carregadas separadamente.
Contem um navegador gráfico para visualização do genoma em que possibilita
aos utilizadores uma navegação localizada numa região específica escolhidas por eles,
mostrando todos os marcadores presentes nessa região. Os marcadores dessa região
tem que estar de acordo com o equilíbrio de Hardy-Weinberg, registo de erros da
herança mendeliana e percentagem de indivíduos genotipados para esse marcador. Só
os marcadores de interesse é que são filtrados pelo próprio programa, mas o utilizador
pode ajustar os limites dependendo da sua pesquisa, adicionando ou eliminando
marcadores. Todas as alterações feitas alteram de uma forma imediata análise em
curso.
6
Haploview: análise e visualização de mapas e LD haplótipos 2012
Figura 1 – Exemplo do ecrã do software HaploView [1]
O Haploview calcula ainda várias medidas para pares de LD que usa para criar
uma representação gráfica como demonstra do na figura acima. Utilizador pode ainda
usar um esquema de cores para identificar as diferentes relações LD. A medida que
analise está a decorrer este mostra as variáveis e a taxa de recombinação
(esquerda/cima). A direita está informação sobre haplótipos da região seleccionada.
Estes haplótipos são gerados depois da selecção de marcadores escolhidos de forma
automática ou manual, ainda gera as suas frequências populacionais.
A figura mais a direita ainda mostra a representação em blocos, em que as
linhas representam a transição entre blocos e espessura indica o grau de LD. A
personalização está novamente presente, podendo exibir alelos como letras, números
ou caixas coloridas. Haploview pode ainda calcular estatísticas TDT e X2
(caso/controlo), para cada marcador. Haploview é organizado em vários tab,
permitindo ao utilizador analisar os dados em tempo real. As informações de cada
janela podem ainda ser convertida para um arquivo PNG, podendo ser utilizado em
apresentações, publicações ou ficheiros texto. O programa pode ainda ser manipulado
através de uma linha de comandos, que permite ao utilizador executar todas as
análises sem abrir a interface gráfica.
7
Haploview: análise e visualização de mapas e LD haplótipos 2012
As versões futuras incluirão vários haplótipos-tag métodos de selecção de SNP,
bem como haplótipos baseados em testes de associação e de avaliação de significância
usando o teste de permutação. Estas características finais vão permitir que o utilizador
a partir de dados do genótipo explore associações genéticas através de um software
de fácil utilização.
Este software é escrito numa linguagem java no qual permite assim que
qualquer plataforma que possua pelo menos java 1.3 pode correr esta aplicação. Neste
artigo é referente a versão 2.05 de Abril de 2004, o Haploview podia ser exibido um
conjunto de dados com 200 marcadores genotipados em 400 indivíduos e ajustar
parâmetros sem nenhum atraso perceptível. O programa também permite o uso da
linha de comandos para fazer cálculos LD em conjuntos de dados muito grandes, em
quantidades pequenas de tempo.
8
Haploview: análise e visualização de mapas e LD haplótipos 2012
Versões de Haploview
Como se trata de um artigo de Abril de 2004, com o passado dos anos foram
sendo lançadas novas versões deste software, aqui vai-se listar todas as versões
lançadas e suas melhorias.
Versão 3.0 (Outubro de 2004) [2]
 Bugfixes for block size display, checkdata tab, allele sorting, EM missing
data.
 Added compressed PNG output mode.
 Lots of new command line options.
 Changed batch mode input format.
 Re-sort out of order info files.
 Substantial improvement in speed and memory usage in EM.
 New color schemes.
 Added additional sample information for 2nd and 3rd HapMap plate.
 Fixed handling of complex pedigrees.
 Added proportional spacing to LD display.
 Added HapMap GBrowse track.
 Filter individuals with lots of missing genotypes.
 Haplotype association tests.
 Update checker.
Versão 3.1 (Janeiro de 2005) [2]
 Additional HapMap info track display options.
 Improved parsing of complex pedigrees.
 Fixed bug with loading of haps style input files.
 Fixed bug with correctly parsing out-of-order info files.
 Fixed problem with association tests on datasets with no blocks.
 Fixed bug with exporting range of markers to LD PNG.
9
Haploview: análise e visualização de mapas e LD haplótipos 2012
Versão 3.2 (Abril de 2005) [2]
 added Tagger interface
 added custom association test input
 added permutation testing of association results
 improved memory efficiency for EM haplotype reconstruction
 added Perlegen sample Ids
 fixed bug in PNG export cutting off final marker
Versao 3.3 (Maio de 2006) [2]
 support for X chromosome
 major memory usage improvements
 allow multiple analysis tracks and label Y axis
 added user defined hapmap sample option
 added haplotypes only permutation option
 added option to show different LD measures or hide them
 added -memory switch and changed default to 512M
 added minor allele to check panel
 added progress bar for data loading
 support for alphabetical (ACGT) input format
 added individual information dialog
 added check panel for phased haps files
 added dump tags button
 last popup dialog is shown at top of display
 added GOLD style color scheme
 can sort tables by clicking on headers
 changed case control allele order
Versão 4.0 (Agosto de 2007) [2]
10
Haploview: análise e visualização de mapas e LD haplótipos 2012
 dded support for HapMap PHASE format data
 added support for phased HapMap downloads
 added support for PLINK output files including plotting functionality
 added a number of Tagger features to coincide with the Tagger website
functionality
 added 2-marker aggressive tagging from the command line
 added log file functionality to command line mode
 added proxy support
 added table sorting to Tagger configuration
 added numerous minor display and interface tweaks
 added export options for Mendel errors and male heterozygotes on x
chromosome
 added command line HapMap info track download
 added case control frequencies to command line association output
 added ld values selection to command line image export
 added citation information to the "About" dialog
 added "Uncapture All" button to Tagger
 added build 36 option to HapMap info track downloads
 added http:// loading for files on the command line and initial load screen
 changed some labelling in Tagger and made pairwise the default option
 changed obsHet calculation to use founders only
 changed HW and het calculations to show as "NA" in X data with too few
individuals
 enhanced GUI design with tabbed pane for initial loading dialog
Versão 4.1 (Abril de 2008) [2]
11
Haploview: análise e visualização de mapas e LD haplótipos 2012
 added support for GeneCruiser lookup
 added support for HapMap release 22
 added -out fileroot specification to the command line
 added consecutive filtering to PLINK with view/add/remove filters
 added SVG output for LD plot and haplotype blocks display
 added min design scores to Tagger in GUI and command line
 added reset thresholds button to Tagger
 added exclude A/T and C/G SNPs button to Tagger
 upgraded graphing packages to latest version
 changed load screen dialog tab orientation for Mac OSX
 fixed bug with LD display pop-up on certain systems
 fixed bug with HapMap info track caching
 fixed bug on LD Display with MAF of .5
 fixed bug where setting tagger cutoff fields to blank would generate exceptions
 fixed bug with PLINK View Filters dialog
 fixed bug with PLINK file column number mismatches
Versão 4.2 (Em Setembro de 2009) [2]
 added support for Phase 3 HapMap
 added support for the latest version of GeneCruiser
 added GeneCruiser lookup to Region Dialog in PLINK tab
 added search as you type and prune table to PLINK results
 added "-v/-version" to option to the command line
 changed tab orientation for initial load screen on Mac OSX
 disabled Genecruiser for non HG18 Hapmap Releases
Actualmente este software encontra-se em modo de “congelamento” estando
a espera que alguém através de mais investigação consiga trazer melhorias futuras de
forma a conseguir-se obter resultados cada vez mais eficientes.
Conclusão
12
Haploview: análise e visualização de mapas e LD haplótipos 2012
Haploview consistiu uma óptima ferramenta para a pesquisa dos investigadores
na área da genômica, no qual permite uma pesquisa fácil e rápida e ainda apresenta
uma série de informações e cálculos estatísticos. Permite ainda ao utilizador
personalizar o aspecto visual facilitando a leitura de dados. Sendo assim um software
open source, intuitivo e user-friendly.
Referências
13
Haploview: análise e visualização de mapas e LD haplótipos 2012
Fonte do artigo: http://bioinformatics.oxfordjournals.org/content/21/2/263.abstract
[1 ] - http://bioinformatics.oxfordjournals.org/content/21/2/263/F1.large.jpg
[2]
-
http://www.broadinstitute.org/science/programs/medical-and-population-
genetics/haploview/version-history
Diversas fontes:
http://pt.wikipedia.org/wiki/Alelo
http://es.wikipedia.org/wiki/Haplotipo
http://hapmap.ncbi.nlm.nih.gov/
http://www.broadinstitute.org/scientific-community/science/programs/medical-andpopulation-genetics/haploview/haploview
http://www.broadinstitute.org/science/programs/medical-and-populationgenetics/program-medical-and-population-genetics
14
Download

Carlos Rodrigues