BTC 510028 - Biologia Molecular e Métodos Analíticos
Carine Moreira
Avaliador: Abadio de Oliveira da Costa
 Problemática
Polimorfismos em sequências de mRNA marcados – Afeta
afinidade de sondas de Microarray
RESULTADOS FALSO-POSITIVO E FALSO NEGATIVO EM
ESTUDOS DE QTL
QTL – Quantitative trait locus
Locus controladores da expressão gênica
REGIÃO AO LONGO DO CROMOSSOMO RESPONSÁVEIS
PELA EXPRESSÃO DE CARACTERÍSTICAS
QUANTITATIVAS
 Características quantitativas:
Reguladas por vários genes + fatores
ambientais
 Agropecuária
 Processos de seleção para
melhoramento genético
FENÓTIPO DE INTERESSE
ECONÔMICO
Relação - Microarray X QTL
 Análise do padrão de
expressão em larga
escala
 Chip com perfil de
expressão
Spots/probes
QTL mapeados – análise do perfil de hibridização
Identificação de QTL
 Estudo QTL – dados do scanner do microarray
 Conhecimento prévio de mapeamento de QTL
DESVANTAGENS
 Custo elevado – desenvolvimento de população experimental (F2);
 Marcadores moleculares que cubram todo o genoma;
 Estudo da herdabilidade da característica em estudo;
Região cromossômica que possivelmente contêm os genes de interesse
– não define número e nem efeitos exatos desses genes sobre a
característica quantitativa;
 Microarrays – Polimorfismos em sondas
 Desenho de sondas a partir de uma única referência;
= ≠
Ø
Resultados confusos de eQTL
Sinais falso-positivo e falso-negativo
Informação incompleta de referência de localização de SNPs
 Avaliar de uma forma detalhada o problema de polimorfismo em
sondas;
ESTRATÉGIAS
1. 1000 Genomes (Março 2012)
Identificação e remoção
de sinais suspeitos de
QTL
NHLBI Exome Sequencing Project
2. Investigação sistemática do efeito no protocolo de remoção de sinal QTL;
3. Avaliar uma solução para o problema – construindo uma manual e um
website para usuários de como identificar sondas que podem conter
polimorfismos;
Pesquisa de dados → Perfil de expressão e genótipo
CRBL – Cerebelo humano
FCTX – cortex frontal
INDIVÍDUOS NORMAIS
Illumina HT12
Perfil de expressão de cérebro de 304 indivíduos Norte Americanos
(NABEC)
Affymetrix Human Exon
Perfil de expressão de cérebro de 134 indivíduos do Reino Unido
(UKBEC)
Illumina HT12
- Sondas 50 oligonucleotídeos (50-mer)
- 48000 sondas
- Alto rendimento
- Custo efetivo
- Ideal para estudos de eQTL
Affymetrix Human Exon
- Sondas 25 oligonucleotídeos (25-mer)
Análise da expressão de QTL e Identificação de sinal LD-resolved →
LD – linkage desequilibrium - se dois genes estão em desequilíbrio de
ligação, isto significa que determinados alelos de cada gene são herdados em
conjunto mais frequentemente do que seria esperado por acaso. Isto pode ser
devido à ligação genética real - isto é os genes estão estreitamente localizado
no mesmo cromossomo, ou pode ser também devido a alguma forma de
interação funcional, onde algumas combinações de alelos em dois loci
 Software MatrixEQTL
 R – Estatística computational
Pesquisa de dados de referência de polimorfismos e Identificação de
sondas contendo polimorfismos →
 Suspect-cis-eQTL – cis-eQTL: sonda contendo polimorfismo com
frequência alélica maior que 1% em Europeus;
 Conjunto de dados de referência e diferentes variações genéticas -
SNPs
 – Illumina HumanHap550 (NABEC)
 Illumina Omni-1 M Quad (UKBEC)
 Painel CEU de HapMap
 1000 Genome Project
 Servidor variantes de exons – NHLBI-ESP
Sondas Affymetrix → Conjunto de quatro sondas
Probe masking
1. Se uma das 4 sondas contêm polimorfismo e a outras não – a análise
foi feita nas 3 – Denominação: Sonda alterada
2. Se mais de uma sonda contêm polimorfismo – Denominação: Sonda
descartada
 Através dessa metodologia tanto resultados falso-positivo quanto falso-negativo
podem ser recuperados
Proporção de sondas contendo polimorfismos na sequência

Uso diferentes dados de referência para determinar o polimorfismo na sonda;

Porcentagem de sondas com polimorfismos é proporcional a quantidade de dados do
chip;

Porcentagem de sondas alteradas – aumenta de acordo com o aumento de dados dos
bancos de referência;
*
*
* Número de SNPs
* Banco de dados
Proporção de LD-resolved cis-acting eQTL a partir de sondas com
polimorfismo na sequência
 Sinais LD suspeitos – porque estão associados a sondas que contêm
polimorfismos;
 Maior que a proporção de sondas que contêm polimorfismo;
Affymetrix Human Exon – mais afetado (55-65%);
A presença de polimorfismo em uma sequência longa (Illumina) tem efeito menos
pronunciado na afinidade de ligação do que na sequência curta;
Abordagem para lidar com os supects cis-eQTL a partir de sondas
descartadas
 Affymetrix Exon – 4 sondas constituintes: Exclui uma que tem
polimorfismo, avalia as três (P-value). Se mais de uma contêm
polimorfismo – descarta a sonda;
 Recupera dois terços das sondas que contêm polimorfismos (sondas alteradas)
Sondas Illumina???
Probe masking
Três alternativas
1. Remover todos os cis-eQTL
2. Aplicar análise de associação
condicional;
3. Aplicar LD-filtering;
 Análise de associação condicional – requer conhecimento da
sequência da sonda polimórfica – sequenciamento – trabalhoso e
caro;
 < 6% de cis-eQTL resgatados (Affymetrix e Illumina)
 LD-filtering: resgata 80% de cis-eQTL – mas resgata falso ciseQTL – independente do R² aplicado
 NÃO É RECOMENDADO
Exemplo de falso-positivo e falso-negativo devido a
polimorfismo em sonda – Dois genes
 MAPT – Associado a doenças neurodegenerativas
 PRICKLE1 – Associado a epilepsia progressiva
Falso-positivo
Affymetrix Human Exon
Falso-negativo
Falso-positivo
Illumina HT12
 Pequena proporção de sequências contendo polimorfismo –
aumenta o número de sinais cis-eQTL – afeta diretamente o evalue que define significância;
 Aumento de banco de dados – mais SNPs conhecidos – Mais
sondas
são
avaliadas
e
identificados
os
possíveis
polimorfismos;
 Tecnologia
para
análise
de
expressão
–
RNA-seq
Polimorfismos em sondas continuará sendo importante;
 Microarray – baixo custo;
–
 Dados de eQTLs baseado em Microarray – recomenda-se
reavaliar as sondas para identificar polimorfismos;
 Principalmente base de dados de grande porte: Phenotype-Genotype Integrator
eQTLbrowser
seeQTL
SNPexpress
GeneVar
 Ideal – Base de dados com identificação automática de QTL suspeitos;
 SOLUÇÃO: Desenvolvimento de um website:
https://caprica.genetics.kcl.ac.uk/~ilori/pipfinder.php
https://caprica.genetics.kcl.ac.uk/~ilori/pipfinder.php
RESULTADOS DE MODO GERAL
 Prevenção na análise e interpretação de eQTLs
 Identificando o problema, este pode ser resolvido;
Download

Slides Seminário