BTC 510028 - Biologia Molecular e Métodos Analíticos Carine Moreira Avaliador: Abadio de Oliveira da Costa Problemática Polimorfismos em sequências de mRNA marcados – Afeta afinidade de sondas de Microarray RESULTADOS FALSO-POSITIVO E FALSO NEGATIVO EM ESTUDOS DE QTL QTL – Quantitative trait locus Locus controladores da expressão gênica REGIÃO AO LONGO DO CROMOSSOMO RESPONSÁVEIS PELA EXPRESSÃO DE CARACTERÍSTICAS QUANTITATIVAS Características quantitativas: Reguladas por vários genes + fatores ambientais Agropecuária Processos de seleção para melhoramento genético FENÓTIPO DE INTERESSE ECONÔMICO Relação - Microarray X QTL Análise do padrão de expressão em larga escala Chip com perfil de expressão Spots/probes QTL mapeados – análise do perfil de hibridização Identificação de QTL Estudo QTL – dados do scanner do microarray Conhecimento prévio de mapeamento de QTL DESVANTAGENS Custo elevado – desenvolvimento de população experimental (F2); Marcadores moleculares que cubram todo o genoma; Estudo da herdabilidade da característica em estudo; Região cromossômica que possivelmente contêm os genes de interesse – não define número e nem efeitos exatos desses genes sobre a característica quantitativa; Microarrays – Polimorfismos em sondas Desenho de sondas a partir de uma única referência; = ≠ Ø Resultados confusos de eQTL Sinais falso-positivo e falso-negativo Informação incompleta de referência de localização de SNPs Avaliar de uma forma detalhada o problema de polimorfismo em sondas; ESTRATÉGIAS 1. 1000 Genomes (Março 2012) Identificação e remoção de sinais suspeitos de QTL NHLBI Exome Sequencing Project 2. Investigação sistemática do efeito no protocolo de remoção de sinal QTL; 3. Avaliar uma solução para o problema – construindo uma manual e um website para usuários de como identificar sondas que podem conter polimorfismos; Pesquisa de dados → Perfil de expressão e genótipo CRBL – Cerebelo humano FCTX – cortex frontal INDIVÍDUOS NORMAIS Illumina HT12 Perfil de expressão de cérebro de 304 indivíduos Norte Americanos (NABEC) Affymetrix Human Exon Perfil de expressão de cérebro de 134 indivíduos do Reino Unido (UKBEC) Illumina HT12 - Sondas 50 oligonucleotídeos (50-mer) - 48000 sondas - Alto rendimento - Custo efetivo - Ideal para estudos de eQTL Affymetrix Human Exon - Sondas 25 oligonucleotídeos (25-mer) Análise da expressão de QTL e Identificação de sinal LD-resolved → LD – linkage desequilibrium - se dois genes estão em desequilíbrio de ligação, isto significa que determinados alelos de cada gene são herdados em conjunto mais frequentemente do que seria esperado por acaso. Isto pode ser devido à ligação genética real - isto é os genes estão estreitamente localizado no mesmo cromossomo, ou pode ser também devido a alguma forma de interação funcional, onde algumas combinações de alelos em dois loci Software MatrixEQTL R – Estatística computational Pesquisa de dados de referência de polimorfismos e Identificação de sondas contendo polimorfismos → Suspect-cis-eQTL – cis-eQTL: sonda contendo polimorfismo com frequência alélica maior que 1% em Europeus; Conjunto de dados de referência e diferentes variações genéticas - SNPs – Illumina HumanHap550 (NABEC) Illumina Omni-1 M Quad (UKBEC) Painel CEU de HapMap 1000 Genome Project Servidor variantes de exons – NHLBI-ESP Sondas Affymetrix → Conjunto de quatro sondas Probe masking 1. Se uma das 4 sondas contêm polimorfismo e a outras não – a análise foi feita nas 3 – Denominação: Sonda alterada 2. Se mais de uma sonda contêm polimorfismo – Denominação: Sonda descartada Através dessa metodologia tanto resultados falso-positivo quanto falso-negativo podem ser recuperados Proporção de sondas contendo polimorfismos na sequência Uso diferentes dados de referência para determinar o polimorfismo na sonda; Porcentagem de sondas com polimorfismos é proporcional a quantidade de dados do chip; Porcentagem de sondas alteradas – aumenta de acordo com o aumento de dados dos bancos de referência; * * * Número de SNPs * Banco de dados Proporção de LD-resolved cis-acting eQTL a partir de sondas com polimorfismo na sequência Sinais LD suspeitos – porque estão associados a sondas que contêm polimorfismos; Maior que a proporção de sondas que contêm polimorfismo; Affymetrix Human Exon – mais afetado (55-65%); A presença de polimorfismo em uma sequência longa (Illumina) tem efeito menos pronunciado na afinidade de ligação do que na sequência curta; Abordagem para lidar com os supects cis-eQTL a partir de sondas descartadas Affymetrix Exon – 4 sondas constituintes: Exclui uma que tem polimorfismo, avalia as três (P-value). Se mais de uma contêm polimorfismo – descarta a sonda; Recupera dois terços das sondas que contêm polimorfismos (sondas alteradas) Sondas Illumina??? Probe masking Três alternativas 1. Remover todos os cis-eQTL 2. Aplicar análise de associação condicional; 3. Aplicar LD-filtering; Análise de associação condicional – requer conhecimento da sequência da sonda polimórfica – sequenciamento – trabalhoso e caro; < 6% de cis-eQTL resgatados (Affymetrix e Illumina) LD-filtering: resgata 80% de cis-eQTL – mas resgata falso ciseQTL – independente do R² aplicado NÃO É RECOMENDADO Exemplo de falso-positivo e falso-negativo devido a polimorfismo em sonda – Dois genes MAPT – Associado a doenças neurodegenerativas PRICKLE1 – Associado a epilepsia progressiva Falso-positivo Affymetrix Human Exon Falso-negativo Falso-positivo Illumina HT12 Pequena proporção de sequências contendo polimorfismo – aumenta o número de sinais cis-eQTL – afeta diretamente o evalue que define significância; Aumento de banco de dados – mais SNPs conhecidos – Mais sondas são avaliadas e identificados os possíveis polimorfismos; Tecnologia para análise de expressão – RNA-seq Polimorfismos em sondas continuará sendo importante; Microarray – baixo custo; – Dados de eQTLs baseado em Microarray – recomenda-se reavaliar as sondas para identificar polimorfismos; Principalmente base de dados de grande porte: Phenotype-Genotype Integrator eQTLbrowser seeQTL SNPexpress GeneVar Ideal – Base de dados com identificação automática de QTL suspeitos; SOLUÇÃO: Desenvolvimento de um website: https://caprica.genetics.kcl.ac.uk/~ilori/pipfinder.php https://caprica.genetics.kcl.ac.uk/~ilori/pipfinder.php RESULTADOS DE MODO GERAL Prevenção na análise e interpretação de eQTLs Identificando o problema, este pode ser resolvido;