Descoberta de novos genes no
genoma de Saccharomyces
cerevisiae
Enio Felipe da Rocha
Vinicio Tavares de Melo Costa da Silva
S. Cerevisiae Genome Project
• Fungos unicelulares
• Primeiro genoma eucariota completamente
sequenciado (1996)
– DNA cromossômico: 12,07 mb
– Apenas 3,8% dos ORFs contém introns.
– Cerca de 5.400 genes codificam proteínas com
mais de cem aminoácidos
Falhas na anotação inicial
• Não foram levados em conta os ncRNA
• Os métodos aplicados subestimaram o
número de genes.
– Alguns genes são transcritos em ncRNAs
– Desde 1997 já sabia-se que existiriam smORFs
que não foram anotados originalmente.
Homologia
Objetivos
• Análise comparativa do genoma de S.
Cerevisiae para identificar novos ORFs não
encontrados anteriormente
• Validar este método para que ele possa ser
usado na atualização da anotação de outros
genomas já seqüenciados.
Metodologia
• Partir da seqüência genômica original
• Remover todos ORFs identificados
originalmente
• Usando o resultado do passo anterior (3,45
mb) encontrar todos os stop-to-stop ORFs
com mais de 18 códons.
– Baseado no número de códons dos genes de E.
Coli
Metodologia
• Comparação dos resultados (140.000
possíveis genes) com um banco de dados de
seqüências contendo genes de todo o reino
fungi mais outros organismos selecionados
• Cutoff de p < 10-4
• Com essa busca foram encontrados 1.057
possíveis ORFs com homólogos no banco de
dados
Metodologia
• A partir desses resultados retirou-se todos os
genes que já tinham sido anotados depois de
1997.
• Descartou-se também os genes que
sobrepunham-se com rRNAs, tRNAs, etc.
• Produto = 558 smORFs em regiões antes
consideradas intergênicas
– Tamanho dos ORFs variam de 18 a 190 códons
Metodologia
Resultados
• Escolha de 117 smORFs para validação
• Verificação da expressão destes ORFs em
organismos
• Primers construídos para a amplificação de
três smORFs e de ACT1.
– Uso de PCR
– Sucesso na amplificação destes genes.
Polymerase Chain Reaction
Resultados
• Verificação da expressão destes genes
– RT-PCR
– Produto para os quatro ORFs foram encontrados
– Garantia de que estes smORFs são expressos nas
células
• Ampliação deste estudo para os outros 114
smORFs
– Achou-se mRNAs para 81 smORFs
– smORF 68 tinha sido retirado do SGD
Resultados
• Apenas 1 smORF foi encontrado mais de uma
vez
– Ele está incluído nos smORFs para os quais não foi
encontrado produto depois da RT-PCR
• Possibilidade de read through?
– A RNA polimerase não se desacopla da fita de
DNA e sintetiza RNA mesmo depois do stop códon
Resultados
• Mediu-se o tamanho dos transcritos de smORF2 e
smORF31 (Northern analysis)
– Ambos os ORFs apresentaram tamanho de 460nt
•
•
•
•
Região traduzida = 250 nt
Região não-traduzida 5’ = 20-30 nt
Região não-traduzida 3’ = 100 nt
Cauda Poli-A = 100 nt
• Forte indício de que não se trata de read through já
que o gene “anterior” a smORF2 está a 1700 nt
upstream
– A transcrição deste gene é originada no seu promotor.
Resultados
• Caracterização de smORF2
– A proteína codificada por este gene está presente
em muitos organismos, até mesmo humanos
• Nos humanos este ORF está presente em 2 loci
– Detecção da proteína codificada
• Marcação do gene (HA inserido no final do gene)
• Resultados experimentais confirmam que o gene
smORF2 realmente codifica uma proteína produzida
• smORF2p é essencial para o organismo?
Resultados
Presença de smORF2 em várias espécies de diferentes
reinos
Resultados
• Vetores sem este gene foram incapazes de
crescer com temperaturas de 37o C
Análise
• Criação de novo método para a identificação
de genes em genomas já seqüenciados
• Método simples acelerará a anotação destes
genomas
– ORFs que não tenham homólogos em outras
espécies (orfãos) não serão encontrados
Referências
•
•
•
•
Kessler, M.M., Zeng, Q., Hogan, S., Cook, R., Morales, A.J., Cottarel, G.
2003. Systematic Discovery of new genes in Saccharomyces cerevisiae
genome. Genome Research 13: 264-271.
Andrade, M.A., Daruvar, A., Casari, G., Schneider, R., Termier, M., and
Sander, C. 1997. Characterization of new proteins found by analysis of
short open reading frames from the full yeast genome. Yeast 13:
1363–1374.
Goffeau, A. 2000. Four years of post-genomic life with 6000 yeast
genes. Federation of European Biochemical Societies 480: 37-41.
Cliften, P.F., Hillier, L.W., Fulton, L., Graves, T., Miner, T., Gish,W.R.,
Waterston, R.H., and Johnston, M. 2001. Surveying Saccharomyces
genomes to identify functional elements bycomparative DNA sequence
analysis. Genome Res. 11: 1175–1186.
Referências
•
•
•
Johnston, M. 2000. The yeast genome: on the road to the golden age.
Current Opinion in Genetics & Development 10: 617-623
Kumar, A., Harrison, P.M., Cheung, K.H., Lan, N., Echols, N.,Bertone, P.,
Miller, P., Gerstein, M.B., and Snyder, M. 2002. An integrated approach
for finding overlooked genes in yeast. Nat.Biotechnol. 20: 58–63.
Olivas, W.M., Muhlrad, D., and Parker, R. 1997. Analysis of the yeast
genome: Identification of new noncoding and small ORF-containing
RNAs. Nucleic Acids Res. 25: 4619–4625.
Download

Seminário New Genes in Yeast