Descoberta de novos genes no genoma de Saccharomyces cerevisiae Enio Felipe da Rocha Vinicio Tavares de Melo Costa da Silva S. Cerevisiae Genome Project • Fungos unicelulares • Primeiro genoma eucariota completamente sequenciado (1996) – DNA cromossômico: 12,07 mb – Apenas 3,8% dos ORFs contém introns. – Cerca de 5.400 genes codificam proteínas com mais de cem aminoácidos Falhas na anotação inicial • Não foram levados em conta os ncRNA • Os métodos aplicados subestimaram o número de genes. – Alguns genes são transcritos em ncRNAs – Desde 1997 já sabia-se que existiriam smORFs que não foram anotados originalmente. Homologia Objetivos • Análise comparativa do genoma de S. Cerevisiae para identificar novos ORFs não encontrados anteriormente • Validar este método para que ele possa ser usado na atualização da anotação de outros genomas já seqüenciados. Metodologia • Partir da seqüência genômica original • Remover todos ORFs identificados originalmente • Usando o resultado do passo anterior (3,45 mb) encontrar todos os stop-to-stop ORFs com mais de 18 códons. – Baseado no número de códons dos genes de E. Coli Metodologia • Comparação dos resultados (140.000 possíveis genes) com um banco de dados de seqüências contendo genes de todo o reino fungi mais outros organismos selecionados • Cutoff de p < 10-4 • Com essa busca foram encontrados 1.057 possíveis ORFs com homólogos no banco de dados Metodologia • A partir desses resultados retirou-se todos os genes que já tinham sido anotados depois de 1997. • Descartou-se também os genes que sobrepunham-se com rRNAs, tRNAs, etc. • Produto = 558 smORFs em regiões antes consideradas intergênicas – Tamanho dos ORFs variam de 18 a 190 códons Metodologia Resultados • Escolha de 117 smORFs para validação • Verificação da expressão destes ORFs em organismos • Primers construídos para a amplificação de três smORFs e de ACT1. – Uso de PCR – Sucesso na amplificação destes genes. Polymerase Chain Reaction Resultados • Verificação da expressão destes genes – RT-PCR – Produto para os quatro ORFs foram encontrados – Garantia de que estes smORFs são expressos nas células • Ampliação deste estudo para os outros 114 smORFs – Achou-se mRNAs para 81 smORFs – smORF 68 tinha sido retirado do SGD Resultados • Apenas 1 smORF foi encontrado mais de uma vez – Ele está incluído nos smORFs para os quais não foi encontrado produto depois da RT-PCR • Possibilidade de read through? – A RNA polimerase não se desacopla da fita de DNA e sintetiza RNA mesmo depois do stop códon Resultados • Mediu-se o tamanho dos transcritos de smORF2 e smORF31 (Northern analysis) – Ambos os ORFs apresentaram tamanho de 460nt • • • • Região traduzida = 250 nt Região não-traduzida 5’ = 20-30 nt Região não-traduzida 3’ = 100 nt Cauda Poli-A = 100 nt • Forte indício de que não se trata de read through já que o gene “anterior” a smORF2 está a 1700 nt upstream – A transcrição deste gene é originada no seu promotor. Resultados • Caracterização de smORF2 – A proteína codificada por este gene está presente em muitos organismos, até mesmo humanos • Nos humanos este ORF está presente em 2 loci – Detecção da proteína codificada • Marcação do gene (HA inserido no final do gene) • Resultados experimentais confirmam que o gene smORF2 realmente codifica uma proteína produzida • smORF2p é essencial para o organismo? Resultados Presença de smORF2 em várias espécies de diferentes reinos Resultados • Vetores sem este gene foram incapazes de crescer com temperaturas de 37o C Análise • Criação de novo método para a identificação de genes em genomas já seqüenciados • Método simples acelerará a anotação destes genomas – ORFs que não tenham homólogos em outras espécies (orfãos) não serão encontrados Referências • • • • Kessler, M.M., Zeng, Q., Hogan, S., Cook, R., Morales, A.J., Cottarel, G. 2003. Systematic Discovery of new genes in Saccharomyces cerevisiae genome. Genome Research 13: 264-271. Andrade, M.A., Daruvar, A., Casari, G., Schneider, R., Termier, M., and Sander, C. 1997. Characterization of new proteins found by analysis of short open reading frames from the full yeast genome. Yeast 13: 1363–1374. Goffeau, A. 2000. Four years of post-genomic life with 6000 yeast genes. Federation of European Biochemical Societies 480: 37-41. Cliften, P.F., Hillier, L.W., Fulton, L., Graves, T., Miner, T., Gish,W.R., Waterston, R.H., and Johnston, M. 2001. Surveying Saccharomyces genomes to identify functional elements bycomparative DNA sequence analysis. Genome Res. 11: 1175–1186. Referências • • • Johnston, M. 2000. The yeast genome: on the road to the golden age. Current Opinion in Genetics & Development 10: 617-623 Kumar, A., Harrison, P.M., Cheung, K.H., Lan, N., Echols, N.,Bertone, P., Miller, P., Gerstein, M.B., and Snyder, M. 2002. An integrated approach for finding overlooked genes in yeast. Nat.Biotechnol. 20: 58–63. Olivas, W.M., Muhlrad, D., and Parker, R. 1997. Analysis of the yeast genome: Identification of new noncoding and small ORF-containing RNAs. Nucleic Acids Res. 25: 4619–4625.