Original Article REDE MINEIRA DE SEQÜENCIAMENTO: O ESTUDO DO TRANSCRIPTOMA DO PARASITA SCHISTOSOMA MANSONI MINAS GERAIS SEQUENCING NETWORK: THE STUDY OF THE PARASITE SCHISTOSOMA MANSONI TRANSCRIPTOME Glória Regina FRANCO1; Francisco PROSDOCIMI2; Alessandra C. FARIA-CAMPOS1; José Miguel ORTEGA1 RESUMO: Schistosoma mansoni é o principal agente etiológico da esquistossomose, uma doença tropical com grande significado em saúde pública nos países em desenvolvimento. Na tentativa de melhor entender a biologia e metabolismo desse parasita, um novo enfoque tem sido utilizado, o qual se baseia em sequenciamento em larga escala e bioinformática. Em 1992, teve início o primeiro projeto brasileiro de descoberta gênica em S. mansoni baseado na geração e caracterização das Etiquetas de Sequências Transcritas (ESTs). Em 2001, dois grandes projetos transcriptoma foram iniciados para este parasita, sendo um deles executado pela rede ONSA em São Paulo e o outro pela Rede Genoma de Sequenciamento de Minas Gerais. Este último tem como objetivo o estudo do genoma expresso do S. mansoni, visando o conhecimento da sua estrutura e mecanismos de controle de expressão gênica, o que se traduz em informação de relevância biológica. Até o momento já foram geradas 58.205 ESTs a partir de bibliotecas das várias fases do ciclo de vida do parasita. Estas ESTs foram submetidas à análise bioinformática, classificadas em categorias funcionais e alguns clones de cDNA, contendo a região codificadora completa, foram escolhidos para sequenciamento direcionado. A estratégia aplicada já permitiu selecionar 3.782 clones, os quais representam 487 proteínas completas diferentes. A utilização prevista de mais proteínas modelo e o progresso do seqüenciamento pressupõem uma importante contribuição à caracterização do proteoma do parasita. UNITERMOS: Schistosoma mansoni, EST, transcriptoma, bioinformatica. INTRODUÇÃO Membros do gênero Schistosoma, Filo Platelminto, classe Trematoda, consistem de vermes de corpo achatado, sendo os agentes etiológicos da esquistossomose, uma doença tropical com grande significado em saúde pública nos países em desenvolvimento. Schistosoma mansoni é o principal agente causador desta parasitose na America do Sul (http://www.who.int/ctd/schisto/epidemio.htm). Apesar dos esforços para controlar essa endemia, a esquistossomose permanece como a maior causa de morbidade em 76 países (ENGELS et al., 2002). Assim, a partir de 1993 a Organização Mundial da Saúde determinou que o estudo da genômica do parasita seria a única forma de se obter informação que pudesse ser revertida em novas ferramentas de controle da doença (EL-SAYED et al., 2004). O estudo da genômica de parasitas reveste-se assim de grande importância para o entendimento da biologia e 1 2 metabolismo destes organismos e também para a busca de bons candidatos para o diagnóstico, a produção de vacinas e principalmente alvos para novas drogas (DEGRAVE et al., 2001). O S. mansoni é um organismo diplóide, contendo 7 pares de autossomos e um par de cromossomos sexuais. O sexo homogamético é o macho (ZZ) enquanto o heterogamético é a fêmea (ZW) (SHORT & GROSSMAN, 1981; SHORT, 1983). O tamanho do seu genoma haplóide compreende 2,7x108 pb, constituído de um conteúdo de A+T bastante elevado (66%) (HILLYER, 1974). O índice deste conteúdo varia dependendo se o DNA é de região codificadora (60%), ficando em torno de 70% na região não codificadora (MEADOWS & SIMPSON, 1989; MILHON & TRACY, 1995). Com base no tamanho do seu genoma e posição evolutiva, calculase que o S. mansoni contenha de 15.000 a 20.000 genes expressos (ALI et al., 1991). Departamento de Bioquímica e Imunologia, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais. Programa de Doutorado em Bioinformática, Departamento de Biologia Geral, Instituto de Ciências Biológicas, Universidade Federal de Minas Gerais. Biosci. J., Uberlândia, v. 20, Especial, p. 93-100. 2004 93 Rede mineira de seqüenciamento... Um projeto de descoberta gênica em S. mansoni foi iniciado em 1992 por um esforço conjunto do Dr. Sérgio Pena (Depto. de Bioquímica e Imunologia do Instituto de Ciências Biológicas da Universidade Federal de Minas Gerais - ICB UFMG) e do Dr. Andrew Simpson (então chefe do Laboratório de Biologia Molecular do Centro de Pesquisas René Rachou da Fundação Oswaldo Cruz CPqRR, FIOCRUZ), ambos em Belo Horizonte. Na sua primeira fase, o Projeto Genoma de Schistosoma mansoni contou com o importante apoio logístico do Dr. Craig Venter (então Diretor do The Institute for Genomic Research TIGR, em Rockville, MD, Estados Unidos). A FAPEMIG financiou a aquisição de um sequenciador automático fluorescente ALF, que foi o primeiro da América Latina. Posteriormente, foi conseguido um apoio mais substancial do PADCT com um projeto coordenado pelo Dr. Sérgio Pena. Para o seqüenciamento de toda a porção expressa do genoma de S. mansoni, seria necessário adotar uma técnica que fosse ao mesmo tempo eficiente e rápida. A estratégia básica utilizada envolveu o seqüenciamento em um único passo de clones de cDNA selecionados aleatoriamente de diferentes bibliotecas, para a obtenção das Etiquetas de Sequências Transcritas (ESTs). As ESTs são produzidas através de uma metodologia extremamente simples, de custo moderado, sendo portanto acessível a pequenos laboratórios. Além de permitir trabalhar apenas com seqüências expressas e identificar rapidamente uma grande quantidade delas por meio de comparações feitas com seqüências depositadas em bancos de dados, as ESTs tem muitas outras aplicações; dentre elas podemos destacar sua utilização na construção de mapas físicos, na caracterização de grandes seqüências genômicas, na identificação de genes em genomas e em tecnologias aplicadas à indústria farmacêutica (ZWEIGER & SCOTT, 1997). Quando o Projeto Genoma de Schistosoma mansoni teve início, menos de 100 genes do parasita haviam sido completamente ou parcialmente sequenciados e depositados em bancos de dados. Para o Projeto Genoma de Schistosoma mansoni foi construída inicialmente uma biblioteca de cDNA de vermes adultos destinada à obtenção de ESTs. Após seqüenciamento intensivo e análise por pesquisas de homologia, as primeiras 607 ESTs foram produzidas. Estas ESTs corresponderam a 169 genes distintos do parasita, sendo que, 154 destes genes nunca antes haviam sido seqüenciados em S. mansoni (FRANCO et al. 1995). Em 1994, a Organização Mundial de Saúde decidiu institucionalizar essa iniciativa em S. mansoni como parte de um extenso programa de estudos genômicos em parasitas. No período de 1994 a 2000 o programa de seqüenciamento foi parcialmente financiado pela WHO/ FRANCO, G.R. et al. TDR e os laboratórios participantes da Schistosoma Genome Network, juntamente com outros grupos geraram cerca de 17000 ESTs. O sucesso do programa de descoberta gênica em S. mansoni, utilizando a estratégia das ESTs, é demonstrado pelo número de genes catalogados e também pelo número de publicações geradas por estes estudos (DIAS NETO et al. 1996; 1997; FRANCO et al. 1995a; 1995b; 1997; 2000; JOHNSTON 1997; JOHNSTON et al., 1999; OLIVEIRA, 2001; OLIVEIRA & JOHNSTON, 2001; PROSDOCIMI et al., 2002; RABELO et al. 1997; SANTOS et al. 1999; ZOUAIN et al. 1998). Como o processo de produção das ESTs trata de um sequenciameno em único passo, isto é, somente uma corrida eletroforética no sequenciador automático de DNA, é comum observar um grande número de erros de seqüenciamento, além de tamanho pequeno das seqüências e ainda alta redundância nos dados, visto que os clones de cDNA são aleatoriamente escolhidos de uma biblioteca (LIANG et al., 2000; MILLER et al., 1999). Na tentativa de superar estes problemas e ainda de fornecer uma visão mais detalhada dos números e tipos de genes selecionados, é comum a utilização de procedimentos de agrupamentos de seqüências (OLIVEIRA & JOHNSTON, 2001). Em nosso laboratório, recuperamos 17071sequências de cDNA de S. mansoni do GenBank (BENSON et al., 2003) e dbEST (BOGUSKI et al., 1993), que foram filtradas para remoção de contaminantes (vetores, seqüências pequenas e ricas em repetição) e agrupadas pelo programa Cap3. Todas as seqüências não redundantes geradas (uniques) foram submetidas ao processos de anotação gênica através da inspeção visual dos alinhamentos locais contra bancos de dados de nucleotídeos e proteínas, usando o programa BLAST (ALTSCHUL et al., 1997). As seqüências foram classificadas em categorias funcionais segundo o COG (Cluster of Ortologous Groups) (TATUSOV et al., 1997), tendo como objetivo a compreensão do metabolismo e biologia do parasita e visando gerar uma carta transcriptômica para o S. mansoni. O agrupamento das 17071 revelou que as ESTs obtidas correspondiam a 6328 seqüências transcritas diferentes de S. mansoni, e que cerca de 70% não poderia ser identificada baseado em pesquisa de homologias em bancos de dados de DNA, proteínas ou domínios protéicos. A classificação funcional das seqüências identificadas revelou que 32% dos genes estão envolvidos em diversos processos celulares básicos, como divisão celular, modificações pós traducionais, enovelamento, endereçamento de proteínas, via secretória, motilidade, transdução de sinal, entre outras; 21% em processamento e armazenamento de informação; 15% em metabolismo e os outros 32% foram pobremente caracterizados. Todas essas informações estão Biosci. J., Uberlândia, v. 20, Especial, p. 93-100. 2004 94 Rede mineira de seqüenciamento... disponibilizadas no website http://www.icb.ufmg.br/~lgb/ schisto (PROSDOCIMI et al., submetido). Em 2001 foram iniciados no Brasil dois programas de seqüenciamento do transcriptoma do S. mansoni: um deles financiado pela FAPESP, visando gerar 120.000 ORESTES (Open Reading Frame ESTs, isto é, ESTs geradas a partir de RT-PCR dos mRNAs utilizando iniciadores aleatórios) e ESTs clássicas de várias fases do ciclo de vida do parasita e um outro financiado pela FAPEMIG/CNPq visando gerar 100.000 ESTs e seqüências de 500 cDNAs completos do S. mansoni. Os avanços obtidos pelo programa Mineiro, ainda em andamento, serão abordados no próximo tópico desta comunicação. Pelo programa FAPESP foram obtidas 179.092 ORESTES e ESTs dos vários estágios do parasita, o que corresponderia a 92% do seu genoma expresso (VERJOVSKI-ALMEIDA et al., 2003). Apesar do grande tamanho do genoma do S. mansoni (270 Mb), uma iniciativa internacional para o seqüenciamento genômico do parasita, apoiada pelo TDR/ WHO, está sendo conduzida pelo TIGR em associação com o Wellcome Trust Sanger Institute (WTSI) (Cambridge, Inglaterra) (EL-SAYED et al., 2004). A estratégia consiste em sequenciar extremidades de BACs (cromossomos artificiais de bactérias) contendo insertos de DNA de S. mansoni obtidos a partir da seleção aleatória de clones. A partir do seqüenciamento das extremidades dos BACs foram gerados 21 Mb de seqüência genômica descontínua, que foram úteis não somente para os projetos de descoberta gênica, mas também para prover marcadores para a produção de um mapa físico de mais alta resolução. O TIGR também gerou seqüências de regiões contínuas de BACs de diferentes cromossomos, numa tentativa de seguir a estratégia de seqüenciamento BAC a BAC, mas devido ao grande número de seqüências repetitivas no genoma e também a quantidade de gaps encontrados, esta estratégia foi abandonada. Em outubro de 2002, o TIGR iniciou o seqüenciamento pela estratégia de shotgun e hoje já possui 7,5 vezes a cobertura do genoma, com a estimativa de menos de 0,5% ainda não sequenciado. Esta instituição está prometendo publicar o primeiro rascunho do genoma de S. mansoni até a metade de 2004 (EL-SAYED et al., 2004). A liberação da seqüência genômica será de grande utilidade, pois permitirá checar a acurácia dos dados de descoberta gênica produzidos em projetos de transcriptoma. Por outro lado, os genes transcritos que foram descobertos podem auxiliar em uma anotação mais precisa do genoma, pois podem ser prontamente localizados na seqüência genômica utilizando ferramentas de bioinformática (Faria Campos et al., neste número). FRANCO, G.R. et al. Rede Mineira de Seqüenciamento do transcriptoma do S. mansoni: Características e objetivos No momento em que foi proposta a formação da Rede Mineira de Seqüenciamento, utilizando o genoma expresso do S. mansoni como modelo, em 2001, um número ainda pouco significativo de ESTs estava presente em bancos de dados, tendo em vista o tamanho do genoma do parasita. Além disso, a grande maioria das ESTs eram derivadas de vermes adultos, tendo sido pouco explorados os outros estágios evolutivos do parasita. Outros estágios de interesse seriam o ovo, principal causador da patologia na esquistossomose e vermes de pulmão que são provavelmente o alvo da resposta imunológica protetora (DOENHOFF et al., 1986; COULSON et al. 1988). Para um conhecimento mais aprofundado dos genes expressos seria necessário, portanto, um aumento considerável no número de seqüências disponíveis de todos os estágios evolutivos do verme. Nosso interesse principal no estudo em larga escala do genoma expresso do S. mansoni não reside apenas no conhecimento de toda sua estrutura e nos mecanismos de controle de expressão, mas também nas informações contidas nas seqüências de seus genes que vão trazer um conhecimento infinitamente maior da biologia do organismo. A expectativa é criar um catálogo parcial dos componentes protéicos do organismo, fornecendo dados relevantes às vias metabólicas, sistemas de transporte, arquitetura molecular etc., aproveitando-se do vasto contigente de informações disponíveis em outros modelos. Além disso, o desenvolvimento deste projeto, em conjunção com outros projetos transcriptoma, cria a base para o futuro estudo do proteoma do S. mansoni (ASHTON et al. 2001). É importante lembrar que além das seqüências, os próprios genes (clones de cDNA) estarão futuramente disponíveis facilitando o estudo nas áreas interesse não só de pesquisadores brasileiros, mas também de pesquisadores no mundo inteiro envolvidos no estudo da esquistossomose. Assim, os objetivos da Rede Mineira de Seqüenciamento são: 1- Gerar bibliotecas de cDNA de vários estágios de desenvolvimento do parasita. 2- Produzir cerca de 100.000 moldes para seqüenciamento parcial a partir das bibliotecas convencionais. 3- Editar o produto de seqüenciamento e remover sequências não úteis para pesquisa de homologia em bancos de dados. 4- Identificar os transcritos por homologia com genes depositados em bases de dados não redundantes. 5- Criar agrupamentos das seqüências derivadas da transcrição de um único gene. 6- A partir de cada agrupamento, modelar a região codificadora e deduzir, quando possível, a proteína codificada pelo mRNA modelado. 7- Conduzir o Biosci. J., Uberlândia, v. 20, Especial, p. 93-100. 2004 95 Rede mineira de seqüenciamento... FRANCO, G.R. et al. seqüenciamento de 500 transcritos (cDNAs) completos de genes selecionados pelo seu interesse biológico, para possibilitar o depósito da proteína deduzida em bases de dados apropriadas. 8- Publicar na Internet uma base de dados curada (análoga ao UniGene) onde cada registro represente um gene distinto. São participantes desta rede laboratórios distribuídos por várias instituições em Minas Gerais: nove laboratórios de seqüenciamento e uma central de bioinformática na UFMG, que compreende o Centro Nacional de Processamento de Alto Desempenho em Minas Gerais e Centro-Oeste (CENAPAD-MG/CO) e o Laboratório de Biodados no Instituto de Ciências Biológicas da UFMG (Tabela 1). Tabela 1 - Instituições e coordenadores envolvidos na Rede Genoma Minas Instituição FAPEMIG CPqRR - FIOCRUZ UFMG UFMG - CENAPAD CPqRR - FIOCRUZ UFMG UFMG UFMG EMBRAPA milho e sorgo UFLA UFOP UFU UFV Coordenador Naftale Katz - Coordenador geral Rodrigo Corrêa-Oliveira - Coordenador científico José Miguel Ortega - Coordenador da bioinformática Osvaldo Carvalho / Fabiano Peixoto Guilherme Corrêa-Oliveira Gloria Franco Fabricio Santos Sergio Costa Newton Carneiro Luciano Paiva Ieso Castro Luiz Goulart Sergio Brommonschenkel Estado Atual do Projeto Transcriptoma de S. mansoni da Rede Genoma de Minas Gerais O número de leituras de boa qualidade geradas até o momento é de 58.205 ESTs, correspondentes a cerca de 11.000 agrupamentos gênicos (clusters). Para a geração de ESTs foram utilizados clones de duas bibliotecas de vermes adultos mistos (AW1 e AW2), duas bibliotecas de ovo (EG1 e EG2), uma biblioteca de cercária (CE1), e uma biblioteca de vermes correspondentes à fase pulmonar (LU1). O número de leituras obtidas a partir de cada biblioteca é variável, sendo que novas seqüências destas e de novas bibliotecas estão sendo obtidas (Tabela 2). Tabela 2 -Número de seqüências individuais produzidas a partir de bibliotecas de diferentes estágios do ciclo de vida do S. mansoni. (a) Número de reações de sequenciamento utilizadas. (b) Número de ESTs com mais de 100 nucleotídeos obtidas. Biblioteca AW1 AW2 CE1 EG1 EG2 LU1 GLOBAL Reações a 23712 19536 672 12048 6624 192 62784 Válidasb 21823 18141 558 11301 6202 180 58205 Rendimento 92.03 % 92.86 % 83.04 % 93.8 % 93.63 % 93.75 % 92.66% Biosci. J., Uberlândia, v. 20, Especial, p. 93-100. 2004 96 Rede mineira de seqüenciamento... Das 58.205 ESTs geradas, 18.379 puderam ser identificadas baseado em homologia com proteínas depositadas na base de dados secundária de proteínas eucariotas (KOGs). O restante das seqüências corresponderam a genes homólogos aos de S. mansoni, a outras espécies de Schistosoma, ou a outros trematódeos, ou ainda não apresentaram qualquer homologia com seqüências conhecidas e depositadas em bancos de dados FRANCO, G.R. et al. públicos. As cerca de 18.000 ESTs identificadas, corresponderam a genes com as mais diversas funções no organismo, sendo a maioria deles (genes representados por mais de 2500 ESTs) pertencentes às categorias de tradução, estrutura e biogênese de ribossomos; citoesqueleto; modificações pós-traducionais, turnover de proteínas, chaperones e transporte e metabolismo de carboidratos (Figura 1). Figura 1 -Distribuição das 18.379 ESTs identificadas por homologia com proteínas KOG, separados nas seguintes categorias funcionais: (J) Tradução, estrutura e biogênese de ribossomos; (A) Modificação e processamento de RNA; (K) Transcrição; (L) Replicação, recombinação e reparo de DNA; (B) Estrutura e dinâmica da cromatina; (D) Divisão celular e particionamento cromossômico; (Y) Estrutura nuclear; (V) mecanismos de defesa; (T) Mecanismos de transdução de sinais; (M) Biogênese do envelope celular e membrana externa; (N) Mobilidade celular e secreção; (Z) Citoesqueleto; (W) Estruturas extra-celulares; (U) Tráfego intracelular, secreção e transporte vesicular; (O) Modificações pós-traducionais, turnover de proteínas, chaperones; (C) Produção e conversão de energia; (G) Transporte e metabolismo de carboidratos; (E) Transporte e metabolismo de aminoácidos; (F) Transporte e metabolismo de nucleotídeos; (H) Metabolismo de coenzimas; (I) Metabolismo de lipídeos; (P) Transporte e metabolismo de íons inorgânicos; (Q) Biossíntese, transporte e catabolismo de metabólitos secundários; (R) Predição de função geral; (S) Função desconhecida. A partir da informação contida nas ESTs, clones foram selecionados para seqüenciamento completo. Utilizando as seqüências já produzidas pelos vários laboratórios e a estratégia de seleção de clones completos desenvolvida pela central de bioinformática da Rede Genoma MG (ver Faria Campos et al., neste número) foram escolhidos clones que possivelmente possuem a seqüência codificadora completa para uma nova rodada de seqüenciamento, direcionada à produção de seqüências representado proteínas completas, as quais podem então constar como novos dados a serem incluídos nas bases de dados de proteínas de S. mansoni. Do total de 58205 Biosci. J., Uberlândia, v. 20, Especial, p. 93-100. 2004 97 Rede mineira de seqüenciamento... seqüências geradas pela Rede Genoma MG, 3782 representam clones candidatos ao sequenciamento completo, sendo que isto eqüivale a 487 proteínas diferentes. A seleção foi feita usando a base de dados secundária KOGs, o que permite uma identificação acrescida de informações com conteúdo biológico. FRANCO, G.R. et al. AGRADECIMENTOS Os autores agradecem a todos os outros participantes da Rede Genoma Minas que geraram as seqüências de DNA e produziram as análises bioinformáticas. ABSTRACT: Schistosma mansoni is the main etiologic agent of schistosomiasis, a tropical disease that is a major public heath problem in developing countries. In order to improve the knowledge on the parasite biology and metabolism, a new approach has been used in schistosomiasis research, which utilizes as its main tools high throughput sequencing and bioinformatics. The first Brazilian initiative on S. mansoni gene discovery begun in 1992, based on the production and characterization of Expressed Sequence Tags (ESTs). In 2001, two transcriptome projects were initiated in Brazil, one from the ONSA network of the São Paulo state and other from the Minas Gerais Genome network. The later has as main goal the characterization of the expressed genome of the parasite, in order to obtain biologically relevant information. Up to now, 58,205 ESTs have been generated from libraries of different stages of the parasite life cycle. The ESTs have been submitted to bioinformatic analysis and cDNA clones harboring the complete coding region have been selected for dedicated sequencing. The strategy used has allowed so far the selection of 3,782 clones corresponding to 487 different complete proteins. The sequencing progress and the use of other model proteins for clone selection will represent an import contribution for the characterization of the parasite proteome. Uniterms: Schistosoma mansoni, EST, transcriptome, bioinformatics REFERÊNCIAS BIBLIOGRÁFICAS ALI, P.O.; SIMPSON, A.J.; ALLEN, R.; WATERS, A.P.; HUMPHRIES, C.J.; JOHNSTON, D.A.; ROLLINSON, D. Sequence of a small subunit rRNA gene of Schistosoma mansoni and its use in phylogenetic analysis. Mol Biochem Parasitol v. 46, p. 201-8. 1991. ALTSCHUL, S.F.; MADDEN, T.L.; SCHAFFER, A.A.; ZHANG, J.; ZHANG, Z.; MILLER, W.; LIPMAN, D.J. Gapped BLAST, PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res v. 25, p. 3389-3402, 1997. ASHTON, P.D.; CURWEN, R.S.; WILSON, R.A. Linking proteome and genome: how to identify parasite proteins. Trends in Parasitol v. 17, p. 198-202, 2001. BENSON, D.A., KARSCH-MIZRACHI, I., LIPMAN, D.J., OSTELL, J., WHEELER, D.L. GenBank. Nucleic Acids Res v. 31, p. 23-27, 2003. BOGUSKI, M.S.; LOWE, T.M.; TOLSTOSHEY, C.M. dbESTdatabase for expressed sequence tags. Nat Genet v. 4, p. 332-333, 1993. COULSON, P.S.; WILSON, R.A. Examination of the mechanisms of pulmonary phase resistance to Schistosoma mansoni in vacccinated mice. Am J Trop Med Hygiene v. 38 p. 529-539, 1988. DEGRAVE, W.M.; MELVILLE, S.; IVENS, A.; ASLETT, M. Parasite genome iniciatives. Int J Parasitol, v. 31, p. 532-536, 2001. DIAS-NETO, E.; HARROP, R.; CORREA-OLIVEIRA, R.; PENA, S.D.; WILSON, R.A.; SIMPSON, A.J. The schistosome genome project: RNA arbitrarily primed PCR allows the accelerated generation of expressed sequence tags. Mem Inst Oswaldo Cruz v. 91, p. 655-7. 1996. Biosci. J., Uberlândia, v. 20, Especial, p. 93-100. 2004 98 Rede mineira de seqüenciamento... FRANCO, G.R. et al. DOENHOFF, M.J.; HASSOUNAH, O.; MURARE, H.; BAIN, J.; LUCAS, S. The schistosome egg granuloma: immunopathology in the caus of host protection or parasite survival? Trans R Soc Trop Med Hyg v. 80, p. 503-514, 1986. EL-SAYED, N.M.; BARTHOLOMEU, D.; IVENS, A.; JOHNSTON, D.A.; LOVERDE, P.T. Advances in schistosome genomics. Trends Parasitol. v. 20, p.154-157, 2004. ENGELS, D.; CHITSULO, L.; MONTRESOR, A.; SAVIOLI, L. The global epidemiological situation of schistosomiasis and new approaches to control and research. Acta Trop, v. 82, p.139-146, 2002. FRANCO, G.R.; ADAMS, M.D.; SOARES, M.B.; SIMPSON, A.J.G.; VENTER, J.C.; PENA, S.D.J. Identification of new Schistosoma mansoni genes by the EST strategy using a directional cDNA library. Gene v. 152, p. 141-147, 1995a. FRANCO, G.R.; RABELO, E.M.; AZEVEDO, V.; PENA, H.B.; ORTEGA, J.M.; SANTOS, T.M.; MEIRA, W.S.; RODRIGUES, N.A.; DIAS, C.M.; HARROP, R.; WILSON, A.; SABER, M.; ABDEL-HAMID, H.; FARIA, M.S.; MARGUTTI, M.E.; PARRA, J.C.; PENA, S.D. Evaluation of cDNA libraries from different developmental stages of Schistosoma mansoni for production of expressed sequence tags (ESTs). DNA Res v. 30, p. 231-240. 1997. FRANCO, G.R.; SIMPSON, A.J.; PENA, S.D. Sequencing and identification of expressed Schistosoma mansoni genes by random selection of cDNA clones from a directional library. Mem Inst Oswaldo Cruz v. 90, p. 215-216. 1995b. FRANCO, G.R.; VALADÃO, A.F.; AZEVEDO, V.; RABELO, E.M.L. The Schistosoma gene discovery program: state of the art. Int J Parasitol v. 30, p. 453-463. 2000. HILLYER, G.V. Buoyant density and thermal denaturation profiles of schistosome DNA. J Parasitol, v. 60, p. 725727, 1974. JOHNSTON, D.A. The WHO/UNDP/World Bank Schistosoma Genome Initiative: current status. Parasitol Today v. 13, p. 45-46. 1997. JOHNSTON, D.A.; BLAXTER, M.L.; DEGRAVE, W.M.; FOSTER, J.; IVENS, A.C.; MELVILLE, S.E. Genomics and the biology of parasites. Bioessays v. 21, p. 131-147, 1999. LIANG, F.; INGEBORG, H.; PERTEA, G.; SVETLANA KARAMYCHEVA SALZBERG, S.L.; QUACKENBUSH, J. An optimized protocol for analysis of EST sequences. Nucleic Acids Res v. 28, p. 3657-3665, 2000. MILLER, R.T.; CHRISTOFFELS, A.G.; GOPALAKRISHNAN, C.; BURKE, J.; PTITSYN, A.A.; BROVEAK, T.R.; HIDE, W.A. A Compreensive approach to clustering of expressed gene sequence: The sequence tag alignment, consensus knowledge base. Genome Res v. 9, p. 1143-1155, 1999. MEADOWS, H.M.; SIMPSON, A.J. Codon usage in Schistosoma. Mol Biochem Parasitol, v. 36, p. 291-293. 1989. MILHON, J.L.; TRACY, J.W. Updated codon usage in Schistosoma. Exp Parasitol, v. 80, p. 353-356. 1995. OLIVEIRA, G. The Schistosoma gene discovery project, an update. Trends in Parasitol, v. 17, p. 108-109. 2001. OLIVEIRA, G.; JOHNSTON, D.A. Mining the schistosome DNA sequence database. Trends in Parasitol, v. 17, p. 501-503, 2001. PROSDOCIMI, F.; FARIA-CAMPOS, A.F.; PEIXOTO, F.C.; PENA, S.D.J.; ORTEGA, M.; FRANCO, G.R. Clustering of Schistosoma mansoni mRNA sequences and analysis of the most transcribed genes: Implications in Metabolism, Biology of Different Developmental Stages. Mem Inst Oswaldo Cruz, v. 97, p. 61-69. 2002. Biosci. J., Uberlândia, v. 20, Especial, p. 93-100. 2004 99 Rede mineira de seqüenciamento... FRANCO, G.R. et al. PROSDOCIMI, F.; SANTOS, F. R.; FRANCO, G. R. Analyses of public Schistosoma mansoni cDNA sequences: new insights on the parasite biology. Submitted (Genetics and Molecular Research). RABELO, E.M.; FRANCO, G.R.; AZEVEDO, V.A.C.; PENA, H.B.; SANTOS, T.M.; MEIRA, W.S.F.; RODRIGUES, N.A.; ORTEGA, M.; PENA, S.D.J. Update of the gene discovery program in Schistosoma mansoni with the expressed sequence tag approach. Mem Inst Oswaldo Cruz v. 92, p. 625-629, 1997. SANTOS, T.M.; JOHNSTON, D.A.; AZEVEDO, V.; RIDGERS, I.L.; MARTINEZ, M.F.; MAROTTA, G.B.; SANTOS, R.L.; FONSECA, S.J.; ORTEGA, J.M.; RABELO, E.M.; SABER, M.; AHMED, H.M.; ROMEIH, M.H.; FRANCO, G.R.; ROLLINSON, D.; PENA, S.D. Analyses of the gene expression profile of Schistosoma mansoni cercariae using the expressed sequence tag approach. Mol Biochem Parasitol v. 103, p. 79-97. 1999. SHORT, R.B.; GROSSMAN, A.I. Conventional giemsa and C-banded karyotypes of Schistosoma mansoni and S. rodhaini. J Parasitol, v. 67, p. 661-671, 1981. SHORT, R.B. Presidential address: Sex and the single schistosome. J Parasitol, v. 69, p. 3-22, 1983. VERJOVSKI-ALMEIDA, S.; DEMARCO, R.; MARTINS, E.A.; GUIMARAES, P.E.; OJOPI, E.P.; PAQUOLA, A.C.; PIAZZA, J.P.; NISHIYAMA JR., M.Y.; KITAJIMA, J.P.; ADAMSON, R.E.; ASHTON, P.D.; BONALDO, M.F.; COULSON, P.S.; DILLON, G.P.; FARIAS, L.P.; GREGORIO, S.P.; HO, P.L.; LEITE, R.A.; MALAQUIAS, L.C.; MARQUES, R.C.; MIYASATO, P.A.; NASCIMENTO, A.L.; OHLWEILER, F.P.; REIS, E.M.; RIBEIRO, M.A.; AS, R.G.; STUKART, G.C.; SOARES, M.B.; GARGIONI, C., KAWANO, T., RODRIGUES, V., MADEIRA, A.M.; WILSON, R.A., MENCK, C.F.; SETUBAL, J.C.; LEITE, L.C.; DIAS-NETO, E. Transcriptome analysis of the acoelomate human parasite Schistosoma mansoni. Nat Genet v. 35, p. 148-157, 2003. TATUSOV, R.L.; KOONIN, E.V.; LIPMAN, D.J. A genomic perspective on protein families. Science v. 278, p. 631637, 1997. ZOUAIN, C.S.; AZEVEDO, V.A.; FRANCO, G.R.; PENA, S.D.; GOES, A.M. Identification of genes encoding Schistosoma mansoni antigens using an antigenic sequence tag strategy. J Parasitol v. 84, p. 1307-1310, 1998. ZWEIGER, G.; SCOTT, R.W. From expressed sequence tags to epigenomics: an understanding of disease processes. Cur Opin Biotechnol v. 8, p. 684-687, 1997. Biosci. J., Uberlândia, v. 20, Especial, p. 93-100. 2004 100