GENOTIPAGEM DE BACTÉRIAS Nalvo F Almeida Faculdade de Computação – UFMS Tuberculose bovina Afeta bovinos e bubalinos ¨ Causada pela bactéria Mycobacterium bovis ¨ Crônica nos animais ¨ ¤ pulmões, fígado, baço, carcaça, úbere ¤ transmissão entre bovinos via leite e aerógena Em geral não apresenta sintomas visíveis ¨ Emagrecimento em casos acentuados ¨ Queda na produção de leite, de carne ¨ Perdas anuais de ~3 bilhões de dólares ¨ Tuberculose bovina ¨ Não existe vacina ou tratamento ¤ O ¨ animal infectado é eliminado (max. 30 dias) Transmissível ao homem ¤ Leite contaminado ¤ Perdigoto Tuberculose bovina ¨ Diagnóstico feito com teste intradérmico ¤ injeção de um composto de proteínas de M. bovis denominado Derivado Proteico Purificado (PPD) ¤ animais infectados manifestam um aumento localizado da espessura da dobra da pele 72 horas após a injeção ¤ podem não responder ao teste mesmo infectados (falsos negativos) Tuberculose bovina ¨ Diagnóstico feito com teste intradérmico ¤ injeção de um composto de proteínas de M. bovis denominado Derivado Proteico Purificado (PPD) ¤ animais infectados manifestam um aumento localizado da espessura da dobra da pele 72 horas após a injeção ¤ podem não responder ao teste mesmo infectados (falsos negativos) ¨ Diagnósticos mais precisos e mais rápidos são necessários Tuberculose bovina Genotipagem de Mycobacterium ¨ ¨ ¨ Entendimento mais aprofundado de Mycobacterium bovis Precisamos antes saber como determinar corretamente uma espécie/cepa Mycobacterium tuberculosis Complex (MTbC ou MTC) Mycobacterium tuberculosis ¤ Mycobacterium africanum ¤ Mycobacterium bovis ¤ Mycobacterium microti ¤ Mycobacterium canettii ¤ Mycobacterium caprae ¤ Mycobacterium pinnipedii ¤ Mycobacterium mungi ¤ Genotipagem de Mycobacterium ¨ Problema ¤ Cepas de Mycobacterium (em especial de bovis) são muito similares Técnicas de genotipagem MLST ¨ Espoligotipagem ¨ MIRU-VNTR ¨ Técnicas de genotipagem MLST ¨ Espoligotipagem ¨ MIRU-VNTR ¨ Mycobacterium Técnicas – MLST ¨ Multi-Locus Sequencing Typing Técnicas – Espoligotipagem • Spoligotyping - Spacer oligonucleotide typing • Método baseado em PCR • Detecta uma região de DR (Direct Repeat) – 36bp – em genomas MTB (mycobacterium tuberculosis complex) Técnicas – Espoligotipagem Guide to the Application of Genotyping to Tuberculosis Prevention and Control. CDC Tuberculosis Genotyping Laboratory Procedures Técnicas – MIRU-VNTR Mycobacterium Interleaved Repeat Unit ¨ Variable Number of Tandem Repeat ¨ Análise de seqs formadas por repetição em tandem (40-100bp) exclusivas de MTC ¨ Técnicas – MIRU-VNTR Técnicas – MIRU-VNTR Técnicas de genotipagem Espoligotipagem ¨ MIRU-VNTR ¨ Não conseguem diferenciar subspécies/cepas muito próximas de Mycobacterium ¨ Características investigadas nesses métodos apresentam evolução convergente ¨ 91191 V2D V2A 04-‐303 534 91193 91192 45-‐08B 18-‐08C 07-‐08. 61-‐09 32-‐08 49-‐09 08-‐08BF2 33 50 35 268 AN5 0822-‐11 02-‐6316_S6 04-‐1858_S3 08-‐1086_S8 08 1930 08 4364 10-‐1862_S5 10-‐7911_S8 10 7070 12-‐5092_S3 95-‐01315_S6 1101101000001110111111111111111111111100000! 1101101000001110111111111111111111111100000! 1101101000001110111111111111111111111100000! 1101101000001110111111111111111111111100000! 1101101000001110111111111111111111111100000! 1101101000001110111111111111111111111100000! 1101101000001110111111111111111111111100000! 1101111101111110111101111111100000111100000! 1101111101111110111101111111111111111100000! 1100111101111110111101111111111111111100000! 0001111101111110111101111111111111110100000! 1101101000001110111111111111111111111100000! 1101111101111110111111111111111111111100000! 1101111101111110111101111111111111000100000! 1101111101111110111111111111111111111100000! 1101111001111110111101111000111111110100000! 1101111101111110111101111000000111111100000! 1101111101111110111101111111111111111100000! ! ! 1101101101111110111101111111111111111100000! 1101000000000010111111111101111111111100000! 1101000000000010111111111111111111111100000! 0101101000001110111111111111111111111100000! 1101101000001110110111111111111111111100000! 1101111101111110111101111111111111111100000! 1101111101011110111111111110001111111000000! 1101101101111110111101111111111111111100000! ! 1101000000000010111111111111111111111100000! MIRU 02-‐6316_S6 23335432534 04-‐1858_S3 23237552533 08-‐1086_S8 3237552533 08 1930 25237452534 08 4364 25237452534 10-‐1862_S5 23336442535 10-‐7911_S8 25147452323 10 7070 23335432534 Nossa abordagem ¨ Ferramentas computacionais para genômica ¤ Comparação de sequências ¤ Anotação ¤ Famílias de proteinas Abordagem genômica Abordagem genômica Abordagem genômica Abordagem genômica Abordagem genômica Abordagem genômica Abordagem genômica Abordagem genômica Abordagem genômica Pipeline Blastp OrthoMCL Orthologsorter MUSCLE Gblocks RAxML NJplot árvore Pipeline Blastp OrthoMCL Orthologsorter MUSCLE Gblocks RAxML NJplot árvore Altschul, S.F., Madden, T.L., Schäffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25:3389-3402. Pipeline Blastp OrthoMCL Orthologsorter MUSCLE Gblocks RAxML NJplot árvore Li Li, Christian J. Stoeckert, Jr., and David S. Roos. OrthoMCL: Identification of Ortholog Groups for Eukaryotic Genomes. Genome Res. 2003 13: 2178-2189. Pipeline (ortólogos e parálogos) E.V. Koonin. An apology fo orthologs - or brave new memes. Genome Biology, 2(4), 2001. Pipeline Blastp OrthoMCL Orthologsorter MUSCLE Gblocks RAxML NJplot árvore Orthologsorter: inferindo genotipagem e funcionalidade a partir de famílias de proteínas ortólogas. Nariélly Calista Farias. Dissertação de Mestrado, Faculdade de Computação, UFMS 2013. Pipeline Blastp OrthoMCL Orthologsorter MUSCLE Gblocks RAxML NJplot árvore Edgar, R. C. (2004). "MUSCLE: multiple sequence alignment with high accuracy and high throughput." Nucleic Acids Res 32(5): 1792-1797. Castresana, J. (2000). "Selection of conserved blocks from multiple alignments for their use in phylogenetic analysis." Mol Biol Evol 17(4): 540-552. Pipeline Blastp OrthoMCL Orthologsorter MUSCLE Gblocks RAxML NJplot árvore RAxML (Randomized Axelerated Maximum Likelihood) Version 8: A tool for Phylogenetic Analysis and Post-Analysis of Large Phylogenies. Bioinformatics, 2014. Pipeline Blastp OrthoMCL Orthologsorter MUSCLE Gblocks RAxML NJplot árvore (USA_08_4364:0.00018719,(USA_10-7070:0.00066666,USA_08-1930:0.00020743)1.000000:0.00013801, (((ARG_4303:0.00007828,(Ref:0.00034238,(ARG_V2D-05-566:0.00004808,ARG_V2A: 0.00000483)1.000000:0.00002851)1.000000:0.00002214)1.000000:0.00002337,((BRA_AN5:0.00024547, ((USA_10-7911:0.00018700,((USA_04-1858:0.00016328,USA_08-1086:0.00004543)0.998000:0.00002663, (USA_98-0251:0.00006950,USA_95-1315:0.00005472)0.440000:0.00000852)1.000000:0.00010365)1.000000 :0.00002107,(BRA_49-09:0.00030382,(((BRA_33:0.00009861,BRA_35:0.00025503)1.000000:0.00003722, (USA_02-6316:0.00022218,USA_10-1862:0.00017178)1.000000:0.00003041)0.999000:0.00002578, (BRA_08-08BF2:0.00009549,((BRA_45-08B:0.00008231,(BRA_50:0.00008819,(BRA_18-08C: 0.00012513,BRA_61-09:0.00016375)0.654000:0.00003647)0.859000:0.00001190)0.967000:0.00001088, (BRA_07-08:0.00006575,BRA_32-08:0.00011937)0.983000:0.00001581)0.635000:0.00000386)1.000000:0.0 0004806)1.000000:0.00004978)1.000000:0.00003899)0.666000:0.00000748)1.000000:0.00002415, (BRA_0822-11:0.00011933,BRA_268:0.00007726)0.998000:0.00003057)0.994000:0.00001717)1.000000:0.0 0002688,(USA_12-5092:0.00011986,(ARG_534:0.00005095,(ARG_91191:0.00002124, (ARG_91193:0.00001501,ARG_91192:0.00001582)0.934000:0.00000542)0.993000:0.00001037)0.971000:0.0 0001248)0.467000:0.00000362)1.000000:0.00034397);! ! Perrière G, Gouy M (1996). "WWW-Query: An on-line retrieval system for biological sequence banks". Biochimie 78:364-369. Pipeline Orthologsorter – subproduto Blastp OrthoMCL Orthologsorter banco de dados MUSCLE Gblocks Sistema web Orthologsorter RAxML NJplot árvore Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Orthologsorter Outras abordagens ¤ SNPs n Concatenar as colunas SNPs para formar o alinhamento ¤ Busca de regiões específicas para marcadores moleculares n Árvore de sufixos n Characteristic Strings n Mais perto de ajudar em técnicas para diagnóstico Árvore de M. bovis baseada em SNPs Orthologsorter e Orthologsorter+SNPs Publicações preliminares ¨ ¨ ¨ J.V.A.Oliveira, T.Raiol, N.C.Farias, N.F.Almeida, G.P.Telles, J.C.Setubal, M.L.Araujo, F.P.Lima, C.Benoit-Pilven, M.M.Brigido, M.T.Souza, L.M.P.Moraes and M.E.T.Walter. Genome sequence of a Brazilian Bacillus cereus isolate 7th Brazilian Symposium on Bioinformatics, August 2012. F.R.Araujo, A.B.C.Castelao, A.A.Fonseca-Jr., M.A.Hodon, M.A.Issa, A.K.Ramalho, G.M.T.Mendes, C.A.N.Ramos, E.B.Sales, P.M.Soares-Filho, N.C.Farias, C.Nishibe and N.F. Almeida. Typing of a Brazilian Mycobacterium isolate by whole-genome sequencing 7th Brazilian Symposium on Bioinformatics, August 2012. H.Muniz, N.C.Farias, T.Raiol, A.L.Cunha-Laura, G.P.Telles and N.F.Almeida A comparison of two approaches for species identication 7th Brazilian Symposium on Bioinformatics, August 2012. Onde Orthologsorter foi usado ¨ ¨ ¨ ¨ ¨ A.R.Wattam et al. Analysis of ten Brucella genomes reveals evidence for horizontal gene transfer despite a preferred intracellular lifestyle J. of Bacteriology 2009 J.C.Setubal et al. The genome sequence of Azotobacter vinelandii, an obligate aerobe specialized to support diverse anaerobic metabolic processes J. of Bacteriology 2009 L.M.Moreira et al. Novel insights into the genomic basis of citrus canker based on the genome sequences of two strains of Xanthomonas fuscans subsp. Aurantifolii BMC Genomics 2010 N.Potnis et al. Comparative genomics reveals diversity among xanthomonads infecting tomato and pepper BMC Genomics 2011 R.Cai et al. The Plant Pathogen Pseudomonas syringae pv. tomato Is Genetically Monomorphic and under Strong Selection to Evade Tomato Immunity PLoS Pathogens 2011 Onde Orthologsorter foi usado ¨ ¨ ¨ ¨ ¨ A.Mazzaglia et al. Pseudomonas syringae pv. actinidiae (PSA) Isolates from Recent Bacterial Canker of Kiwifruit Outbreaks Belong to the Same Genetic Lineage PLoS ONE 2012 A.R.Wattam et al. Comparative Genomics of Early-Diverging Brucella Strains Reveals a Novel Lipopolysaccharide Biosynthesis Pathway mBio 2012 S.Slater et al. The Genome of Agrobacterium tumefaciens C58: Reconciliation of sequence data, updated annotation, and distribution of linear chromosome in genus Agrobacterium Appl. Environ. Microbiol. 2012 P.F.Sarris et al Comparative Genomics of Multiple Strains of Pseudomonas cannabina pv. alisalensis, a Potential Model Pathogen of Both Monocots and Dicots PLoS ONE 2013 N.A. Wulff et al. The complete genome sequence of Candidatus Liberibacter americanus, associated with citrus Huanglongbing Molecular Plant-Microbe Interactions 2014 0.05 Acinetobacter P.aeruginosa PAO1 1.00 P.aeruginosa PA14 1.00 P.aeruginosa PA7 Azotobacter P.stutzeri A1501 1.00 P.mendocina ymp P.putida KT2440 1.00 1.00 1.00P.putida F1 1.00 P.putida GB-11 1.00 1.00 P.putida W619 P.entomophila L48 1.00 P.fluorescens Pf-5 1.00 P.fluorescens Pf0-1 1.00 P.syringae DC3000 1.00 P.syringae B728a 1.00 P.syringae 1448A Mycobacterium bovis ¨ ¨ ¨ C. Nishibe, A.B.C. Castelão, R.D. Costa, B.J. Pinto, L. Varuzza, A.A. Cataldi, A. Bernardelli, F. Bigi, F.C. Blanco, M.J. Zumárraga, N.F. Almeida, and F.R. Araújo Draft Genome Sequence of Mycobacterium bovis 04-303, a Highly Virulent Strain from Argentina Genome Announcements 2013, 1(6), 1:e00931-13 C.P.Araújo, A.L.A.R.Osório, K.S.G.Jorge, C.A.N.Ramos, A.F.S.Filho, C.E.S.Vidal, E.Roxo, C.Nishibe, N.F.Almeida, A.A.F.Júnior, M.R.Silva, J.D.B.Neto, V.D.Cerqueira, M.J.Zumárraga and F.R.Araújo Detection of Mycobacterium bovis in bovine and bubaline tissues using nested-PCR for TbD1 PLOS ONE March 2014, Vol. 9, Issue 3, e91023 A.B.C.Castelão, C.Nishibe, A.Moura, A.P.de Alencar, M.A.Issa, M.A.Hodon, P.M.P.C.Mota, E.B.Sales, A.A.Fonseca-Junior, N.F.Almeida, F.R.Araújo Draft Genome of AN5 Strain of Mycobacterium bovis, used for Production of Purified Protein Derivative Genome Announcements 2014, 2(2):e00277 Próximos passos ¨ Primers específicos ¤ characteristic string ¤ árvore de sufixo generalizada Characteristic strings S1 S2 Sr T Encontrar a menor subcadeia de T que ocorre em S1 S2 … Sr com pelo menos k diferenças Outros próximos passos ¨ Genômica comparativa de todos os isolados sequenciados ¤ SNPs ¤ Famílias de proteinas, ¤ Pseudogenes ¤ Meta informações Colegas Flábio R. Araújo Pesquisador – Embrapa Gado de Corte Ana Beatriz Castelão Aluna de doutorado Luciana Montera Pesquisadora – Facom-UFMS Christiane Nishibe Aluna de doutorado Nariélly Farias Aluna de mestrado Rodrigo Andrade Cardoso Aluna de mestrado Financiamento Campo Grande, MS Campo Grande, MS ¨ Não é verdade que tem só índio e jacaré Campo Grande, MS ¨ Não é verdade que tem só índio e jacaré ¨ Tem também onça, arara, tuiuiu, capivara, … Bonito, MS Campo Grande, MS UFMS Facom-UFMS ¨ ¨ ¨ ¨ 5 cursos de graduação na área de computação Doutorado Mestrado acadêmico Mestrado Profissional ¤ Embrapa ¨ ¨ ¨ Gado de Corte Aprox. 1200 alunos 51 professores 20 técnico-administrativos Obrigado facom.ufms.br/~nalvo ! [email protected]!