1 Caracterização das Famílias de Carreadores Mitocondriais de Ânions Di- e Tricarboxílicos André G. Madeira1, Antônio S. Kimus Braz1, Hana P. Masuda1 e Jiri Borecky1. 1 Centro de Ciências Naturais e Humanas, Universidade Federal do ABC, Santo André, SP, Brasil. As proteínas da super família de proteínas carreadoras mitocondriais de anions (MACF) realizam a comunicação entre o citoplasma da célula eucariótica e o interior da mitocôndria. Por possuírem uma alta semelhança estrutural, existe uma grande dificuldade na classificação dessas proteínas em subfamílias e também nas análises de evolução dos genes que as codificam. Para entender melhor a evolução e função dos membros dessa superfamília, 202 sequências de aminoácidos de proteínas carreadoras mitocondriais de ânions de diversos organismos foram analisadas. Foram construídas árvores filogenéticas com métodos de inferência Bayesiana e máxima verossimilhança e foi feita uma análise de predição de motivos. A árvore filogenética construída mostrou que carreadores de 2-oxoglutarato/malato (M2OMs) de diversos organismos se agrupam em um único ramo da árvore. As proteínas desacopladoras (UCPs) se agrupam em um ramo separado dos M2OMs e foi possível esclarecer as relações entre os diversos isotipos de UCPs e incluir os carreadores de di/tricarboxilato (DITRICs) entre as M2OMs. Foi possível ainda estimar que os principais eventos de duplicação gênica responsáveis pela grande variedade da superfamília ocorreram ainda na base de Eukarya. Palavras Chave—Carreadores mitocondriais de ânions, M2OM, UCP. I. INTRODUÇÃO N dos organismos eucariotos, um fato de crucial importância foi o surgimento da mitocôndria, que está associada principalmente com o metabolismo energético e a geração de calor. Uma das hipóteses mais aceitas para o seu surgimento é a teoria endossimbiótica, segundo a qual uma célula procariótica aeróbica teria sido englobada por uma célula ancestral das células eucarióticas. Teria então evoluído uma relação de endossimbiose, onde a célula procariótica teria se especializado na geração de energia – mitocôndria – e se tornado dependente da nutrição provida pela célula eucariótica, ao passo que a célula eucariótica também teria se tornado dependente da energia produzida por essa organela, uma vez que quase não existem organismos eucarióticos desprovidos de mitocôndrias. Tendo em vista que a mitocôndria exerce papéis tão importantes na célula eucariótica e tem uma origem procariótica, o que é refletido no seu material genético, tornase necessária uma comunicação muito refinada entre o citoplasma da célula e o interior da mitocôndria, tanto para o transporte de metabólitos quanto para a sinalização. Essa comunicação é exercida através de canais e trocadores protéicos. As proteínas mitocondriais carreadoras de ânions são proteínas integrais da membrana mitocondrial interna que atuam no transporte de metabólitos aniônicos, participando no metabolismo de energia (glicólise, gliconeogênese, lipólise e síntese de ácidos graxos). A superfamília dessas proteínas (Mitochondrial Anion Carrier Family, MACF) possui pelo menos dez membros e todos os carreadores possuem três repetições de cerca de 100 aminoácidos com dois domínios hidrofóbicos transmembrana cada [1]. Os membros estudados nesse trabalho foram os carreadores de dicarboxilato (DICs; [1,2]), carreadores de tricarboxilatos (TRICs; [1,3]), carreadores de di/tricarboxilatos (DITRICs, A ORIGEM encontrados somente em plantas; [4]), carreadores de 2oxoglutarato/malato (M2OMs; [1]) e as proteínas desacopladoras (uncoupling proteins, UCPs; [1]). Todas essas proteínas apresentam alta similaridade entre si em sua estrutura, porém, diferem quanto a função. Portanto, estudos focados na caracterização dos novos membros da MACF em relação estrutura-função, como análises de inferência filogenética, são necessários para sua verdadeira classificação dentro da MACF e para determinar a validade das diversas famílias encontradas na literatura. Foram coletadas diversas sequências de aminoácidos e foram construídas árvores filogenéticas a fim de se estabelecer as relações entre as subfamílias estudadas, e foram também caracterizados motivos específicos para determinadas subfamílias. Foram estabelcidas as relações entre os M2OMs e as UCPs, que foram identificadas como subfamílias separadas, através de inferência Bayesiana e por análises de máxima verossimilhança, enquanto que as DITRICs foram classificadas como M2OMs modificadas. II. METODOLOGIA Busca pelas sequências A busca pelas sequências de aminoácidos foi realizada utilizando o banco de dados do NCBI (http://www.ncbi.nlm.nih.gov/) pela ferramenta BLAST (http://blast.ncbi.nlm.nih.gov/Blast.cgi). Foram buscadas sequências anotadas como DICs, TRICs, DITRICs e M2OMs, além de sequências de UCPs para comparação. Além desta, outra estratégia foi adotada: as sequências foram coletadas de acordo com os valores de e-value, similaridade e identidade com sequências “isca” na ferramenta BLAST. As sequências utilizadas como “iscas” foram o M2OM humano (Q02978.3), UCP1 humana (AAH69556.1), UCP5 humana (NP003942.1) e UCP4 humana (NP004268.3). 2 Alinhamentos Foram realizados alinhamentos com o software clássico Clustal X versão 2.0 [5] e com o software AMAP versão 2.2 [6], que utiliza o método de alinhamento por anelamento de sequências. Árvores filogenéticas Com base nos alinhamentos, foram construídas nove árvores filogenéticas não enraizadas com o software MEGA versão 4 [7], variando-se os modelos utilizados (neighborjoining, evolução mínima ou máxima parcimônia) e o valor do teste de bootstrap. Foram construídas ainda mais duas árvores filogenéticas, uma com o método de inferência Bayesiana através do software MrBayes versão 3.1.2 [8], que contou com um número reduzido de sequências devido ao pesado processamento envolvido, e outra com o método de máxima verossimilhança, através do software PhylML vesão 3.0.1[9]. III. RESULTADOS E DISCUSSÃO Foram encontradas 202 sequências de proteínas da MACF Foram encontradas 78 sequências com a isca M2OM, 79 sequências com a isca UCP1, 19 sequências com a isca UCP5 e 26 sequências com a isca UCP4. Entre as sequências obtidas com a isca UCP1, estão uma série de proteínas anotadas como UCP2 e UCP3, o que indica que essas três isoformas de UCP formam um grupo bastante relacionado. Entre as sequências de M2OM foram coletadas sequências anotadas como DIC, o que indicaria confusão na classificação, e DITRIC, cuja posição na árvore filogenética construída será discutida adiante. As sequências de membros da MACF foram encontradas em diversos grupos de eucariotos. Os grupos onde as mesmas não foram encontradas provavelmente carecem de dados depositados em bancos de dados públicos, uma vez que se espera que estas proteínas estejam presentes em todos os grupos de eucariotos que possuem mitocôndrias. Foram então realizados alinhamentos com o software AMAP versão 2.2, que utiliza a tecnologia do alinhamento por anelamento de seqüências [6]. A partir desse alinhamento, foram construídas árvores por inferência Bayesiana e máxima verossimilhança. Isotipos de UCPs se encontram agrupados na árvore porém em um ramo separado dos M2OMs A árvores aqui apresentada (Figura 1) foi construída com base em alinhamentos realizados no software AMAP, utilizando a metodologia de máxima verossimilihança (Maximmum Likelihood, ML). Podemos observar que M2OM é um grupo monofilético se considerarmos os DITRICs como sendo M2OMs modificados, uma vez que DITRICs foram encontrados juntos no mesmo ramos de M2OMs de plantas. Foram identificados dois grandes grupos de M2OMs – um com proteínas de plantas e fungos e outro com proteínas de animais, ambos com proteínas de eucariotos unicelulares na base do ramo. Isso nos leva a crer que houve uma duplicação gênica no início da evolução de Eukarya e que os animais mantiveram uma isoforma enquanto a outra foi mantida pelas plantas e pelos fungos, ocorrendo perdas secundárias diferentes nos diferentes grupos. Todas as UCPs analisadas também formam um grupo monofilético, porém é perceptível a distinção entre um ramo com as UCPs 1, 2 e 3 (onde ainda ocorre um agrupamento das duas últimas em relação à primeira) e outro com as UCPs 4 e 5 (também separadas como famílias irmãs). De acordo com a árvore, essa divisão deve ter ocorrido ainda na base de Eukarya, pouco depois da divisão entre M2OMs e UCPs. IV. CONCLUSÃO Pela árvore construída, foi possível observar uma clara separação dos ramos que representam as famílias de M2OMs e UCPs. Proteínas anotadas como DICs, uma de fungo Aspergillus fumigatus Af293 (AfumDIC) e duas proteínas putativas de fungo Aspergillus clavatus NRRL1 (AclaDIC) e da planta Mesembryanthemum crystallinum (McryDIC) apareceram no ramo das M2OMs, indicando que muito ainda deve ser feito para esclarecer as origens de todas essas proteínas mitocondriais, se é que existem tantas famílias distintas. Um fato interessante é a inclusão das DITRICs intimamente relacionadas com as M2OMs, porém, formando um grupo monofilético. As DITRICs teriam evoluído recentemente de um gene muito parecido com o gene das proteínas M2OMs. Apesar dos resultados dos trabalhos recentes, muitos problemas ainda existem na classificação dos membros da MACF. Uma série de proteínas tem anotações inconclusivas e frequentemente errôneas. O que teria grande influência nesse aspecto é o fato de essas proteínas terem divergido muito antigamente, há bilhões de anos, no início da história dos eucariotos, e em um curto período de tempo, o que torna difícil a tarefa de estabelecer relações entre as famílias e classificar as sequências encontradas. AGRADECIMENTOS À UFABC, pela oportunidade de realizar o trabalho. Esse trabalho foi suportado pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico – CNPq. REFERÊNCIAS [1] M. Laloi. “Plant mitochondrial carriers: an overview” Cell. Mol. Life Sci., 1999, 56: 918-944. [2] S. Mizuarai, S. Miki, H. Araki, K. Takanashi e H. Kotani “Identification of dicarboxylate carrier Slc25a10 as malate transporter in de novo fatty acid synthesis” J. Biol. Chem., 2005, 37: 32434-32441. [3] M. E. Mycielska, A. Patel, N. Rizaner, M. P. Mazurek, H. Keun, A. Patel, V. Ganapathy e M. B. Djamgoz “Citrate transport and metabolism in mammalian cells: prostate epithelial cells and prostate cancer” Bioessays., 2009, 31: 10-20. [4] N. Picault, M. Hodges, L. Palmieri e F. Palmieri “The growing family of mitochondrial carriers in Arabidopsis” Trends. Plant. Sci., 2004, 9: 138146. 3 Fig. 1. Árvore filogenética construída com o programa PhylML. O ramo em azul representa os M2OMs. O ramo em vermelho representa as UCPs 1, 2 e 3. O ramo em verde representa as UCPs 4 e 5. As proteínas destacadas em negrito representam as DITRICs. [5] M. A. Larkin, G. Blackshields, N. P. Brown, R. Chenna, P. A. McGettigan, H. McWilliam, F. Valentin, I. M. Wallace, A. Wilm, R. Lopez, J. D. Thompson, T. J. Gibson e D. G. Higgins. “Clustal W and Clustal X version 2.0” Bioinformatics, 2007, 23: 2947-2948. [6] A. S. Schwartz e L. Pachter. “Multiple alignment by sequence annealing” Bioinformatics, 2007, 23: e24–e29. [7] K. Tamura, J. Dudley, M. Nei e S. Kumar. “MEGA4: Molecular Evolutionary Genetics Analysis (MEGA) software version 4.0.” Mol. Biol. Evol., 2007, 24: 1596-1599. [8] F. Ronquist e J. P. Huelsenbeck. “MrBayes 3: Bayesian phylogenetic inference under mixed models” Bioinformatics, 2003, 19: 1572-1574. [9] S. Guindon e O. Gascuel “A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood” Syst. Biol., 2003, 52: 696-704.