Cadernos Mateus DOC VIII · Infinito Quando no limite o risco tende para infinito! à luz do “dogma central” da biologia molecular Ricardo J. F. Branco UCIBIO, Universidade Nova de Lisboa 1. Introdução Quando nos interpelamos acerca da existência e sustentabilidade da vida na Terra, facilmente constatamos que sendo este, até a data, um evento singular, pelo menos na diminuta fracção do Universo que nos é dada a conhecer, não deixa de ser também um processo contínuo de adaptação. Podemos então supor que, mesmo na eminência de uma interrupção abrupta da organização da vida, tal como a conhecemos hoje, seria plausível assumir como provável a ocorrência de eventos de natureza semelhante, assumindo como condição necessária a conservação dos pressupostos termodinâmicos e das condições físico-químicas que lhe têm servido de suporte existencial ao longo da sua evolução. É aliás essa característica singular da perpetuação da vida de geração em geração, quiçá ad eternum, que nos tem permitido com grande mestria interligar cronologicamente todas as formas e etapas ao longo do desenvolvimento da vida neste contexto, quer seja numa base celular ou noutra qualquer forma de organização superior conhecida, materializadas nas inúmeras arquiteturas alguma vez exploradas pela Natureza. Aqui o sentido do adjetivo “superior” é somente traduzir a maior complexidade destes sistemas, por oposição aos demais corpos inertes ou inanimados. Sendo o nosso objecto de reflexão um sistema dinâmico, na verdadeira acessão da palavra (i.e. em evolução ininterrupta), não é de estranhar que uma interpretação causal da transmissão de informação que o codifica – numa base genética, tenda a assumido um papel de destaque na discussão filosófica sobre o próprio conceito de “informação” aplicado às ciências biológicas, nas suas múltiplas dimensões, expressões e interdependências entre organismos.1 Dela depende a sustentabilidade da vida, a qual assenta em mecanismos precisos e reprodutíveis de codificação e transmissão da informação primordial, i.e. da informação genética, vital para a sua subsistência e continuidade material. 1. A descoberta da estrutura dos ácidos nucleicos e a sua importância para a compreensão dos processos elementares da transmissão de informação ao nível genético inter-geracional é ilustrado de forma impar no livro de James D. Watson de 1968, “the double hélix”.5 IICM · Instituto Internacional Casa de Mateus 2. Tal como a encriptação de um qualquer código, ou simplesmente a codificação do alfabeto em palavras numa determinada língua, também a vida está munida de um códice universal e elementar, o qual de forma unívoca pode ser traduzido por processos biológicos em cadeia. Deste processo complexo podemos destacar o primeiro passo de transcrição no qual a informação contida na molécula primordial de DNA, que constitui a base dos nossos cromossomas, é transcrita numa molécula análoga, a que chamamos de mRNA. Num segundo passo esta molécula sai do núcleo e vai ser traduzida numa sequência de amino ácidos que dará origem a uma proteína depois de maturada. Finalmente, a divisão celular implica a replicação prévia de todo o material genético de forma a dotar cada uma das novas células descendentes geneticamente equivalentes. Estes são em suma os três processos elementares dos quais depende a transferência e interpretação da informação genética que dá suporte a todos os seres celulares e não celulares 3. Diz-se de moléculas que se organizam em agregados em número variável, como seja a formação de fibrilhas, estrutura esta de maior Assim sendo, a informação genética, codificada nas chamadas “moléculas da vida” como são os ácidos nucleicos,1 constitui a base do “Dogma Central” da biologia molecular, essencial para a compreensão de processos complexos como o de replicação, transcrição e tradução em entidades supramoleculares distintas,2 vulgarmente designadas de proteínas, tal como descrito pela primeira vez no famoso artigo de Francis H. C. Crick, publicado em 1958 e intitulado “On Protein Synthesis”.2 Neste contexto, a questão trazida a debate no âmbito do oitavo e último seminário do ciclo de encontros Mateus.Doc, subordinado ao temo “O Infinito”, procurará reflectir sobre a extensão, fundamento e aplicação deste conceito filosófico à noção científica de codificação e transmissão fidedigna da informação, partindo de uma base genética até ao nível supramolecular ou macromolecular,3 e do seu papel na “sustentabilidade” ou manutenção da vida, à luz de uma interpretação causal. 2. Disseminação contínua e unívoca da informação genética primordial Podemos compreender melhor o problema subjacente à disseminação da informação nos sistemas biológicos, recorrendo ao exemplo trivial de uma dada sequência macromolecular, e.g. sequência de DNA, codificar univocamente a sequência de uma outra estrutura macromolecular de natureza distinta e.g. sequência primária de amino-ácidos de uma proteína, ambas estruturas finitas no número de elementos que as compõem. Duas questões se colocam à partida: 1) desde logo qual o momento em que podemos assumir que uma dada estrutura ou sequência desta natureza passou a ter capacidade de codificar intrinsecamente na sua composição elementar algum tipo de informação vital da qual dependam estruturas derivadas?; 2) em que sentido e extensão se operam os fluxos de transmissão dessa informação e subordinada a que hierarquia ou regulação? Segundo a definição avançada por Crick, somente estruturas supramoleculares de determinado tipo possuem esta capacidade Cadernos Mateus DOC VIII · Infinito de codificarem informação biologicamente relevante, com vista à sua tradução em sequências macromoleculares distintas, como sejam as proteínas. Esta não é contudo uma relação biunívoca, entre o código genético uno e universal e a respectiva sequência de amino-ácidos aí codificada, uma vez que o mecanismo inverso não é biologicamente permitido. Isto é, nenhum organismo conhecido até hoje conseguiu a partir da sequência de uma proteína, reproduzir a sequência genética específica que lhe deu origem aplicando um mecanismo idêntico de tradução e transcrição inversos. Mesmo para as proteínas funcionais – conhecidas por enzimas, que assistem este mecanismo de auto-replicação do material genético, tal possibilidade não é permitida. No entanto, é possível que uma simples cadeia de DNA pré-existente se replique indefinidamente e por complementaridade regenere a dupla hélice original, assegurando assim que a informação aí codificada seja redundante e permaneça inalterada, processo este essencial para assegurar a integridade molecular do DNA e minimizar potenciais riscos causados pela introdução fortuita de erros ou mutações nas bases elementares do código genético. Esta formulação é habitualmente designada por transferência ou fluxo da informação genética, a qual propõe uma das maiores generalizações científicas que serviu de base ao enunciado “dogma central” da biologia molecular contemporânea.4 Por “informação” Crick entende a determinação precisa de um amino-ácido na sequência de uma proteína, ou elemento de uma cadeia de ácidos nucleicos. Segundo ele, esta informação uma vez transferida para a sequência de uma proteína não mais pode ser revertida. Por outras palavras, a transferência de informação entre ácidos nucleicos DNA/DNA, DNA/RNA ou de ácidos nucleicos para proteínas é possível, mas a transferência contrária de proteína para um ácido nucleico ou para outra proteína está biologicamente inacessível. complexidade, a qual lhe confere propriedades distintas e vantagens cooperativas em relação às suas unidades constitutivas individuais.. 4. Esta corrente de pensamento a qual atribui ao dogma central da biologia molecular um “papel cognitivo” tem suscitado aceso debate na comunidade científica opondo por exemplo o cepticismo radical manifestado por Sarkar, S. 6 ao optimismo excessivo expresso por Maynard, S.7 IICM · Instituto Internacional Casa de Mateus Figura 1 – Ilustração do mecanismo de transferência de informação postulado originalmente por Francis Crick em 1958, no qual as setas sólidas representam as únicas transferências possíveis de acordo com o enunciado do “dogma central”.2 A interpretação do fluxo ou transmissão da informação genética abarca assim dois outros planos fundamentais em biologia molecular, para além da síntese proteica, são eles o da replicação da molécula de DNA, dando origem a uma cópia fiel a qual é essencial ao processo de divisão celular inerente à perpetuação de uma linhagem descendente de células geneticamente idênticas, e a transcrição da informação para um outro tipo de ácido nucleico – mRNA, processo este igualmente implicado na produção de proteínas no local específico da célula, o ribossoma. Esta relação causal, com origem na molécula de DNA, tem sido experimentalmente demonstrada pela genética molecular, contudo ela depende em si mesma da pré-existência de maquinaria bioquímica apropriada, ou seja de proteínas, as quais representam na cascata de processos: replicação → transcrição → tradução não só um efeito mas também uma condição “sine qua non” ao mecanismo unívoco de transmissão da informação genética. Neste ponto somos confrontados com uma ambivalência causal que nos remete para uma potencial regressão infinita, pois se é verdade que à luz do modelo proposto por Crick a pré-existência de uma cadeia simples de DNA é a causa primeira para a formação de uma segundo cadeia complementar através de um processo de replicação, não deixa de ser igualmente verdade a relação Cadernos Mateus DOC VIII · Infinito causal com a necessária pré-existência de enzimas e.g. DNA polimerase, para que a replicação da hélice de DNA ocorra. Assim, Crick em 1964 3 sentiu necessidade de complementar o seu modelo de causalidade estrutural introduzindo a ideia de “template causation”, segundo o qual qualquer um dos três processos referidos anteriormente requer a pré-existência de um “template” ou molde molecular. 3. Sustentabilidade e risco nos mecanismos de transmissão de informação genética “ad infinitum” As experiências levadas a cabo entretanto vieram corroborar a validade da tese que defende haver uma colinearidade entre a informação contida numa sequência proteica e a do gene responsável pela sua codificação ao nível das respectivas estruturas moleculares, ou seja, qualquer mutação pontual introduzida numa posição específica da sequência de DNA, resulta necessariamente numa alteração precisa da sequência de amino-ácidos da proteína que nela está codificada. Contudo, devido à redundância do código genético, na qual diferentes sequências de três letras ou codões codificam para o mesmo amino-ácido, é possível não se observar qualquer alteração ao nível proteico, se essa sequência mutada codificar para o mesmo amino-ácido. Uma terceira possibilidade seria obter-se uma proteína truncada, se a mutação na sequência de DNA resultar numa sequência de terminação, a qual abortaria prematuramente a síntese proteica inviabilizando a sua posterior finalidade. Esta aparente infinidade de possíveis combinações genéticas poderia traduzir-se igualmente num infinito universo de proteínas por elas codificadas. Sabemos hoje no entanto que não é assim, as soluções encontradas pela Natureza durante o seu processo de contínua adaptação, como sendo as mais eficientes e funcionais num determinado contexto ambiental estão codificadas numa pequena fracção do material genético. Na prática a natureza encontrou uma forma muito expedita de resolver o problema da potencial variabilidade infinita do código genético recorrendo ao conceito de simetria e da combinação de domínios de um repertório vasto mas limitado de estruturas tridimensionais estáveis nele codificadas – as proteínas, optimizado para as condições IICM · Instituto Internacional Casa de Mateus fisiológicas onde os organismos se desenvolveram e através das quais evoluíram. Um importante princípio subjaz no entanto a esta discussão, o qual assegura que toda a “informação” necessária à criação de uma estrutura tridimensional de uma proteína a partir da sua sequência primária linear de amino-ácidos, ou seja na sua conformação nativa, está contida nesta mesma sequência, sendo assim a tradução proteica é em certa medida um processo determinístico. No entanto, a resiliência da estrutura proteica a alterações pontuais de amino-acidos é muito elevada, permitindo por vezes uma acumulação elevada de alterações na sequência proteica sem comprometer a sua estabilidade estrutural ou funcional. Quando tal não se verifica e as propriedades da proteína ficam irreversivelmente comprometidas, ocorre o princípio da selecção natural, resultando eventualmente numa variabilidade funcional que melhor responda à pressão evolutiva imposta pelo meio. A hipótese da estrutura de uma proteína estar à partida pré-determinada pela sequência de amino-acidos que lhe dá origem traduz a chamada hipótese termodinâmica associada ao enrolamento das proteínas numa estrutura bem definida, cuja experiência de Anfinsen veio demonstrar, pondo em causa a necessidade de um “template” externo na síntese proteica, ao contrário dos processos de replicação e transcrição referidos anteriormente.4 No fluxo de informação entre os genes e as proteínas, a adopção espontânea de uma determinada estrutura nativa bem definida é o factor decisivo que assegura a sua função intrínseca num determinado processo biológico. A hipótese termodinâmica remete-nos para um conceito mais lato, o de equilíbrio termodinâmico, para o qual todos os sistemas tendem no limite. Segundo a hipótese de Anfinsen, também as proteínas tendem a adoptar espontaneamente a sua estrutura nativa, termodinamicamente mais favorável. O mesmo será válido para dimensões de complexidade molecular superiores, nas quais várias proteínas se podem agregar, revelando funcionalidades cooperativas, distintas da das suas unidades constituintes. Por outro lado, a hipótese termodinâmica, ajuda-nos também a entender quais os mecanismos de redução dos graus de liberdade Cadernos Mateus DOC VIII · Infinito num sistema biológico. Caso contrário, o número de hipóteses a explorar e o tempo para que cada molécula encontre a sua precisa configuração funcional tenderia para o infinito. Na realidade o mesmo aconteceria com o encontro efectivo entre duas moléculas na célula, caso não houvesse um reconhecimento molecular específico para cada par. 4. Conclusão A sustentabilidade de qualquer processo biológico no tempo está assim depende de três factores fundamentais: 1) da capacidade de assegurar um fluxo contínuo de transmissão fiel da informação genética primordial ao longo das gerações; 2) da capacidade de aproveitar a variabilidade genética que codifica essa informação como fonte de diversidade funcional num contexto em constante mutação; 3) do princípio termodinâmico que permite optimizar o aparecimento e interacção selectiva de estruturas moleculares, independentemente do seu grau de complexidade. A verificação destes factores permite-nos entender a manutenção sine die dos sistemas biológicos, tal como os conhecemos hoje, bem como aceitar como plausível a existência de sistemas de codificação e transmissão de informação análogos, noutros ambientes planetários do nosso cosmos, pelos quais procuramos. Bibliografia Šustar, P. Crick’s Notion of Genetic Information and the “Central Dogma” of Molecular Biology. British Journal for the Philosophy of Science, 2007, 58, 13–24. Crick, F. H. C. On Protein Synthesis. Symp. Soc. Exp. Biol. 1958, 12, 138–163. Crick, F. H. C. The Biochemistry of Genetics. Int. Union Biochem. Symp. Ser. 1964, 33, 109–128. Anfinsen, C. B. Principles That Govern the Folding of Protein Chains. Science 1973, 181 (4096), 223–230. Watson, J. D. The Double Helix; Athenaeum Press, 1968; Vol. 40. Sarkar, S. Information in Genetics and Development Biology. Philos. Sci. 2000, 67, 208–213. IICM · Instituto Internacional Casa de Mateus Smith, J. M. The Concept of Information in Biology. Philosophy of Science, 2000, 67, 177–194.