Bioinformática e Sistemas Complexos em Biologia
Florencio Pazos Cabaleiro. Centro Nacional de Biotecnología (CNB-CSIC). Madrid [email protected]
A aproximação reducionista aplicada a Biologia tem sido, como em outras áreas da ciência,
a que mais êxitos tem proporcionado a esta disciplina. Esta aproximação baseia-se em estudar um
sistema separando-o em componentes mais simples e fácies de estudar, supondo-se de que as
propriedades desse sistema se podem-se obter a partir das propriedades dos componentes
individuais. No limite, este método pressupõe que qualquer característica de um sistema poderá em
princípio explicar-se a partir dos átomos ou inclusive partículas subatómicas que o compõem e que,
nos casos em que este não se tenha podido fazer, o problema está na falta de conhecimento
detalhado destes componentes, o que realimenta a abordagem reducionista pois implica que a
solução passa por estudar mais a fundo as propriedades destes componentes. No caso da Biologia
esta perspectiva reducionista levada ao limite pretenderá, por exemplo, explicar fenómenos tão
complexos como a consciência ou as funções cerebrais superiores baseando-se em reacções
químicas ou fenómeno atómicos quânticos. A crença na capacidade ilimitada da abordagem
reduccionista para resolver problemas científicos é muito lógico se pensarmos no tremendo êxito
que tem tido e continua a ter. Na física, a descoberta da estrutura atómica da matéria e o feito de
que propriedades de níveis superiores (reacções químicas, propriedades macroscópicas de
materiais, etc.) se pudessem explicar tomando como base as propriedades dos átomos fez-me
pensar que tudo se poderia explicar seguindo esta aproximação. No caso da Biologia, o advento da
Biologia Molecular durante o século XX e seus tremendos êxitos explicando muitas características
dos sistemas vivos a partir dos seus componentes moleculares levou a pensar que todos os
fenómenos biológicos poderiam chegar a explicar-se assim. Da mesma maneira, dado que as
moléculas biológicas estão formadas por átomos, o conhecimento detalhado destas permitiria
explicar fenómenos biológicos a qualquer escala. Desta maneira a Biologia, como qualquer outra
ciência, convergiria face a Física. Ainda hoje há quem defenda estas posições extremas. As
primeiras críticas à abordagem reducionista vêem dos estudos de sistemas complexos. Esses
primeiros estudos são muito recentes, dos anos 70, se bem que estão baseados em dados e
observações muito anteriores que ninguém se atreveu a interpretar como um erro da aproximação
reduccionista. Nestes estudos descobriu-se que certas propriedades de alguns sistemas não
poderiam nunca ser preditas a partir de seus componentes já que dependiam de certos tipos de
interacções entre eles (retroalimentação, etc.) que requeriam um modelo matemático não-linear. As
equações não lineares só podiam ser resultantes por aproximação ou simulação, o que fazia que a
mais mínima imprecisão nos dados se amplifique (pela própria alta interdependência do sistema)
até resolve-lo. Certas propriedades (emergentes) simplesmente apareciam e nunca se poderia
chegar a deduzi-las por muito avançado que estivesse o nosso conhecimento dos componentes do
sistema e suas interacções. Não era um problema de falta de conhecimento detalhado ou de falta
de ferramentas matemáticas, esta impossibilidade de predizer propriedades do sistema a partir dos
componentes era algo intrínseco a própria natureza do sistema. Até então, fenómenos tão
quotidianos e de tanta importância prática como turbulências em fluidos, fenómenos atmosféricos,
estruturas biológicas, que resistiam à abordagem reduccionista, eram caracterizados de
“curiosidades”. A Teoria do Caos e de Sistemas Complexos chegou quando a abordagem molecular
a Biologia estava em seu apogeu e isto fez com que se incorporassem mais tarde ás ciências da
vida. No entanto, desde o princípio se viu que os sistemas vivos eram um dos protótipos de
sistemas complexos. Agora estamos começando a ver claramente, e de maneira dramática em
muitos casos, os limites do reducionismo em Biologia. Hoje está claro que muitíssimos fenómenos
biológicos nunca poderão ser explicados a partir de componentes moleculares 1,2. De todo não é
uma simples soma das partes senão uma função muito mais complexa de estas 3,4. Sabemos agora
que as propriedades dos componentes individuais significam muito pouco e só no contexto das
complexas interacções com outros adquirem significado biológico. A obtenção do repertório de
“componentes” de vários organismos (sequenciação de genomas, proteómica) e a realização de
que estes repertórios não pareciam estar, nem em quantidade nem em qualidade, relacionados com
a tremenda diferença entre organismos (similar número de genes entre C elegans e humano, quase
uma identidade nas sequências de proteínas de humano e ratos) não parece tirar força à ideia de
que estes componentes moleculares podiam explicar as características últimas dos organismos 5.
Uma característica dos sistemas complexos (entre eles os biológicos) é a “emergência”. Uma
propriedade emergente é aquela que surge das intrincadas relações entre componentes pelo que se
resiste totalmente a ser deduzida a partir de estes. As propriedades emergentes diferenciam-se das
“resultantes”, que podem ser extrapoladas a partir dos componentes. Propriedades emergentes dos
sistemas vivos (inclusivamente a um nível muito baixo) são, por exemplo, as características
topológicas das redes biológicas (modularidade, centralidade)6-8. A níveis superiores (fisiológicos,
mentais) quase todas as propriedades são emergentes e resistem a uma abordagem reducionista:
por exemplo, estruturas fisiológicas como veias, folhas de plantas, alvéolos pulmonares, etc., não
podem ser deduzidas a partir da informação genética, pois surgem de complicados processos autoorganizativos que implicam inevitavelmente interacções com o ambiente 9. Curiosamente, nestes
casos as propriedades de níveis superiores determinam as características dos inferiores 1,10,11: por
exemplo: a necessidade de que as redes biológicas sejam modulares e tenham pontos centrais
(hubs) determina as características dos componentes moleculares que a formam (modulando-os
evolutivamente). Isto é precisamente o contrário da visão reducionista em que, são os componentes
de níveis baixos os que determinam as propriedades de níveis superiores, e nunca o contrário.
Outra característica destes sistemas é a “robustez”, no sentido de que não se vêem
irreversivelmente afectados por certas perturbações que são capazes de se recuperar 5. A robustez
consegue-se basicamente por redundância e modularidade12. Isto é curioso dado que a alta
interdependência nestes sistemas tende a amplificar qualquer efeito (ver acima), incluídas
perturbações, pelo que se esperaria que fossem muito instáveis. A explicação está no conceito de
atractor da Teoria do Caos: em muitos sistemas complexos a sua evolução leva-os a um estado
dinâmico em que o seu comportamento, ainda que complexo e imprevisível nos detalhes, os faz
passar um número limitado e finito de estados (as Perante qualquer perturbação que os tire daí,
evoluem regressando a esse atractor. Em Biologia, os atractors têm-se relacionado com conceitos
tão importantes como a homeostasia, ou inclusivamente, com os diferentes tipos celulares (tecidos),
que se têm interpretado com atractors no espaço de expressões génicas 13, teoria que se está
confirmando experimentalmente com dados de DNA arrays 14. Um aspecto onde dramaticamente se
manifesta a falha da aproximação reducionista em Biologia, é no tratamento de certas doenças
complexas como o cancro. Muitos componentes moleculares implicados no cancro têm-se estudado
exaustivamente à escala molecular (sequências, estruturas, mutantes), sem que isso tenha ajudado
a apontar soluções globais a esta doença. Isto deve-se, como se disse acima, a que as
características moleculares destes componentes significam muito pouco por si só, e só no contexto
das suas complexas interacções com outros adquirem significado para esta doença. Outro exemplo,
é o desenho de drogas, que também até ao momento se tem baseado primordialmente numa
aproximação reducionista. A falha desta perspectiva reflecte-se no decréscimo constante do número
de novas drogas que saem no mercado, apesar da crescente inversão da matéria. Outras técnicas
terapêuticas prometedoras, que também estão a dar resultados muito por abaixo dos esperados,
como a terapia genética, RNA “no-sense”, etc. 15, coincidem com a primeira na perspectiva
reducionista (“uma droga – uma “diana”) que não valoriza o suficiente as complexas relações da
droga e da “diana” com outros componentes celulares, o que leva a que esta não funcione ou
produza efeitos secundários indesejados. A base reducionista destas técnicas terapêuticas, também
deveria ter feito com que se beneficiassem enormemente dos projectos de “catalogação” de
componentes (sequenciação de genomas, proteómica, genómica estrutural) quando se tem visto
claramente que não tem sido assim 16. O desenho racional de vacinas também segue uma
abordagem reducionista, reduzindo o complexo processo de “protecção de um organismo contra
uma infecção” a um problema de interacção entre duas moléculas (antigenio/vacina - anticorpo) 2.
Esta é uma das causas de não se ter encontrado ainda vacina para certos vírus como o HIV a pesar
de todo o dinheiro e esforço investidos 17. No caso das vacinas, a aproximação reducionista chegou
mais longe com as vacinas de péptidos, cujo fracasso é muito conhecido 18. A própria metodologia
em Biologia é altamente reducionista. Um exemplo são as experiências de knockout genético para
revelar o papel de um determinado gene. Estas experiências têm dado em muitos casos resultados
falsos: genes que se sabe têm funções essenciais cuja função não produz efeito, funções com
efeitos totalmente diferentes aos esperados ou aos que se dão em organismos próximos e também
estirpes 19. Em muitos casos isto se deve a subvalorizar as características mencionadas de robustez
do sistema e o feito com que, muitas vezes, a função biológica de um gene só adquire sentido em
contexto de suas complexisimas relações com outros. Também a nível metodológico, a ilimitada
confiança nas aproximações in-vitro, e mais recentemente in-silico, a Biologia tem levado a pensar
que estas aproximações podiam chegar até ao último conhecimento biológico prescindindo da
aproximação in-vivo. A Teoria de Sistemas Complexos diz-nos que, dado que são aproximações, os
pequenos detalhes que podemos perder nestes passos podem levar a que muitas das conclusões
obtidas não tenham nada a ver com o que ocorre in-vivo.
Todas estas novas visões não-reducionistas estão relacionadas com a chamada Biologia de
Sistemas 4,5, que estuda os fenómenos biológicos como formados por componentes em
complexíssimas relações, onde muitas propriedades do sistema só se podem entender estudando
estas relações e as propriedades emergentes que possui (aproximação de alto baixo), e não
estudando em detalhe as propriedades dos componentes e tentando predizer as do sistema a partir
deles (visão reduccionista). Nesta aproximação a Bioinformática é fundamental já que se requer do
tratamento de grandes quantidades de informação (componentes e relações). Esta nova disciplina
também necesita de novas ferramentas experimentais (quase todas as actuais estão desenhadas
pensando numa abordagem reducionista), como os DNA microarrays, a nanotecnología,
microfluidos 20, etc. Os DNA array são o exemplo perfeito de estudo biológico desde o punto de
vista de sistemas já que nesta técnica se perde precisão en la monitorización de los valores de
expresión de los genes individuales (componentes) para obtener “fotografías” globales del “espacio
de expresión génica” del sistema y sus cambios. A visão anti-reduccionista da Biologia é recente e,
lamentavelmente, os seus esforços tem-se centrado mais em demostrar as limitações da
perspectiva reducionista (ás vezes demasiado criticamente 11) que em dar realmente soluções. No
entanto, a aproximação não-reducionista no tratamento de problemas biológicos também está a dar
resultados, tanto de conhecimento básico como aplicado. Entre o conhecimento básico que esta
aproximação tem produzido, destaca-se o obtido do estudo de redes biológicas 12,21. Da rede de
interacção entre proteínas tem-se estudado a sua topologia, distribuição e número de interacções,
localização de pontos críticos, taxa evolutiva dos distintos tipos de pontos, tolerância da rede a
perturbações e erros, e comparação da organização das redes em distintos organismos 6-8,22-26.
Sobre as redes metabólicas, os numerosos estudos incluem descrições da sua topologia e
conectividade 23, carácter modular e a relação destes módulos com vias metabólicas “clássicas” 27,
evolução da rede 28,29, características e evolução da rede de metabolismo secundário 30. Sobre as
redes de regulação génica tem-se estudado a sua composição em motivos 31 donde activações e
repressões se combinam em complexas funções para modular e resultado final 32,33. Também se
tem visto que estes motivos têm surgido independentemente partindo de componentes distintos, por
evolução convergente e em distintos organismos, mercê a sua importância 34,35. Enquanto as
aplicações práticas também houve várias aproximações desde este novo ponto de vista a doenças:
Um modelo sobre a rede de interacções metabólicas e genéticas relacionadas com a utilização de
galactose em levedura permitiu formular hipóteses sobre doenças humanas complexas 22. Algo tão
complexo como o cancro de próstata, está a começar a estudar com DNA arrays de milhões de
sequências 20 e tem-se visto que meio milhar de factores de transcrição estão relacionados com
este processo, tornando impossível qualquer tratamento ou aproximação reduccionista ao problema
(baseada num só target). Nesta doença também se tem visto que, dada a tremenda complexidade
do processo, o uso de um grupo grande de moléculas e das suas relações como marcadores
tumorais (em análises de sangue, etc.) é mais eficaz que o uso de marcadores simples 20. Em geral
está-se passando de uma visão em que os targets são proteínas ou genes, a uma em que são
subredes biológicas, dado que a doença perturba a subrede inteira 20,22. A abordagem nãoreducionista não tenciona acabar com a abordagem reducionista, mas sim, complementá-lo, de
maneira que se aplique a aproximação adequada a cada problema biológico e a cada nível de
complexidade. A visão diametralmente oposta ao reduccionismo, holismo extremo, que considera
que tudo depende de tudo e que portanto nunca poderemos predizer nada, também não nos é útil.
Esta visão anti-reduccionista da Biologia também implica que esta deve manter-se como una
disciplina à parte com as suas próprias vocabulário e conceitos distintos da Física ou da Química 2.
Referencias
1. Oltvai, Z. N. & Barabási, A.-L. (2002). Life’s complexity pyramid. Science. 298, 763–764.
2. Van Regenmortel, M. H. (2004). Reductionism and complexity in molecular biology. Scientists
now have the tools to unravel biological and overcome the limitations of reductionism. EMBO
Rep. 5, 1016-1020.
3. Nurse, P. (2003). Systems biology: understanding cells. Nature. 424, 883.
4. Kitano, H. (2002). Computational systems biology. Nature. 420, 206-210.
5. Kitano, H. (2002). Systems Biology: A Brief Overview. Science. 295, 1662-1664.
6. Jeong, H., Mason, S. P., Barabási, A. L. & Oltvai, Z. N. (2001). Lethality and centrality in protein
networks. Nature. 411, 41-42.
7. Guelzim, N., Bottani, S., Bourgine, P. & Képès, F. (2002). Topological and causal structure of
the yeast transcriptional regulatory network. Nature Genet. 31, 60-63.
8. Wuchty, S., Oltvai, Z. N. & Barabasi, A. L. (2003). Evolutionary conservation of motif
constituents in the yeast protein interaction network. Nat Genet. 35, 176-179.
9. Cho, A. (2004). Life's Patterns: No Need to Spell It Out? Science. 303, 782-783.
10. Kim, J. (1999). Making sense of emergence. Philos Stud. 95, 3-36.
11. Lewontin, R. (2000). The Triple Helix. Gene, Organism and Environment, Harvard University
Press, Cambridge, MA, USA.
12. Alm, E. & Arkin, A. P. (2003). Biological networks. Curr Opin Struct Biol. 13, 193-202.
13. Kauffman, S. A. (1993). The Origins of Order, Oxford University Press, New York.
14. Huang, S., Eichler, G., Bar-Yam, Y. & Ingber, D. E. (2005). Cell Fates as High-Dimensional
Attractor States of a Complex Gene Regulatory Network. Phys Rev Letters. 94, 128701.
15. Glassman, R. H. & Sun, A. Y. (2004). Biotechnology: identifying advances from the hype. Nat
Rev Drug Discov. 3, 177-183.
16. Drews, J. (2003). Strategic trends in the drug industry. Drug Discov Today. 8, 411-420.
17. Burton, D. R. & Moore, J. P. (1998). Why do we not have an HIV vaccine and how can we make
one? Nat Med. 4, 495-498.
18. Van Regenmortel, M. H. (2001). Pitfalls of reductionism in the design of peptide-based
vaccines. Vaccine. 19, 2369-2374.
19. Pearson, H. (2002). Surviving a knockout blow. Nature. 415, 8-9.
20. Hood, L., Heath, J. R., Phelps, M. E. & Lin, B. (2004). Systems biology and new technologies
enable predictive and preventative medicine. Science. 306, 640-643.
21. Barabasi, A. L. & Oltvai, Z. N. (2004). Network biology: understanding the cell's functional
organization. Nat Rev Genet. 5, 101-113.
22. Ideker, T., Thorsson, V., Ranish, J. A., Christmas, R., Buhler, J., Eng, J. K., et al. (2001).
Integrated genomic and proteomic analyses of a systematically perturbed metabolic network.
Science. 292, 929-934.
23. Jeong, H., Tombor, B., Albert, R., Oltvai, Z. N. & Barabási, A. L. (2000). The large scale
organisation of metabolic networks. Nature. 407, 651-653.
24. Fraser, H. B., Hirsh, A. E., Steinmetz, L. M., Scharfe, C. & Feldman, M. W. (2002). Evolutionary
rate in the protein interaction network. Science. 296, 750-752.
25. Kelley, B. P., Sharan, R., Karp, R. M., Sittler, T., Root, D. E., Stockwell, B. R., et al. (2003).
Conserved pathways within bacteria and yeast as revealed by global protein network alignment.
Proc Natl Acad Sci U S A. 100, 11394-11399.
26. Aldana, M. & Cluzel, P. (2003). A natural class of robust networks. Proc Natl Acad Sci U S A.
100, 8710-8714.
27. Ravasz, E., Somera, L., Mongru, D. A., Oltvai, Z. N. & Barabási, A. L. (2002). Hierarchical
organization of modularity in metabolic networks. Science. 297, 1551-1555.
28. Schmidt, S., Sunyaev, S., Bork, P. & Dandekar, T. (2003). Metabolites: a helping hand for
pathway evolution? Trends Biochem Sci. 28, 336-341.
29. Alves, R., Chaleil, R. A. G. & Sternberg, M. J. E. (2002). Evolution of enzymes in metabolism: a
network perspective. J Mol Biol. 320, 751-770.
30. Pazos, F., Valencia, A. & De Lorenzo, V. (2003). The organization of the Microbial
Biodegradation Network from a Systems-Biology perspective. EMBO Rep. 4, 994-999.
31. Milo, R., Shen-Orr, S. S., Itzkovitz, S., Kashtan, N., Chklovskii, D. & Alon, U. (2002). Network
motifs: simple building blocks of complex networks. Nature. 298, 824-827.
32. Shen-Orr, S. S., Milo, R., Mangan, S. & Alon, U. (2002). Network motifs in the transcriptional
regulation network of Escherichia coli. Nature Genet. 31, 64-68.
33. Setty, Y., Mayo, A. E., Surette, M. G. & Alon, U. (2003). Detailed map of a cis-regulatory input
function. Proc Natl Acad Sci U S A. 100, 7702-7707.
34. Conant, G. C. & Wagner, A. (2003). Convergent evolution of gene circuits. Nat Genet. 34, 264266.
35. Babu, M. M. & Teichmann, S. (2003). Evolution of transcription factors and the gene regulation
network in Escherichia coli. Nucleic Acids Res. 31, 1234-1244.
Download

Bioinformtica e Sistemas Complexos em Biologia