Evolução Biológica e Algoritmos
Genéticos
Fábio Lima Custódio
[email protected]
Sumário
• Conceitos gerais
• O que é evolução?
• Forças Evolutivas
–
–
–
–
Mutação
Deriva Gênica
Fluxo gênico
Seleção Natural
• A teoria evolutiva como um algoritmo de otimização
Genes
• Fragmento de DNA que codifica uma certa função bioquímica,
por exemplo, a produção de uma proteína
• É fundamentalmente uma unidade de herança
• Qualquer fragmento de DNA que sofre ação da
seleção natural
• O DNA de um organismo pode conter desde uma dúzia de
genes (como o de um vírus), até dezenas de milhares (como o
de um humano)
DNA: A Molécula da Vida
• O Ácido Desoxirribonucleico (ADN ou DNA) é o material
genético fundamental de todos os organismos vivos
• O DNA é uma macro-molécula com uma estrutura em duplahélice
• Os dois filamentos da hélice, chamados de fitas, são
polímeros de nucleotídeos
• Um nucleotídeo é um carboidrato (desoxirribose) ligado a um
grupamento fosfato e a uma base nitrogenada
Genes e proteínas
• Genes codificam as proteínas.
Típico organismo moderno
DNA Transcrição RNA
Tradução
Proteínas
Replicação
• A seqüência de aminoácidos de um polipeptídeo é chamada de
estrutura primária. Mas existem 3 outros níveis de organização
estrutural, que, em conjunto, determinam a formação
tridimensional da proteína, e, em conseqüência, sua função (ou
efeito fenotípico).
Cromossomo
• Cromossomo: uma das cadeias de DNA que se encontra no
núcleo das células
• Cada gene é capaz de ocupar somente uma região em
particular de um cromossomo (seu “lugar” ou locus)
• Em cada locus pode existir, em uma população, “formas”
alternativas do gene. Essas formas são chamadas de alelos
6
Genoma
• A coleção total de genes (e portanto, cromossomos) que um
organismo possui
Desenvolvimento
• Genótipo:
A composição genética de um organismo (a informação
contida no genoma)
• Pode-se dizer que, é o que potencialmente pode vir a ser um
indivíduo
Desenvolvimento
• Fenótipo:
Conjunto das características (observáveis) específicas de um
indivíduo
...
Conceitos básicos
• Indivíduo:
Um só membro de uma população
Conceitos básicos
• População:
Um grupo de indivíduos que podem interagir, por exemplo,
para reproduzir
Reprodução
• Reprodução: a geração de um novo indivíduo a partir de
 2 progenitores: sexual
 1 progenitor: asexual
Reprodução
• Gametas:
As células que levam informações genéticas dos pais com o
propósito de efetuar reprodução sexuada
Reprodução
• Denomina-se diplóide a uma célula que contém duas cópias de
cada cromossomo
• As cópias são chamadas de homólogas, quer dizer, contém os
mesmos genes na mesma seqüência  Cromossomos
homólogos
• Denomina-se haplóide a célula que contém somente uma
cópia dos cromossomos
• Um exemplo é o gameta de um organismo diplóide
Reprodução
• Dessa forma, em muitas espécies que se reproduzem
sexuadamente os genes em um dos conjuntos de
cromossomos de uma célula diplóide são herdados do gameta
do pai, enquanto que os genes do outro conjunto são do
gameta da mãe
Recombinação
• Durante a reprodução sexual ocorre a recombinação
(cruzamento ou crossover)
• Caso haplóide: Os genes fazem intercâmbio entre os
cromossomos (haplóides) dos pais
Recombinação
• Caso diplóide: Em cada pai, os genes podem se trocar entre os
pares de cromossomos na formação dos gametas
• Os gametas dos dois pais se juntam para formar um só
conjunto de cromossomos diplóides
Recombinação
• Recombinação (crossover)
• De acordo com o modelo de evolução biológica de
Darwin, os requisitos mínimos para os processos
evolutivos ocorrerem (no sentido filogenético) são
(Banzhaf et al., 1998):
– Reprodução de indivíduos na população
– Variação que afeta a probabilidade de
sobrevivência dos indivíduos
– Hereditariedade na reprodução
– Competição por recursos finitos
Evolução, o que é?
•
São as mudanças na composição genética de uma
determinada população ao longo de gerações
– Mudanças na frequência dos alelos ao longo do tempo
•
Quatro mecanismos distintos levam a essas mudanças
Evolução, o que é?
•
São as mudanças na composição genética de uma
determinada população ao longo de gerações
– Mudanças na frequência dos alelos ao longo do tempo
•
1.
2.
3.
4.
Quatro mecanismos distintos levam a essas mudanças
Mutação
Deriva gênica
Fluxo gênico (migração)
Seleção natural (ou artificial)
Mutação, origens e efeitos evolutivos
• Mutação como fonte de nova variabilidade genética e como
força evolutiva que altera as frequências dos genes em uma
população
• Constitui a origem de todas as novidades genéticas em uma
população
– Grandes ou pequenas
• No sentido amplo, a mutação refere-se a qualquer mudança
imprevista e hereditária no genótipo de um organismo
Mutação, origens e efeitos evolutivos
• Características básicas da mutação gênica
– Pode ocorrer de forma espontânea: erros da enzima DNA polimerase
– Ou induzida por agentes mutagênicos
– Pode ocorrer em qualquer tipo celular, mas apenas as que ocorrem
em gametas são herdáveis
– Ocorrência rara?
Mutação, origens e efeitos evolutivos
• Mutação como força evolutiva
– Células somáticas X células germinativas
– Mudanças na frequência gênica
Mutação, origens e efeitos evolutivos
• Mutação como força evolutiva
– Pequeno efeito na frequência gênica
– Um evento único possui uma chance muito pequena (zero) de
propagação indefinida em uma população muito grande (infinita)...
– Populações reais são finitas! De fato, ocasionalmente mutações únicas
sobrevivem indefinidamente e levam a uma mudança na frequência
gênica
– Porém, com taxas de mutação “normais”, a mutação sozinha pode
produzir somente mudanças muito vagarosas nas frequências gênicas
– Como esse não é o caso em populações naturais, é claro que as
frequências gênicas naturais não são produto da mutação sozinha
Deriva Gênica
• Quando uma população se reproduz...
Gene Pool
• Quando uma população se reproduz...
Deriva Gênica
• Quando uma população se reproduz, existe uma amostragem
no gene pool
– Como se fosse um sorteio, em que os alelos sorteados encontram-se
nos gametas que se unem para formar filhotes
Deriva Gênica
• A frequência dos genes apresenta uma distribuição binomial
– Um alelo é de um determinado tipo OU não
• Cada geração nova é produzida como uma amostragem da
população anterior
• Variação nas frequências gênicas, puramente ao acaso, ligada
exclusivamente aos desvios padrões das frequências
σ ( p) =
pq
n
Deriva Gênica
• A frequência dos genes apresenta uma distribuição binomial
– Um alelo é de um determinado tipo OU não
• Cada geração nova é produzida como uma amostragem da
população anterior
• Variação nas frequências gênicas, puramente ao acaso, ligada
exclusivamente aos desvios padrões das frequências
σ ( p) =
pq
n
• O que aconteceria com uma população infinita?
• O que acontece na prática?
Deriva Gênica
• O que acontece na prática?
Deriva Gênica, em outras palavras...
• São variações que as frequências dos genes sofrem.
– Porque as populações são finitas e cada ser vivo deixa um número
variável de filhotes a cada geração
– É o resultado direto do efeito do desvio padrão no processo de
amostragem que acontece durante o ciclo reprodutivo
– Como o desvio padrão depende do tamanho das amostras: quanto
maior uma população menor a deriva gênica
Fluxo Gênico
• Introdução ou perda de cópias de um alelo na população
Seleção Natural: Definição
• Ela não é um agente ativo, nem uma entidade dotada de
mente ou vontade
• Trata-se de uma avaliação estatística da diferença de
sobrevivência (ou mortalidade) de organismos que são
diferentes em uma ou mais características
• A seleção natura não causa a sobrevivência diferencial, ela é a
sobrevivência diferencial
Seleção Natural: Definição
• “Pode atuar” em qualquer nível dos organismos:
–
–
–
–
Genes
Indivíduos
Populações
Espécies
• Em geral, assumimos que a unidade de seleção
natural é o indivíduo. A sobrevivência diferencial
se deve, então, às diferencias no fenótipo,
determinadas por um ou mais locos gênicos
Seleção Natural: Mecanismos
•
A seleção natura funciona com base em três premissas
1. Genótipos variam dentro de uma população e essa variação é
hereditária
2. Componentes bióticos e abióticos no ambiente de um
organismos agem como pressões seletivas
3. Genótipos melhor adaptados a essas pressões deixam mais
cópias
Seleção Natural: Mecanismos
• 1- Genótipos variam dentro de uma população e essa variação é
hereditária
• De onde vem a variação?
MUTAÇÃO!
• Como a nova variação é passada adiante? Reprodução! (deriva gênica)
• Durante a reprodução ocorre um processo chamado recombinação.
Que faz com que os novos alelos surgidos por mutação sejam
imediatamente colocados em uma variedade de ambientes
genéticos
– Isso é particularmente importante!
– O fenótipo é resultado da interação entre os diferentes genes de um
organismo
Seleção Natural: Mecanismos
• 2- Componentes bióticos e abióticos no ambiente de um
organismos agem como pressões seletivas
• Exemplo de fatores bióticos:
– Predadores
– Competidores
– Mutualistas
• Exemplo de fatores abióticos:
– Disponibilidade de recursos
– Condições físicas
– Condições químicas
• As pressões pode ter origem natural ou artificial
Seleção Natural: Mecanismos
•
3- Genótipos melhor adaptados a
essas pressões deixam mais cópias.
•
Adaptação: uma característica
geneticamente determinada que
melhora a habilidade de um
organismo de sobreviver e
reproduzir em um ambiente em
particular
•
Indivíduos melhor adaptados
possuem um maior valor adaptativo
(“fitness”)
Seleção Natural: Definição e valor adaptativo.
• A seleção natural é a reprodução diferencial dos indivíduos numa
população
– A mortalidade (ou sobrevivência) dos organismos não ocorre ao acaso
• É uma força determinista que causa uma mudança nas frequências
gênicas com sentido e direção determinados. Sempre na direção do
aumento do valor adaptativo médio das populações
• O que é valor adaptativo?
– É a contribuição relativa de um genótipo para a geração seguinte. A taxa
de sobrevivência de um determinado genótipo
– Valor adaptativo médio é a média dos valores adaptativos dos genótipos
em uma população ponderada pelas respectivas frequências
Seleção Natural: Valor adaptativo.
• O que é valor adaptativo.
– É a contribuição relativa de um genótipo para a geração seguinte. A taxa
de sobrevivência de um determinado genótipo.
– Valor adaptativo médio é a média dos valores adaptativos dos genótipos
em uma população ponderada pelas respectivas freqüências. Por
exemplo, um caso de vantagem do hereozigoto:
WAA = 0,9
WAa = 1,0
Com
p = 0,5 e q = 0,5
Logo
p2 = 0,25 2pq=0,5 q2=0,25
O valor adaptativo médio, W é
0,9x0,25+1,0x0,5+0,9x0,25 = 0,95
Waa = 0,9
Seleção Natural: Paisagem adaptativa
• Se podemos calcular o valor adaptativo médio de uma
população, podemos criar uma representação deste valor em
função de p ou q
• Isso é chamado de paisagem adaptativa (“fitness landscape”)
Seleção Natural: Paisagem adaptativa
• Se podemos calcular o valor adaptativo médio de uma
população, podemos criar uma representação deste valor em
função de p ou q.
• Isso é chamado de paisagem adaptativa (“fitness landscape”).
Seleção Natural: Paisagem adaptativa
• As paisagens adaptativas são particularmente úteis para se
vislumbrar o processo evolutivo.
• A escalada do monte improvável de R. Dawkins
• Múltiplos caminhos para os picos.
• ESS.
Estratégias
Evolutivamente
Estáveis.
Evolução, finalizando
•
Quais dos quatro mecanismos da evolução gera adaptação?
1. mutação
2. fluxo gênico
3. deriva gênica
4. seleção
•
Apenas a seleção natural! As outras forças geram variação sem ligação
com melhoria na sobrevivência em um dado ambiente
•
Como estas forças interagem?
– De fato, quanto menor o tamanho de uma população, maior o desvio padrão na
amostragem reprodutiva, assim, quanto menor uma população menores os efeitos
da seleção natural
– De forma análoga, quanto maior uma população, menores serão os efeitos da
deriva gênica
Uma grande ideia
• O conceito de paisagem adaptativa inspirou cientistas da área
de exatas
– Os pesquisadores vinham lidando com problemas cada vez mais
complexos e com formulações incompletas
– Em tais problemas os
métodos tradicionais de
otimização falhavam ou
tinham uma performance
inaceitável...
Uma solução natural
•
A natureza já havia resolvido o maior de todos os problemas há muito
tempo
–
Como o problema da sobrevivência é resolvido?
1. Possíveis soluções são codificadas no genoma (armazenadas no
DNA)
2. Essas possíveis soluções sofrem mudanças aleatórias que passam
de uma geração para outra, são copiadas com fidelidade
3. Essas mudanças causam diferenças na qualidade das soluções
4. Soluções diferentes podem ser combinadas dando ainda mais
variedade
5. As soluções piores, comparativamente, têm menor chance de se
perpetuar, isto é, deixar cópias ao longo das gerações
Uma solução natural
• Foi “apenas” uma questão de adaptar os cinco passos
para resolver outros problemas
• Surgiram os algoritmos genéticos
– Inspirados em processos naturais, cientistas criaram um poderoso
método de otimização, capaz de lidar com problemas de grande
complexidade
– Desde o seu surgimento têm sido aplicados a uma infinidade de
problemas interessantes em muitas áreas diferentes
Algoritmos genéticos
• Um algoritmo genético básico (standard GA).
Inicie a população P;
Avaliar aptidão dos indivíduos dessa população P;
Repita
Repita
Selecione 2 indivíduos de P ;
Aplique um operador de recombinação com probabilidade p(r);
Aplique operador de mutação com probabilidade p(m);
Insira os novos indivíduos em P’;
Até que P’ esteja completa;
Avalie a população P’;
P <- P’;
Até que critério de parada seja satisfeito;
Fim.
Algoritmos genéticos
• Codificação: as solução serão codificadas como no
genoma dos organismos reais
• Por exemplo,
– Estamos querendo encontrar um determinado tipo de configuração de
um peptídeo (pequena proteínas)
– A configuração 3D é determinada pelos ângulos PHI e PSI para cada
aminoácido da estrutura
– Uma solução possível pode ser codificada em uma lista de pares de
ângulos
(60, 50) (50, -60) (80, 75) (20, 60) ...
Algoritmos genéticos
• Codificação: as solução serão codificadas como no
genoma dos organismos reais
• Por exemplo,
(60, 50) (50, -60) (80, 75) (20, 60) ...
Algoritmos genéticos
• Criar uma população inicial
• Consiste em gerar as primeiras soluções para o problema
– Aleatória
– Segundo alguma informação sobre o problema
Algoritmos genéticos
• Avaliar a população
• Consiste em computar as aptidões das possíveis soluções
• Em outras palavras: determinar se uma solução é melhor
do que a outra
• Definindo a função objetivo
– A configuração que buscamos é a que possui o maior número de
pontes de hidrogênio
• Decodificar os ângulos em coordenadas cartesianas (x, y, z) e
contar as pontes de hidrogênio
(60, 50) (50, -60) (80, 75) (20, 60) ...

n pontes
Algoritmos genéticos
• Aplicar os operadores
• Escolher indivíduos para aplicar operadores que irão
gerar variação
– A escolha pode ser dependente da aptidão ou não (pressão seletiva)
• Aleatória, torneio e roleta são os métodos mais comuns
Algoritmos genéticos
• Operadores inspirados na biologia
– Mutação
(60, 50) (50, -60) (80, 75) (20, 60) ...  (60, 50) (30, -80) (80, 75) (25, 55) ...
– Crossover (recombinação)
• Outros operadores inspirados em fenômenos genéticos
• Aplicar operadores até construir uma nova população
Algoritmos genéticos
• Temos duas populações
• Como selecionar indivíduos dentre as duas população para
compor a próxima geração?
Algoritmos genéticos
• Temos duas populações
• Como selecionar indivíduos dentre as duas população para
compor a próxima geração?
• Substituição parental com base na aptidão
– Elitismo
– Fusão
Algoritmos genéticos
• Elitismo
Parental
Filhos
11
12
11
10
10
12
6
6
10
4
2
6
2
1
2
Valores de aptidão = número de pontes de H. Quanto maior melhor
Nova geração
Algoritmos genéticos
• Fusão
Parental
Filhos
11
12
10
10
6
6
4
2
2
1
Valores de aptidão = número de pontes de H. Quanto maior melhor
Nova geração
Algoritmos genéticos
12
11
• Fusão
Parental
Filhos
10
10
11
12
10
10
6
6
4
2
2
1
6
6
4
2
2
1
Valores de aptidão = número de pontes de H. Quanto maior melhor
Algoritmos genéticos
• Fusão
Parental
Filhos
11
12
12
10
10
11
6
6
10
4
2
10
2
1
6
Valores de aptidão = número de pontes de H. Quanto maior melhor
Nova geração
Algoritmos genéticos
• Repetir até...
– Atingida uma solução satisfatória
– Esgotado um orçamento computacional
– Atingido um tempo limita
Algoritmos genéticos
• De uma maneira relativamente simples as forças
evolutivas são implementadas para resolver uma grande
gama de problemas
• Os requisitos de acordo com o modelo de evolução biológica
de Darwin estão presentes
–
–
–
–
Reprodução de indivíduos na população
Variação que afeta a probabilidade de sobrevivência dos indivíduos
Hereditariedade na reprodução
Competição por recursos finitos
Algoritmos genéticos
• De uma maneira relativamente simples as forças
evolutivas são implementadas para resolver uma grande
gama de problemas
1. mutação  variação introduzida pelos operadores
genéticos
2. fluxo gênico  populações diferentes trocando informação
3. deriva gênica  variância natural, pois as populações são
finitas
4. seleção  critério de otimização
Fim
Download

Evolução Biológica e Algoritmos Genéticos