Algoritmos Geneticos
Material adaptado de
http://www.dca.ufrn.br/~estefane/metaheuristicas/
Problemas de Permutação

Em muitos problemas de otimização a
meta é encontrar um ordenamento
eficiente de ações ou tarefas.

Exemplos:
 Problema do Caixeiro Viajante
 Problemas de Agendamento
 Coloração de Grafos
Problema do Caixeiro Viajante
 Dado N cidades, achar a caminho
mais curto passando por todas as
cidades uma única vez.
 PCV é NP-dificil
Representação do PCV
 As cidades são representadas
diretamente no cromossomo.
Cromossomos
A B C D F E G
A B C D F G E
Operadores de Permutação
 Order-Based Mutation
 Position-Based Mutation
 Scramble Mutation
 OBX (Order-Based Crossover)
 PBX (Position-Based Crossover)
 PMX (Partially Matched Crossover)
 CX (Cycle Crossover)
 OX (Order Crossover)
Mutação de Permutação
Position-Based Mutation : retira o elemento da posição i
e insere na posição j
A B C D E F G
A C D EB F G
Order-Based Mutation : troca o elemento da posição i
com o elemento na posição j
A B C D E F G
A E C D B F G
Mutação de Permutação
Scramble Mutation - Uma sublista, aleatoriamente
selecionada, é embalharada.
A B C D E F G
A B D E C F G
Order-Based Crossover (OBX)
Elementos são selecionadas aleatoriamente. É imposta
uma ordem nos elementos selecionadas do pai1 igual a
ordem dos respectivos elementos em pai2.
pai1 A B C D F E G
pai2 C E G A D F B
*
*
*
filho1 A D C F B E G
filho2 C A G D E F B
Position-Based Crossover (PBX)
Elementos são selecionadas aleatoriamente e a posição
dos elementos selecionadas no pai2 é imposto ao pai1.
pai1 A B C D F E G
pai2 C E G A D F B
*
*
*
filho1 B E C A D F G
filho2 C B E D F G A
Partially Matched Crossover (PMX)
Realiza trocas no sentido de pai1 para pai2 e depois no
sentido inverso, isto é, de pai2 para pai1, para evitar
cromossomos inválidos.
pai1 A B C D E F G
pai2 C F E B G D A
filho1
filho2
A D E B C F G
E F C D G B A
O Problema da Mochila zero-um
(do inglês, 0-1 knapsack problem)
𝑛
Maximizar
𝑧=
𝑐𝑗 𝑠𝑗
𝑗=1
𝑛
Sujeita a
𝑤𝑗 𝑠𝑗 < 𝑏
𝑗=1
𝑠𝑗 ∈ 0,1
Uma solução s é um vetor de uns e zeros.
Se o objeto j está mochila então sj = 1, caso contrário
sj = 0.
Algoritmo Genético

Cromossomo


A solução s (um vetor de uns e zeros) é naturalmente representada por um
cromossomo binário.
Operadores binários padrão

Crossover de 1-ponto (ou 2-pontos, etc)

Mutação (invertendo os bits)
Uma Instância do Problema da Mochila
Capacidade da mochila:
b = 25
11001110 (cromossomo válido)
peso = 5+4+4+4+6 = 23 < 25
função objetivo = 3+3+2+3+5 = 16
11111001 (inválido)
peso = 36 > 25
Função objetivo = ?
Como Lidar com Indivíduos Inválidos?

Solução 1 – reparar o indivíduo

Solução 2 – penalizar a função objetivo
Reparando o Indivíduo


Indivíduo inválido

11111001

peso = 36 > 25

Função objetivo = 16
1 1 1 1 1 0 0 1
desprezar
Indivíduo “reparado”

11110000

Peso = 24 (ok!)

Função objetivo = 12
visitar cada bit da
esquerda para a direita e
desprezar os bits que
invalidam a solução.
Reparando o Indivíduo


Por qual ordem dos bits devem ser visitados?

Da esquerda para direita?

No sentido oposto?

Aleatoriamente?
Algoritmo Guloso

Visitar primeiro os bits com a maior razão benefício/peso;

Pode produzir melhores resultados.
Penalizando a Função Objetivo
Um exemplo de penalidade é:
Onde a é um coeficiente de penalidade igual a:
Objetos que ultrapassam a capacidade da mochila
são penalizados.
Penalizando a Função Objetivo

Exemplo

11111001

peso = 36 > 25

Função original = 16

Função com penalidade = 16 – 14 x (36-25) = -138
Discussão
Principais Tópicos

População Inicial

Funções Objetivo de Alto Custo

Critérios de Parada

Convergência Prematura

Diversidade

Tipos de Substituição

Problemas na Aptidão

Ranking

Seleção por Torneio

Amostragem Estocástica Uniforme
População Inicial (1/3)

Gerada Aleatoriatoriamente.

Gerada uniformente em uma grade.

Gerada com tendenciosidade para regiões promissoras do espaço de
busca
População Inicial (2/3)

Para garantir que toda posição da cadeia tem 0 e 1 na população:

Gera a primeira metade da população aleatoriamente.

Inverte todos os bits da primeira metade: tem-se a segunda metade.
1a.
metade
2a.
metade
1011010
0100101
0111011
100010
0001101
1110010
1100110
0011001
População Inicial (3/3)

Seeding: insere a solução obtida por outro método de otimização na
população inicial (garante que AG não fará pior do que o outro método)

Iniciar com uma larga população inicial e depois reduzir o tamanho.
Convergência Prematura (1/2)

O AG converge para um mínimo/máximo local.
Convergência Prematura (2/2)

Causas:

Excessivo números de filhos de um mesmo indivíduo (o superindivíduo)

Perda de diversidade.

Deriva Genética (Genetic Drift)


Desaparecimento de genes na população devido puramente ao acaso.

Ocorre principalmente em pequenas populações.
Alta pressão de seleção.
Diversidade (1/2)

Combatendo a perda de diversidade

Aumentar a taxa de mutação.

Evitar cromossomos duplicatas na população.

Diminuir a pressão da seleção.
Diversidade (2/2)

Combatendo a perda de diversidade

Controlar o número de filhos do superdíviduo (indivíduo com alta aptidão,
mas não com aptidão ótima) usando:

Ranking.

Escalonamento.

Seleção por torneio.
Tipos de Substituição

Substituição Geracional

Substituição Geracional com Elitismo

Substituição de Regime Permanente (do inglês steady state)
Substituição Geracional
Seja N o tamanho da população:

Os N pais são substituídos pelos N filhos em cada geração.

Os N pais são substituídos por N individuos do conjunto união de pais e
filhos.

Comentário: o segundo caso aumenta a pressão de seleção.
Substituição Geracional
com Elitismo

Os k < N melhores pais nunca são substituídos.

Tipicamente k = 1

Aumentando k aumenta a pressão de seleção (risco de convergência
prematura).
Substituição de
Regime Permanente (1/2)


Em cada “geração” apenas 2 (ou 1) filhos são gerados e substituem:

Os 2 piores indivíduos da população.

Os pais.

Os 2 indivíduos mais velhos (i.e., que estão a mais tempo da população),
pois já transmitiram os seus genes.
Taxa de crossover é geralmente alta (~1).
Substituição de
Regime Permanente (2/2)

Alternativamente, k < N filhos são gerados e substituem os k piores
indivíduos.

Evitar inserir um filho na população quando já existe uma duplicata
dele na população.
Problemas na Aptidão (1/3)

Aptidão negativa não funciona com a roleta.

Aptidão excessivamente alta


Poucos individuos ocupando larga fatia da roleta

Muitos individuos ocupando pequena fatia da roleta

Causa convergência prematura
Solução: controlar o número de filhos do superindivíduo.
.
Problemas na Aptidão (2/3)

Resolução insuficiente para diferenciar os melhores dos piores
individuos.

A seleção torna-se aleatória (Passeio ao Acaso).

Convergência lenta
Problemas na Aptidão (3/3)

Exemplo:

Soluções

Expandir o intervalo da aptidão (usando ranking, escalamento linear)

Seleção por torneio
Ranking Linear (1/3)
Onde i é o índice do cromossomo na população
em ordem decrescente de valor da função
objetivo.
Ranking linear requer:
1  Max  2
Max + Min = 2
Valores bons para Max: de 1.2 a 1.5
Ranking Linear (2/3)
Ranking Linear (3/3)

Controlando a pressão da seleção por Ranking linear:

maior pressão => mais intensificação;

menos pressão => mais diversificação.
Ranking Exponencial
𝑓𝑖 = 𝑞(1 − 𝑞)𝑖−1
q  [0, 1] e i é o índice do cromossomo na população em
ordem decrescente de valor da função objetivo.
Ranking exponencial permite maior pressão de seleção do
que o ranking linear.
Escalonamento Linear

Escalonamento linear
onde g é o valor da função objetivo
a e b são determinados tal que o
número máximo de filhos do melhor
indivíduo seja no máximo igual a C
(onde tipicamente C = 2)
Seleção por Torneio

Escolhe-se k (tipicamente 2) indivíduos aleatoriamente da população e
o melhor é selecionado.

Não é proporcional a aptidão,

Não é necessário roda da roleta, escalamento da aptidão ou ranking.
Seleção por Torneio
Os indivíduos são selecionados
para os torneios com igual
probabilidade.
O torneio é vencido
pelo indivíduo com
maior aptidão
Seleção por Torneio


Aumentando o tamanho k do torneio acarreta:

Aumento da pressão de seleção.

Risco de convergência prematura.
Por isso, o torneio binário é o mais utilizado.
Seleção por Torneio

Seleção por torneio com probabilidades

(Reduz ainda mais a pressão de seleção)
1)O melhor indivíduo do torneio é selecionado com
probabilidade p > 0,5
2)O segundo melhor é selecionado com probabilidade
p(1-p)
3)O terceiro é selecionado com probabilidade p(1-p)2
4)e assim por diante...
Amostragem Estocástica Uniforme
Evita a grande variância de filhos esperados do
método da roleta (é tão perfeito quanto possivel)
N ponteiros igualmente
espaçados.
e
d
a
c
b
Pais selecionados
a a b c d
Critérios de Parada
Atingiu um dado número de gerações ou avaliações.
 Encontrou a solução (quando esta é conhecida).
 Perda de diversidade.
 Convergência: não ocorre melhora significativa na solução durante um
dado número de gerações.

Funções Objetivo
de Alto Custo (1/3)
Em muitos problemas do mundo real o custo computacional do AG está
concentrado na avalição do individuo.
 Exemplo:


Simulação completa de um processo.

Um treinamento de uma rede neural.
Funções Objetivo
de Alto Custo (2/3)

Dicas para reduzir o números de reavaliações do indivíduo:

Evitar cromossomos iguais na população inicial.

Verificar se o filho já existe nas populações passadas e na atual.

Verificar se filho = pai (e.g. checar se crossover e mutação foi aplicado).

Manter a população com cromossomos distintos.
Funções Objetivo
de Alto Custo (3/3)
Simplificar a função objetivo (pelo menos nas gerações iniciais)
 Usar um método de subida de encosta quando o AG já encontrou as
regiões promissoras do espaço de busca (nas gerações finais).

Como os Algoritmos
Genéticos Funcionam
Esquemas
Cadeias formadas por três símbolos: 0, 1, e *
O simbolo * (um curinga) significa 0 ou 1.
Em inglês, o simbolo * é chamado de “don't care”.
Esquemas
 O número esperado de esquemas H
na geração seguinte (sem levar em
conta a destruição causada pelo
crossover e mutação) é dado por:
onde: m 
a
m
b
m é o número de cromossomos da população atual que
contém o esquema H
b é a média das aptidões de toda população
a é a média das aptidões dos cromossomos que contém o
esquema H
Esquemas
H1 = 1**** está presente em
A1, A2 e A3: m1 = 3
3+2+4
𝑎1 =
=3
3
𝑏=
3 + 2 + 4 + 11
=5
4
𝑚′1 = 3 ×
3
= 1,8
5
É esperado que esquema H1 esteja presente em 1,8 indivíduos
na geração seguinte.
Esquemas
H3 = *0*01 está presente em
A3 e A4.
𝑚′3 = 2 ×
4 + 11
=3
2×5
Na geração seguinte, espera-se ter três indivíduos com H3 na
população.
Conclusões
: (acima da aptidão média) aumenta na geração seguinte.
H
3
H1 (abaixo da aptidão média) diminui na geração seguinte.
Tamanho do Esquema
O tamanho do esquema H , denotado por (H), é a
diferença entre a última posição ocupada por 1 ou 0 e a
primeira posição ocupada por 1 ou 0.
Exemplos,
H1 = 1****,
H2 = **10*,
H3 = *0*01,
(H1) = 0
(H2) = 1
(H3) = 3
(H) representa o
número de possíveis
pontos de corte que
destroi H.
Ordem do Esquema
A ordem do esquema H , denotado por O(H), é o
número de posições em H que não tem o símbolo *.
Exemplos,
H1 = 1****,
H2 = **10*,
H3 = *0*01,
O(H1) = 1
O(H2) = 2
O(H3) = 3
O(H) representa o número
de posições em que a
mutação pode destruir H.
O Efeito Destrutivo do Crossover
Um grande esquema em pai1
(01*|**10)
Um pequeno esquema em pai2
(***|*101)
filho
(01*|*101)
O primeiro esquema está presente filho, mas o segundo
esquema foi destruído pelo crossover.
Conclusão: pequenos esquemas possuem maior
probabilidade de sobrevivência.
O Efeito Destrutivo da Mutação
Esquemas de baixa ordem possuem maior probabilidade de
sobrevivência ao operador de mutação.
Teorema dos Esquemas (Holland)

Mesmo considerando os efeitos destrutivos do crossover e mutação,
este teorema afirma que:
Esquemas pequenos e de baixa ordem contidos
em bons cromossomos aumentam
exponencialmente nas gerações seguintes, ao
passo que esquemas contidos em cromossomos
ruins tendem a desaparecer nas gerações
seguintes.
A Hipótese dos
Blocos de Construção

Blocos de construção são os esquemas pequenos e de baixa ordem.

A hipótese: bons blocos de construção são passados de uma geração
para outra e recombinados para formar cromossomos cada vez
melhores.
Paralelismo implícito

AG manipula uma população de apenas N cadeias de bits, mas processa
em paralelo grande número de esquemas (na ordem de O(N3)
esquemas).
Problemas Deceptivos

Não obedecem a Hipótese dos Blocos de Construção.

Genes com alta epitasia.

São difíceis para os Algoritmos Genéticos resolver (e para outras
técnicas de otimização também).

São raros em problemas do mundo real.
Download

Algoritmos Geneticos