MARÇO
2013
Algoritmo Genético
Como já dito em cartas anteriores, gostamos bastante de análise bottom-up. Nem todo equity holder é um
value investor. Aliás, temos nos posicionado de forma clara ao dizer que percebemos certa hipocrisia em se
vender como um adepto de qualquer filosofia de investir. Não achamos que exista uma teoria do campo
unificado sobre como ganhar dinheiro. De tempos em tempos, entretanto, testamos ideias com bom
histórico de retorno. Desde que respeitadas certa exigências e formalidades. Recentemente nos
debruçamos sobre a aplicação do Algoritmo Genético como ferramenta de otimização. Aproveitando o
esforço de nossos matemáticos testamos um importante corolário dos value investors segundo o qual o
único múltiplo com significado duradouro é a relação entre o preço de mercado da empresa e seu acervo
líquido contábil, price-to-book no jargão do mercado.
O algoritmo genético, como a maioria dos métodos de otimização, propõe uma maneira eficaz de navegar
em conjuntos de dados de dimensão alta. O termo “dimensão alta”, embora possa a princípio causar
estranhamento, refere-se apenas ao número de variáveis livres de um dado problema. Uma analogia que
talvez acalme os ânimos do leitor menos confortável com a ideia é imaginar um gigantesco painel de
controle com dezenas de botões e alavancas, responsável pela produção de uma máquina, onde cada
estado possível desse painel é representado por um elemento em nosso conjunto de dados. Embora seja
relativamente simples testar todos os resultados possíveis da máquina para as várias posições de um botão
específico, alterar posições em todos os botões e alavancas e lidar com todas as possibilidades
simultaneamente não é computacionalmente factível.
O algoritmo lida com vários desses estados simultaneamente, tratando cada um deles como um "indivíduo"
e, geração após geração, promove mudanças nas configurações de cada um, buscando evoluir essa
"espécie" na direção da melhor configuração possível.
Quando falamos em evolução, o texto que notoriamente nos vem à cabeça é o célebre "A Origem das
Espécies", publicado por Darwin em meados do século XIX e cujo conteúdo e estudo sobre a seleção
natural servem de alicerce para o que hoje conhecemos como Teoria da Evolução.
Muitas das ideias de Darwin floresceram ao longo dos quase cinco anos que passou acompanhando o navio
HMS Beagle, quando teve oportunidade de coletar, examinar e catalogar uma enorme variedade de
organismos vivos. O pensamento humano, de forma análoga às espécies pesquisadas pelo biólogo inglês
em suas viagens, também teve que ser submetido ao teste do tempo, adequar-se a toda sorte de
adversidade e competição para que nós, distintos das demais espécies justamente pela proeza intelectual,
pudéssemos - como fez Darwin - questionar o status quo, dar espaço para o surgimento de novas
abordagens, reavaliar nosso modo de pensar e permitir que as ideias excepcionais se destaquem e
sobrevivam mesmo face ao ambiente inóspito dos longos períodos de obscuridade, frequentemente
presentes na história de nossa civilização.
1
Embora se trate de um tema ainda presente em nosso zeitgeist, a contenda entre as diferentes ideias
acerca da origem das espécies não é nada recente. Anaximandro, no século VI a.C., defendia ideias
surpreendentemente semelhantes às de Darwin. Essas mesmas ideias, duzentos anos mais tarde, foram
revisitadas por Platão e Aristóteles e, muito mais tarde, Santo Agostinho. Se interpretarmos o ideário
humano através das épocas como um sistema evolutivo onde, geração após geração, uma espécie se vê
submetida à competição interna e à seleção natural e seus indivíduos se especializam, através de mutações
e cruzamentos, adaptando cada detalhe de seu código genético às novas condições, evoluir torna-se
inevitável.
Não é difícil traçar paralelos entre os aspectos observados nesse processo e as diferentes metodologias de
análise de negócios. É esperado que, em circunstâncias de concorrência acirrada, um gestor estimule a
especialização e aperfeiçoamento dos processos para manter-se competitivo. Esse enfoque, no entanto,
foge do escopo desta carta.
Estruturalmente calcado em sistemas intrínsecos ao processo evolucionário, o algoritmo genético,
exemplar notável da miríade de métodos computacionais de Machine Learning, encontra no darwinismo
seu modo de navegar no oceano de alta dimensão.
Aprofundando um pouco o exemplo dos botões num painel de controle; dentro de uma espécie, cada
indivíduo é caracterizado unicamente por seu código genético. Sob o prisma do algoritmo, esse código
representa o conjunto particular de instruções inerentes à aplicação pretendida. Por exemplo, uma vez
fixado um período e dada a série histórica de dados de um ou mais ativos, pode-se caracterizar um
indivíduo como o conjunto extenso de parâmetros que determina condições de entrada, saída, alocação e
exposição a risco assumidas no decorrer do período dado.
Numa outra abordagem, dado um conjunto grande de empresas e séries histórica de preços e indicadores
tais como o citado anteriormente price-to-book, um indivíduo se caracteriza pelos critérios utilizados a
partir destes indicadores para tomar decisões de compra e venda.
i)
Seleção
A seleção natural ou "sobrevivência do mais adaptado" é talvez a forma mais contundente de garantir a
evolução de uma espécie. Num ambiente hostil, é de se esperar que a herança genética dos espécimes
mais adaptados seja passada para as gerações seguintes. Na etapa de seleção do algoritmo, os indivíduos
são ordenados de acordo com uma função de fitness, responsável por medir o quão bem sucedido é cada
indivíduo frente à tarefa proposta pelo método. Apenas os indivíduos mais aptos passarão pelas etapas
seguintes. No contexto de mercado, possíveis candidatos para função de fitness são: retorno absoluto,
índice Sharpe, DrawDown, ou o que quer que se queira testar.
ii)
Cruzamento
Uma maneira de diversificar o conjunto genético de uma espécie sem comprometer fundamentalmente
suas características principais é o cruzamento entre cromossomos. Nessa etapa o algoritmo escolhe, dentre
os indivíduos sobreviventes ao processo de seleção natural, partes aleatórias do código genético de dois ou
mais membros, promovendo cruzamentos e gerando descendentes, criados a partir dos já existentes. A
2
amplitude dessa diversificação, no entanto, é limitada. Cruzamentos, pela maneira como são definidos, não
tem como acrescentar informações totalmente novas ao código genético dos descendentes.
iii)
Mutação
Ao promover uma ou mais alterações pontuais no código genético de um indivíduo, uma mutação pode, ao
contrário dos cruzamentos, acrescentar informações totalmente novas ao conjunto genético de uma
geração. Embora a princípio todos os indivíduos de uma geração possam ser submetidos à mutação, o
índice de mutações expressivas observadas na natureza tende a ser muito baixo, do contrário corre-se o
risco de destruir o progresso lento atingido pelos cruzamentos. Num certo sentido, podemos encarar a
mutação como uma aposta com uma pequena chance de criar indivíduos extraordinários, mas que, na
maioria dos casos, traz pouco benefício diretamente verificável à espécie, uma vez que os mutantes
inexpressivos frequentemente sequer sobrevivem à etapa de seleção da geração seguinte.
O leitor pode se perguntar, a essa altura, quais benefícios a mutação traz para o conjunto genético, haja
vista que a repetição exaustiva de seleções e cruzamentos parece já ser suficiente para que a população
convirja para estados cada vez mais eficientes. O que não nos pode escapar, no entanto, é que em todo
processo de convergência, a diferença perceptível entre os elementos torna-se cada vez menor. Sem a
possibilidade de mudar radicalmente, uma população sujeita apenas a cruzamentos e seleções torna-se
estagnada e, consequentemente, aperfeiçoa-se muito pouco entre uma geração e outra. Nesses casos, a
mutação surge como a grande alternativa para promover diversidade.
O exercício que motivou essa carta, particularmente, foi um estudo conduzido por nossa equipe onde
foram analisadas as variáveis earnings per share, price to earnings, price-to-book e return on equity e suas
influências na identificação de tendência de ativos pré-selecionados. Essa base de dados compreendia 69
ativos num período de 3000 observações, equivalente a aproximadamente 12 anos. Os indivíduos eram
caracterizados por valores distintos das variáveis citadas acima, além de critérios de Stop Gain e Stop Loss.
Sendo assim, tendo como função de fitness o Índice Sharpe médio no período, para cada ativo, foi
observado que o indivíduo que sobreviveu ao longo de 60 gerações de cruzamentos e mutações
apresentou como característica fundamentalista apenas a variável price-to-book.
Ode a Benjamin Graham e sua visão sobre investimento. Nossas conclusões ao rodar um algoritmo genético
nos moldes do que fizemos corroboram bastante com sua visão. Há algumas razões objetivas para isso. A
principal delas é legal. O pouco que o aparato regulatório se posiciona sobre valor da firma garante ao
acionista o valor de livro como referência mínima. Não vamos tentar explicar os motivos por trás da força
desse indicador. Apenas deixamos abertos os resultados para que o leitor tire suas próprias conclusões.
Agradecemos a confiança,
Equipe de Gestão
Esta carta é publicada somente com o propósito de divulgação de informações e não deve ser considerada como uma oferta de
venda dos Fundos Ático, nem tampouco como uma recomendação de investimento em nenhum dos valores mobiliários, quando,
aqui citados. Todos os julgamentos e estimativas aqui contidos são apenas exposições de opiniões até a presente data e podem
mudar, sem prévio aviso, a qualquer momento. Performance passada não é necessariamente garantia de performance futura. Os
investidores em fundos não são garantidos pelo administrador ou por qualquer mecanismo de seguro ou ainda, pelo fundo
garantidor de crédito.
3
Download

Algoritmo Genético