Inversão da Velocidade e do Tempo para Incidência Normal por Algoritmos Genéticos a partir de Dados Sísmicos Shelly C. D. A. Medeiros, Mércia B. C. e Silva, Israel Ramos GTEP-Grupo de Tecnologia e Engenharia de Petróleo, Pontifícia Universidade Católica do Rio de Janeiro, Brasil (shelly, mbcs, israel)@civ.puc-rio.br Marco Pacheco ICA – Laboratório de Inteligência Computacional Aplicada, Pontifícia Universidade Católica do Rio de Janeiro, Brasil [email protected] Resumo A exploração sísmica estuda o subsolo a partir de ondas geradas artificialmente na superfície terrestre. A técnica básica de exploração sísmica consiste em gerar ondas elásticas na superfície e medir o tempo levado pelas ondas para percorrer a distância da fonte aos receptores. Esta técnica tem sido extensamente aplicada no estudo do subsolo para a exploração de petróleo. A partir dos dados sísmicos é feito o processo de inversão para a obtenção de parâmetros físicos das camadas de rocha. O uso de algoritmos genéticos para problemas de inversão sísmica é relativamente recente, mas os resultados tem sido promissores. O objetivo deste trabalho é a aplicação de algoritmos genéticos na inversão da velocidade e do tempo para incidência normal a partir de dados sísmicos. Foram utilizados sismogramas sintéticos para os experimentos e os resultados obtidos foram satisfatórios. Palavras-chave: algoritmos genéticos, sismogramas sintéticos Abstract The seismic exploration studies the underground from artificially generated waves on Earth. The basic technique of seismic exploration is to generate elastic waves on the surface and measure the time taken for waves to traverse the distance from the source to receivers. This technique has been widely applied in the study of the underground for oil exploration. The seismic data is done to reverse the process to obtain physical parameters of the layers of rock. The use of genetic algorithms for problems of seismic inversion is relatively recent, but the results have been promising. The objective of this work is the application of genetic algorithms in the inversion of velocity and time for normal incidence from seismic data. Synthetic seismograms were used for the experiments and the results were satisfactory. Keywords: genetic algorithms, synthetic seismograms 1. Introdução A sísmica tem por objetivo obter uma imagem do subsolo, a fim de definir a estrutura das camadas e a distribuição dos tipos de rocha [1]. Esta técnica é vantajosa em relação a outras técnicas aplicadas no mapeamento do subsolo para a área de petróleo por não necessitar de perfuração e por permitir um levantamento de dados de uma área de grande extensão. O método sísmico consiste em avaliar a propagação de ondas sonoras geradas por impulsos na superfície da terra. As ondas que retornam à superfície são capturadas por receptores. Os dados sísmicos são formados pelos tempos em que cada onda levou para percorrer a distância da fonte ao receptor e a sua amplitude de chegada. Tradicionalmente, são utilizados métodos estatísticos para a inversão sísmica, como as medidas de coerência [2]. Podemos citar dentre várias técnicas o Semblance que é uma medida de coerência e tem sido muito aplicada na determinação da velocidade das camadas de rocha [3]. O processo de inversão sísmica torna-se complexo por não existirem modelos matemáticos que representem com exatidão o comportamento do subsolo. Uma das principais dificuldades na obtenção de um modelo matemático para a definição de uma determinada propriedade da rocha está na composição irregular das rochas. Podemos citar como irregularidades as fraturas, a variação de profundidade ao longo da camada rochosa, a existência de camadas de transição entre dois tipos de rocha. Atualmente, existem equações analíticas que procuram calcular os parâmetros físicos das rochas o mais próximo possível da realidade [4]. Apesar da inversão sísmica ser complexa, esta é indispensável para o estudo dos dados sísmicos. Algoritmos Genéticos (GAs) são métodos computacionais de busca e otimização inspirados nos mecanismos de evolução natural e da genética. Os Algoritmos Genéticos operam sobre uma população de soluções dos problemas codificados usando transições probabilísticas e não determinística [5]. Neste trabalho será aplicado a técnica do GAs para encontrar soluções para velocidade e tempo para incidência normal (tempo Zero) para uma única camada. Para calcular a função de avaliação dos indivíduos serão fornecidos conjuntos de dados sísmicos sintéticos conhecidos como sismogramas. No próximo capítulo são apresentados brevemente o estudo sísmico e o problema de inversão de parâmetros. Também, serão descritos o processo de geração dos sismogramas sintéticos utilizados no experimento. Num capítulo seguinte, será detalhado o GA desenvolvido para o problema abordado, e em seguida os resultados obtidos e as conclusões desse trabalho. 2. A Sísmica e o Problema de Inversão Existem vários métodos para estudar o subsolo. Os métodos sísmicos são os mais econômicos, pois não necessitam de perfuração [1], estudando o solo a partir da propagação de ondas na crosta terrestre. Uma das técnicas mais básicas da exploração sísmica consiste em gerar artificialmente ondas elásticas (que perturbam o solo sem causar danos a este) na superfície da terra e medir o tempo que a onda levou desde a fonte até um conjunto de receptores posicionados em linha com a fonte. Este tempo é um atributo sísmico. As ondas são geradas na superfície por meio de fontes geradoras de tensão, como por exemplo cargas explosivas. Ao retornarem à superfície, são detectadas por receptores, como por exemplo, os geofones. A partir dos atributos sísmicos medidos (tempos sísmicos) são extraídos outros atributos sísmicos como, por exemplo, freqüência e energia. A Fig. 1 apresenta um esquema da técnica básica de estudo sísmico dos solos. A onda se propaga pelo solo até encontrar uma interface – transição entre dois meios com diferentes propriedades elásticas – onde é dividida em duas partes: refletida e refratada. A onda propagada na vertical é conhecida como incidência normal. receptores fonte superfície Figura 1. Esquema da técnica básica do estudo sísmico do subsolo. i1 r1 V1 interface V2 i2 V1 : velocidade no meio 1 V2 : velocidade no meio 2 i1 : ângulo de incidência i2 : ângulo de refração r2 : ângulo de reflexão Figura 2. Exemplo de um raio sísmico refletido e refratado numa interface. A Fig. 2 mostra a propagação de uma onda. A parte refletida retorna à superfície e é lida por receptores. A parte refratada segue sendo propagada pelas demais camadas abaixo da interface. Esse processo se repete a cada nova transição entre rochas, até que a energia se disperse e não mais retorne à superfície. O objetivo da inversão de parâmetros na sísmica é, a partir dos atributos sísmicos, quantificar com o máximo de exatidão possível parâmetros físicos das rochas como velocidade, porosidade, densidade e outras propriedades [2]. Inicialmente, calcula-se o tempo que a onda leva para atravessar uma camada para incidência normal (propagação da onda na vertical - ver Fig.1), considerando a profundidade (z) e a velocidade (V) da camada, dado por t0 = 2z . V (1) Veja na Tabela 1 as propriedades de cada modelo. Prof identifica a profundidade da camada, dt é o intervalo de tempo de leitura no receptor, Vel é a velocidade da camada e t0 é o tempo para incidência normal. Os modelos foram inseridos no ANRAY® para gerar os sismogramas sintéticos desse trabalho. Tabela 1. Propriedades dos modelos Com a equação (2) são relacionados os tempos sísmicos com a velocidade (V), o tempo para incidência normal da camada (tempo Zero-t0). A distância entre a fonte e o receptor r (x) são prédefinidas assim como o número de receptores. O posicionamento dos receptores em relação a fonte é conhecido como sistema de aquisição de dados. x 2r t =t + 2 . V 2 r 2 0 (2) Veja que para cada receptor r é obtido um tempo sísmico. Este tempo também depende do número de camadas que estão sendo consideradas (neste trabalho apenas uma camada é considerada). Sismograma SISMOG1 SISMOG2 SISMOG3 SISMOG4 Prof (Km) dt (s) Vel (Km/s) t0 (s) 1.0 1.0 0.4 1.5 0.002 0.004 0.004 0.004 2.8 1.5 2.0 4.0 0.714 1.34 0.4 0.75 Para todos os sismogramas, foi definido um único sistema de aquisição de dados, formado por uma fonte geradora e 50 receptores. O primeiro receptor está a uma distância de 50 metros da fonte. Os demais estão posicionados, em linha, a cada 50 metros a partir do primeiro receptor. As Figuras 3.a, 3.b, 3.c, 4.d mostram os sismogramas gerados 1, 2, 3 e 4, respectivamente. O eixo X(Km) é formado pelo vetor VECx (offsets) e o eixo t(seg) é formado pelo vetor VECdt. 3. Geração dos Sismogramas Sintéticos Sismograma é um conjunto de dados sísmicos formado pelas amplitudes das ondas que chegam aos receptores. A cada pequeno espaço de tempo (dt), o receptor faz uma leitura e na chegada de uma nova onda suas amplitudes são armazenadas. Serão necessários dois vetores para analisar o sismograma. O vetor VECdt é formado pelos tempos em que o receptor leu dados. Por exemplo, se dt é de 0.002s, então o vetor seria formado por 0.002, 0.004, 0.006,..., até o número máximo de leituras. Já o VECx é formado pelas distância entre a fonte e o receptor (offset). Por exemplo, se a distância é de 0.05Km, então o vetor seria formado por 0.05, 0.10, 0.15,..., até o número total de receptores. O sismograma sintético é representado por uma matriz em que as colunas são os índices dos receptores e as linhas os índices dos tempos. Para buscar o tempo em que uma determinada amplitude foi armazenada, deve-se selecionar o índice da linha no sismograma. A partir desse índice, busca-se no vetor VECdt o valor do tempo. Os sismogramas sintéticos usados neste trabalho foram gerados no programa ANRAY®. Cada sismograma foi gerado considerando uma única camada de rocha. Figura 3.a. Sismograma 1. Figura 3.b. Sismograma 2. Tabela 2. Intervalos e resolução por variável Gene (Variável) velocidade tempoZero Valor mínimo Valor máximo Valor Resolução 1.4 Km/s 0.02 s 6.0 Km/s 2.0 s 0.1 0.002 O número de bits necessários para cada gene é dado por Figura 3.c. Sismograma 3. vMáximo − vMínimo . (3) v Re solução Para a variável velocidade foram definidos 6 bits e para a variável tempo Zero foram definidos 10 bits. O cromossoma, então, é formado por 16 bits e o tamanho do espaço de busca é de 216 bits. Veja na Fig.4 a estrutura do cromossoma. nBits = VELOCIDADE TEMPOZERO 26 bits Figura 3.d. Sismograma 4. 4. Algoritmos Genéticos Algoritmos Genéticos (GAs) são algoritmos de otimização global, baseados nos mecanismos de seleção natural e da genética. Eles empregam uma estratégia de busca paralela e estruturada, mas aleatória, que é voltada em direção ao reforço da busca de pontos de "alta aptidão", ou seja, pontos nos quais a função a ser minimizada (ou maximizada) tem valores relativamente baixos (ou altos) [5]. Apesar de aleatórios, eles não são caminhadas aleatórias não direcionadas, pois exploram informações históricas para encontrar novos pontos de busca onde são esperados melhores desempenhos. Isto é feito através de processos iterativos, onde cada iteração é chamada de geração. Neste trabalho as variáveis a serem otimizadas são a velocidade da camada e o tempo de incidência normal (tempo Zero) para uma única camada. Portanto, o cromossoma é formado por um gene que representa a velocidade e outro para o tempo Zero. Por ser de tratar de um problema numérico, foi escolhida a representação binária. Para formar cada gene do cromossoma, foram definidos os valores de mínimo e máximo e a resolução desejada para cada variável, descritos na Tabela 2. Estes limites de mínimo e máximo representam a maioria dos tipos de rocha já conhecidos no subsolo. 210 bits Figura 4. Estrutura do cromossoma. A medida de aptidão dos indivíduos é dada por n Ap = ∑ ( t r max − t r indivíduo ) , r =1 (4) onde r é o índice do receptor. Na equação (4) o termo tmax é o valor o tempo sísmico em que foi registrada maior amplitude no sismograma para o receptor r. O termo tindivíduo é o tempo calculado para o receptor r pela Equação (2) a partir dos valores decodificados do indivíduo (velocidade e tempo Zero). É feita uma subtração entre esses dois termos. Essas diferenças serão somadas para os n receptores pertencentes ao sismograma. O objetivo deste GA é evoluir a população a encontrar indivíduos com menor valor de aptidão. Foi utilizado o toolbox Genetic Algorithm para MATLAB® para a implementação do GA. O GA é inicializado com a criação da população. A população foi definida com 50 indivíduos. É calculada a aptidão para cada indivíduo. Estes são ordenados, e os indivíduos mais aptos são selecionados. Estabeleceu-se que o percentual de indivíduos a serem criados a cada nova geração (prole) é de 70%. Sobre os indivíduos selecionados são aplicados os operadores de crossover e de mutação. O crossover aplicado neste GA é de um ponto de corte e a taxa é de 70%. A taxa de mutação assumida é de 0.7/16. A nova prole é inserida na população inicial e repetem-se os passos seguintes, enquanto o número pré-definido de gerações não for alcançado. 5. Experimentos e Resultados Por ser um processo estocástico, para cada sismograma foram avaliados 50 experimentos com 300 gerações cada um. As Figuras 5.a, 5.b, 5.c e 5.d mostram os resultados obtidos para os sismogramas gerados 1, 2, 3 e 4. Nessas figuras podem ser vistos os valores para a velocidade e tempo para incidência normal (tempo Zero) dos melhores indivíduos em cada experimento. Os valores são pontuais e são representados pela marca ‘o’. Figura 5.d. Experimentos – melhores indivíduos. Foram selecionadas as regiões de maior concentração de resultados para cada variável. Assumiu-se que os valores desejados estão nestas regiões. Calculou-se uma média dos valores posicionados nestas regiões. Dado que é conhecido o valor real (valor esperado) de cada variável, calculouse o erro absoluto. Na Tabela 3 são mostrados os valores médios para a velocidade e o tempo Zero e seus erros absoluto em cada sismograma. Tabela 3. Valores médios e o erro absoluto Velocidade (Km/s) Valor Real Figura 5.a. Experimentos – melhores indivíduos. Valor médio Tempo (s) Erro Valor Absoluto Real Valor médio Erro Absoluto 0.712 0.002 2.8 2.79 Sismograma 1 0.01 0.71 1.5 1.475 Sismograma 2 0.025 1.34 1.33 0.01 2.0 1.98 Sismograma 3 0.02 0.4 0.409 0.009 4.0 3.96 Sismograma 4 0.04 0.75 0.748 0.002 Figura 5.b. Experimentos – melhores indivíduos. 6. Conclusões Figura 5.c. Experimentos – melhores indivíduos. Foi aplicado a técnica de Algoritmos Genéticos para a obtenção da velocidade e do tempo para incidência normal a partir de dados sísmicos. Os experimentos foram desenvolvidos com sismogramas sintéticos cada um com dados de amplitude para uma única camada. Os valores de erro absoluto em todos os casos foi abaixo de 0.05. Esse resultado é considerado satisfatório para a sísmica, pois os valores encontrados pelo GA são suficientes para um especialista analisar a camada de rocha. Para trabalhos futuros, é sugerido trabalhar com sismogramas com mais de uma camada de rocha, modificando o cromossoma e a medida de aptidão. É interessante também avaliar o desempenho do GA dado um sismograma real. Neste caso, o programa não calcularia mais as amplitudes máximas para a função de avaliação, mas seria necessário a seleção das amplitudes pelo especialista. Planeja-se aplicar Coevolucionismo nesse problema a fim de evoluir a velocidade e o tempo para incidência normal em separados com o desejo de obter melhores resultados. 7. Referências [1] R. E. Sheriff, and L. P. Geldart, Exploration Seismology, Cambridge University Press, United Kingdom, 1995. [2] A. Tarantola, Inverse Problem Theory, Elservier, Amsterdam, 1987. [3] N. S. Neidell, and M. T. Taner, “Semblance and Other Coherency Measures for Multichannel Data”, Geophysics, vol. 36, no. 3, P. 482-497, June 1971. [4] A. A. Fitch, Applied Science Publishers, Kent, United Kingdom, 1983. [5] D. Goldberg, Genetic Algorithms in Search, Optimization and Machine Learning, Addison-Wesley, 1989. 0