Versão online: http://www.lneg.pt/iedt/unidades/16/paginas/26/30/185 Comunicações Geológicas (2014) 101, Especial II, 951-954 IX CNG/2º CoGePLiP, Porto 2014 ISSN: 0873-948X; e-ISSN: 1647-581X Uso de informação sensorial para melhorar o mapeamento de teores em TPH em solos Use of sensorial data to improve the mapping of TPH grades in soils J. A. Almeida1*, S. Roxo1 Artigo Curto Short Article © 2014 LNEG – Laboratório Nacional de Geologia e Energia IP Resumo: Este artigo apresenta uma metodologia destinada a gerar imagens simuladas 3D de teores em Hidrocarbonetos Totais de Petróleo - Total Petroleum Hydrocarbons (TPH) em solos potencialmente contaminados, integrando informação principal proveniente de determinações analíticas com informação sensorial ou secundária. A metodologia é ilustrada para a área de um antigo parque de combustíveis. São discutidos os resultados, com particular relevância para a integração da informação secundária e para a exploração do espaço de incerteza. Palavras-chave: Hidrocarbonetos Totais de Petróleo, Informação sensorial, Condicionamento a uma variável secundária categórica, Simulação por campos de probabilidade. Abstract: This paper presents an innovative methodology for simulating 3D stochastic images of total petroleum hydrocarbons (TPH) in potentially contaminated soils, making use of analytical determinations as primary data and sensorial information as secondary data. This methodology is illustrated for a deactivated oil storage site. Results are discussed with particular regard to the integration of the secondary information and to uncertainty mapping. Keywords: Total petroleum hydrocarbons, Sensorial information, Conditioning to a secondary categorical variable, Probability field simulation. 1 CICEGe, Departamento de Ciências da Terra, FCT-Universidade Nova de Lisboa, 2829-516 Caparica, Portugal. * Autor correspondente / Corresponding author: [email protected] 1. Introdução Um solo é classificado como contaminado quando são identificadas concentrações de substâncias químicas que colocam restrições no uso do local, de forma a minimizar os riscos para a saúde pública e para o ambiente. Na prática, um solo contaminado excede pelo menos os valores de referência num componente de acordo com a legislação adotada em cada país (Brito, 2005). Os hidrocarbonetos são um exemplo de um contaminante persistente, pelo que o mapeamento das suas concentrações é de particular importância em solos subjacentes onde foram ou ainda são manuseadas estas substâncias, nomeadamente em refinarias, parques de combustíveis e estações de serviço (Pereira et al., 2001; Roxo, 2011). No caso dos hidrocarbonetos é usual fazer as determinações analíticas das várias componentes de carbono e adicionar os componentes não voláteis num total designado por Total Petroleum Hydrocarbons ou (TPH) que é a variável considerada no estudo agora apresentado. A remediação convencional dos locais contaminados por hidrocarbonetos é baseada na remoção dos solos contaminados e deposição em locais adequados. Esta técnica, como qualquer outra, tem custos e estes são tanto maiores quanto maior for a quantidade de solos envolvidos, pelo que é essencial a correta delimitação dos locais contaminados. Por um lado evita-se a descontaminação inútil de solos limpos (custo direto) e a não descontaminação de locais contaminados (custo indireto para a saúde e para o ambiente). É assim fundamental programar de forma ótima os trabalhos de amostragem, que envolvem sondagens para solos, recolha de amostras, medições sensoriais (informação secundária) e análises químicas (informação principal). No caso da contaminação por hidrocarbonetos, as análises indiretas podem incluir classes de cheiro, classes de cor e classes de reação ao óleo (CRO) que é a extensão e cor da película de óleo que se forma sobre a água quando é adicionado solo num tanque com água. As medições indiretas são mais expeditas e baratas do que as análises químicas, pelo que podem ser obtidas em maior número, todavia são limitadas ao local das sondagens e nunca conhecidas em todos os locais de forma pseudo-contínua. Também, pelo seu carácter, são de tipo qualitativo e expressam-se por variáveis categóricas com algumas modalidades. A informação secundária apenas poderá ser utilizada se for possível estabelecer uma dependência estatística com os dados das análises químicas, pelo que todos os troços das sondagens com análises químicas devem ser classificados em termos das análises sensoriais. Com a informação das análises sensoriais e das determinações analíticas, a fase de caracterização espacial ou mapeamento prossegue com a construção de mapas 3D dos teores em hidrocarbonetos nos solos, fazendo uso de técnicas geoestatísticas de estimação e simulação (Goovaerts, 1997). Os mapas obtidos permitem quantificar o volume dos solos contaminados e quantificar a incerteza, nomeadamente, recomendando a extensão ou aumento da densidade do 952 J. A. Almeida, S. Roxo / Comunicações Geológicas (2014) 101, Especial II, 951-954 plano de amostragem. As técnicas de simulação têm a vantagem de gerarem vários cenários equiprováveis e por isso ajudarem à escolha do método de remediação e planeamento dos trabalhos de campo como este se tratasse de uma função de transferência dependente dos quantitativos totais de solos contaminados e da sua morfologia. Por exemplo, para os mesmos quantitativos o custo de remediação é variável conforme os solos contaminados estiverem num único local ou em vários locais, devido à mobilização dos equipamentos e maior probabilidade de diluição. Neste trabalho propõe-se uma metodologia de simulação destinada a fazer o mapeamento de teores em TPH em solos, combinando informação principal de análises químicas com informação secundária mais abundante, não totalmente conhecida em todos os locais, e expressa sob a forma de uma variável categórica. Esta metodologia poderá ser utilizada noutras situações similares, mesmo em casos de estudo fora do contexto de caracterização da contaminação de solos, desde que esteja disponível o mesmo tipo de informação de partida. 2. Metodologia A metodologia proposta foi orientada pelo facto de se pretender simular uma variável continua amostrada nalguns troços de sondagem (variável principal, teor em TPH) a uma variável categórica (variável secundária, CRO) amostrada em todas as sondagens mas todavia não conhecida em todos os locais. A primeira etapa é fazer a estimação da variável secundária para toda a área de estudo, sendo a krigagem da indicatriz a melhor alternativa (Soares et al., 1992; Goovaerts, 1997). O resultado é um mapa de probabilidades de pertença a cada modalidade ou associação de modalidades. Reflete a tendência local para teores mais elevados ou mais baixos mas é necessário, numa segunda etapa, simular condicionalmente os teores em TPH. Aqui várias alternativas podem ser consideradas, por exemplo, converter as probabilidades para teores médios e simular com condicionamento a médias locais por Simulação Sequencial Directa (SSD), ou por co-SSD (Soares, 2001; Soares et al., 2006; Almeida, 2010; Charifo et al., 2013) com histogramas locais (Roxo, 2011). Esta abordagem mostrou sub-valorização sistemática dos teores nos mapas simulados, porque localmente foram considerados valores médios calculados com base num histograma que é muito assimétrico positivo. Para minimizar a sub-valorização dos teores em TPH optou-se por uma abordagem inovadora que consiste nos seguintes procedimentos: - Iniciar uma malha de nós a 2D ou 3D ( ); - Em cada nó , estimação da probabilidade de pertença a cada modalidade ou agrupamentos de modalidades ; por krigagem da indicatriz ( - Sub-dividir os valores da variável principal ; , …); modalidades ( por - - Geração de n imagens simuladas dos teores da variável principal TPH por modalidades ( ; , …). Pode ser utilizada a Simulação Sequencial Gaussiana (SSG) ou a Simulação Sequencial Direta (SSD) sem informação secundária. Para cada nó , construção de histogramas locais compósitos por mistura ponderada dos teores simulados em TPH das várias populações . A construção utiliza o procedimento de Monte Carlo do seguinte modo: existem n realizações de TPH condicionais a , n realizações de TPH condicionais a ,etc. Se a probabilidade estimada de pertença a é então o histograma compósito no nó terá valores sorteados das simulações de , - valores sorteados das simulações de , e assim por diante, perfazendo n valores. Conhecidos os histogramas locais dos teores em TPH para todos os nós da malha em estudo, a etapa final utiliza o procedimento de simulação por campos de probabilidade (Probability Field Simulation – PFS) (Goovaerts, 1997) para a geração das imagens finais de TPH. Para este procedimento geram-se imagens de probabilidades com lei uniforme para a malha de nós em estudo (por SSG e correspondência de histogramas) e aplica-se novamente a regra de Monte Carlo agora em cada histograma local compósito. O resultado final são as imagens simuladas de TPH condicionais à variável sensorial e às determinações analíticas em TPH. Como nos locais das amostras em TPH as classes da variável categórica são amostradas, o procedimento garante que as imagens são condicionais aos valores dos teores. Também como as imagens simuladas de probabilidades com lei uniforme utilizam o variograma dos teores em TPH, as imagens finais reproduzem corretamente o variograma dos dados experimentais. 3. Caso de estudo 3.1. Dados iniciais Na área em estudo com cerca de 17,5 ha foram efetuadas 140 sondagens que na sua maioria atingiram o substrato rochoso. Foram retiradas 820 amostras de solos a intervalos com cerca de 0,5 m para análises sensoriais (cheiro, cor e CRO). Os resultados das análises sensoriais foram expressos por uma variável categórica com cinco modalidades. Destas amostras, 276 foram analisadas em laboratório para determinação dos teores em TPH. A análise estatística inicial mostrou que das três análises sensoriais a que exibia melhor correlação com os teores é francamente a CRO. Também, verificou-se que a discriminação em cinco classes era excessiva e redundante e que era preferível simplificar para duas classes, as de menor teor em TPH {0,1} e as de maior teor em TPH {2,3,4}. Também optou-se por estudar 6 níveis de 0,5 m Mapeamento de TPH em solos cada em profundidade, ou seja entre os zero e os três metros. Foram calculados variogramas experimentais para a variável CRO (variável binária) e para os teores em TPH. Estimou-se por krigagem da indicatriz a probabilidade de cada nó pertencer à CRO = {2,3,4} ou ao seu complementar CPO = {0,1}, onde os dados disponíveis são as 820 análises sensoriais. Na figura 1a) apresenta-se a imagem estimada para o nível [1.5 m; 2 m] da probabilidade de CPO = {2,3,4}. Os valores variam entre 0 e 1 (grau de probabilidade) com prevalência dos mais elevados em duas manchas maiores e duas manchas menores. 953 Independentemente dos valores absolutos desta grandeza, os maiores valores de variância local estão próximo dos registos de TPH mais elevados e onde muito próximo se encontram outros registos muito mais baixos, indicador de heterogeneidade. Nos locais com menos amostras, a variância não é muito elevada porque os teores são, regra geral, baixos, o que também mostra a apetência da amostragem para os locais onde se espera haver maior grau de contaminação. 3.2. Simulação de imagens de TPH por classes de modalidades da variável sensorial Nesta fase procedeu-se à simulação dos teores em TPH (Nunes & Almeida, 2010). Os teores em TPH amostrados nas 276 localizações foram subdivididos em dois conjuntos, um para as CRO = {0,1} e outro para as CRO = {2,3,4}. Foram então simuladas 100 realizações de TPH para cada conjunto, ou seja 100 imagens simuladas com os valores de CRO = {0,1} e 100 imagens de CRO = {2,3,4}. Nas simulações utilizou-se o variograma ajustado ao conjunto dos teores em TPH. Nas figuras 1b) e 1c) mostram-se realizações simuladas dos teores em TPH com os conjunto dos dados onde CRO = {0,1} e CRO = {2,3,4}, respetivamente. As imagens simuladas são condicionais ao histograma das respetivas subpopulações, pelo que na primeira os valores em TPH são muito mas baixos do que na segunda imagem. Como as classes não discriminam os teores a 100%, o intervalo de teores em TPH entre 135 ppm e 1455 ppm é comum às duas imagens, todavia é uma fração diminuta do total dos valores o que mostra que a utilização da variável secundária tem vantagens. 3.3. Geração de histogramas locais compósitos e simulação das imagens de TPH por PFS Nesta etapa juntam-se o mapa de probabilidade de pertença a cada CRO {0,1} ou {2,3,4} com as simulações condicionais a cada CRO para um conjunto único de imagens simuladas. Como referido na metodologia, nó a nó calcularam-se histogramas locais compósitos e com a simulação por campos de probabilidade gerou-se o valor simulado em cada nó. A imagem da figura 1d) mostra-se o resultado final dos teores em TPH para o horizonte [1,5 m; 2 m] e junta as imagens das figuras 1a), 1b) e 1c). O resultado é condicional às probabilidades estimadas da variável sensorial CRO e aos teores das determinações analíticas e exibe o variograma dos teores em TPH. Este procedimento foi efetuado para as 100 imagens tendo-se gerado 100 cenários equiprováveis de teores em TPH. No final calcularam-se a imagem média das 100 realizações (Fig. 1e) e a imagem da variância local (Fig. 1f). A imagem da variância local permite quantificar a incerteza local que resulta da quantidade de amostras, da distância de cada célula da malha às amostras mais próximas e da heterogeneidade das medições. Fig. 1. Representação de resultados para o horizonte [1,5 m; 2 m] (a) Imagem estimada de probabilidade de pertença à CRO {2,3,4}. (b) Imagem simulada de teores em TPH para a CRO {0,1}. (c) Imagem simulada de teores em TPH para a CRO {2,3,4}. d) Imagem simulada final de teores em TPH. (e) Imagem de valores médios em TPH. (f) Imagem da variância local dos valores simulados em TPH. Fig. 1. Results for the level [1.5 m; 2 m]. (a) Estimated probability of belonging to the CRO {2,3,4}. (b) One simulated image of TPH grades for CRO {0.1}. (c) One simulated image of TPH grades for CRO {2,3,4}. (d) Final simulated image of TPH grades. (e) Average values of TPH grades. (f) Local variance of the simulated values of TPH grades. 4. Conclusões A metodologia apresentada permite caracterizar espacialmente, por simulação, uma variável contínua amostrada num número reduzido de localizações condicional a uma variável categórica indireta amostrada nos mesmos locais e noutros, mas que não seja completamente amostrada na malha onde se pretendem apresentar os resultados. Os estatísticos dos resultados finais 954 J. A. Almeida, S. Roxo / Comunicações Geológicas (2014) 101, Especial II, 951-954 e os variogramas foram validados por comparação com o dos dados experimentais. Embora a metodologia tenha sido apresentada no contexto de um caso de estudo de solos contaminados, tem potencialidades para ser aplicada a todas as situações onde as características dos dados experimentais sejam da mesma natureza. Referências Almeida, J.A., 2010. Modelling of cement raw material compositional indices with direct sequential cosimulation. Engineering Geology, 114(1–2), 26–33. Brito, M.G., 2005. Metodologia para avaliação e remediação da contaminação por metais pesados em áreas industriais degradadas. Tese de doutoramento, Universidade Nova Lisboa (não publicada), 336 p. Charifo, G., Almeida, J.A., Ferreira, A., 2013. Managing borehole samples of unequal lengths to construct a high-resolution mining model of mineral grades zoned by geological units. Journal of Geochemical Exploration, 132, 209–223. Goovaerts, P., 1997. Geostatistics for Natural Resources Evaluation. Oxford University Press, 483 p. Nunes, R., Almeida, J.A., 2010. Parallelization of sequential Gaussian, indicator and direct simulation algorithms. Computers & Geosciences, 36, 1042–1052. Pereira, M.J., Almeida, J., Costa, C., Soares, A., 2001. Accounting for soft information in mapping soil contamination with TPH at an old storage site. In: P. Monastiez. D. Allard, R. Froidevaux, (Eds). geoENV III, Geoestatistic Environmental Applications. Kluwer Academic Publish., Dordrecht, 475–486. Roxo, S., 2011. Integração de informação secundária na modelação geoestatistica da qualidade de solos em locais potencialmente contaminados. Aplicação à área subjacente de uma antiga refinaria. Tese de mestrado, Universidade Nova Lisboa (não publicada), 64 p. Soares, A., 2001. Direct Sequencial Simulation and Cosimulation. Mathematical Geosciences, 33, 911–926. Soares, A., Almeida, J.A., Guerreiro, L., 2006. Incorporating secondary information using direct sequential cosimulation. In: T.C. Coburn, J.M. Yarus, R.L. Chambers, (Eds). Stochastic modeling and geostatistics: Principles, methods, and case studies. Vol. II, AAPG Computer Applications in Geology, 5, 35-43. Soares, A., Tavora, J., Pinheiro, L., Freitas, C., Almeida, J., 1992. Predicting Probability Maps of air pollution concentration: A case study on Barreiro/Seixal Industrial Area. In: A. Soares, (Ed.). Geostatistics Troia ’92, II, 625–636.