Importância do Uso das Técnicas de Visualização na Interpretação dos Dados da Metanálise em Dados Agrícolas Importance of Using Visualization Techniques in Meta-Analysis Interpretation Data on Agricultural Data Bruna Rossetto Delazeri1, Simone Nasser Matos2, Alaine Margarete Guimarães1, Marcelo Giovanetti Canteri3 1 Departamento de Informática, Universidade Estadual de Ponta Grossa, Ponta Grossa, Paraná, Brasil, [email protected]; [email protected] 2 Departamento de Informática, Universidade Tecnológica Federal do Paraná, Ponta Grossa, Paraná, Brasil, [email protected] 3 Departamento de Agronomia, Universidade Estadual de Londrina, Londrina, Paraná, Brasil, [email protected] RESUMO Utilizada na área agronômica para realizar estimativas empíricas de eficiência técnica para o desenvolvimento da produtividade e investigação econômica da cultura, a metanálise é uma técnica probabilística agrupa os resultados de diversos estudos que abordam o mesmo assunto e produz um resultado que resume o todo. Os resultados gerados são exibidos em forma gráfica sem proporcionar interatividade com o usuário, tampouco reproduz uma interface amigável e de fácil compreensão. Para que se possa obter uma análise exploratória visual dos resultados mais satisfatórios, existem as técnicas de Visualização de Informação que são aplicadas para mapear os dados em forma gráfica com o objetivo de ampliar a cognição do usuário. Este artigo aplica a Técnica de Visualização Bifocal Tree como alternativa para melhorar a representação visual do gráfico Forest Plot, gerado pelo Software R, e exibe o resultado da aplicação da técnica em uma prototipação. PALAVRAS-CHAVE: Metanálise, Técnicas de Visualização de Informação, Software R. ABSTRACT Used in agronomy to perform empirical estimates of technical efficiency for the development of productivity and economic research culture, meta-analysis is a probabilistic technique brings together the results of several studies that discuss the same subject and produces a result which summarizes all. The results generated are displayed in graphical form without providing interactivity with the user, either playing a friendly interface and easy to understand. For can get a visual exploratory analysis of the most satisfactory results, there are Information Visualization techniques that are applied to map the data in graphical form in order to expand the user cognition. This paper presents the view of Technical Bifocal Tree as an alternative to improve the visual representation of Forest Plot graphical, generated by the Software R, and displays the result of technical application in a prototyping. KEYWORDS: Meta-analysis, Techniques of Information Visualization, Software R. 1. INTRODUÇÃO A metanálise é uma técnica probabilística que utiliza da fusão de resultados obtidos em diversos estudos e produz resultados que resumem o conjunto. Esta técnica pode ser aplicada em um modelo de efeito fixo ou aleatório por meio de software existentes, como exemplo, o Software R, gratuito e livre (ZIEGELMANN;2013). Os gráficos gerados pelo software não proporcionam interatividade com o usuário, tampouco reproduz uma interface amigável e de fácil compreensão. Para que se possa obter uma análise exploratória visual dos resultados mais satisfatórios, existem as técnicas de Visualização de Informação que são aplicadas para mapear os dados em forma gráfica com o objetivo de ampliar a cognição do usuário (THIAM, 2001). A Visualização de Informação é um método de computação gráfica empregada para auxiliar no processo de análise de um conjunto de dados por meio de representações gráficas manipuláveis. Estas representações não apenas apresentam os resultados, mas fornecem mecanismos que permitem ao usuário interagir com a informação, examinando-a visualmente (VALIATI et al., 2008) Este artigo tem a finalidade de aprimorar o aspecto do gráfico Forest Plot gerado pelo do Software R através da execução da metanálise para determinar a eficácia do uso do fungicida Fluquinconazol na semente de soja, utilizado para minimizar o impacto causado pela doença da ferrugem asiática na produtividade da cultura. Os resultados serão exibidos por meio de uma prototipação utilizando uma técnica de visualização hierárquica, direcionando o esforço da exploração dos dados unicamente ao computador, permitindo que o usuário possa explorar níveis distintos de visualização, obtendo maior interação com os dados e podendo examinar melhor os resultados para que a tomada de decisão, aplicada ao cultivo para minimizar os efeitos da doença, seja mais rápida e precisa. 2. METANÁLISE A metanálise utiliza-se de técnicas estatísticas de agrupamento que combina e analisa os resultados de diversos estudos de uma área específica, de modo a obter resultados mais específicos ou até mesmo definitivos, diferentemente das revisões de literatura, muitas vezes comparadas entre si, que cobre uma série de fontes diferentes, realizando um trabalho descritivo (PATEL, 1989). Nem toda revisão de literatura possui metanálise, entretanto, uma metanálise que não possua uma revisão é potencialmente tendenciosa, portanto deve ser cuidadosamente utilizada. Assim como na revisão, o pré-requisito de maior importância da metanálise é que os diversos estudos individuais abordem o mesmo assunto de pesquisa ou então examine diferentes aspectos de uma questão mais ampla (FEUER; 1999). A qualidade da precisão estatística obtida através do uso da metanálise depende da exaustividade da pesquisa bibliográfica, ou seja, é proporcional ao número de amostras encontradas. Para combinar os estudos em uma metanálise, é necessário determinar a medida de efeito (ME) e calculá-la para cada estudo, assim os estudos serão agrupados através da medida adotada. A escolha da ME depende da pesquisa em questão, do tipo de variável envolvida e da quantidade de grupos comparados. As medidas de efeito mais utilizadas na metanálise em experimentos são: risco relativo (RR), razão de chances (odds ratio) e diferença de média (ZIEGELMANN;2013). Definida a medida de efeito, é elementar apontar a presença, ou não, de heterogeneidade entre os estudos classificados (ZIEGELMANN;2013). Diferentes estudos podem produzir várias estimativas para uma mesma medida de efeito. Esta diferença é chamada de heterogeneidade e, quanto maior a distinção, maior será a heterogeneidade. Depois de calculada a heterogeneidade entre os estudos, é necessário escolher o modelo mais adequado ao estudo de caso, fixo ou aleatório. O modelo fixo considera que todos os estudos incluídos na metanálise são provenientes de uma população de estudos. O Modelo de efeito aleatório apresenta como resultado uma única medida de efeito, juntamente com o intervalo de confiança. (ZIEGELMANN; 2013). 3. SOFTWARE R O R é um software definido como uma linguagem e ambiente para estatística computacional e gráfica. É gratuito e de livre distribuição, sob os termos da GNU (HORNIK; LEISH, 2001). Fornece uma integração ampla de variedades estatísticas e técnicas gráficas e é altamente extensível, permitindo criação e modificação de suas funções. É compilado e roda em plataformas tais como: Linux, Windows e MacOS. Referindo-se aos procedimentos estatísticos, o Software R possui diversas funções, como: linear, modelos lineares generalizados, modelos de regressão não-linear, análise de séries temporais, parâmetros clássicos e testes não paramétricos, agrupamento e nivelamento (HORNIK; LEISH, 2001). 4. TÉCNICAS DE VISUALIZAÇÃO DE INFORMAÇÃO Técnicas de Visualização de Informações são utilizadas para facilitar a análise de dados, em que o excesso de informações dificulta o processo de entendimento. Ao utilizar estas técnicas é possível reunir vários dados em uma única imagem, permitindo que o usuário obtenha melhor visão da informação e extraia melhor os detalhes (VAZ; CARVALHO, 2004). A visualização é definida pelo processo de mapeamento de dados e informações em um formato gráfico, explorando o uso computacional para realizar as representações visuais com o objetivo de ampliar o conhecimento. A área científica é beneficiada pelo poder computacional de transformar os dados em visualizações sofisticadas, tornando visíveis as particularidades do objeto de interesse, uma vez que esta classe é baseada por dados fornecidos por fenômenos naturais do mundo físico, e auxiliam no processo iterativo de análise e interpretação de dados (BRANCO; 2003). Dentre as técnicas de visualização de informação mais encontradas na bibliografia, existe a Bifocal Tree, uma técnica hierárquica desenvolvida com o objetivo de facilitar a percepção da hierarquia existente na estrutura de dados (CAVA; 2002). Esta é uma técnica que utiliza de uma estrutura de dados do tipo árvore, possuindo um nodo pai (ou raiz) partindo destes os nodos filhos. A Bifocal Tree, representada pelo diagrama de nodos, é dividida em dois subdiagramas, o da área de detalhe, que tem por objetivo exibir de forma detalhada a subárvore cujo nodo foi selecionado pelo usuário, e o da área de contexto, que fornece uma visão global de toda estrutura de dados. Antes da concepção desta técnica deve-se estabelecer quais nodos fazem parte de cada subdiagrama. Além disso, cores são utilizadas para diferenciar os tipos de nodos para oferecer ao usuário melhor ponto de referência (CAVA; 2002). 4.1. Visualização de informação estatística Segundo Tufte (2001) os gráficos visualmente atraentes tem a capacidade de reunir o poder do conteúdo e da interpretação, além da visualização imediata de números relevantes. O requinte gráfico é frequentemente encontrado na simplicidade do design e na complexidade dos dados e, os melhores gráficos ilustram o útil e importante. O ambiente estatístico do Software R disponibiliza diversos pacotes para a aplicação da metanálise e geração de gráficos como: meta, metacor, metaMA e metafor (RODRIGUES; ZIELGELMANN, 2010). O pacote metafor possui disponibilidade de conduzir a metanálise nos modelos de efeito fixo e aleatório e exibe seus resultados de forma gráfica com os gráficos Forest Plot (A), Funnel Plot (B), Radial Plot (C) e Standardized Residuals (D) (RODRIGUES; ZIELGELMANN, 2010). Os gráficos gerados por meio dos softwares disponíveis não proporcionam interatividade com o usuário, tampouco reproduzem uma interface amigável e de fácil compreensão. A confiança do resultado da metanálise é proporcional ao número de amostras que é encontrado na bibliografia (DELAYAINE, 1991), portanto, os gráficos gerados como resultados trazem uma grande quantidade de informação estática, dificultando o entendimento, aumentando a probabilidade de erro de interpretação gráfica. 5. MATERIAL E MÉTODOS A metanálise no âmbito agrícola é utilizada para realizar estimativas empíricas de eficiência técnica para o desenvolvimento da produtividade e investigação econômica da agricultura (THIAM, 2001; KOLAWOLE, 2014). A Figura 1 ilustra uma visão geral do processo da metanálise na área agronômica obtida por meio de vários experimentos em pequenos blocos que utilizaram como base o fungicida fluquinconazol no tratamento das sementes de soja no combate à doença da ferrugem asiática da soja, intitulada base de dados fluquinconazol. Realizar esta metanálise se faz importante para que uma tomada de decisão mais rápida e precisa possa ser realizada para minimizar os impactos que a doença da ferrugem asiática causa na cultura da soja. Figura 1- Visão geral da metanálise resultante de artigos selecionados sobre o uso do Fluquinconazol Fonte: Autoria Própria Cada um dos estudos ilustrados na Figura 1 possuem diversos experimentos. Extraído os estudos, são tabelados e se produz com eles o banco de dados que será utilizado para o cálculo da metanálise realizado pelo Software R. Neste experimento obteve-se um total de 12 estudos, com 64 experimentos, cada um com sua respectiva taxa de aumento, ou não, de produtividade. Cada experimento utilizou o fungicida Fluquinconazol como base para aplicar na semente da soja, alguns ainda receberam, posteriormente, pulverizações aéreas nas plantas já crescidas. A produtividade de cada experimento foi calculada a partir de um bloco chamado de testemunha, o qual não recebeu nenhum tipo de fungicida. Ao rodar o banco de dados obtido no Software R, gerou-se as respostas tanto em forma textual quanto gráfica. Os displays gráficos são parte integrante da metanálise utilizados para facilitar a comunicação visual, realçar características importantes e exibir os resultados estatísticos produzidos (LANGAN et al., 2012). Existem diversos métodos para apresentar os resultados estatísticos obtidos pela aplicação da metanálise, tradicionalmente, o mais utilizado é o gráfico Forest Plot (DELAYAINE, 1991). Este é capaz de sintetizar graficamente a particularidade de informações de cada estudo aplicado e os resultados da metanálise exprime em uma única figura todos os dados sobre a precisão do tratamento e a contribuição particular de cada estudo para o resultado da análise (DELAYAINE, 1991). A Figura 2 ilustra o gráfico Forest Plot trazendo como resultado a compilação estatística do banco de dados. Na Figura 2 (A), são exibidos apenas 12 experimentos, do Araújo et. al. (2012), pois exibir todos 64 experimentos ficariam ilegíveis na imagem. A Figura 12 (B) ilustra o resultado da metanálise dos 64 experimentos. Os estudos mostram o aumento, ou não, da produtividade da cultura da soja com a aplicação com o uso do fungicida. Na coluna da esquerda estão listados os estudos escolhidos para realizar a revisão sistemática. A coluna Hedges representa os resultados obtidos, este resultado é calculado a partir dos experimentos realizados nos estudos, utilizando a diferença entre uma planta que teve a aplicação do Fluquinconazol na semente e outra que não obteve, chamada de testemunha. As linhas horizontais representam o intervalo de confiança de cada estudo. Se a linha horizontal tocar a vertical indica que não há diferença estatística entre os grupos em relação ao benefício ou malefício do tratamento. O ponto central de cada linha horizontal representa o odds ratio, ou seja, o tamanho do efeito do estudo. Ainda no ponto central, as diferenças de tamanhos indicam o peso relativo de cada estudo no resultado final. O losango (ou diamante) localizado na parte inferior da figura indica o resultado final da combinação dos estudos, ou seja, a metanálise, e seu tamanho representa o intervalo de confiança (ATALLAH; CASTRO, 1997). Este gráfico se apresenta ao usuário de forma não interativa dificultando sua compreensão. Para tanto, uma melhor análise exploratória visual dos resultados se evidencia como fator importante para que as tomadas de decisões a partir dos resultados obtidos possam ser aplicadas com mais precisão. Figura 2- Gráfico gerado pelo Software R como resultado da metanálise da utilização do Fluquinconazol no tratamento da semente da soja Fonte: Autoria Própria 6. RESULTADOS E DISCUSSÃO Para aperfeiçoar a apresentação do gráfico Forest Plot, como resultado da metanálise, foi eleita a Técnica de Visualização de Informação Hierárquica Bifocal Tree, por meio de estudo de pesquisa bibliográfica. Além disso, a técnica obteve aprimoramento textual para poder exibir as informações específicas de cada experimento. As Figuras 5, 6 e 7 ilustram o resultado da prototipação da técnica realizada com o Software Balsamiq Mockups 3.1.2. A Figura 3 ilustra a prototipação da técnica em alto nível, onde primeiramente tem-se o resultado da metanálise (A) obtido através do banco de dados fluquinconazol. Se o usuário desejar saber informações mais detalhadas sobre os estudos que foram selecionados para realizar a metanálise, deve-se clicar no círculo indicado Metanálise (em vermelho) e a figura expande, interagindo com o usuário, exibindo todos os estudos (B). A Figura 4 ilustra o protótipo já em uma versão mais específica, a qual o usuário ao clicar no estudo Furlan e Scherb (2007) o gráfico exibe todos os experimentos que foram realizados por este estudo, em seguida, o usuário pode clicar no experimento Nativo/ Folicur e obter dinamicamente todas as informações inclusas no experimento. Para exibir estas informações, a técnica Bifocal Tree foi aprimorada com exibição textual, a qual não possui em sua versão de criação. Nos protótipos, cada tamanho de círculo é proporcional ao peso do estudo no resultado da metanálise, ou seja, a medida de efeito. As linhas pretas que ligam o resultado da metanálise aos estudos e os estudos aos experimentos representam o intervalo de confiança, quanto maior for a linha há mais variabilidade dentro do estudo. Figura 3 – Protótipo de alto nível da aplicação da técnica de visualização de informação hierárquica Bifocal Tree Aprimorada Fonte: Autoria Própria Figura 4 – Prototipação da técnica de visualização de informação hierárquica Bifocal Tree Aprimorada com detalhamento de estudo Fonte: Autoria Própria Por fim, se o usuário quiser obter uma visão geral do gráfico, basta pressionar duplo clique no círculo Metanálise e o gráfico exibirá toda a estrutura de dados que resultou a metanálise, como mostra a Figura 5. A prototipação realizada foi baseada em algumas guias desenvolvidas por Tufte2 para melhorar a qualidade visual da exibição de informação estatística como: Apresentar uma complexidade de detalhes acessível: o usuário pode acessar, a partir dos nós, cada nível específico do gráfico, e também visualizar o gráfico totalmente expandido, auxiliando o usuário na exibição dos detalhes. Refletir um equilíbrio, proporção, uma sensação de escala relevante: o usuário consegue distinguir quais estudos possuem mais relevância para obter o resultado final da metanálise. Escolher corretamente o formato e o design: a técnica Bifocal Tree foi selecionada a partir de uma exaustiva pesquisa bibliográfica das Técnicas de Visualização de Informação para melhor representar o gráfico Forest Plot. Desenhar de forma profissional, com detalhes técnicos de uma produção feita com cuidado: depois de eleita a Bifocal Tree, a prototipação foi realizada a partir do estudo detalhado da técnica e cuidadosamente aprimorada para melhor exibir o gráfico e aumentar a cognição do usuário. Figura 5 – Visão Geral do Protótipo da aplicação da técnica de visualização de informação hierárquica Bifocal Tree aprimorada Fonte: Autoria Própria 7. CONCLUSÕES Como resultado, este artigo apresenta a prototipação da Técnica de Visualização de Informação Bifocal Tree aprimorada como um aperfeiçoamento na representação gráfica do resultado obtido através da menatálise, para melhorar a interpretação dos resultados e proporcionar estimativas empíricas no desenvolvimento da produtividade e investigação econômica da cultura. Posteriormente será realizado a implementação da técnica Bifocal Tree aprimorada exibida no protótipo e anexada ao Software R. REFERÊNCIAS ATALLAH, N. A.; CASTRO, A. A. (1997). Revisões sistemáticas da literatura e metanálise: a melhor forma de evidência para tomada de decisão em saúde e a maneira mais rápida de atualização terapêutica. Diagnóstico & Tratamento, v. 2, p. 12-15. BRANCO, V. M. A. Visualização como Suporte à Exploração de uma Base de Dados Pluviométricos. 2003. 27f. Dissertação (Mestrado em Ciência da Computação) - Universidade de São Paulo, São Paulo. CAVA, R. A. et al. The Bifocal Tree: a Technique for the Visualization of Hierarchical Information Structures. In: Workshop on Human Factors in Computer System, IHC, 2002, Fortaleza: SBC, 2002. DELAYAINE, F. et al. Meta-analysis. Health Policy, v.19, p.185-196, 1991. DIAS, M. P. A Contribuição da Visualização para a Ciência da Informação. 2007. Dissertação (Mestrado em Ciência da Informação) - Pontifícia Universidade Católica de Campinas, Campinas, 2007. FEUER, D. J. Meta-analysis. Pilliative Medicide, v. 13, p. 433-437, 1999. HORNIK, K., LEISH, F. R News. The Newsletter of the R Project, v.1, 32f. 2001. KOLAWOLE, O. The Paradigm of Agricultural Efficiency and its Implication on Food Security in Africa: What Does Meta-analysis Reveal?. World Development, v. 64, p. 690-702, 2014. LUZZARDI, P. R. G. Critérios de avaliação de técnicas de visualização de informações hierárquicas. 2003. 124 f. Dissertação (Doutorado em Computação) – Universidade Federal do Rio Grande Do Sul, Porto Alegre, 2003 MADDEN, L. V. e PAUL, P. A. (2011). Meta-Analysis for Evidence Synthesis in Plant Pathology: An Overview. Phytopathology Symposium PATEL, M. S. An introduction to Meta-analysis. Health Policy, v.11, p. 79-85, 1989. RODRIGUES C. L. e ZIELGELMANN P. K. (2010). Metanálise: um guia prático. Revista Hospital das Clinicas de Porto Alegre, v. 30, p. 436-447. THIAM, et. al. Technical efficiency in developing country agriculture: A meta-analysis. Agricultural Economics, v.25, p. 235-243, 2001. TUFTE, E. R. The Visual Display of Quantitative Information. 2. Ed. Graphics Pr, 2001. 200 p. VAZ, F. R. e CARVALHO C. L. Visualização de Informações. 2004. 21F. Relatório Técnico – Instituto de Informática, Universidade Federal de Goiás. VENABLES et. al. An Introduction to R. 2001. 99 f. Disponível em: <http:// http://www.rproject.org//>. Acesso em: 29 mai. 2015. ZIEGELMANN, P. K. Conceptual and Practical Aspects of Meta-Analysis. Revista de Enfermagem da UFPI, v.2, p. 8-13, 2013.