Desafios de big data para gestão em doenças negligenciadas: um estudo de dengue na rede social Jorge L Magalhães; Luc Quoniam; Núbia Boechat twitter pela abordagem 2.0 1,2,3 3,4 2 1FIOCRUZ/Farmanguinhos. INTRODUÇÃO Deptº Síntese. Área Gestão e Inovação Tecnológica 2Aix-Marseille Université – Institut de Recherches en Sciences de l'Information et de Communication 3Bolsista Capes pós-doutorado 12.298. 4Universidade Nove de Julho – UNINOVE, São Paulo. A velocidade da geração de dados no século 21 é praticamente instantânea devido a big data1 . Assim, a questão é ter habilidade para extrair, analisar e converter os 2,5 quintilhões (2.5×1018) de dados gerados diariamente no mundo (McKinsey Global Institute, 2011). Os serviços online e mídia social têm gerado quantidades de informações a baixo custo e sem precedentes na história. Considerando uma economia global e integrada, é imperativo que os gestores busquem dados cada vez mais precisos para tomada de decisão. Assim, é salutar adaptar-se constantemente nesse novo contexto mundial (Quoniam, 2010). Na saúde, melhores condições de vida e ações de saúde pública estão na agenda mundial e se agravam quando 80% da população mundial negligenciada vive em países de baixa ou média renda, não tendo acesso aos medicamentos essenciais (WHO, 2010), e intensificase com doenças que perpetuam essas condições da pobreza, como dengue, malária etc. (Morel et al, 2005). Melhorar a saúde das populações mais pobres depende do desenvolvimento e implantação de variedades de inovações em saúde, aos quais incluem novos medicamentos, dispositivos, diagnósticos e tecnologias em engenharia de processos e manufatura, novas abordagens de gestão, software e políticas em sistemas de saúde. Assim, a internet tem se tornado fundamental para leigos e profissionais da saúde (Brownstein et al, 2008) OBJETIVOS Contato: [email protected] Assim, dos 150 documentos essenciais obtidos, observa-se a formação de 37 clusters dispostos em cores, sendo que17 tratam do ‘impacto’ sobre o tema pesquisado, 14 associados à dengue, 5 câncer etc. Essa abordagem facilita a visualização e o resgate dos principais documentos na área. O termo ‘big data’ se relaciona em dados com o termo ‘saúde’ em 43% na internet. De acordo com o Twitter Statistics há 550 milhões de usuários no twitter e emitem, em média, 58 milhões de tweets/dia. As nações TOP 5 usuárias são EUA, Brasil, Japão, UK e Indonésia. A figura 2 demonstra uma rede de pessoas do twitter comentando sobre dengue durante o mês de março/2013 no Rio de Janeiro. No software, há possibilidade de clicar nos pontos e identificar a pessoa e o que a mesma comenta. A concentração de pontos pretos indica a quantidade maciça de twitter em determinado local e suas respectivas interligações (retweets). Esse cenário Figura 2: Rede de tweets e retweets sobre dengue. indicaria um possível surto de casos de dengue. Outro exemplo, é o ponto vermelho e suas ramificações, porém em escala menor. Nessa abordagem, a possibilidade de um observatório de saúde focado em redes sociais poderia contribuir no sentido de munir os gestores de vigilância epidemiológica com dados em tempo real, possibilitando ações de saúde pública ágil a fim de conter endemias. Identificar o big data na área da saúde e algumas ferramentas do conceito web 2.0. A doença dengue foi usada como demonstração no estudo de caso. RESULTADOS E DISCUSSÃO Dados obtidos sobre doenças, saúde, pesquisas etc., podem ser identificados não somente em abordagens tradicionais, mas também em diversos canais da Web. Devido a existência do big data, a dificuldade é estudar essa gama de informações. Um caminho é o uso de ferramentas colaborativas 2.0 (Lynch, 2008). Existem 55700 documentos sobre doenças negligenciadas e dengue na busca pelo software Carrot®. Ao aplicar data miner e restringir com correlações mais consistentes dentro do PubMed, reduz-se a Figura 1: Cluster sobre doenças negligenciadas no PubMed. pesquisa em 97,3% (figura 1). AGRADECIMENTOS CONCLUSÃO É realidade o uso do big data na saúde. Portanto, há necessidade de aliar ferramentas 2.0 a fim de melhor entender e adaptar-se às interações das novas abordagens de tecnologias, como por exemplo, as redes sociais. De tal modo, usá-las como método para antever a identificação e análise de doenças e prover ações de saúde pública. BIBLIOGRAFIA • • • • • • C. Lynch, Big data: How do your data grow?, Nature, vol. 455, no 7209, p. 28–29, set. 2008. C. M. Morel, S. J. Serruya, G. O. Penna, e R. Guimarães, Co-authorship Network Analysis: A Powerful Tool for Strategic Planning of Research, Development and Capacity Building Programs on Neglected Diseases, PLoS Negl. Trop. Dis., vol. 3, no 8, p. e501, ago. 2009. J. Scott e P. J. Carrington, Handbook of Social Network Analysis. SAGE, 2011. J. S. Brownstein, C. C. Freifeld, B. Y. Reis, e K. D. Mandl, Surveillance Sans Frontières: InternetBased Emerging Infectious Disease Intelligence and the HealthMap Project, Plos Med., vol. 5, no 7, p. e151, 2008. McKinsey Global Institute. Big Data: The Management Revolution. Harvard Business Review, 2011. Quoniam, L, Lucien, A, Intelligence compétitive 2.0 : organisation, innovation et territoire. France: Librairie Lavoisier, 2010. 1Volume de dados criados diariamente pela sociedade e cada vez maiores excedendo a capacidade das tecnologias atuais poderem trata-los adequadamente (McKinsey, 2010).