SUPORTE À CRIAÇÃO DE INTELIGÊNCIA ORGANIZACIONAL EM UMA EMPRESA PÚBLICA DE JORNALISMO COM O USO DE MINERAÇÃO DE TEXTOS EDILBERTO M. SILVA 1,2, HÉRCULES. A. DO PRADO 1,3, EDILSON FERNEDA 1 1 Programa de Pós-graduação em Gestão do Conhecimento e da Tecnologia da Informação, Universidade Católica de Brasília (UCB/DF) Campus Universitário II – Pró-Reitoria de Pós-Graduação e Pesquisa – SGAN 916 – Módulo B, 70.790-160 Brasília/DF 2 Agência Brasil Radiobrás – Empresa Brasileira de Comunicação S.A. SCRN 702/3 Bloco B Ed. Radiobrás – Brasília/DF – CEP: 70.710–750 3 Embrapa – Cerrados Km 18 da BR020 – Planaltina – DF, CEP 73.301-970 – Caixa Postal 08.223 e-mails: [email protected], [email protected], [email protected] Apresenta-se, nesse artigo, um estudo de caso sobre a criação de inteligência organizacional com a aplicação de ferramentas de mineração de texto. Partindo do questionamento do cumprimento do papel social da Radiobrás, empresa pública de jornalismo, construiu-se um modelo para análise de padrões extraídos do enorme volume de textos produzidos por seus jornalistas. O método CRISP-DM foi aplicado compreendendo a aquisição das matérias produzidas ao longo de 2001, preparação desse material, com a limpeza e formatação dos arquivos, criação de um modelo de agrupamentos e a geração de diversas visões na forma de estatísticas e de gráficos. As visões foram fornecidas à administração da empresa permitindo interpretações úteis para o autoconhecimento da organização. O processo completo é descrito em detalhes no corpo do artigo. Considerando que a Radiobrás é uma importante empresa do Estado, detendo um papel relevante na divulgação dos atos da administração pública do país, fica evidente a necessidade de uma auto-avaliação calcada no conhecimento sobre os resultados das suas atividades. Como qualquer outra empresa, a Radiobrás está sujeita à crescente exigência de competitividade imposta às organizações modernas. Nesse cenário, a geração e a fixação da inteligência organizacional têm se revelado como diferenciais competitivos que podem levar a uma gestão mais adequada dos negócios em diversos sentidos, como no relacionamento da organização com os seus clientes e na adequação da sua estrutura de trabalho, entre outros. A importância da informação para a elaboração do conhecimento e, conseqüentemente, a síntese da inteligência é largamente reconhecida, requerendo tratamento adequado para obtenção de insights que levem à ativação dos processos mentais que levarão àquela síntese. Diversas visões, internas e externas, sobre os rumos da organização podem ser obtidas com o uso de ferramentas para a extração de padrões em grandes quantidades de dados, subsidiando decisivamente os gestores na tomada de decisões fundamentadas. Essas visões, construídas para responder a questões específicas, formam um acervo de conhecimento num processo de aprendizagem organizacional que deverá gerar desdobramentos nos modos de gestão da organização. As contribuições da Tecnologia da Informação nesse campo desenvolveram-se inicialmente visando à extração de padrões dos bancos de dados transacionais que se configuram num conjunto de tabelas bem comportadas. Entretanto, considerando que a maior parte das informações nas organizações encontra-se na forma textual, desenvolvimentos recentes permitem a extração de padrões interessantes a partir desse tipo de dados, como por exemplo, no presente caso: (i) mensuração da produção e distribuição geográfica de suas notícias, (ii) levantamento das palavras mais usadas, (iii) descoberta das áreas de abrangência das notícias, (iv) avaliação do cumprimento papel da empresa, de acordo com os assuntos abordados em suas notícias, e (v) avaliação da cobertura jornalística da empresa. Palavras-chave: Inteligência Organizacional; aprendizagem organizacional; CRISP-DM; KDT; Radiobrás. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx SUPPORT TO THE CREATION OF ORGANIZACIONAL INTELLIGENCE IN A PUBLIC COMPANY OF JOURNALISM WITH THE USE OF TEXT MINING. In this article it is presented a case study on the creation of organizational intelligence in Radiobrás with the application of text mining tools. Departing from the question about if Radiobrás is fulfilling its social role, we construct an analysis model based on the enormous volume of texts produced by its journalists. CRISP-DM method was applied including the acquisition of the news produced during 2001, preparation of this material, with the cleansing and formatting of the archives, creation of a model of clustering and the generation of many views in the form of statistics and graphs. The views had been supplied to the administration of the company allowing useful interpretations of the self-knowledge of the organization. The complete process is described in details in the body of the article. Considering that the Radiobrás is an important company of the State, pursuing an important objective by spreading out the acts of the public administration of the country, it is evident the necessity of a self evaluation based in the knowledge of its results. We must recognize that, as any another company, Radiobrás is subject to the increasing requirement of competitiveness imposed to the modern organizations. In this scene, the generation and retention of organizational intelligence have been recognized as a competitive differential that can lead to a more adequate management of the businesses in many directions, as in its relationship with customers and in the adequacy of its structure of work, among others. The importance of the information for the elaboration of the knowledge and, consequently, the synthesis of intelligence is wide recognized, requiring treatment adjusted for attainment of insights that can lead to the activation of the mental processes that will lead to that synthesis. Many internal and external views on the routes of the organization can be built with the use of tools for the extraction of patterns in great amounts of data, subsidizing decisively the managers in the decision making process. These views, constructed to answer the specific questions, constitute knowledge in a process of Organizacional Learning that influences radically the way in which the organization is managed. The contributions of IT in this field were developed, initially, aiming at the extraction of patterns from transactional databases that contains well structured data. However, considering that most of the information in the organizations are found find in textual form, recent developments allows the extraction of interesting standards from this type of data, as for example, in the present case with: (i) the measure of production and geographic distribution of Radiobrás news, (ii) a survey of the most used words, (iii) the discovery of the covering areas of the news, (iv) the evaluation of how the company is fulfilling its role, in accordance with the subjects approached in its news, and (v) the evaluation of the journalistic covering of the company. Keywords: Organizacional intelligence; learning organization; CRISP-DM; KDT; Radiobrás. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx I – INTRODUÇÃO As organizações estão sendo constantemente desafiadas a se adaptarem às mudanças ambientais, levando em consideração, entre outros, as expectativas dos clientes, estratégias competitivas, avanços tecnológicos, condições instáveis na economia e na sociedade. Considerando que a tomada de decisão é um processo de investigação, reflexão e análise, justifica-se o aumento da necessidade da alta administração de obter informação qualitativa que contenha um alto valor agregado. As organizações podem ser vistas como sistemas de processamento de informação e, portanto, têm informações alinhavadas na maioria de seus procedimentos administrativos. Assim, a Gestão do Conhecimento pode, por sua vez, ser vista como o conjunto de atividades que busca desenvolver e controlar todo tipo de conhecimento em uma organização, a fim de apoiar o processo decisório em todos os níveis. Neste trabalho, discorre-se sobre um estudo de caso realizado em uma empresa pública de jornalismo para a criação de inteligência organizacional com a aplicação de ferramentas de mineração de texto. Para isso, a partir do questionamento do cumprimento do papel social da empresa, procurou-se delinear o ambiente informacional sob o foco do modelo genérico de gestão do conhecimento. II – MOTIVAÇÃO De acordo com Tan1 , 80% da informação contida nas organizações se encontram na forma textual. Em contraste com este fato, uma pesquisa publicada em Kdnuggets®2 afirma que somente 2% de toda aplicação de descoberta de conhecimento são aplicadas em bancos de dados textuais. Se forem adicionadas aplicações em web mining, que usa textos com tags, este percentual chega-se a 7%. Neste sentido, questiona-se por que, numa economia com acirrada competitividade, as aplicações de descoberta de conhecimento em texto não são tão comuns quanto seria de se esperar. Em seu modelo (figura 1) que explica a adoção de novas tecnologias, Moore3 discute a existência de um “abismo” entre as fases “adeptos iniciais” e “maioria inicial” que uma tecnologia deve atravessar para torna-se extensamente aplicada. A motivação deste estudo está baseada no reconhecimento de que o text mining encontra-se exatamente neste ponto. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx FIGURA 1 – Classificação de consumidores de novas tecnologias A partir desse ponto, pode-se enumerar algumas hipóteses para investigar o por que do text mining não ter atravessado ainda este “abismo”: (i) falta de uma tecnologia adequada, no que se refere à exigência em sua usabilidade, por exemplo, (ii) poucos relatos de experiê ncia de sucesso e (iii) inexistência de uma metodologia adequada para guiar os usuários nas aplicações de text mining; Considerando a disponibilidade de tecnologias com excelente nível de maturidade, com diversas funcionalidades e interfaces adequadas aos usuários comuns, decidiu-se focalizar os estudos na terceira hipótese, que trata da questão metodológica. A pesquisa foi conduzida com um estudo de caso no qual se utilizam notícias publicadas por uma agência de notícias brasileira, a Radiobrás. Para explorar nossas hipóteses, aplicou-se a metodologia CRISP-DM (CRoss-Industry Standard Process for Data Mining)4 , concebida originalmente para Data Mining. Essa metodologia foi desenvolvida com o intuito de promover a padronização de conceitos e técnicas na busca de informações específicas para tomada de decisões. Ela consiste de um conjunto de fases e processos padrões para gerência de projetos de Data Mining, independentes da área de negócio e das ferramentas usadas, de forma estruturada e metódica. É constituída de seis fases: (i) Compreensão do Negócio, (ii) Compreensão dos Dados, (iii) Preparação dos Dados, (iv) Modelagem, (v) Avaliação do Modelo e (vi) Aplicação. III – ANÁLISE DOS TEXTOS PRODUZIDOS A metodologia CRISP-DM foi aplicada em um estudo de caso na Radiobrás com o uso de ferramentas de mineração de texto sobre seu acervo público de notícias. A Radiobrás é uma empresa pública brasileira que visa servir de canal de interlocução dos órgãos do Governo Federal com a sociedade brasileira, buscando universalizar as informações referentes WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx a atos e fatos da administração pública federal do Brasil. Realizou-se a análise de 55.635 textos, totalizando cerca de 8.700.000 palavras. Para tanto, como pré-processamento, foram executadas as seguintes tarefas: (i) aquisição e transferência dos arquivos textos – notícias – do acervo da empresa, (ii) preparação dos arquivos textos, (iii) estatística de quantidade de textos, palavras e tamanho de arquivos, (iv) limpeza dos dados: arquivos corrompidos, nulos, inválidos ou fora do escopo do projeto (notícias em português), (v) engenharia nos dados: separação de notícias em arquivos independentes, e (vi) estatística final: palavras mais usadas, resultado após limpeza dos dados. A seguir, foi feita a modelagem, onde foram selecionadas as tecnologias a serem utilizadas. Verificados os objetivos da mineração e os dados disponíveis, foi realizada uma clusterização dos textos da empresa, que consiste em agrupar objetos similares em grupos distintos, onde todos os objetos deste grupo detenham características em comum. No caso deste projeto, separam-se as matérias em grupos, onde todos os membros compartilham determinadas palavras. Deste modo, foi possível particionar uma grande coleção de documentos, isolando aqueles pertencentes a um mesmo assunto. Isto facilitou a identificação de documentos relevantes para o usuário. Aplicando-se técnicas adicionais, foi possível identificar o assunto ou conhecimento específico de cada grupo, facilitando o processo de recuperação de informações ou descoberta de conhecimento. Com a análise destes agrupamentos, pode-se criar e explicar hipóteses. Baseado no conhecimento a priori detido pelo especialista, adquirido com a experiência nos dados da empresa ou ainda pelas informações fornecidas pela descrição e sumarização dos dados, pretende-se obter relações relevantes ao negócio da empresa. Para a realização da clusterização foi escolhida a proposta de Palazzo, apresentada na pesquisa de Wives5 e implementada na ferramenta Eurekha. Após a obtenção dos grupos e respectivos centróides, foi realizada uma análise dos mesmos, buscando extrair conhecimento a partir das informações encontradas. Foi então realizada uma categorização de assuntos abordados pela Radiobrás. Esta categorização foi realizada pelo especialista com base na metodologia apresentada por Halliman6 , que usou, além das informações dos grupos, seu conhecimento prévio do negócio. A partir do percentual de distribuição de matérias nos grupos, o especialista categorizou os grupos encontrados mês a mês e por assunto. A quantificação das categorias foi realizada através dos dados de distribuição (%) dos centróides em relação à sua incidência no período. Com a categorização foi possível relacionar os principais assuntos tratados pela empresa. Foram identificadas cinco grandes áreas: (i) Presidência da República – 30% WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx (presidente, Fernando, Henrique, Cardoso), (ii) Economia – 21% (banco central, valores monetários, inflação, cotação das bolsas de valores, cotação do dólar, taxa de juros, tesouro nacional), (iii) Meteorologia – 21% (previsão do tempo, nublado, parcialmente, chuvas), (iv) Desenvolvimento – 8% (energia, valores monetários, nomes de estatais, investimento e desenvolvimento) e (v) Política – 7% (siglas de partidos, câmara, senado, nome de ministros, nomes de senadores). Outras áreas com menor incidência de apresentação também foram elencadas. Elas representam 13% do total de notícias veiculadas. Estas áreas e suas principais palavras-chave são as seguintes: Educação (censo escolar, universidade, ENEM), Saúde (AIDS, HIV, clone, genéricos, hospital, colesterol, remédio), Internacional (ONU, WWF, El Salvador, Mercosul, Palestina, Israel, Nova York, atentado, torres, Estados Unidos), Segurança (polícia federal, antidrogas), Previdência (INSS, previdência social, prazo), C&T (Genoma, tecnologia), Justiça (tribunal, federal, justiça, julgamento, índio, Galdino), Meio Ambiente (meio ambiente, pássaros, ISO, Amazônia), Agricultura (INCRA, reforma, agrária. IBAMA, solo), Cultura (carnaval, arte, museu, exposição, orquestra, sinfônica, bonito, festival, inverno), Transporte (aeroportos, polícia, rodoviária, metrô, conferência, trânsito), Esporte (INTECOM, ECT, futebol, Nike, CBF, sets, maratona, Vasco, Gama, Cruzeiro, Goiás, olimpíada), Nacional (qualidade, preço, carne, acidente, P-36) e Trabalho (mulher, acordo, rurais, trabalho, infantil, fórum, SENAC, SEBRAE). Para melhor análise das categorias foram criados diversos gráficos. A seguir, são apresentados alguns, juntamente com interpretação realizada pelo especialista. No Gráfico de “incidência de palavras” são apresentas as palavras mais usadas no decorrer do período e sua evolução no decorrer do mesmo (figura 2). Sua avaliação mostra que o uso constante das palavras “presidente”, “governo”, “ministro” sugerem uma abordagem das ações da Presidência da República e do Governo Federal. A palavra “saúde” aumenta na proporção em que o Governo Federal e o Ministério da Saúde divulgam campanhas de vacinação e prevenção de doenças (AIDS, por exemplo). E a característica mais realçada: o uso da palavra “energia” comprovando o aspecto de cobertura da administração pública na campanha “anti-apagão” conduzida pelo Governo Federal. Já pela análise do Gráfico de “tipo e distribuição geográfica no Brasil” (figura 3), pode-se concluir que a maioria das notícias veiculadas é do tipo flash (IT-Internet), que não trazem cons igo uma identificação de qual editoria é o foco da notícia (política, economia, nacional, entre outras), ao contrário das matérias consolidadas (MA). Isto não permite, a priori, uma avaliação mais precisa, através de meios convencionais de distribuição de WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx editorias (pesquisa por editoria, por exemplo). É possível ainda comprovar que o maior número de notícias provêm de: Brasília – DF, Rio de Janeiro – RJ e São Paulo – SP. Isto se deve ao fato de o DF e o RJ serem os estados da federação como maior concentração de órgãos federais no Brasil. Neste gráfico é realçada ainda a presença de Pernambuco – PE. Em uma análise mais apurada, verificou-se que isto se deve à cobertura da empresa na ação do Governo Federal no “Polígono da Maconha”. presidente ministro Mês governo energia dezembro novembro outubro setembro agosto julho junho maio abril março fevereiro janeiro Inicidência Destaque na Evolução saúde FIGURA 2 – Destaque na evolução das palavras mais usadas FIGURA 3 – Tipos de notícias e distribuição geográfica Economia Presidência 62,00 45,00 46,00 31,50 24,00 25,00 17,00 16,50 12,00 8,00 julho junho maio abril março fevereiro janeiro dezembro novembro outubro setembro agosto julho junho maio abril março fevereiro 6,00 janeiro 25,25 23,00 23,00 19,50 10,75 dezembro 31,00 31,00 19,00 novembro 32,25 outubro 29,00 setembro 36,00 agosto 32,00 36,00 FIGURA 4 – Exemplo de categorias encontradas (presidência e economia) WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx O Gráfico “categorias” (figura 4) representa uma classificação subjetiva do especialista realizada nos grupos encontrados pela ferramenta de KDT (Knowledge Discovery in Text), através de seus centróides. A presença da categoria “presidência”, “política”, “desenvolvimento” e “economia”, condiz com os objetivos da empresa: cobertura da Presidência da Repúb lica e dos atos e fatos da administração pública federal brasileira. Comprovam ainda, visto terem sido obtidas com análise de suas principais palavras (assuntos abordados), estarem de acordo com a classificação adotada pela empresa em suas editorias. Reflete também que em certos meses, devido a fatos diversos, há congruência de notícias para determinados assuntos. Por exemplo: (i) crise financeira e risco de inflação (aumento em economia), (ii) campanha “anti-apagão” (aumento em desenvolvimento), (iii) guerras entre países e atentados aos EUA (aumento em Internacional e em Segurança), (iv) greve nos metrôs, ônibus e trens (aumento em transportes), (v) campanhas educacionais (aumento em educação) e (vi) meteorologia, considerada de grande valor, visto que, devido a inúmeros fatores, estes dados podem ser essenciais em regiões longínquas, onde só há recepção de tais informações através de rádios. IV – GESTÃO DO CONHECIMENTO E IMPACTOS DA MINERAÇÃO DE TEXTOS Existem muitas abordagens sobre os processos de interpretação dos eventos que ocorrem em uma organização. Daft & Weick7 apresentam o relacionamento entre os conceitos de varredura, monitoramento, compreensão, interpretação, entendimento e aprend izado em três estágios (figura 5). Estes estágios constituem o processo geral de aprendizado. FIGURA 5 – Processo geral de aprendizado O processo inicia-se com a tarefa de observar o ambiente e fornecer dados, coletados de sistemas ou de pessoas, para os gerentes. De posse destes dados é desenvolvido o entend imento compartilhado, atribuindo- lhes significado. O aprendizado envolve uma nova ação baseada na interpretação. Este processo, no qual o conhecimento é desenvolvido sobre as relações dos resultados das ações, é definido como Aprendizado Organizacional. O processo reinicia-se com o fornecimento de novos dados para interpretação, oriundos do ato de aprender. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx Este processo pode ser tomado como base para organizações que visam adquirir conhecimento organizacional por meio da gestão do conhecimento. Para tanto, Stollenwerk8 apresenta um modelo genérico de gestão do conhecimento por meio do estudo dos principais modelos existentes em gestão e planejamento estratégico, procurando extrair o essencial de cada um deles. 4.1 MODELO GENÉRICO DE GESTÃO DO CONHECIMENTO A Gestão do Conhecimento e o Planejamento Estratégico são alvos de diversas abordagens, definições e percepções. Neste trabalho, selecionou-se o modelo genérico de Stolle nwerk que buscou agrupar os processos comuns por afinidade de conceitos. O modelo resultante (figura 6), segundo a autora, compõe os elementos e dimensões para aplicabilidade, caracterizando a importância e conceituação da Gestão de Conhecimento nas organizações. FIGURA 6 – Modelo genérico de gestão do conhecimento O modelo apresentado é composto de sete processos: (i) identificação, (ii) captura, (iii) seleção/validação, (iv) organização/modelagem, (v) compartilhamento, (vi) aplicação e (vii) criação. Além disso, o modelo ainda inclui quatro fatores facilitadores: (i) liderança, (ii) cultura organizacional, (iii) medição e recompensa e (iv) tecnologia de informação e comunicação. A seguir, apresenta-se uma descrição sucinta destes processos e fatores que compõem o modelo genérico. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx 4.1.1 - PROCESSOS DA GESTÃO DO CONHECIMENTO Identificação Este processo é considerado como estratégico para organização. Nele estão inseridos a identificação e desenvolvimento das competências críticas (competências essenciais) para o sucesso da organização. Estas competências devem refletir, apoiar e estarem alinhadas com a missão, valores e visões do negócio. No enfoque gerenc ial são abordados conhecimentos, tecnologias e habilidades que apóiam as competências atuais. No enfoque estratégico é visto a relação de transferência e aquisição dos conhecimentos e habilidades necessários para apoiar o desenvolvimento de novas competências. Suas principais etapas são: (i) lista de competências, (ii) análise das competências necessárias e existentes, (iii) mapeamento do conhecimento, (iv) identificação das fontes (páginas amarelas, diretório de especialistas, etc) e (v) soluções para suprir as necessidades de competências necessárias versus as existentes. Captura A captura trata da aquisição de conhecimento, habilidades e experiências necessárias para criar e manter as competênc ias, similar a fase de criação de conhecimento. Esta captura pode ser obtida de fontes internas tais como especialistas e profissionais seniores, sistemas de gestão da organização, clientes e fornecedores internos, simulação e modelagem de processos, políticas, práticas e procedimentos e treinamento interno. Como fontes externas para obtenção deste conhecimento pode-se relacionar: publicações, serviços de consultoria, sistemas especialistas e bancos de dados comerciais, conferências e congressos, treinamentos e seminários, relacionamentos com clientes e fornecedores, joint ventures, benchmarking, entre outras. Entre suas principais etapas, destacam-se: (i) identificações das fontes internas e externas, (ii) seleção das estratégias de aquisição e (iii) aquisição, formalização e recuperação do conhecimento. Seleção e validação O processo de seleção e validação visa filtrar o conhecimento gerado, recuperado ou desenvolvido avaliando sua qualidade e o sintetizando para uso futuro. Neste processo são consolidados pontos como: (i) relevância e confiabilidade do conhecimento, (ii) proposição de soluções de problemas relacionados a conhecimentos conflitantes, (iii) desenvolvimento e criação de conhecimento não disponível, (iv) redução do grau de incerteza do conhecimento não comprovado e (v) estabelecimento de visões múltiplas quando houver solução para conhecimentos conflitantes. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx Organização e armazenagem O processo de organização e armazenagem visa, por meio da utilização de sistemas, garantir a recuperação, de forma rápida, fácil e correta, do conhecimento armazenado. Buscase formalizar o conhecimento ao máximo, objetivando otimizar sua eficácia. Suas etapas são: (i) classificação do conhecimento, (ii) definição da arquitetura de tecnologia da informação (TI) e (iii) criação de repositórios de conhecimentos, informações e dados. Compartilhamento: acesso e distribuição Neste processo, busca-se facilitar o acesso das informações e conhecimentos que geralmente se restringem a um pequeno grupo de pessoas. A facilidade de acesso é o ponto crítico do processo. Assim, a TI envolvida torna-se crucial. Para tanto, é necessário: (i) identificação da necessidade de informação e de conhecimento, (ii) criação de mecanismos de recuperação e disseminação do conhecimento, (iii) capacitação dos usuários potenciais nas ferramentas de recuperação e (iv) disseminação automática do conhecimento em tempo hábil. Aplicação É vital que o conhecimento adquirido seja aplicado em situações reais da organização. Isto pode auxiliar na busca de benefícios tais como melhoria de desempenho e conquista de novos mercados. Neste processo, são registradas as experiências com a utilização do conhecimento e ainda a necessidade de novos conhecimentos. Suas etapas são: (i) aplicação do conhecimento relevante, confiável e de alto valor agregado e (ii) registro das lições aprend idas e dos ganhos obtidos com a utilização. Criação do conhecimento Este processo envolve aprendizagem, externalização do conhecimento, lições aprend idas, pensamento criativo, pesquisa, experimentação, descoberta e inovação. A criação de um novo conhecimento pode ser potencializada com a formulação e operacionalização da estratégia, inteligência competitiva, pesquisa e desenvolvimento, reengenharia, benchmarking, entre outros. São etapas deste processo: (i) compartilhamento do conhecimento tácito; (ii) criação de conceitos; (iii) justificação de conceitos; (iv) construção de um arquétipo; e (v) difusão interativa do conhecimento (cross-leveling knowledge). 4.1.2 FATORES FACILITADORES DA GES TÃO DO CONHECIMENTO Liderança É papel da liderança no processo de gestão obter compromisso e direcionamento por parte dos administradores da organização. Este processo está diretamente ligado à eficácia da WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx gestão do conhecimento na empresa. Nenhuma mudança significativa ocorre a menos que parta da cúpula. Cultura organizacional É necessário que haja na organização uma cultura ao estímulo para cooperação. Organizações de conhecimento são caracterizadas por terem: (i) alto desempenho, (ii) foco no cliente, (iii) foco em melhoria e em excelência, (iv) nível elevado de competência e de conhecimento, (v) altas taxas de aprendizagem e inovação, (vi) autogerenciamento, (vii) próatividade e visão de futuro e (viii) compartilhamento de conhecimento. Medição e avaliação Para que o processo geral de gestão do conhecimento tenha êxito, é necessário medir e avaliar os desempenhos, comportamentos e atitudes. Desse modo, é possível efetuar o devido reconhecimento e recompensa dos colaboradores. Métodos de medição e acompanhamento permitem e facilitam atingir metas com melhor definição de padrões e foco nas ações. Tecnologia da Informação A existência de uma TI adequada é vital para suporte à gestão de conhecimento. Geralmente, os projetos de gestão utilizam ferramentas de TI tais como banco de dados relacionais, Data Mining, Data Warehousing e ferramentas de busca. Consideram-se ferramentas de compartilhamento de conhecimento tais como videoconferências, workgroups, newgroups, e-mails, Intranet e Internet. 4.2 CONTRIBUIÇÕES DA MINERAÇÃO DE TEXTO NO MODELO DE GESTÃO DO CONHECIMENTO DA RADIOBRÁS Mesmo que de maneira informal e pontual, a Radiobrás já aplica gestão do conhecimento. Em relação à aplicação formal da gestão de conhecimento, tem-se a realização de planejamento estratégico na empresa. Como referencial teórico para a presente análise, utilizou-se o modelo genérico de Gestão do Conhecimento de Stollenwerk. É importante salientar que a análise realizada neste trabalho foi delimitada no nível hierárquico definido pela Assessoria Administrativa da Radiobrás, vinculada à diretoria administrativa da empresa. Um dos objetivos desta pesquisa é a motivação da administração superior da empresa em divulgar e ampliar a prática de gestão do conhecimento. Observou-se que, através da aplicação da metodologia CRISP-DM, se chegou a dois tipos de conhecimento: um primeiro, decorrente da aplicação da metodologia em si, e um segundo, como conseqüência da análise dos resultados obtidos pela mineração de dados. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx Em relação ao primeiro tipo de conhecimento, foram descobertos problemas de armazenamento das matérias. Com isso, a empresa pôde direcionar esforços com objetivo de recuperar tais informações em outras fontes, tais como: (i) backups; (ii) repositórios/servidores antigos; (iii) arquivos em formato ‘html’ no servidor web da empresa. Em conseqüência, novas rotinas de segurança e armazenamento foram planejadas, a fim de resguardar, da melhor maneira, o acervo da empresa. Quanto ao segundo tipo de conhecimento, a análise obtida com o uso do text mining, constatou formalmente o cumprimento do papel social da Radiobrás junto à sociedade. Anteriormente, esta hipótese era tida como verdade sustentada com base na experiência de seus dir igentes. Esse foi o principal resultado alcançado. Além disso, foi possível mensurar, de forma mais precisa, a produção da empresa. Na primeira estatística de produção foram avaliadas as matérias separadas por períodos mensais de produção, informando quantidade de registros, tamanho total por mês (bytes), quantidade média por dia de produção e tamanho médio de cada matéria (bytes). Isso possibilitou à empresa avaliar sua produção no decorrer de um ano inteiro, podendo assim gerenciar melhor sua logística de cobertura. Foi obtida também a quantidade de palavras por matéria. Isso permitiu que se determinasse a média de palavras por texto em cada mês, viabilizando o acompanhamento do fluxo e do padrão de tamanho das notícias veiculadas, fator importante para o jornalismo. Outro resultado significativo foi a obtenção das palavras usadas com maior freqüência. De posse destas palavras e de suas correlações, foi possível apurar com acurácia os principais assuntos abordados pela empresa. A limpeza e a engenharia de dados forneceu a quantidade de matérias inválidas ou fora do contexto. Assim, foi possível determinar o nível de incidência desses tipos indesejáveis de matérias. Outro produto da análise foi a distribuição geográfica das origens das matérias. Isso permitiu à empresa comprovar a eficácia de sua cobertura jornalística no país, correlaciona ndo assuntos, localidades e fatos de grande repercussão nacional no período analisado. A partir do agrupamento das notícias foi possível certificar e enumerar as grandes áreas de abrangência da empresa. A comprovação destas áreas permitiu aos administradores certificarem o cumprimento das metas traçadas à empresa. Os administradores da Radiobrás, com os resultados obtidos neste trabalho puderam conhecer melhor o potencial das tecnologias envolvidas no processo, e com isto pretendem WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx estender a abrangência do projeto. Entre os futuros passos pode-se considerar: (i) aplicação da tecnologia nos demais produtos da empresa, (ii) estudo de uma forma de universalizar o conhecimento adquirido na organização, (iii) revisão de alguns processos e estudo, com maior profundidade, dos conceitos e assuntos descobertos (por exemplo, direcionamento a produção) e (iv) melhor exploração de alguns grupos, analisando de outra forma a categorização de assuntos. V – CONCLUSÕES E TRABALHOS FUTUROS A Radiobrás desponta como uma empresa que busca excelência em sua administração. A disputa para obtenção de direitos para agenciar a publicidade legal aliada à concorrência na cobertura jornalística do governo é exemplo de fator condicionante para tal filosofia de administração. Na cobertura jornalística, destacam-se os serviços de televisão, mídia impressa, notícias em tempo real, portal Internet e rádio que, por ser veículo oficial do governo, torna suas notícias também oficiais. Este cenário contribui para que a empresa tenha necessidade de manter-se no mercado jornalístico como referência. Outros fatores expressos em sua missão fazem com que a Radiobrás tenha que estar em constante melhoria na prestação de seus serviços. Conhecer os assuntos tratados pela empresa, confrontando-os com fatos e acontecimentos mundiais permitiu aos administradores também confrontar as ações do governo –através da veiculação jornalística – com as rotinas atuais da organização. Nesse sentido, a nossa pesquisa evidenciou uma aderência da produção da Radiobrás com os seus objetivos. Como trabalho futuro, os resultados obtidos deverão ser alvo de crítica mais refinada para um possível refinamento em algumas das etapas consideradas. Pretende-se, assim, que o autoconhecimento proporcionado pelos resultados aqui apresentados seja plenamente aproveitado em benefício da instituição. NOTAS E REFERÊNCIAS 1 TAN, A.-H. Text mining: The state of the art and the challenges, Kent Ridge Digital Labs, 1999. Disponível em <http://textmining.krdl.org.sg>. Acesso em: 23 ago. 2001. 2 NUGGETS® KDnuggets.com (KD stands for Knowledge Discovery) is the leading source of information on Data Mining, Web mining, Knowledge Discovery, and Decision Support Topics. Disponível em <http://www.kdnuggets.com/polls/data_mining_techniques.htm>. Acesso em: 21 ago. 2001. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx 3 citado em AGRAWAL, R. Data Mining: Crossing the Chasm. Invited talk at the 5th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD–99), San Diego, California, August 1999. Disponível em <http://www.almaden.ibm.com/cs/quest/PUBS.html>. Acesso em: 15 mai. 2001. 4 CHAPMAN, P., KERBER R., CLINTON J., KHABAZA T., REINARTZ T., WIRTH R. – The CRISP-DM Process Model. Discussion Paper, 2000. Disponível em <http://www.crisp– dm.org>. Acesso em: 08 jul. 2001. 5 WIVES, L. K. Um Estudo sobre Agrupamento de Documentos Textuais em Processamento de Informações não Estruturadas Usando Técnicas de Clustering. Dissertação de Mestrado, PPGC/UFRGS, Porto Alegre (RS), 1999. 6 HALLIMAN, C. Business intelligence using smart techniques: environmental scanning using text mining and competitor analysis using scenarios and manual simulation. Information Uncover, Houston, 2001. 7 citado em MORESI, E. A. D. Monitoramento Ambiental. In: TARAPANOFF, K. (Org.) Inteligência Organizacional e Competitiva, Brasília, Ed. UnB, p. 93-109, 2001. 8 STOLLENWERK, M. de F. L. Gestão do Conhecimento: conceitos e modelos. In: TARAPANOFF, K. (Org.) Inteligência Organizacional e Competitiva, Brasília, Ed. UnB, p. 143-163, 2001. WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS. CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS. xxxx