SUPORTE À CRIAÇÃO DE INTELIGÊNCIA ORGANIZACIONAL EM
UMA EMPRESA PÚBLICA DE JORNALISMO COM O USO DE
MINERAÇÃO DE TEXTOS
EDILBERTO M. SILVA 1,2, HÉRCULES. A. DO PRADO 1,3, EDILSON FERNEDA 1
1
Programa de Pós-graduação em Gestão do Conhecimento e da Tecnologia da Informação,
Universidade Católica de Brasília (UCB/DF)
Campus Universitário II – Pró-Reitoria de Pós-Graduação e Pesquisa – SGAN 916 – Módulo B, 70.790-160 Brasília/DF
2
Agência Brasil Radiobrás – Empresa Brasileira de Comunicação S.A.
SCRN 702/3 Bloco B Ed. Radiobrás – Brasília/DF – CEP: 70.710–750
3
Embrapa – Cerrados
Km 18 da BR020 – Planaltina – DF, CEP 73.301-970 – Caixa Postal 08.223
e-mails: [email protected], [email protected], [email protected]
Apresenta-se, nesse artigo, um estudo de caso sobre a criação de inteligência organizacional com a aplicação de ferramentas
de mineração de texto. Partindo do questionamento do cumprimento do papel social da Radiobrás, empresa pública de
jornalismo, construiu-se um modelo para análise de padrões extraídos do enorme volume de textos produzidos por seus
jornalistas. O método CRISP-DM foi aplicado compreendendo a aquisição das matérias produzidas ao longo de 2001,
preparação desse material, com a limpeza e formatação dos arquivos, criação de um modelo de agrupamentos e a geração de
diversas visões na forma de estatísticas e de gráficos. As visões foram fornecidas à administração da empresa permitindo
interpretações úteis para o autoconhecimento da organização. O processo completo é descrito em detalhes no corpo do artigo.
Considerando que a Radiobrás é uma importante empresa do Estado, detendo um papel relevante na divulgação dos atos da
administração pública do país, fica evidente a necessidade de uma auto-avaliação calcada no conhecimento sobre os
resultados das suas atividades. Como qualquer outra empresa, a Radiobrás está sujeita à crescente exigência de
competitividade imposta às organizações modernas. Nesse cenário, a geração e a fixação da inteligência organizacional têm
se revelado como diferenciais competitivos que podem levar a uma gestão mais adequada dos negócios em diversos sentidos,
como no relacionamento da organização com os seus clientes e na adequação da sua estrutura de trabalho, entre outros. A
importância da informação para a elaboração do conhecimento e, conseqüentemente, a síntese da inteligência é largamente
reconhecida, requerendo tratamento adequado para obtenção de insights que levem à ativação dos processos mentais que
levarão àquela síntese. Diversas visões, internas e externas, sobre os rumos da organização podem ser obtidas com o uso de
ferramentas para a extração de padrões em grandes quantidades de dados, subsidiando decisivamente os gestores na tomada
de decisões fundamentadas. Essas visões, construídas para responder a questões específicas, formam um acervo de
conhecimento num processo de aprendizagem organizacional que deverá gerar desdobramentos nos modos de gestão da
organização. As contribuições da Tecnologia da Informação nesse campo desenvolveram-se inicialmente visando à extração
de padrões dos bancos de dados transacionais que se configuram num conjunto de tabelas bem comportadas. Entretanto,
considerando que a maior parte das informações nas organizações encontra-se na forma textual, desenvolvimentos recentes
permitem a extração de padrões interessantes a partir desse tipo de dados, como por exemplo, no presente caso: (i)
mensuração da produção e distribuição geográfica de suas notícias, (ii) levantamento das palavras mais usadas, (iii)
descoberta das áreas de abrangência das notícias, (iv) avaliação do cumprimento papel da empresa, de acordo com os
assuntos abordados em suas notícias, e (v) avaliação da cobertura jornalística da empresa.
Palavras-chave: Inteligência Organizacional; aprendizagem organizacional; CRISP-DM; KDT; Radiobrás.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
SUPPORT TO THE CREATION OF ORGANIZACIONAL INTELLIGENCE IN A PUBLIC COMPANY OF
JOURNALISM WITH THE USE OF TEXT MINING. In this article it is presented a case study on the creation of
organizational intelligence in Radiobrás with the application of text mining tools. Departing from the question about if
Radiobrás is fulfilling its social role, we construct an analysis model based on the enormous volume of texts produced by its
journalists. CRISP-DM method was applied including the acquisition of the news produced during 2001, preparation of this
material, with the cleansing and formatting of the archives, creation of a model of clustering and the generation of many
views in the form of statistics and graphs. The views had been supplied to the administration of the company allowing useful
interpretations of the self-knowledge of the organization. The complete process is described in details in the body of the
article. Considering that the Radiobrás is an important company of the State, pursuing an important objective by spreading
out the acts of the public administration of the country, it is evident the necessity of a self evaluation based in the knowledge
of its results. We must recognize that, as any another company, Radiobrás is subject to the increasing requirement of
competitiveness imposed to the modern organizations.
In this scene, the generation and retention of organizational
intelligence have been recognized as a competitive differential that can lead to a more adequate management of the
businesses in many directions, as in its relationship with customers and in the adequacy of its structure of work, among
others. The importance of the information for the elaboration of the knowledge and, consequently, the synthesis of
intelligence is wide recognized, requiring treatment adjusted for attainment of insights that can lead to the activation of the
mental processes that will lead to that synthesis. Many internal and external views on the routes of the organization can be
built with the use of tools for the extraction of patterns in great amounts of data, subsidizing decisively the managers in the
decision making process. These views, constructed to answer the specific questions, constitute knowledge in a process of
Organizacional Learning that influences radically the way in which the organization is managed. The contributions of IT in
this field were developed, initially, aiming at the extraction of patterns from transactional databases that contains well
structured data. However, considering that most of the information in the organizations are found find in textual form, recent
developments allows the extraction of interesting standards from this type of data, as for example, in the present case with: (i)
the measure of production and geographic distribution of Radiobrás news, (ii) a survey of the most used words, (iii) the
discovery of the covering areas of the news, (iv) the evaluation of how the company is fulfilling its role, in accordance with
the subjects approached in its news, and (v) the evaluation of the journalistic covering of the company.
Keywords: Organizacional intelligence; learning organization; CRISP-DM; KDT; Radiobrás.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
I – INTRODUÇÃO
As organizações estão sendo constantemente desafiadas a se adaptarem às mudanças
ambientais, levando em consideração, entre outros, as expectativas dos clientes, estratégias
competitivas, avanços tecnológicos, condições instáveis na economia e na sociedade.
Considerando que a tomada de decisão é um processo de investigação, reflexão e
análise, justifica-se o aumento da necessidade da alta administração de obter informação
qualitativa que contenha um alto valor agregado.
As organizações podem ser vistas como sistemas de processamento de informação e,
portanto, têm informações alinhavadas na maioria de seus procedimentos administrativos.
Assim, a Gestão do Conhecimento pode, por sua vez, ser vista como o conjunto de atividades
que busca desenvolver e controlar todo tipo de conhecimento em uma organização, a fim de
apoiar o processo decisório em todos os níveis.
Neste trabalho, discorre-se sobre um estudo de caso realizado em uma empresa
pública de jornalismo para a criação de inteligência organizacional com a aplicação de
ferramentas de mineração de texto. Para isso, a partir do questionamento do cumprimento do
papel social da empresa, procurou-se delinear o ambiente informacional sob o foco do modelo
genérico de gestão do conhecimento.
II – MOTIVAÇÃO
De acordo com Tan1 , 80% da informação contida nas organizações se encontram na
forma textual. Em contraste com este fato, uma pesquisa publicada em Kdnuggets®2 afirma
que somente 2% de toda aplicação de descoberta de conhecimento são aplicadas em bancos
de dados textuais. Se forem adicionadas aplicações em web mining, que usa textos com tags,
este percentual chega-se a 7%. Neste sentido, questiona-se por que, numa economia com
acirrada competitividade, as aplicações de descoberta de conhecimento em texto não são tão
comuns quanto seria de se esperar.
Em seu modelo (figura 1) que explica a adoção de novas tecnologias, Moore3 discute a
existência de um “abismo” entre as fases “adeptos iniciais” e “maioria inicial” que uma
tecnologia deve atravessar para torna-se extensamente aplicada. A motivação deste estudo
está baseada no reconhecimento de que o text mining encontra-se exatamente neste ponto.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
FIGURA 1 – Classificação de consumidores de novas tecnologias
A partir desse ponto, pode-se enumerar algumas hipóteses para investigar o por que do
text mining não ter atravessado ainda este “abismo”: (i) falta de uma tecnologia adequada, no
que se refere à exigência em sua usabilidade, por exemplo, (ii) poucos relatos de experiê ncia
de sucesso e (iii) inexistência de uma metodologia adequada para guiar os usuários nas
aplicações de text mining;
Considerando a disponibilidade de tecnologias com excelente nível de maturidade,
com diversas funcionalidades e interfaces adequadas aos usuários comuns, decidiu-se
focalizar os estudos na terceira hipótese, que trata da questão metodológica. A pesquisa foi
conduzida com um estudo de caso no qual se utilizam notícias publicadas por uma agência de
notícias brasileira, a Radiobrás.
Para explorar nossas hipóteses, aplicou-se a metodologia CRISP-DM (CRoss-Industry
Standard Process for Data Mining)4 , concebida originalmente para Data Mining. Essa
metodologia foi desenvolvida com o intuito de promover a padronização de conceitos e
técnicas na busca de informações específicas para tomada de decisões. Ela consiste de um
conjunto de fases e processos padrões para gerência de projetos de Data Mining,
independentes da área de negócio e das ferramentas usadas, de forma estruturada e metódica.
É constituída de seis fases: (i) Compreensão do Negócio, (ii) Compreensão dos Dados, (iii)
Preparação dos Dados, (iv) Modelagem, (v) Avaliação do Modelo e (vi) Aplicação.
III – ANÁLISE DOS TEXTOS PRODUZIDOS
A metodologia CRISP-DM foi aplicada em um estudo de caso na Radiobrás com o uso
de ferramentas de mineração de texto sobre seu acervo público de notícias. A Radiobrás é
uma empresa pública brasileira que visa servir de canal de interlocução dos órgãos do
Governo Federal com a sociedade brasileira, buscando universalizar as informações referentes
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
a atos e fatos da administração pública federal do Brasil.
Realizou-se a análise de 55.635 textos, totalizando cerca de 8.700.000 palavras. Para
tanto, como pré-processamento, foram executadas as seguintes tarefas: (i) aquisição e
transferência dos arquivos textos – notícias – do acervo da empresa, (ii) preparação dos
arquivos textos, (iii) estatística de quantidade de textos, palavras e tamanho de arquivos, (iv)
limpeza dos dados: arquivos corrompidos, nulos, inválidos ou fora do escopo do projeto
(notícias em português), (v) engenharia nos dados: separação de notícias em arquivos
independentes, e (vi) estatística final: palavras mais usadas, resultado após limpeza dos dados.
A seguir, foi feita a modelagem, onde foram selecionadas as tecnologias a serem
utilizadas. Verificados os objetivos da mineração e os dados disponíveis, foi realizada uma
clusterização dos textos da empresa, que consiste em agrupar objetos similares em grupos
distintos, onde todos os objetos deste grupo detenham características em comum. No caso
deste projeto, separam-se as matérias em grupos, onde todos os membros compartilham
determinadas palavras. Deste modo, foi possível particionar uma grande coleção de
documentos, isolando aqueles pertencentes a um mesmo assunto. Isto facilitou a identificação
de documentos relevantes para o usuário. Aplicando-se técnicas adicionais, foi possível
identificar o assunto ou conhecimento específico de cada grupo, facilitando o processo de
recuperação de informações ou descoberta de conhecimento.
Com a análise destes agrupamentos, pode-se criar e explicar hipóteses. Baseado no
conhecimento a priori detido pelo especialista, adquirido com a experiência nos dados da
empresa ou ainda pelas informações fornecidas pela descrição e sumarização dos dados,
pretende-se obter relações relevantes ao negócio da empresa.
Para a realização da clusterização foi escolhida a proposta de Palazzo, apresentada na
pesquisa de Wives5 e implementada na ferramenta Eurekha.
Após a obtenção dos grupos e respectivos centróides, foi realizada uma análise dos
mesmos, buscando extrair conhecimento a partir das informações encontradas. Foi então
realizada uma categorização de assuntos abordados pela Radiobrás. Esta categorização foi
realizada pelo especialista com base na metodologia apresentada por Halliman6 , que usou,
além das informações dos grupos, seu conhecimento prévio do negócio.
A partir do percentual de distribuição de matérias nos grupos, o especialista
categorizou os grupos encontrados mês a mês e por assunto. A quantificação das categorias
foi realizada através dos dados de distribuição (%) dos centróides em relação à sua incidência
no período. Com a categorização foi possível relacionar os principais assuntos tratados pela
empresa. Foram identificadas cinco grandes áreas: (i) Presidência da República – 30%
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
(presidente, Fernando, Henrique, Cardoso), (ii) Economia – 21% (banco central, valores
monetários, inflação, cotação das bolsas de valores, cotação do dólar, taxa de juros, tesouro
nacional), (iii) Meteorologia – 21% (previsão do tempo, nublado, parcialmente, chuvas), (iv)
Desenvolvimento – 8% (energia, valores monetários, nomes de estatais, investimento e
desenvolvimento) e (v) Política – 7% (siglas de partidos, câmara, senado, nome de ministros,
nomes de senadores).
Outras áreas com menor incidência de apresentação também foram elencadas. Elas
representam 13% do total de notícias veiculadas. Estas áreas e suas principais palavras-chave
são as seguintes: Educação (censo escolar, universidade, ENEM), Saúde (AIDS, HIV, clone,
genéricos, hospital, colesterol, remédio), Internacional (ONU, WWF, El Salvador, Mercosul,
Palestina, Israel, Nova York, atentado, torres, Estados Unidos), Segurança (polícia federal,
antidrogas), Previdência (INSS, previdência social, prazo), C&T (Genoma, tecnologia),
Justiça (tribunal, federal, justiça, julgamento, índio, Galdino), Meio Ambiente (meio
ambiente, pássaros, ISO, Amazônia), Agricultura (INCRA, reforma, agrária. IBAMA, solo),
Cultura (carnaval, arte, museu, exposição, orquestra, sinfônica, bonito, festival, inverno),
Transporte (aeroportos,
polícia,
rodoviária,
metrô,
conferência,
trânsito),
Esporte
(INTECOM, ECT, futebol, Nike, CBF, sets, maratona, Vasco, Gama, Cruzeiro, Goiás,
olimpíada), Nacional (qualidade, preço, carne, acidente, P-36) e Trabalho (mulher, acordo,
rurais, trabalho, infantil, fórum, SENAC, SEBRAE).
Para melhor análise das categorias foram criados diversos gráficos. A seguir, são
apresentados alguns, juntamente com interpretação realizada pelo especialista.
No Gráfico de “incidência de palavras” são apresentas as palavras mais usadas no
decorrer do período e sua evolução no decorrer do mesmo (figura 2). Sua avaliação mostra
que o uso constante das palavras “presidente”, “governo”, “ministro” sugerem uma
abordagem das ações da Presidência da República e do Governo Federal. A palavra “saúde”
aumenta na proporção em que o Governo Federal e o Ministério da Saúde divulgam
campanhas de vacinação e prevenção de doenças (AIDS, por exemplo). E a característica
mais realçada: o uso da palavra “energia” comprovando o aspecto de cobertura da
administração pública na campanha “anti-apagão” conduzida pelo Governo Federal.
Já pela análise do Gráfico de “tipo e distribuição geográfica no Brasil” (figura 3),
pode-se concluir que a maioria das notícias veiculadas é do tipo flash (IT-Internet), que não
trazem cons igo uma identificação de qual editoria é o foco da notícia (política, economia,
nacional, entre outras), ao contrário das matérias consolidadas (MA). Isto não permite, a
priori, uma avaliação mais precisa, através de meios convencionais de distribuição de
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
editorias (pesquisa por editoria, por exemplo). É possível ainda comprovar que o maior
número de notícias provêm de: Brasília – DF, Rio de Janeiro – RJ e São Paulo – SP. Isto se
deve ao fato de o DF e o RJ serem os estados da federação como maior concentração de
órgãos federais no Brasil. Neste gráfico é realçada ainda a presença de Pernambuco – PE. Em
uma análise mais apurada, verificou-se que isto se deve à cobertura da empresa na ação do
Governo Federal no “Polígono da Maconha”.
presidente
ministro
Mês governo
energia
dezembro
novembro
outubro
setembro
agosto
julho
junho
maio
abril
março
fevereiro
janeiro
Inicidência
Destaque na Evolução
saúde
FIGURA 2 – Destaque na evolução das palavras mais usadas
FIGURA 3 – Tipos de notícias e distribuição geográfica
Economia
Presidência
62,00
45,00
46,00
31,50
24,00
25,00
17,00
16,50
12,00
8,00
julho
junho
maio
abril
março
fevereiro
janeiro
dezembro
novembro
outubro
setembro
agosto
julho
junho
maio
abril
março
fevereiro
6,00
janeiro
25,25 23,00
23,00
19,50
10,75
dezembro
31,00 31,00
19,00
novembro
32,25
outubro
29,00
setembro
36,00
agosto
32,00
36,00
FIGURA 4 – Exemplo de categorias encontradas (presidência e economia)
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
O Gráfico “categorias” (figura 4) representa uma classificação subjetiva do
especialista realizada nos grupos encontrados pela ferramenta de KDT (Knowledge Discovery
in Text), através de seus centróides. A presença da categoria “presidência”, “política”,
“desenvolvimento” e “economia”, condiz com os objetivos da empresa: cobertura da
Presidência da Repúb lica e dos atos e fatos da administração pública federal brasileira.
Comprovam ainda, visto terem sido obtidas com análise de suas principais palavras (assuntos
abordados), estarem de acordo com a classificação adotada pela empresa em suas editorias.
Reflete também que em certos meses, devido a fatos diversos, há congruência de notícias para
determinados assuntos. Por exemplo: (i) crise financeira e risco de inflação (aumento em
economia), (ii) campanha “anti-apagão” (aumento em desenvolvimento), (iii) guerras entre
países e atentados aos EUA (aumento em Internacional e em Segurança), (iv) greve nos
metrôs, ônibus e trens (aumento em transportes), (v) campanhas educacionais (aumento em
educação) e (vi) meteorologia, considerada de grande valor, visto que, devido a inúmeros
fatores, estes dados podem ser essenciais em regiões longínquas, onde só há recepção de tais
informações através de rádios.
IV – GESTÃO DO CONHECIMENTO E IMPACTOS DA MINERAÇÃO DE TEXTOS
Existem muitas abordagens sobre os processos de interpretação dos eventos que
ocorrem em uma organização. Daft & Weick7 apresentam o relacionamento entre os conceitos
de varredura, monitoramento, compreensão, interpretação, entendimento e aprend izado em
três estágios (figura 5). Estes estágios constituem o processo geral de aprendizado.
FIGURA 5 – Processo geral de aprendizado
O processo inicia-se com a tarefa de observar o ambiente e fornecer dados, coletados
de sistemas ou de pessoas, para os gerentes. De posse destes dados é desenvolvido o
entend imento compartilhado, atribuindo- lhes significado. O aprendizado envolve uma nova
ação baseada na interpretação. Este processo, no qual o conhecimento é desenvolvido sobre as
relações dos resultados das ações, é definido como Aprendizado Organizacional. O processo
reinicia-se com o fornecimento de novos dados para interpretação, oriundos do ato de
aprender.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
Este processo pode ser tomado como base para organizações que visam adquirir
conhecimento organizacional por meio da gestão do conhecimento. Para tanto, Stollenwerk8
apresenta um modelo genérico de gestão do conhecimento por meio do estudo dos principais
modelos existentes em gestão e planejamento estratégico, procurando extrair o essencial de
cada um deles.
4.1 MODELO GENÉRICO DE GESTÃO DO CONHECIMENTO
A Gestão do Conhecimento e o Planejamento Estratégico são alvos de diversas
abordagens, definições e percepções. Neste trabalho, selecionou-se o modelo genérico de
Stolle nwerk que buscou agrupar os processos comuns por afinidade de conceitos. O modelo
resultante (figura 6), segundo a autora, compõe os elementos e dimensões para aplicabilidade,
caracterizando a importância e conceituação da Gestão de Conhecimento nas organizações.
FIGURA 6 – Modelo genérico de gestão do conhecimento
O modelo apresentado é composto de sete processos: (i) identificação, (ii) captura,
(iii) seleção/validação, (iv) organização/modelagem, (v) compartilhamento, (vi) aplicação e
(vii) criação. Além disso, o modelo ainda inclui quatro fatores facilitadores: (i) liderança, (ii)
cultura organizacional, (iii) medição e recompensa e (iv) tecnologia de informação e
comunicação. A seguir, apresenta-se uma descrição sucinta destes processos e fatores que
compõem o modelo genérico.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
4.1.1 - PROCESSOS DA GESTÃO DO CONHECIMENTO
Identificação
Este processo é considerado como estratégico para organização. Nele estão inseridos a
identificação e desenvolvimento das competências críticas (competências essenciais) para o
sucesso da organização. Estas competências devem refletir, apoiar e estarem alinhadas com a
missão, valores e visões do negócio. No enfoque gerenc ial são abordados conhecimentos,
tecnologias e habilidades que apóiam as competências atuais. No enfoque estratégico é visto a
relação de transferência e aquisição dos conhecimentos e habilidades necessários para apoiar
o desenvolvimento de novas competências. Suas principais etapas são: (i) lista de
competências, (ii) análise das competências necessárias e existentes, (iii) mapeamento do
conhecimento, (iv) identificação das fontes (páginas amarelas, diretório de especialistas, etc) e
(v) soluções para suprir as necessidades de competências necessárias versus as existentes.
Captura
A captura trata da aquisição de conhecimento, habilidades e experiências necessárias
para criar e manter as competênc ias, similar a fase de criação de conhecimento. Esta captura
pode ser obtida de fontes internas tais como especialistas e profissionais seniores, sistemas de
gestão da organização, clientes e fornecedores internos, simulação e modelagem de processos,
políticas, práticas e procedimentos e treinamento interno. Como fontes externas para obtenção
deste conhecimento pode-se relacionar: publicações, serviços de consultoria, sistemas
especialistas e bancos de dados comerciais, conferências e congressos, treinamentos e
seminários, relacionamentos com clientes e fornecedores, joint ventures, benchmarking, entre
outras. Entre suas principais etapas, destacam-se: (i) identificações das fontes internas e
externas, (ii) seleção das estratégias de aquisição e (iii) aquisição, formalização e recuperação
do conhecimento.
Seleção e validação
O processo de seleção e validação visa filtrar o conhecimento gerado, recuperado ou
desenvolvido avaliando sua qualidade e o sintetizando para uso futuro. Neste processo são
consolidados pontos como: (i) relevância e confiabilidade do conhecimento, (ii) proposição de
soluções de problemas relacionados a conhecimentos conflitantes, (iii) desenvolvimento e
criação de conhecimento não disponível, (iv) redução do grau de incerteza do conhecimento
não comprovado e (v) estabelecimento de visões múltiplas quando houver solução para
conhecimentos conflitantes.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
Organização e armazenagem
O processo de organização e armazenagem visa, por meio da utilização de sistemas,
garantir a recuperação, de forma rápida, fácil e correta, do conhecimento armazenado. Buscase formalizar o conhecimento ao máximo, objetivando otimizar sua eficácia. Suas etapas são:
(i) classificação do conhecimento, (ii) definição da arquitetura de tecnologia da informação
(TI) e (iii) criação de repositórios de conhecimentos, informações e dados.
Compartilhamento: acesso e distribuição
Neste processo, busca-se facilitar o acesso das informações e conhecimentos que
geralmente se restringem a um pequeno grupo de pessoas. A facilidade de acesso é o ponto
crítico do processo. Assim, a TI envolvida torna-se crucial. Para tanto, é necessário: (i)
identificação da necessidade de informação e de conhecimento, (ii) criação de mecanismos de
recuperação e disseminação do conhecimento, (iii) capacitação dos usuários potenciais nas
ferramentas de recuperação e (iv) disseminação automática do conhecimento em tempo hábil.
Aplicação
É vital que o conhecimento adquirido seja aplicado em situações reais da organização.
Isto pode auxiliar na busca de benefícios tais como melhoria de desempenho e conquista de
novos mercados. Neste processo, são registradas as experiências com a utilização do
conhecimento e ainda a necessidade de novos conhecimentos. Suas etapas são: (i) aplicação
do conhecimento relevante, confiável e de alto valor agregado e (ii) registro das lições
aprend idas e dos ganhos obtidos com a utilização.
Criação do conhecimento
Este processo envolve aprendizagem, externalização do conhecimento, lições
aprend idas, pensamento criativo, pesquisa, experimentação, descoberta e inovação. A criação
de um novo conhecimento pode ser potencializada com a formulação e operacionalização da
estratégia,
inteligência
competitiva,
pesquisa
e
desenvolvimento,
reengenharia,
benchmarking, entre outros. São etapas deste processo: (i) compartilhamento do
conhecimento tácito; (ii) criação de conceitos; (iii) justificação de conceitos; (iv) construção
de um arquétipo; e (v) difusão interativa do conhecimento (cross-leveling knowledge).
4.1.2 FATORES FACILITADORES DA GES TÃO DO CONHECIMENTO
Liderança
É papel da liderança no processo de gestão obter compromisso e direcionamento por
parte dos administradores da organização. Este processo está diretamente ligado à eficácia da
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
gestão do conhecimento na empresa. Nenhuma mudança significativa ocorre a menos que
parta da cúpula.
Cultura organizacional
É necessário que haja na organização uma cultura ao estímulo para cooperação.
Organizações de conhecimento são caracterizadas por terem: (i) alto desempenho, (ii) foco no
cliente, (iii) foco em melhoria e em excelência, (iv) nível elevado de competência e de
conhecimento, (v) altas taxas de aprendizagem e inovação, (vi) autogerenciamento, (vii) próatividade e visão de futuro e (viii) compartilhamento de conhecimento.
Medição e avaliação
Para que o processo geral de gestão do conhecimento tenha êxito, é necessário medir e
avaliar os desempenhos, comportamentos e atitudes. Desse modo, é possível efetuar o devido
reconhecimento e recompensa dos colaboradores. Métodos de medição e acompanhamento
permitem e facilitam atingir metas com melhor definição de padrões e foco nas ações.
Tecnologia da Informação
A existência de uma TI adequada é vital para suporte à gestão de conhecimento.
Geralmente, os projetos de gestão utilizam ferramentas de TI tais como banco de dados
relacionais, Data Mining, Data Warehousing e ferramentas de busca. Consideram-se
ferramentas de compartilhamento de conhecimento tais como videoconferências, workgroups,
newgroups, e-mails, Intranet e Internet.
4.2 CONTRIBUIÇÕES DA MINERAÇÃO DE TEXTO NO MODELO DE GESTÃO DO
CONHECIMENTO DA RADIOBRÁS
Mesmo que de maneira informal e pontual, a Radiobrás já aplica gestão do
conhecimento. Em relação à aplicação formal da gestão de conhecimento, tem-se a realização
de planejamento estratégico na empresa. Como referencial teórico para a presente análise,
utilizou-se o modelo genérico de Gestão do Conhecimento de Stollenwerk.
É importante salientar que a análise realizada neste trabalho foi delimitada no nível
hierárquico definido pela Assessoria Administrativa da Radiobrás, vinculada à diretoria
administrativa da empresa. Um dos objetivos desta pesquisa é a motivação da administração
superior da empresa em divulgar e ampliar a prática de gestão do conhecimento.
Observou-se que, através da aplicação da metodologia CRISP-DM, se chegou a dois
tipos de conhecimento: um primeiro, decorrente da aplicação da metodologia em si, e um
segundo, como conseqüência da análise dos resultados obtidos pela mineração de dados.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
Em relação ao primeiro tipo de conhecimento, foram descobertos problemas de
armazenamento das matérias. Com isso, a empresa pôde direcionar esforços com objetivo de
recuperar
tais
informações
em
outras
fontes,
tais
como:
(i)
backups;
(ii)
repositórios/servidores antigos; (iii) arquivos em formato ‘html’ no servidor web da empresa.
Em conseqüência, novas rotinas de segurança e armazenamento foram planejadas, a fim de
resguardar, da melhor maneira, o acervo da empresa.
Quanto ao segundo tipo de conhecimento, a análise obtida com o uso do text mining,
constatou formalmente o cumprimento do papel social da Radiobrás junto à sociedade.
Anteriormente, esta hipótese era tida como verdade sustentada com base na experiência de
seus dir igentes. Esse foi o principal resultado alcançado.
Além disso, foi possível mensurar, de forma mais precisa, a produção da empresa. Na
primeira estatística de produção foram avaliadas as matérias separadas por períodos mensais
de produção, informando quantidade de registros, tamanho total por mês (bytes), quantidade
média por dia de produção e tamanho médio de cada matéria (bytes). Isso possibilitou à
empresa avaliar sua produção no decorrer de um ano inteiro, podendo assim gerenciar melhor
sua logística de cobertura.
Foi obtida também a quantidade de palavras por matéria. Isso permitiu que se
determinasse a média de palavras por texto em cada mês, viabilizando o acompanhamento do
fluxo e do padrão de tamanho das notícias veiculadas, fator importante para o jornalismo.
Outro resultado significativo foi a obtenção das palavras usadas com maior freqüência.
De posse destas palavras e de suas correlações, foi possível apurar com acurácia os principais
assuntos abordados pela empresa.
A limpeza e a engenharia de dados forneceu a quantidade de matérias inválidas ou fora
do contexto. Assim, foi possível determinar o nível de incidência desses tipos indesejáveis de
matérias.
Outro produto da análise foi a distribuição geográfica das origens das matérias. Isso
permitiu à empresa comprovar a eficácia de sua cobertura jornalística no país,
correlaciona ndo assuntos, localidades e fatos de grande repercussão nacional no período
analisado.
A partir do agrupamento das notícias foi possível certificar e enumerar as grandes
áreas de abrangência da empresa. A comprovação destas áreas permitiu aos administradores
certificarem o cumprimento das metas traçadas à empresa.
Os administradores da Radiobrás, com os resultados obtidos neste trabalho puderam
conhecer melhor o potencial das tecnologias envolvidas no processo, e com isto pretendem
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
estender a abrangência do projeto. Entre os futuros passos pode-se considerar: (i) aplicação da
tecnologia nos demais produtos da empresa, (ii) estudo de uma forma de universalizar o
conhecimento adquirido na organização, (iii) revisão de alguns processos e estudo, com maior
profundidade, dos conceitos e assuntos descobertos (por exemplo, direcionamento a
produção) e (iv) melhor exploração de alguns grupos, analisando de outra forma a
categorização de assuntos.
V – CONCLUSÕES E TRABALHOS FUTUROS
A Radiobrás desponta como uma empresa que busca excelência em sua administração.
A disputa para obtenção de direitos para agenciar a publicidade legal aliada à concorrência na
cobertura jornalística do governo é exemplo de fator condicionante para tal filosofia de
administração. Na cobertura jornalística, destacam-se os serviços de televisão, mídia
impressa, notícias em tempo real, portal Internet e rádio que, por ser veículo oficial do
governo, torna suas notícias também oficiais.
Este cenário contribui para que a empresa tenha necessidade de manter-se no mercado
jornalístico como referência. Outros fatores expressos em sua missão fazem com que a
Radiobrás tenha que estar em constante melhoria na prestação de seus serviços.
Conhecer os assuntos tratados pela empresa, confrontando-os com fatos e
acontecimentos mundiais permitiu aos administradores também confrontar as ações do
governo –através da veiculação jornalística – com as rotinas atuais da organização. Nesse
sentido, a nossa pesquisa evidenciou uma aderência da produção da Radiobrás com os seus
objetivos. Como trabalho futuro, os resultados obtidos deverão ser alvo de crítica mais
refinada para um possível refinamento em algumas das etapas consideradas. Pretende-se,
assim, que o autoconhecimento proporcionado pelos resultados aqui apresentados seja
plenamente aproveitado em benefício da instituição.
NOTAS E REFERÊNCIAS
1
TAN, A.-H. Text mining: The state of the art and the challenges, Kent Ridge Digital Labs,
1999. Disponível em <http://textmining.krdl.org.sg>. Acesso em: 23 ago. 2001.
2
NUGGETS® KDnuggets.com (KD stands for Knowledge Discovery) is the leading source
of information on Data Mining, Web mining, Knowledge Discovery, and Decision Support
Topics. Disponível em <http://www.kdnuggets.com/polls/data_mining_techniques.htm>.
Acesso em: 21 ago. 2001.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
3
citado em AGRAWAL, R. Data Mining: Crossing the Chasm. Invited talk at the 5th ACM
SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD–99),
San
Diego,
California,
August
1999.
Disponível
em
<http://www.almaden.ibm.com/cs/quest/PUBS.html>. Acesso em: 15 mai. 2001.
4
CHAPMAN, P., KERBER R., CLINTON J., KHABAZA T., REINARTZ T., WIRTH R. –
The CRISP-DM Process Model. Discussion Paper, 2000. Disponível em <http://www.crisp–
dm.org>. Acesso em: 08 jul. 2001.
5
WIVES, L. K. Um Estudo sobre Agrupamento de Documentos Textuais em Processamento
de Informações não Estruturadas Usando Técnicas de Clustering. Dissertação de Mestrado,
PPGC/UFRGS, Porto Alegre (RS), 1999.
6
HALLIMAN, C. Business intelligence using smart techniques: environmental scanning
using text mining and competitor analysis using scenarios and manual simulation.
Information Uncover, Houston, 2001.
7
citado em MORESI, E. A. D. Monitoramento Ambiental. In: TARAPANOFF, K. (Org.)
Inteligência Organizacional e Competitiva, Brasília, Ed. UnB, p. 93-109, 2001.
8
STOLLENWERK, M. de F. L. Gestão do Conhecimento: conceitos e modelos. In:
TARAPANOFF, K. (Org.) Inteligência Organizacional e Competitiva, Brasília, Ed. UnB, p.
143-163, 2001.
WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E GESTÃO DO CONHECIMENTO, 3., 2002, SÃO PAULO. ANAIS.
CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, 1., 2002, SÃO PAULO. ANAIS.
xxxx
Download

artigo - Prof. Edilberto Silva