Processamento, arquivamento e recuperação
de documentos (Document Imaging)
Simone de Abreu
“Estamos vivendo o que muitos especialistas e a mídia chamam de
“Sociedade do Conhecimento”, conhecimento este distribuído das mais diversas
maneiras e meios de divulgação, seja o conhecimento contido nos próprios
indivíduos, seja em filmes, seja em papel.”
Roquemar Baldam.
O que é Document Imaging?
O GED toma como base a tecnologia de Document Imaging (DI).
DI é uma tecnologia de documentos digitais composta por uma série de
operações, começando com a captura, passando pela correção e resultando na
conversão de originais em papel,ou microfilme, em documentos eletrônicos
editáveis. Essa tecnologia permite que todos os tradicionais arquivos de
documentos em papel sejam convertidos para o meio digital. Eles passam a ser
disponibilizados localmente ou via rede de computadores, sendo rapidamente
localizados e melhor gerenciados. Como conseqüência, obtém-se a agilidade
no suporte à tomada de decisões, fundamental na velocidade exigida no mundo
dos negócios globalizados.
A captura da imagem, geralmente, é feita com o auxílio de um scanner para
agilizar os processos de consulta, processamento e distribuição de documentos.
Seus objetivos básicos são: “capturar documentos em formato eletrônico,
armazená-los em ambiente seguro, recuperá-los quando necessário e permitir
a manipulação, conforme os processos de negócio da empresa”.
É comum que o DI apresente comandos de auxílio à pesquisa por meio de
índices, links com visualizadores, opções de alteração do aspecto de pesquisa
e visual da tela, áreas para apresentar resultados de pesquisas, comandos que
permitem indexação e importação de documentos, entre outros.
Um ambiente GED permite-nos ter sobre a mesa “todo” o arquivo da empresa
(de forma digital) e, claro, com restrições de acesso, pois o funcionário do setor
de compras não precisa ter conhecimento das atas de reuniões de diretoria.
Dessa forma, é possível acessar documentos em segundos, sem correr o risco
de extraviá-los. No entanto, de forma alguma um ambiente GED irá acabar com
o uso de papel na empresa, pois os conceitos de “paperless office” possuem
restrições legais.
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
11
Fluxo de Trabalho de um sistema GED
Documentos preparados e
prontos para a digitalização.
Captura e digitalização dos
documentos.
Processamentos e indexação
das imagens e texto.
Servidor de missão crítica.
Alta disponibilidade.
Alta capacidade.
Acesso aos documentos
através do portal WEB.
Gravação dos documentos em
mídia CD/DVD.
Pesquisa e visualização através de qualquer
microcomputador com unidade de CD/DVD.
Legislação sobre documentos armazenados em mídias eletrônicas e ópticas.
http://www.cenadem.com.br/legis01.php
2
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
Componentes de um ambiente de DI
Os componentes de um ambiente de DI podem variar conforme o contexto,
tudo depende do problema a ser tratado. No entanto, existem algumas
características comuns e essenciais que podem ser utilizadas nesse tipo de
situação, são elas:
•
Interface de pesquisa, visualização e indexação.
•
Banco de dados para armazenar os índices.
•
Visualizador de imagens.
•
Recursos de customização.
•
Recursos de programação.
•
Segurança.
•
Funcionalidades comuns.
Todos esses componentes devem interagir entre si para que tenhamos um
sistema rápido e confiável.
Indexando documentos
A cada documento recebido ou gerado em papel por uma empresa, é
necessário que se faça uma organização para o uso posterior. Geralmente, eles
são etiquetados, ordenados, indexados e colocados em pastas, que são
armazenadas em um arquivo físico. Se essas etapas não forem obedecidas, a
busca por algum documento dentro da organização não terá a mesma eficácia.
Esse cenário não se modifica quando tratamos de documentos eletrônicos.
Um sistema de DI deve poder propor diferentes métodos para organizar
informações, visando sua utilização futura. A metodologia usada deve ser
facilmente entendida e utilizada pelas pessoas encarregadas de recuperar os
documentos, como também pelas pessoas responsáveis por organizá-los.
Existem três formas para se organizar documentos em um sistema de DI:
• Indexação por campos (Index Fields)
Método tradicional utilizado para arquivos em papel que usa campos de
categorias e palavras-chave. Um sistema de DI deverá permitir que os usuários
adaptem as templates (moldes de telas) , com bastante flexibilidade, aos campos
a serem indexados, possibilitando que telas de recuperação de documentos
sejam criadas com diversos tipos de campos.
Esses sistemas devem permitir o uso de menus, agilizando a escolha dos
campos de índice e possuir ferramentas para o auxílio da entrada automática de
informações nesses campos.
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
33
• Indexação de texto completo (Full-text Indexing)
Com esta forma de indexação, um sistema de DI minimiza o tempo que as
pessoas utilizam para ler e indexar os documentos de forma manual utilizando
palavras-chave.
Para que seja oferecida essa funcionalidade, o software deve possuir o recurso
OCR (Optical Character Recognition), que reduz bastante o custo de indexação e
melhora a capacidade de recuperação dos documentos. Qualquer palavra ou
frase existente no documento serve como índice de busca.
•
Diretório/Arquivo
Um sistema de DI deve oferecer um modo visual para que os documentos
sejam encontrados. Praticamente em todos os escritórios, documentos são
encontrados em pastas, dentro de uma gaveta ou em arquivos físicos. Um
sistema de DI deve recriar essa hierarquia através da visualização de pastas,
organizadas em seus diversos níveis.
Essa interface gráfica, similar à estrutura de pastas, facilitará a transição de
um sistema de armazenagem em papel para o sistema eletrônico, tornando-o
didático e fácil de ser utilizado.
Banco de dados para armazenar os índices
É no banco que dados que os índices de pesquisa são armazenados para
que se possa localizar o documento no futuro. Um índice, por sua vez, é entendido
como uma informação que nos permite localizar um documento.
Exemplos de índice:
• Nota fiscal: CNPJ, data, valor e número da nota.
•
Recursos humanos: matrícula do empregado, tipo de documento e data.
• Financeiro: centro de custo, valor, objeto da despesa e data.
• Secretaria: tipo documental de acordo com plano de arquivo, data, setor e
origem.
Quando se trata de grande volume documental em DI, procura-se trabalhar,
sempre que possível, com índices de volume e tamanho reduzidos. No entanto,
devemos tomar certo cuidado, pois a indexação é um dos itens que mais oneram
o custo total de projeto de GED. Logo, quanto mais otimizado, melhor.
Podemos notar uma tendência de se trabalhar com banco de dados do
mercado, utilizando, freqüentemente, bancos de dados corporativos em uso na
empresa. Os bancos de dados relacionais como Oracle e SQL Server são os
mais comuns. Mas, sua aplicação estende-se às mais diversas bases de dados,
inclusive com bancos de dados proprietários dos fabricantes de GED.
4
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
Um banco de dados proprietário tende a tornar a aplicação mais barata, mas
é preciso tomar o cuidado de verificar se é possível fazer a integração com as
demais aplicações da empresa. A maioria dos bancos permite integrações sem
problema algum, mas é fundamental ter certeza disso.
Os bancos de dados de mercado possuem muitas aplicações que podem
ajudar o usuário a fazer integrações como, por exemplo, o ODBC; além de terem
acesso a diversos profissionais para auxiliar nessas tarefas.
Um item que deve ser sempre observado é o desempenho com seu volume
de documentos. Se for preciso um ambiente com milhões de documentos, será
necessária uma estrutura mais robusta, além de meios eficientes de pesquisa.
Aliás, um fator que incentiva poucos termos e curtos índices é exatamente o
grande volume de documentos.
Um volume grande de documentos depende da aplicação. Por exemplo, 5
milhões de documentos, para uma grande empresa de fundos de pensão, podem
significar muito pouco. Para uma empresa de engenharia, normalmente, 500.000
desenhos significam uma enormidade de documentos.
Visualizador para as imagens de documentos
Não é comum falar em DI ou qualquer outra aplicação GED sem falar de
visualizadores e suas interfaces de consulta a documentos armazenados.
Os visualizadores mais comuns são aqueles que permitem abrir formatos
de imagem digitalizada e, conforme já foi visto, esse tipo de arquivo compõe
grande parte dos documentos que entram em sistemas. A maioria dos ambientes
já vem com visualizador nativo para esse tipo de imagem e documentos off ice.
Para imagens e documentos nativamente digitais, também chamados
documentos universais, pode haver a necessidade de integração da aplicação
com visualizadores externos; ou seja, compra-se o ambiente GED e são
anexados os visualizadores (gratuitos ou não). Documentos mais sofisticados,
como desenhos híbridos de CAD e imagem digitalizada, podem precisar dos
tais visualizadores externos, pois ambientes de DI não são normalmente
preparados para receber documentos de engenharia. Outros como arquivos
PDF, por exemplo, podem utilizar visualizadores próprios do fabricante.
Como foi visto, podemos ter vários visualizadores integrados ao ambiente.
Cada um deles será acionado dependendo do tipo de documento digital que se
deseja abrir.
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
55
Entre as funções mais comuns que esses visualizadores apresentam,
podemos destacar:
• Aproximar e afastar a imagem na tela (Zoom + e -).
•
Deslocamento da imagem (pan).
•
Rotação para posição de leitura (rotation).
• Anexar anotações (post it).
•
Marcações e traços (redlines ou markup).
• Marca-texto (Highlight).
•
Bloqueio de áreas para proteger dados sigilosos.
• Escala de cinza para melhorar a leitura de imagem digitalizada em preto e
branco (scale to gray).
Recuperando documentos
O sistema de indexação utilizado em um processo influencia diretamente a
qualidade de recuperação dos documentos. A interação entre o sistema e os
usuários deve se dar por meio de ferramentas simples e entendíveis.
Com isso, o usuário terá de navegar em uma árvore de pastas (diretórios) e,
em algumas situações, deve realizar pesquisas por campos. Caso a informação
que o usuário tem sobre o documento seja uma palavra ou frase, a pesquisa em
texto completo (full-text) será a mais eficiente mas, qualquer que seja o método,
o processo para recuperar os documentos deve ser intuitivo e simples.
Para uma maior eficiência e rapidez nas buscas, um sistema completo deve
ser capaz de associar a pesquisa por campos com a pesquisa por texto completo.
Controlando acesso
Nos ambientes informatizados atuais, temos a configuração de redes de
computadores que permitem que pessoas diferentes utilizem diversos
equipamentos, de vários locais, com o intuito de pesquisar informações.
6
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
Um sistema completo deve disponibilizar para seus usuários diversos níveis
de acesso, de acordo com cada usuário, sem que o caráter confidencial da
informação e a segurança sejam comprometidos. O sistema deve apresentar
características como:
• Grande disponibilidade
Um sistema de DI precisa oferecer diversas formas para o acesso dos
arquivos. A forma mais utilizada é o modelo cliente/servidor, disponibilizando
uma aplicação cliente no desktop do usuário, permitindo o escaneamento,
indexação e a recuperação dos documentos.
Cresce a necessidade dos usuários, em escritórios remotos, terem
mobilidade para trocar documentos com colegas de trabalho ou mesmo para
trabalharem em localidades distantes.
Há, também, o fato de que o compartilhamento de documentos pela Internet
ou Intranet permite que a aplicação de controle documental seja disponibilizada
por toda a rede da empresa, estendo-se para usuários externos. Os usuários
devem conseguir fazer a pesquisa, recuperação e visualização dos documentos
com o auxílio de qualquer navegador Web e em qualquer plataforma.
•
Segurança
Levando em conta que os sistemas de DI são muito utilizados para arquivar
grande variedade de documentos, sejam de origem pública ou privada, um
sistema com a responsabilidade de controlar os acessos é fundamental. O
administrador desse sistema deve determinar quais diretórios e documentos
poderão ser acessados pelos usuários, além das ações que poderão ser
executadas nos documentos (editar, copiar e apagar).
Um sistema de segurança considerado robusto deve permitir acesso a todas
as pessoas autorizadas, seja ele local, remoto ou via web, sem deixar, no entanto,
que a segurança seja colocada em risco.
Recursos de customização
A probabilidade de dois locais diferentes guardarem documentos usando os
mesmos critérios é mínima, a não ser que ambos tenham a mesma origem ou
empresa. Essencialmente, a maioria dos ambientes de GED deve ser adaptada
à necessidade dos usuários em questão.
Fato interessante: é comum que todo produto, quando apresentado, mostre
a tela de um cliente ou aplicação do caso. Nem sempre é possível ver exatamente
o tipo de documento e índice que você deseja.
É interessante que a ferramenta escolhida tenha uma interface para
customização e que seja documentada. Se a interface não estiver disponível,
pode ser mais complicado adaptar o ambiente às necessidades locais. Caso
ela exista, certifique-se de que acompanha o produto e verifique se possui algum
custo.
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
77
Recursos de programação
São muitas as situações em que recursos de programação podem ser
necessários. Um desenvolvedor não consegue prever toda a gama de
possibilidades que as empresas possam querer um dia. Mesmo que isso fosse
possível, teria um custo astronômico. Portanto, para fazer as adaptações que
sua empresa precisa, pode ser fundamental que a ferramenta seja programável.
Exemplos de necessidade de programação:
•
Criar guias de remessas de documentos especiais.
• Permitir preenchimento automático de índices por meio de regras
preestabelecidas.
•
Integrar ao seu sistema de correio eletrônico.
•
Tratamento de dados dos índices.
•
Integrar as demais aplicações da empresa.
• Integrar as tecnologias típicas que necessitam imagem: Workflow, ERP,
B2B, CRM etc...
Claro que as diversas ferramentas possuem diferenças entre si. O que pode
ser apenas customizado em uma aplicação terá de ser programado em outra.
É importante notar que a linguagem de programação utilizada também deve
ser observada. Muitas das ferramentas de GED podem ser programadas com
linguagens comuns de mercado, que são mais interessantes por possibilitarem
um acesso facilitado a alguém que possa ajudar em uma situação complicada.
Relatórios
É importante que o sistema possua meios de extração de relatório de diversos
tipos como, por exemplo, lista de documentos, auditoria etc..
Glossário
Optical Character Recognition (OCR) - processo pelo qual são utilizadas
ferramentas para que se obtenham dados processáveis por sistemas de processamento
de dados a partir de imagens digitais.
Business-to-business (B2B) - tornou-se a linguagem de negócios que faz uso das
tecnologias baseadas em web para conduzir os negócios entre empresas. “Negócios”
significa compra e venda ou, também, troca de informações. As transações B2B podem
ocorrer diretamente entre empresas ou através de uma terceira (intermediária) para
ajudar a compatibilizar compradores e vendedores, reunidos em e-Marketplaces.
8
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
Leia o case da UNISUL.
Case UNISUL - Palhoça - Santa Catarina (http://www.mgsii.com.br/cases.html#3)
Declaração da professora Vera Lúcia da Rosa Fernandes.
Porque a universidade decidiu implantar um programa de GED?
No início de 2004,foi implantado, na UNISUL - campus da Grande Florianópolis, o Projeto
INtegrar, que prevê a distribuição das áreas administrativa e acadêmica em um único
espaço físico de 1400 m2.
Foram montadas “ilhas de trabalho” e uma das metas do diretor do campus era trabalhar
com o mínimo possível de papéis nas mesas. Além disso, neste espaço não havia lugar
para arquivos deslizantes, utilizados para arquivamento de documentos.
Criou-se, então, a Seção de Arquivos, local em que centralizamos os arquivos correntes.
A seção ficou, geograficamente, distante do usuário do documento e foi neste momento
que decidimos implantar um programa de GED para atender as necessidades de consulta
e das informações.
Quais foram os benefícios?
Foram muitos, pois, como foi comentado, a distância do documento em relação a seu
usuário era grande.
1º) O atendimento presencial na seção de arquivos diminui de 100% para 10%, ou seja,
só são colocados os documentos em que, realmente, há necessidade de utilização em
meio físico.
2º) Garantimos a informação certa, na hora certa e no lugar certo.
3º) Tivemos maior controle sobre a organização do arquivo físico, ou seja, a freqüência
de movimentação do arquivo físico diminui de 100% para 10%, o que mantém o arquivo
organizado e seguro.
4º) Agilidade no atendimento ao usuário.
5º) Otimização do espaço físico.
6º) Massa documental organizada.
7º) Eficiência administrativa.
8º) Incremento à pesquisa.
Como foi o processo de instalação e treinamento?
O processo foi relativamente simples, pois o scanner i260 não requer nenhum tipo de
equipamento especial para sua instalação e sua operação é fácil.
O software Neutron atende todas as nossas necessidades e se, em algum momento,
essa necessidade é diferente do que o software oferece, os técnicos fazem as
adaptações necessárias imediatamente.
O treinamento foi muito bem administrado pelos especialistas que puderam tirar todas as
dúvidas dos usuários.
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
99
Como já foi dito, o programa é eficiente, eficaz e muito fácil de ser operacionalizado. Em
geral, não há necessidade de conhecimentos especiais para a digitalização, indexação
e disponibilização das imagens deste sistema de GED.
Quanto ao suporte técnico?
O suporte técnico é muito eficiente. Sempre que temos uma dúvida, queremos algo novo
ou temos qualquer problema com o scanner ou com o software somos prontamente
atendidos pelo suporte técnico.
Algo do início ao fim do processo não atingiu os objetivos esperados?
Não. Todos os objetivos foram atingidos de forma plena.
Se tivesse que dar uma nota pelos serviços prestados, de 5 a 10, qual seria?
Como professora universitária que sou, estou acostumada a analisar trabalhos e projetos,
atribuindo notas a eles. Pelo acompanhamento do processo de digitalização do campus
Pedra Branca que tenho feito e considerando o que já foi dito nas questões anteriores,
minha nota é 10.
Bibliografia básica:
BALDAM, R., VALLE, R., CAVALCANTI, M.
GED – Gerenciamento Eletrônico de
Documentos. 2.ed. São Paulo: Érica, 2002.
BALDAM, R. EDMS: Gerenciamento
Eletrônico de Documentos Técnicos. São
Paulo: Érica, 2004.
Bibliografia complementar:
Centro Nacional de Desenvolvimento do Gerenciamento da Informação http://www.cenadem.com.br/
10
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi
1111
Download

Processamento, arquivamento e recuperação de documentos