Processamento, arquivamento e recuperação de documentos (Document Imaging) Simone de Abreu “Estamos vivendo o que muitos especialistas e a mídia chamam de “Sociedade do Conhecimento”, conhecimento este distribuído das mais diversas maneiras e meios de divulgação, seja o conhecimento contido nos próprios indivíduos, seja em filmes, seja em papel.” Roquemar Baldam. O que é Document Imaging? O GED toma como base a tecnologia de Document Imaging (DI). DI é uma tecnologia de documentos digitais composta por uma série de operações, começando com a captura, passando pela correção e resultando na conversão de originais em papel,ou microfilme, em documentos eletrônicos editáveis. Essa tecnologia permite que todos os tradicionais arquivos de documentos em papel sejam convertidos para o meio digital. Eles passam a ser disponibilizados localmente ou via rede de computadores, sendo rapidamente localizados e melhor gerenciados. Como conseqüência, obtém-se a agilidade no suporte à tomada de decisões, fundamental na velocidade exigida no mundo dos negócios globalizados. A captura da imagem, geralmente, é feita com o auxílio de um scanner para agilizar os processos de consulta, processamento e distribuição de documentos. Seus objetivos básicos são: “capturar documentos em formato eletrônico, armazená-los em ambiente seguro, recuperá-los quando necessário e permitir a manipulação, conforme os processos de negócio da empresa”. É comum que o DI apresente comandos de auxílio à pesquisa por meio de índices, links com visualizadores, opções de alteração do aspecto de pesquisa e visual da tela, áreas para apresentar resultados de pesquisas, comandos que permitem indexação e importação de documentos, entre outros. Um ambiente GED permite-nos ter sobre a mesa “todo” o arquivo da empresa (de forma digital) e, claro, com restrições de acesso, pois o funcionário do setor de compras não precisa ter conhecimento das atas de reuniões de diretoria. Dessa forma, é possível acessar documentos em segundos, sem correr o risco de extraviá-los. No entanto, de forma alguma um ambiente GED irá acabar com o uso de papel na empresa, pois os conceitos de “paperless office” possuem restrições legais. Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi 11 Fluxo de Trabalho de um sistema GED Documentos preparados e prontos para a digitalização. Captura e digitalização dos documentos. Processamentos e indexação das imagens e texto. Servidor de missão crítica. Alta disponibilidade. Alta capacidade. Acesso aos documentos através do portal WEB. Gravação dos documentos em mídia CD/DVD. Pesquisa e visualização através de qualquer microcomputador com unidade de CD/DVD. Legislação sobre documentos armazenados em mídias eletrônicas e ópticas. http://www.cenadem.com.br/legis01.php 2 Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi Componentes de um ambiente de DI Os componentes de um ambiente de DI podem variar conforme o contexto, tudo depende do problema a ser tratado. No entanto, existem algumas características comuns e essenciais que podem ser utilizadas nesse tipo de situação, são elas: • Interface de pesquisa, visualização e indexação. • Banco de dados para armazenar os índices. • Visualizador de imagens. • Recursos de customização. • Recursos de programação. • Segurança. • Funcionalidades comuns. Todos esses componentes devem interagir entre si para que tenhamos um sistema rápido e confiável. Indexando documentos A cada documento recebido ou gerado em papel por uma empresa, é necessário que se faça uma organização para o uso posterior. Geralmente, eles são etiquetados, ordenados, indexados e colocados em pastas, que são armazenadas em um arquivo físico. Se essas etapas não forem obedecidas, a busca por algum documento dentro da organização não terá a mesma eficácia. Esse cenário não se modifica quando tratamos de documentos eletrônicos. Um sistema de DI deve poder propor diferentes métodos para organizar informações, visando sua utilização futura. A metodologia usada deve ser facilmente entendida e utilizada pelas pessoas encarregadas de recuperar os documentos, como também pelas pessoas responsáveis por organizá-los. Existem três formas para se organizar documentos em um sistema de DI: • Indexação por campos (Index Fields) Método tradicional utilizado para arquivos em papel que usa campos de categorias e palavras-chave. Um sistema de DI deverá permitir que os usuários adaptem as templates (moldes de telas) , com bastante flexibilidade, aos campos a serem indexados, possibilitando que telas de recuperação de documentos sejam criadas com diversos tipos de campos. Esses sistemas devem permitir o uso de menus, agilizando a escolha dos campos de índice e possuir ferramentas para o auxílio da entrada automática de informações nesses campos. Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi 33 • Indexação de texto completo (Full-text Indexing) Com esta forma de indexação, um sistema de DI minimiza o tempo que as pessoas utilizam para ler e indexar os documentos de forma manual utilizando palavras-chave. Para que seja oferecida essa funcionalidade, o software deve possuir o recurso OCR (Optical Character Recognition), que reduz bastante o custo de indexação e melhora a capacidade de recuperação dos documentos. Qualquer palavra ou frase existente no documento serve como índice de busca. • Diretório/Arquivo Um sistema de DI deve oferecer um modo visual para que os documentos sejam encontrados. Praticamente em todos os escritórios, documentos são encontrados em pastas, dentro de uma gaveta ou em arquivos físicos. Um sistema de DI deve recriar essa hierarquia através da visualização de pastas, organizadas em seus diversos níveis. Essa interface gráfica, similar à estrutura de pastas, facilitará a transição de um sistema de armazenagem em papel para o sistema eletrônico, tornando-o didático e fácil de ser utilizado. Banco de dados para armazenar os índices É no banco que dados que os índices de pesquisa são armazenados para que se possa localizar o documento no futuro. Um índice, por sua vez, é entendido como uma informação que nos permite localizar um documento. Exemplos de índice: • Nota fiscal: CNPJ, data, valor e número da nota. • Recursos humanos: matrícula do empregado, tipo de documento e data. • Financeiro: centro de custo, valor, objeto da despesa e data. • Secretaria: tipo documental de acordo com plano de arquivo, data, setor e origem. Quando se trata de grande volume documental em DI, procura-se trabalhar, sempre que possível, com índices de volume e tamanho reduzidos. No entanto, devemos tomar certo cuidado, pois a indexação é um dos itens que mais oneram o custo total de projeto de GED. Logo, quanto mais otimizado, melhor. Podemos notar uma tendência de se trabalhar com banco de dados do mercado, utilizando, freqüentemente, bancos de dados corporativos em uso na empresa. Os bancos de dados relacionais como Oracle e SQL Server são os mais comuns. Mas, sua aplicação estende-se às mais diversas bases de dados, inclusive com bancos de dados proprietários dos fabricantes de GED. 4 Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi Um banco de dados proprietário tende a tornar a aplicação mais barata, mas é preciso tomar o cuidado de verificar se é possível fazer a integração com as demais aplicações da empresa. A maioria dos bancos permite integrações sem problema algum, mas é fundamental ter certeza disso. Os bancos de dados de mercado possuem muitas aplicações que podem ajudar o usuário a fazer integrações como, por exemplo, o ODBC; além de terem acesso a diversos profissionais para auxiliar nessas tarefas. Um item que deve ser sempre observado é o desempenho com seu volume de documentos. Se for preciso um ambiente com milhões de documentos, será necessária uma estrutura mais robusta, além de meios eficientes de pesquisa. Aliás, um fator que incentiva poucos termos e curtos índices é exatamente o grande volume de documentos. Um volume grande de documentos depende da aplicação. Por exemplo, 5 milhões de documentos, para uma grande empresa de fundos de pensão, podem significar muito pouco. Para uma empresa de engenharia, normalmente, 500.000 desenhos significam uma enormidade de documentos. Visualizador para as imagens de documentos Não é comum falar em DI ou qualquer outra aplicação GED sem falar de visualizadores e suas interfaces de consulta a documentos armazenados. Os visualizadores mais comuns são aqueles que permitem abrir formatos de imagem digitalizada e, conforme já foi visto, esse tipo de arquivo compõe grande parte dos documentos que entram em sistemas. A maioria dos ambientes já vem com visualizador nativo para esse tipo de imagem e documentos off ice. Para imagens e documentos nativamente digitais, também chamados documentos universais, pode haver a necessidade de integração da aplicação com visualizadores externos; ou seja, compra-se o ambiente GED e são anexados os visualizadores (gratuitos ou não). Documentos mais sofisticados, como desenhos híbridos de CAD e imagem digitalizada, podem precisar dos tais visualizadores externos, pois ambientes de DI não são normalmente preparados para receber documentos de engenharia. Outros como arquivos PDF, por exemplo, podem utilizar visualizadores próprios do fabricante. Como foi visto, podemos ter vários visualizadores integrados ao ambiente. Cada um deles será acionado dependendo do tipo de documento digital que se deseja abrir. Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi 55 Entre as funções mais comuns que esses visualizadores apresentam, podemos destacar: • Aproximar e afastar a imagem na tela (Zoom + e -). • Deslocamento da imagem (pan). • Rotação para posição de leitura (rotation). • Anexar anotações (post it). • Marcações e traços (redlines ou markup). • Marca-texto (Highlight). • Bloqueio de áreas para proteger dados sigilosos. • Escala de cinza para melhorar a leitura de imagem digitalizada em preto e branco (scale to gray). Recuperando documentos O sistema de indexação utilizado em um processo influencia diretamente a qualidade de recuperação dos documentos. A interação entre o sistema e os usuários deve se dar por meio de ferramentas simples e entendíveis. Com isso, o usuário terá de navegar em uma árvore de pastas (diretórios) e, em algumas situações, deve realizar pesquisas por campos. Caso a informação que o usuário tem sobre o documento seja uma palavra ou frase, a pesquisa em texto completo (full-text) será a mais eficiente mas, qualquer que seja o método, o processo para recuperar os documentos deve ser intuitivo e simples. Para uma maior eficiência e rapidez nas buscas, um sistema completo deve ser capaz de associar a pesquisa por campos com a pesquisa por texto completo. Controlando acesso Nos ambientes informatizados atuais, temos a configuração de redes de computadores que permitem que pessoas diferentes utilizem diversos equipamentos, de vários locais, com o intuito de pesquisar informações. 6 Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi Um sistema completo deve disponibilizar para seus usuários diversos níveis de acesso, de acordo com cada usuário, sem que o caráter confidencial da informação e a segurança sejam comprometidos. O sistema deve apresentar características como: • Grande disponibilidade Um sistema de DI precisa oferecer diversas formas para o acesso dos arquivos. A forma mais utilizada é o modelo cliente/servidor, disponibilizando uma aplicação cliente no desktop do usuário, permitindo o escaneamento, indexação e a recuperação dos documentos. Cresce a necessidade dos usuários, em escritórios remotos, terem mobilidade para trocar documentos com colegas de trabalho ou mesmo para trabalharem em localidades distantes. Há, também, o fato de que o compartilhamento de documentos pela Internet ou Intranet permite que a aplicação de controle documental seja disponibilizada por toda a rede da empresa, estendo-se para usuários externos. Os usuários devem conseguir fazer a pesquisa, recuperação e visualização dos documentos com o auxílio de qualquer navegador Web e em qualquer plataforma. • Segurança Levando em conta que os sistemas de DI são muito utilizados para arquivar grande variedade de documentos, sejam de origem pública ou privada, um sistema com a responsabilidade de controlar os acessos é fundamental. O administrador desse sistema deve determinar quais diretórios e documentos poderão ser acessados pelos usuários, além das ações que poderão ser executadas nos documentos (editar, copiar e apagar). Um sistema de segurança considerado robusto deve permitir acesso a todas as pessoas autorizadas, seja ele local, remoto ou via web, sem deixar, no entanto, que a segurança seja colocada em risco. Recursos de customização A probabilidade de dois locais diferentes guardarem documentos usando os mesmos critérios é mínima, a não ser que ambos tenham a mesma origem ou empresa. Essencialmente, a maioria dos ambientes de GED deve ser adaptada à necessidade dos usuários em questão. Fato interessante: é comum que todo produto, quando apresentado, mostre a tela de um cliente ou aplicação do caso. Nem sempre é possível ver exatamente o tipo de documento e índice que você deseja. É interessante que a ferramenta escolhida tenha uma interface para customização e que seja documentada. Se a interface não estiver disponível, pode ser mais complicado adaptar o ambiente às necessidades locais. Caso ela exista, certifique-se de que acompanha o produto e verifique se possui algum custo. Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi 77 Recursos de programação São muitas as situações em que recursos de programação podem ser necessários. Um desenvolvedor não consegue prever toda a gama de possibilidades que as empresas possam querer um dia. Mesmo que isso fosse possível, teria um custo astronômico. Portanto, para fazer as adaptações que sua empresa precisa, pode ser fundamental que a ferramenta seja programável. Exemplos de necessidade de programação: • Criar guias de remessas de documentos especiais. • Permitir preenchimento automático de índices por meio de regras preestabelecidas. • Integrar ao seu sistema de correio eletrônico. • Tratamento de dados dos índices. • Integrar as demais aplicações da empresa. • Integrar as tecnologias típicas que necessitam imagem: Workflow, ERP, B2B, CRM etc... Claro que as diversas ferramentas possuem diferenças entre si. O que pode ser apenas customizado em uma aplicação terá de ser programado em outra. É importante notar que a linguagem de programação utilizada também deve ser observada. Muitas das ferramentas de GED podem ser programadas com linguagens comuns de mercado, que são mais interessantes por possibilitarem um acesso facilitado a alguém que possa ajudar em uma situação complicada. Relatórios É importante que o sistema possua meios de extração de relatório de diversos tipos como, por exemplo, lista de documentos, auditoria etc.. Glossário Optical Character Recognition (OCR) - processo pelo qual são utilizadas ferramentas para que se obtenham dados processáveis por sistemas de processamento de dados a partir de imagens digitais. Business-to-business (B2B) - tornou-se a linguagem de negócios que faz uso das tecnologias baseadas em web para conduzir os negócios entre empresas. “Negócios” significa compra e venda ou, também, troca de informações. As transações B2B podem ocorrer diretamente entre empresas ou através de uma terceira (intermediária) para ajudar a compatibilizar compradores e vendedores, reunidos em e-Marketplaces. 8 Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi Leia o case da UNISUL. Case UNISUL - Palhoça - Santa Catarina (http://www.mgsii.com.br/cases.html#3) Declaração da professora Vera Lúcia da Rosa Fernandes. Porque a universidade decidiu implantar um programa de GED? No início de 2004,foi implantado, na UNISUL - campus da Grande Florianópolis, o Projeto INtegrar, que prevê a distribuição das áreas administrativa e acadêmica em um único espaço físico de 1400 m2. Foram montadas “ilhas de trabalho” e uma das metas do diretor do campus era trabalhar com o mínimo possível de papéis nas mesas. Além disso, neste espaço não havia lugar para arquivos deslizantes, utilizados para arquivamento de documentos. Criou-se, então, a Seção de Arquivos, local em que centralizamos os arquivos correntes. A seção ficou, geograficamente, distante do usuário do documento e foi neste momento que decidimos implantar um programa de GED para atender as necessidades de consulta e das informações. Quais foram os benefícios? Foram muitos, pois, como foi comentado, a distância do documento em relação a seu usuário era grande. 1º) O atendimento presencial na seção de arquivos diminui de 100% para 10%, ou seja, só são colocados os documentos em que, realmente, há necessidade de utilização em meio físico. 2º) Garantimos a informação certa, na hora certa e no lugar certo. 3º) Tivemos maior controle sobre a organização do arquivo físico, ou seja, a freqüência de movimentação do arquivo físico diminui de 100% para 10%, o que mantém o arquivo organizado e seguro. 4º) Agilidade no atendimento ao usuário. 5º) Otimização do espaço físico. 6º) Massa documental organizada. 7º) Eficiência administrativa. 8º) Incremento à pesquisa. Como foi o processo de instalação e treinamento? O processo foi relativamente simples, pois o scanner i260 não requer nenhum tipo de equipamento especial para sua instalação e sua operação é fácil. O software Neutron atende todas as nossas necessidades e se, em algum momento, essa necessidade é diferente do que o software oferece, os técnicos fazem as adaptações necessárias imediatamente. O treinamento foi muito bem administrado pelos especialistas que puderam tirar todas as dúvidas dos usuários. Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi 99 Como já foi dito, o programa é eficiente, eficaz e muito fácil de ser operacionalizado. Em geral, não há necessidade de conhecimentos especiais para a digitalização, indexação e disponibilização das imagens deste sistema de GED. Quanto ao suporte técnico? O suporte técnico é muito eficiente. Sempre que temos uma dúvida, queremos algo novo ou temos qualquer problema com o scanner ou com o software somos prontamente atendidos pelo suporte técnico. Algo do início ao fim do processo não atingiu os objetivos esperados? Não. Todos os objetivos foram atingidos de forma plena. Se tivesse que dar uma nota pelos serviços prestados, de 5 a 10, qual seria? Como professora universitária que sou, estou acostumada a analisar trabalhos e projetos, atribuindo notas a eles. Pelo acompanhamento do processo de digitalização do campus Pedra Branca que tenho feito e considerando o que já foi dito nas questões anteriores, minha nota é 10. Bibliografia básica: BALDAM, R., VALLE, R., CAVALCANTI, M. GED – Gerenciamento Eletrônico de Documentos. 2.ed. São Paulo: Érica, 2002. BALDAM, R. EDMS: Gerenciamento Eletrônico de Documentos Técnicos. São Paulo: Érica, 2004. Bibliografia complementar: Centro Nacional de Desenvolvimento do Gerenciamento da Informação http://www.cenadem.com.br/ 10 Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi Processamento, arquivamento e recuperação de documentos / Anhembi Morumbi 1111