Product Data Sheet Reconhecimento Ótico de Caracteres (OCR) O que é O OCR (Optical Character Recognition – Reconhecimento Ótico de Caracteres) do OnBase é um pacote de reconhecimento de documentos muito preciso e fácil de usar, integrado de forma imperceptível ao módulo Document Imaging (Processamento de imagens de documentos) do OnBase. O OCR do OnBase reconhece e converte caracteres impressos alfanuméricos em uma imagem digitalizada de documento, convertendo as imagens em um documento de texto legível pela máquina, para facilitar as pesquisas de texto e/ou a indexação por texto. Criar versões em texto de imagens de documentos permite fazer buscas de texto para encontrar um documento particular e para localizar conteúdo específico dentro de um documento. Os usuários podem então localizar imediatamente palavras ou frases específicas dentro de um documento ou de um grupo de documentos, otimizando de forma dramática mesmo as tarefas de pesquisa mais complicadas. Dentre os documentos habitualmente digitalizados e traduzidos por OCR estão: correspondência comercial, memorandos jurídicos, contratos, folhas de especificação, explicações de benefícios de pacientes e manuais. Como funciona O OCR do OnBase usa o sistema OCR ScanSoft OmniPage®, amplamente elogiado por seu alto grau de precisão e flexibilidade. O OCR do OnBase é um software OCR de página completa, com múltiplas opções de saída. As versões de texto podem ser armazenadas em ASCII, PDF, MSWord e HTML. A formatação pode ser mantida, preservando assim a aparência original dos documentos de imagem, ou removida totalmente, mantendo somente o texto do documento. Também se pode variar a velocidade do processo de OCR, escolhendo-se entre mais reconhecimento ou mais velocidade, dependendo do que se quer e da qualidade dos documentos originais. O OCR do OnBase oferece a flexibilidade de ter configurações de OCR diferentes salvas para cada tipo de documento processado. O processo de reconhecimento OCR pode ser realizado em imagens de dois tons, cinza e mesmo coloridas, suportando atualmente reconhecimento de caracteres para 18 idiomas. Quem se beneficia O módulo de OCR do OnBase pode beneficiar qualquer empresa que esteja digitalizando documentos em papel e que precise pesquisar determinadas palavras e sentenças nesses documentos, a fim de rapidamente localizar o documento específico ou página exata dentro desse documento. Recursos técnicos • • • • • • Execução sob demanda ou por tarefa agendada. Formatação OCR flexível permite escolher entre mais velocidade e mais precisão conforme necessário para o tipo de documento. Seleção do formato de saída, incluindo texto ASCII, PDF, MSWord, ou HTML. Formatação dos originais pode ser mantida ou removida. Compatibilidade com 18 idiomas, na mesma estação de trabalho. Sistema OCR ScanSoft OmniPage®. Benefícios para o negócio • • • • Recuperação rápida e simples de documentos, com base em seu conteúdo. Eliminação da necessidade de indexar documentos com cada valor que precisasse ser usado para recuperá-los. Acesso direto à página que contém a informação procurada dentro do documento. Buscas dentro de documentos de imagem; qualificação desses documentos para indexação de texto completa. Requisitos do sistema • • • • • • • Windows 98, NT, 2000 ou XP. SQL Server 7 ou superior. Oracle 8: versão 8.0.5 ou superior. Oracle 8i: v 8.1.7.2 ou superior. Oracle 9, 9i. Sybase SQL Server v11.5. Sybase SQL Anywhere 5.5.04, 7.0.0 a 7.0.3 e 8.0 (Incompatível com versões 6.0.X). 28500 Clemens Road • Westlake, Ohio 44145 • tel.: 440.788.5000 • fax: 440.788.5100 • www.onbase.com ©Hyland Software, Inc.