Product Data Sheet
Reconhecimento Ótico de Caracteres (OCR)
O que é
O OCR (Optical Character Recognition – Reconhecimento Ótico de Caracteres) do OnBase é um pacote de
reconhecimento de documentos muito preciso e fácil de usar, integrado de forma imperceptível ao módulo Document
Imaging (Processamento de imagens de documentos) do OnBase. O OCR do OnBase reconhece e converte caracteres
impressos alfanuméricos em uma imagem digitalizada de documento, convertendo as imagens em um documento de
texto legível pela máquina, para facilitar as pesquisas de texto e/ou a indexação por texto. Criar versões em texto de
imagens de documentos permite fazer buscas de texto para encontrar um documento particular e para localizar
conteúdo específico dentro de um documento. Os usuários podem então localizar imediatamente palavras ou frases
específicas dentro de um documento ou de um grupo de documentos, otimizando de forma dramática mesmo as
tarefas de pesquisa mais complicadas. Dentre os documentos habitualmente digitalizados e traduzidos por OCR estão:
correspondência comercial, memorandos jurídicos, contratos, folhas de especificação, explicações de benefícios de
pacientes e manuais.
Como funciona
O OCR do OnBase usa o sistema OCR ScanSoft OmniPage®, amplamente elogiado por seu alto grau de precisão e
flexibilidade. O OCR do OnBase é um software OCR de página completa, com múltiplas opções de saída. As versões de
texto podem ser armazenadas em ASCII, PDF, MSWord e HTML. A formatação pode ser mantida, preservando assim a
aparência original dos documentos de imagem, ou removida totalmente, mantendo somente o texto do documento.
Também se pode variar a velocidade do processo de OCR, escolhendo-se entre mais reconhecimento ou mais
velocidade, dependendo do que se quer e da qualidade dos documentos originais. O OCR do OnBase oferece a
flexibilidade de ter configurações de OCR diferentes salvas para cada tipo de documento processado. O processo de
reconhecimento OCR pode ser realizado em imagens de dois tons, cinza e mesmo coloridas, suportando atualmente
reconhecimento de caracteres para 18 idiomas.
Quem se beneficia
O módulo de OCR do OnBase pode beneficiar qualquer empresa que esteja digitalizando documentos em papel e que
precise pesquisar determinadas palavras e sentenças nesses documentos, a fim de rapidamente localizar o documento
específico ou página exata dentro desse documento.
Recursos técnicos
•
•
•
•
•
•
Execução sob demanda ou por
tarefa agendada.
Formatação OCR flexível permite
escolher entre mais velocidade e
mais precisão conforme necessário
para o tipo de documento.
Seleção do formato de saída,
incluindo texto ASCII, PDF, MSWord,
ou HTML.
Formatação dos originais pode ser
mantida ou removida.
Compatibilidade com 18 idiomas, na
mesma estação de trabalho.
Sistema OCR ScanSoft OmniPage®.
Benefícios para o negócio
•
•
•
•
Recuperação rápida e simples de
documentos, com base em seu
conteúdo.
Eliminação da necessidade de
indexar documentos com cada valor
que precisasse ser usado para
recuperá-los.
Acesso direto à página que contém
a informação procurada dentro do
documento.
Buscas dentro de documentos de
imagem; qualificação desses
documentos para indexação de
texto completa.
Requisitos do sistema
•
•
•
•
•
•
•
Windows 98, NT, 2000 ou XP.
SQL Server 7 ou superior.
Oracle 8: versão 8.0.5 ou superior.
Oracle 8i: v 8.1.7.2 ou superior.
Oracle 9, 9i.
Sybase SQL Server v11.5.
Sybase SQL Anywhere 5.5.04, 7.0.0
a 7.0.3 e 8.0 (Incompatível com
versões 6.0.X).
28500 Clemens Road • Westlake, Ohio 44145 • tel.: 440.788.5000 • fax: 440.788.5100 • www.onbase.com
©Hyland Software, Inc.
Download

OCR