Document Imaging Software JOCR
- Categoria: Programas
JOCR é um software especializado de reconhecimento óptico de caracteres (ocr) que pode reconhecer caracteres de imagens tiradas na área de trabalho do computador.
Antes de nos aprofundarmos na funcionalidade, devemos observar que o JOCR requer o componente Microsoft Office Document Imaging, que é um componente do Microsoft Office 2003 e de versões mais recentes do Office. A ferramenta Office deve ser instalada para que o JOCR funcione.
O próprio JOCR é um programa de software portátil. A interface se parece com a de um programa de software de captura de tela. Ele se oferece para capturar uma região, a área de trabalho ou a janela ativa. A imagem é então exibida na interface do programa com opções para imprimi-la ou copiá-la, ou para reconhecê-la, o que inicia o processo de OCR.
OCR com JOCR
O reconhecimento é obviamente a parte principal, pois irá analisar a imagem em questão para descobrir todos os personagens que ela contém. O software de imagem de documentos exibe a contagem de caracteres identificados e os exibe no editor de texto padrão, de onde podem ser editados ou copiados facilmente.
O software de imagem de documentos pode ser útil em situações em que o texto precisa ser copiado dos elementos da interface. Podem ser mensagens de erro, texto exibido em aplicativos ou imagens. A taxa de reconhecimento depende muito do tipo de imagem e texto usados. Ele varia de brilhante (quase nenhuma edição necessária) a fraco (falha em reconhecer certos personagens, muita edição necessária).
JOCR é compatível com os seguintes idiomas: chinês, tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, russo, espanhol, sueco, turco.
Veredito
JOCR é um programa bem projetado que você pode usar para transformar texto em qualquer imagem ou programa que você vê na máquina Windows em texto.
Nota : Jocr não é atualizado desde 2006, o que torna provável que não funcione em versões mais recentes do Windows ou do Office. Uma solução comparável é GOCR , um software de reconhecimento de caracteres de código aberto que você pode baixar da página do projeto no Sourceforge.
O programa está disponível para Linux e Windows, e como código-fonte. Você precisa carregar imagens no programa para que o conteúdo textual das imagens possa ser transformado em texto simples que você possa copiar. Embora não suporte a funcionalidade de captura de tela, é fácil criar você mesmo uma captura de tela, salvá-la como um arquivo de imagem e carregá-la no programa para que o texto seja reconhecido.