5 serviços de OCR on-line gratuitos testados e revisados

Tem um documento PDF(PDF document) ou uma imagem que gostaria de converter em texto? Recentemente, alguém me enviou um documento pelo correio que eu precisava editar e enviar de volta com correções. A pessoa não conseguiu localizar uma cópia digital, então fui encarregado de colocar todo aquele texto em formato digital.

Não havia como eu passar horas digitando tudo de volta, então acabei tirando uma boa foto de alta qualidade do documento e depois queimei um monte de serviços de OCR on-line para ver qual me daria o melhor resultados.

Neste artigo, vou passar por alguns dos meus sites favoritos para OCR que são gratuitos. Vale a pena notar que a maioria desses sites fornece um serviço básico gratuito e, em seguida, tem opções pagas se você quiser recursos extras, como imagens maiores, documentos PDF de várias páginas , diferentes idiomas de entrada etc.

Também é bom saber de antemão que a maioria desses serviços não poderá corresponder à formatação do seu documento original. Estes são principalmente para extrair texto e é isso. Se você precisar que tudo esteja em um layout ou formato(layout or format) específico , terá que fazer isso manualmente assim que obtiver todo o texto do OCR .

Além disso, os melhores resultados para obter o texto virão de documentos com resolução de 200 a 400 DPI(DPI resolution) . Se você tiver uma imagem com baixo DPI(DPI image) , os resultados não serão tão bons.

Por fim, havia muitos sites que testei que simplesmente não funcionaram(t work) . Se você pesquisar o OCR on-line gratuito no Google , verá vários sites, mas vários dos sites nos 10 principais resultados nem concluíram a conversão. Alguns davam tempo limite, outros davam erros e alguns ficavam presos na página de “conversão”, então nem me preocupei em mencionar esses sites.

Para cada site, testei dois documentos para ver como seria a saída. Para meus testes, eu simplesmente usei meu iPhone 5S para tirar uma foto de ambos os documentos e depois os enviei diretamente para os sites para conversão.

Caso você queira ver como ficaram as imagens que usei para o meu teste, anexei-as aqui: Test1 e Test2 . Observe que essas não são as versões de resolução total das imagens tiradas do telefone. Eu usei a imagem de resolução(resolution image) total ao fazer o upload para os sites.

OnlineOCR

OnlineOCR.net é um site limpo e simples que apresentou resultados muito bons no meu teste. A principal coisa que eu gosto é que ele não tem toneladas de anúncios em todo o lugar, o que geralmente é o caso desses tipos de sites de serviços de nicho(niche service) .

ocr online gratis

Para começar, selecione seu arquivo e espere até(file and wait till) que ele termine de carregar. O tamanho máximo de upload para este site é 100 MB. Se você se registrar para uma conta gratuita, você obtém alguns recursos extras, como tamanho de upload maior, PDFs de várias páginas , idiomas de entrada diferentes, mais conversões por hora etc.

Em seguida, escolha seu idioma de entrada(input language) e, em seguida, escolha o formato de saída(output format) . Você pode escolher entre Word , Excel ou Texto Simples(Plain Text) . Clique(Click) no botão Converter(Convert) e você verá o texto exibido na parte inferior em uma caixa junto com um link de download(download link) .

saída ocr

Se tudo o que você quer é o texto, basta copiá-lo e colá(copy and paste) -lo da caixa. No entanto, sugiro que você baixe o documento do Word(Word document) porque ele faz um trabalho surpreendentemente bom ao manter o layout do documento original.

Por exemplo, quando abri o documento do Word(Word document) para meu segundo teste, fiquei surpreso ao descobrir que o documento incluía uma tabela com três colunas, exatamente como na imagem.

saída de ocr online

De todos os sites, este foi de longe o melhor. Vale a pena se registrar se você precisar fazer muitas conversões.

Para completar, também vou vincular os arquivos de saída criados por cada serviço para que você possa ver os resultados por si mesmo. Aqui estão os resultados do OnlineOCR : Test1 Doc e Test2 Doc(Test1 Doc and Test2 Doc) .

Observe que ao abrir esses documentos do Word em seu computador, você receberá uma mensagem no Word informando que é da Internet e que a edição(Internet and editing) foi desabilitada. Isso é perfeitamente aceitável porque o Word não(Word doesn) confia em documentos da Internet e você realmente não precisa habilitar a edição se quiser apenas visualizar o documento.

i2OCR

Outro site que deu bons resultados foi o i2OCR(i2OCR) . O processo é muito semelhante: escolha seu idioma, arquivo e pressione Extrair Texto(Extract Text) .

i2ocr

Você terá que esperar um minuto ou dois aqui porque este site demora um pouco mais. Além disso, na Etapa 2(Step 2) , certifique-se de que sua imagem esteja aparecendo com o lado direito para cima na visualização, caso contrário, você receberá um monte de rabiscos como saída. Por algum motivo, as imagens do meu iPhone estavam sendo exibidas no modo retrato(portrait mode) no meu computador, mas no modo paisagem quando fiz o upload para este site.

saída i2ocr

Eu tive que abrir manualmente a imagem em um aplicativo de edição de fotos, girá-la 90 graus, depois girá-la de volta para retrato e salvá-la novamente. Depois(Once) de concluído, role para baixo e ele mostrará uma visualização do texto junto com um botão de download(download button) .

Este site se saiu muito bem com a saída para o primeiro teste, mas não se saiu tão bem com o segundo teste que teve o layout de coluna(column layout) . Aqui estão os resultados do i2OCR: Test1 Doc e Test2 Doc(Test1 Doc and Test2 Doc) .

FreeOCR

O Free-OCR.com pegará(Free-OCR.com) suas imagens e as converterá em texto simples(plain text) . Não tem a opção de exportar para o formato Word(Word format) . Escolha seu arquivo, selecione um idioma e clique em Iniciar(Start) .

O site é rápido e você obterá a saída rapidamente. Basta clicar(Just click) no link para baixar o arquivo de texto(text file) para o seu computador.

freeocr

Assim como o NewOCR(NewOCR) mencionado abaixo, este site capitaliza todos os T's no documento. Não tenho ideia de por que faria isso, mas por algum motivo estranho, este site e o NewOCR(site and NewOCR) fizeram isso. Não é grande coisa mudá-lo, mas é um processo tedioso que você realmente não deveria ter que fazer.

Aqui estão os resultados do FreeOCR : Test1 Doc e Test2 Doc(Test1 Doc and Test2 Doc) .

ABBYY FineReader Online

Para usar o FineReader Online , você precisa se registrar em uma conta, que oferece uma avaliação gratuita de 15 dias para OCR de até 10 páginas gratuitamente. Se você precisar fazer apenas um OCR único para algumas páginas, poderá usar este serviço. Certifique(Make) -se de clicar no link de verificação(verify link) no e-mail de confirmação(confirmation email) após o registro.

leitor fino online

Clique em Reconhecer(Recognize) na parte superior e, em seguida, clique em Carregar(Upload) para selecionar seu arquivo. Escolha seu idioma, formato de saída e clique em Reconhecer(Recognize) na parte inferior. Este site tem uma interface limpa e sem anúncios também.

Nos meus testes, esse site conseguiu pegar o texto do primeiro documento de teste(test document) , mas ficou absolutamente enorme quando abri o documento do Word(Word doc) , então acabei fazendo de novo e escolhendo Texto Simples(Plain Text) como formato de saída(output format) .

Para o segundo teste com as colunas, o documento do Word(Word document) estava vazio e nem consegui encontrar o texto. Não tenho certeza do que aconteceu lá, mas não parece ser capaz de lidar com nada além de parágrafos simples. Aqui estão os resultados do FineReader : Test1 Doc e Test2 Doc.

Novo OCR

O próximo site, NewOCR.com , foi bom, mas não tão bom quanto o primeiro. Em primeiro lugar, tem anúncios, mas felizmente não uma tonelada. Você primeiro seleciona seu arquivo e, em seguida, clica no botão Visualizar(Preview) .

Enviar Imagem

Você pode girar a imagem e ajustar a área onde deseja digitalizar o texto. É mais ou menos como o processo de digitalização(scanning process) funciona em um computador com um scanner conectado.

imagem ocr

Se o documento tiver várias colunas, você pode verificar o botão Análise de layout de página( Page layout analysis) e ele tentará dividir o texto em colunas. Clique(Click) no botão OCR(OCR button) , aguarde alguns segundos para concluir e role para baixo quando a página for atualizada.

No primeiro teste, ele pegou todo o texto corretamente, mas por algum motivo colocou todos os T em maiúsculas no documento! Não faço ideia de por que faria isso, mas fez. No segundo teste com a análise de página(page analysis) habilitada, obteve a maior parte do texto, mas o layout estava completamente desligado.

Aqui estão os resultados do NewOCR : Test1 Doc e Test2 Doc.

Conclusão

Como você pode ver, o grátis não oferece resultados muito bons na maioria das vezes, infelizmente. O primeiro site mencionado é de longe o melhor porque não só fez um ótimo trabalho de reconhecimento de todo o texto, como também conseguiu manter o formato do documento original.

Se você precisar apenas de texto, a maioria dos sites acima deve ser capaz de fazer isso por você. Se você tiver alguma dúvida, sinta-se à vontade para comentar. Aproveitar!



About the author

Sou técnico em informática e tenho mais de 10 anos de experiência na área. Eu me especializei no desenvolvimento do Windows 7 e Windows Apps, bem como no design de Cool Websites. Sou extremamente conhecedor e experiente na área, e seria um ativo valioso para qualquer organização que queira expandir seus negócios.



Related posts