3 melhores ferramentas de OCR online para extrair texto de imagens

Transcrever texto de imagens pode ser uma verdadeira dor. Quando o texto é apresentado como uma imagem ou algum outro formato não selecionável, a escola e o trabalho(school and work) tornam-se difíceis. A única solução é colocar esses olhos e dedos para trabalhar e começar a digitar – ou não é?

Optimal Character Recognition , ou OCR , é o processo de conversão de texto digitado ou manuscrito de mídia como documentos digitalizados ou fotos em texto simples.

Embora esteja sujeito a erros, dependendo da clareza do texto, usar OCR para extrair texto de imagens pode economizar horas de trabalho monótono. Um caso de uso(use case) de OCR seria se você for um estudante universitário que(college student) precisa de uma página específica de um livro didático. Se um amigo lhe enviar uma foto da página, você pode usar o OCR para extrair todo o texto da imagem para ler e copiá-lo facilmente.

Neste artigo, vamos explorar três das melhores ferramentas de OCR on-line para extrair texto de imagens, nenhuma das quais requer software(OCR software) ou plug-ins de OCR para download.

OnlineOCR

O OnlineOCR(OnlineOCR) é uma das maneiras mais simples e rápidas de converter uma imagem ou arquivo PDF(image or PDF file) em vários formatos de texto diferentes.

Sem uma conta, OnlineOCR.net permitirá converter até 15 arquivos em texto por hora. O registro de uma conta oferece acesso a recursos como a conversão de documentos PDF de várias páginas e muito mais.

O OnlineOCR.net(OnlineOCR.net) suporta a conversão dos formatos PDF(PDF) , JPG , BMP , TIFF e GIF , produzindo-os como DOCX , XLSX ou TXT .

OnlineOCR.net pode reconhecer texto em inglês(English) , africâner(Afrikaans) , albanês(Albanian) , basco(Basque) , brasileiro(Brazilian) , búlgaro(Bulgarian) , catalão(Catalan) , chinês(Chinese) , croata(Croatian) , tcheco(Czech) , dinamarquês(Danish) , holandês(Dutch) , esperanto , estoniano(Estonian) , finlandês(Finnish) , francês(French) , galego(Galician) , alemão(German) , grego(Greek) , húngaro(Hungarian) , islandês(Icelandic) , indonésio(Indonesian) , italiano(Italian), japonês(Japanese) , coreano(Korean) , latim(Latin) , letão(Latvian) , lituano(Lithuanian) , macedônio(Macedonian) , malaio(Malay) , moldávio(Moldavian) , norueguês(Norwegian) , polonês(Polish) , português(Portuguese) , romeno(Romanian) , russo(Russian) , sérvio(Serbian) , eslovaco(Slovak) , esloveno(Slovenian) , espanhol(Spanish) , sueco(Swedish) , tagalo(Tagalog) , turco(Turkish) e ucraniano.

O processo de conversão(conversion process) requer três etapas simples. Você carrega um arquivo, limitado a 15 MB, seleciona seu idioma e formato de saída(language and output format) e clica no botão Converter(Convert) .

Independentemente do formato de saída(output format) selecionado, uma visualização de texto simples da conversão aparecerá em um campo abaixo de um link para baixar o arquivo no formato selecionado. Isso ajuda a evitar que os usuários desperdicem um download em uma extração que pode ser imprecisa.

Novo OCR(NewOCR)(NewOCR)

Atualmente, o NewOCR(NewOCR) oferece apenas extração de texto de arquivos de imagem, mas suporta alguns outros recursos interessantes que muitos provedores de OCR online não oferecem.(OCR)

Para começar a usar o NewOCR(NewOCR) , basta clicar no botão Escolher arquivo(Choose File) , selecionar a imagem da qual deseja extrair o texto e clicar no botão azul Visualizar(Preview) . Isso exibirá uma visualização da sua imagem e apresentará várias opções adicionais.

Ao contrário da maioria dos outros conversores de imagem para texto online, o NewOCR permitirá que você defina vários idiomas de reconhecimento. Isso pode ser bastante útil se você não tiver certeza do idioma em que o texto de uma imagem está escrito, mas tiver um bom palpite e desejar obter uma tradução adequada do texto simples(plain text) .

Se sua imagem estiver inclinada para um lado, você também poderá girá-la dinamicamente. Depois de aplicar as opções necessárias, você pode clicar no botão azul OCR para extrair o texto da imagem.

A partir daqui, você pode baixar o texto extraído em formato TXT , DOC ou PDF(PDF format) , ou enviá-lo diretamente para o Google Tradutor ou Google Docs(Google Translate or Google Docs) para edição posterior.

OCR.space

Por último, mas não menos importante, o OCR.space(OCR.space) é definitivamente uma das opções mais robustas que encontramos, e deve cobrir praticamente qualquer operação de imagem para texto.

OCR.space é uma das melhores ferramentas de OCR que suporta o formato de arquivo WEBP(WEBP file) . Além disso, PNG , JPG e PDF também são suportados. Além disso, você não precisa fazer upload de um arquivo - você pode vinculá-lo remotamente se estiver disponível em algum lugar online.

Outros recursos de nicho incluem rotação automática(auto-rotation) , digitalização de recibos(receipt scanning) , reconhecimento(table recognition) de mesa e dimensionamento automático(auto-scaling) . OCR .space é uma das únicas ferramentas de OCR online que suportam a saída de arquivos como PDFs pesquisáveis(searchable PDFs) ​​(com texto visível ou invisível), e você pode até escolher entre um dos dois mecanismos de OCR(OCR engines) diferentes para a melhor extração possível.

Tudo o que você precisa fazer é carregar ou vincular um arquivo, clique no botão Start OCR!botão e, em seguida, uma visualização de seus resultados será carregada dinamicamente na mesma página. Se você selecionou sua saída como um PDF pesquisável , os botões Baixar(Download) e Mostrar sobreposição(Show Overlay) também estarão disponíveis.

Um dos recursos mais interessantes e exclusivos do OCR.space é que ele pode gerar sua extração como JSON . Esse JSON terá campos que incluem cada palavra do texto e suas coordenadas na própria imagem. Este é um recurso muito apreciado se você for um codificador tentando extrair texto de imagens programaticamente.

Com as três ferramentas da web acima, extrair o texto de praticamente qualquer imagem clara e legível deve ser muito fácil. Mesmo que você seja um digitador rápido com vários monitores, não há necessidade de sofrer com a transcrição de imagens de texto. O OCR(OCR) foi feito por um motivo, e esses sites ajudam você a fazer o melhor uso dele!

Se você tiver outras dicas para as melhores ferramentas ou serviços de OCR que gostaria de compartilhar, ou gostaria de ajuda para usar um dos acima, sinta-se à vontade para nos enviar uma mensagem nos comentários abaixo.



About the author

Sou técnico em informática e tenho mais de 10 anos de experiência na área. Eu me especializei no desenvolvimento do Windows 7 e Windows Apps, bem como no design de Cool Websites. Sou extremamente conhecedor e experiente na área, e seria um ativo valioso para qualquer organização que queira expandir seus negócios.



Related posts