Pythonを使ったOCRで沼った話

Jupyterlab上でPythonを使ってOCRをやろうとしたら沼った話.海外ニキのコメントを検索しながら目的達成.

# ocr_card_filter.py
import os
from PIL import Image
import pyocr
import pyocr.builders

# Installed TesseractのPATH
pyocr.tesseract.TESSERACT_CMD = full path
~~~~
#省略

#OCR
builder = pyocr.builders.TextBuilder()
result = tool.image_to_string(img, lang="jpn", builder=builder)
print(result)

with open("ocr.txt",mode="w") as f:
    f.write(result)
brew list tesseract

これでtesseractが格納されている場所を表示する.そして!!!!Jupyterlab上で上のコードを動かすときは,必ずtesseractのfull pathを書いておくこと.これがないと,tesseractが見つからないって怒られる.

ocrの精度については,調べたところ,色を白黒にしたり,一部分だけ切り取ってやったりとあるらしい.個人的に便利な使い方は,スクリーンショットを撮って,それをすぐにtextに直すこと.

まあ,精度を向上するには機械学習とか色々あるらしい.それもいずれ勉強できたらな.

ツイッターでシェア
みんなに共有、忘れないようにメモ

🚀🐶CZ投資ちゃんねる🐶🌕

大学院生です.YouTube始めました.株式,CFD,為替を中心にトレードしています.トレアイ「CZ」で参加しています.よろしくお願いします.

Crieitは誰でも投稿できるサービスです。 是非記事の投稿をお願いします。どんな軽い内容でも投稿できます。

また、「こんな記事が読みたいけど見つからない!」という方は是非記事投稿リクエストボードへ!

有料記事を販売できるようになりました!

こじんまりと作業ログやメモ、進捗を書き残しておきたい方はボード機能をご利用ください。
ボードとは?

コメント