2018年3月14日水曜日

PyOCRを使って文字認識する

PyOCRとは何か?

tesseract-ocrをpythonから使えるようにしたもの。
pythonからtesseractを呼び出して画像から文字を認識する。
詳しくはhttps://github.com/openpaperwork/pyocr

前提

2018年3月13日火曜日

tesseract-ocrで画像の文字認識をやってみる

文字認識(OCR)をやってみたい

画像から文字を取得したい。tesseractを利用するのが定番のようだ。 pythonなどからも利用できるようだがとりあえずコマンドラインで使ってみたい。

目標

Windows10にtesseractをインストールしてコマンドラインで使う