実際のところ
いろいろアプローチはあるようですが、後々を考慮してサーバー形式かつDockerのものを。
幸い、CPU系統を色々選べるマルチプラットフォーム仕様なので出張先のホテルで動作検証したい時も挙動の再現性がよい(切実)
$ docker run -p 8884:8884 hertzg/tesseract-server:latest
WEB GUI
http://127.0.0.1:8884/にアクセスすると
試しにペイントでこんなデータを生成してみました。
これを先ほどのフォームに喰わせると
{"data":{"exit":{"code":0,"signal":null},"stderr":"","stdout":"OxDEADBEEF\n\f"}}
参考もと
Raspberry Pi 3に日本語 OCR Tesseractをインストールして OCR文字認識をする方法 (ラズパイ3で オープンソースの OCRエンジン Tesseractをインストールして使用する方法まとめ)
ラズパイとAI-OCRで生産日報を電子化する(後編):ラズパイで製造業のお手軽IoT活用(5)(2/2 ページ) - MONOist
GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)
GitHub - hertzg/tesseract-server: A small lightweight HTTP server that converts photos, images and scanned documents to text using optical character recognition by utilizing the power of Google Tesseract.