AWS Textractで書類をOCRしてみたけど日本語未対応やんけ

redhornet96 https://blog.hatena.ne.jp/redhornet96/ もふもふ技術部 https://www.mof-mof.co.jp/tech-blog/ OCR AWS Textract Amazon Textract（ドキュメントからテキストやデータを簡単に自動抽出）表形式のテキストが抽出出来るらしいとのことで「これはアツいのでは」と思い、AWSのTextractを試してみる。準備 aws-cliでOCR デモ画面準備公式ドキュメントを見ながら進めてみます。 Detecting Document Text with Amazon Textract - Amazon Textract ドキュメントによるとS3にOCR対象のファイルをアップする必要があるらしい。下記から拝借した納品書みたいなやつをS3にアップする。 http://www.hitachi.co.jp/Pro… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fwww.mof-mof.co.jp%2Ftech-blog%2Faws-extract-ocr" title=" AWS Textractで書類をOCRしてみたけど日本語未対応やんけ - もふもふ技術部" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://images.ctfassets.net/683ogktz4b18/52fStoZwGA8Y0E4LAoDfZ1/d2ed11a32e6697f11254d85a242b1aaa/document.png Hatena Blog https://hatena.blog 2019-09-24 00:00:00 AWS Textractで書類をOCRしてみたけど日本語未対応やんけ rich https://www.mof-mof.co.jp/tech-blog/aws-extract-ocr 1.0 100%