【AWS】Amazon Textractを使ってPDF解析を行ってみた　[日本語ダメでした]

gangannikki https://blog.hatena.ne.jp/gangannikki/ ganganの技術備忘録 https://gangannikki.hatenadiary.jp/ AWS Deep Learning はじめにこんにちは、がんがんです。以前、Pythonを用いたOCR解析の実験を行いました。割とよい精度で出来たのですが当時は画像でした。前回の記事はこちらから参照ください。 gangannikki.hatenadiary.jp さて、現在進行中のプロジェクトでは日本語PDFを解析したいという課題があります。本課題を解消するためにクラウドサービスを用いたOCR解析の使用を検討しております。本記事ではAWSさんが提供するAmazon Textractを用いて比較・検証を行っていきます。 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fgangannikki.hatenadiary.jp%2Fentry%2F2020%2F02%2F14%2F222000" title="【AWS】Amazon Textractを使ってPDF解析を行ってみた　[日本語ダメでした] - ganganの技術備忘録" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/g/gangannikki/20200214/20200214215010.jpg Hatena Blog https://hatena.blog 2020-02-14 22:20:00 【AWS】Amazon Textractを使ってPDF解析を行ってみた　[日本語ダメでした] rich https://gangannikki.hatenadiary.jp/entry/2020/02/14/222000 1.0 100%