日本語対応 OCR モデルの比較

techscore https://blog.hatena.ne.jp/techscore/ TECHSCORE BLOG https://blog.techscore.com/ はじめに私は書籍を全文検索するために、OCRでテキスト化を行なっています。コストの面から、個人利用無料のYomiTokuというローカルOCRを使っていますが、どの程度の精度なのか知るために、簡単に他のOCRモデルと比較してみました。 TL;DR（3行まとめ）強いノイズあり → Google Cloud Vision一択（唯一実用レベル）通常の文書 → Azure or YomiToku（最高精度・高速・低コスト） OpenAI系 → 今回の日本語OCRでは全般的に不適比較対象モデル OCR専用でないものも含めて、以下のモデルを比較対象としました。 Google Cloud Visio… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fblog.techscore.com%2Fentry%2F2025%2F12%2F17%2F080000" title="日本語対応 OCR モデルの比較 - TECHSCORE BLOG" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/t/techscore/20251215/20251215141338.png Hatena Blog https://hatena.blog 2025-12-17 08:00:00 日本語対応 OCR モデルの比較 rich https://blog.techscore.com/entry/2025/12/17/080000 1.0 100%