<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>techscore</author_name>
  <author_url>https://blog.hatena.ne.jp/techscore/</author_url>
  <blog_title>TECHSCORE BLOG</blog_title>
  <blog_url>https://blog.techscore.com/</blog_url>
  <categories>
  </categories>
  <description>はじめに 私は書籍を全文検索するために、OCRでテキスト化を行なっています。 コストの面から、個人利用無料のYomiTokuというローカルOCRを使っていますが、どの程度の精度なのか知るために、簡単に他のOCRモデルと比較してみました。 TL;DR（3行まとめ） 強いノイズあり → Google Cloud Vision一択（唯一実用レベル） 通常の文書 → Azure or YomiToku（最高精度・高速・低コスト） OpenAI系 → 今回の日本語OCRでは全般的に不適 比較対象モデル OCR専用でないものも含めて、以下のモデルを比較対象としました。 Google Cloud Visio…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fblog.techscore.com%2Fentry%2F2025%2F12%2F17%2F080000&quot; title=&quot;日本語対応 OCR モデルの比較 - TECHSCORE BLOG&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://cdn-ak.f.st-hatena.com/images/fotolife/t/techscore/20251215/20251215141338.png</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2025-12-17 08:00:00</published>
  <title>日本語対応 OCR モデルの比較</title>
  <type>rich</type>
  <url>https://blog.techscore.com/entry/2025/12/17/080000</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
