macOSでPDFに透過OCR（検索できる文字）を付ける：`ocrmypdf` + `tesseract`

ED105 https://blog.hatena.ne.jp/ED105/ 43号線を西へ東へ https://driveon43.com/ Python AI 過去には専門書を裁断して高速スキャナーでPDF化する作業、いわゆる自炊という作業を結構やっておりました。本を切り刻むという行為には罪悪感もありますし、何しろ手間がかかってだんだんやらなくなっていました。ただ、やっぱりPDFにしておくと便利ですが、私の使っていたソフトウェアではきちんとしたOCRができ無くて、テキストを検索でき無くて困っていました。 OCRされた文章が透明テキストとしてPDFに埋め込まれていると使い勝手がいいのですが、ただスキャンしただけのPDFは「見た目はPDFだけど、中身は画像」なので、検索もコピーもできません。 AdobeのAcrobatの有償版では、OCRが可能なので年間… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fdriveon43.com%2Fentry%2F2026%2F02%2F18%2F193911" title="macOSでPDFに透過OCR（検索できる文字）を付ける：`ocrmypdf` + `tesseract` - 43号線を西へ東へ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/E/ED105/20260218/20260218193501.png Hatena Blog https://hatena.blog 2026-02-18 19:39:11 macOSでPDFに透過OCR（検索できる文字）を付ける：`ocrmypdf` + `tesseract` rich https://driveon43.com/entry/2026/02/18/193911 1.0 100%