【Gemini 3 Flash】画像認識は「見る」から「調査する」へ。新機能Agentic Vision完全解説

hiros1192 https://blog.hatena.ne.jp/hiros1192/ エンジニアの思い立ったが吉日 https://engineer-kichizitsu.net/ AI AI画像 Gemini ツール生成AI ニュースマルチモーダルAIを活用した開発を行っていると、こんな課題に直面したことはありませんか？「高解像度の図面を渡したのに、細かい寸法を読み間違えられた」「画像内のオブジェクト数を数えさせたら、毎回結果が違う」これまでのAIは、画像を「パッと見て」回答する静的な処理が主流でした。人間で言えば、チラッと見ただけで記憶を頼りに答えるようなものです。これでは微細な情報の見落としは避けられません。しかし、2026年1月27日にGoogleがGemini 3 Flash向けに発表した新機能「Agentic Vision（エージェンティック・ビジョン）」は、この常識を覆しました。AIが自らPythonコ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fengineer-kichizitsu.net%2Fentry%2F20260128%2F1769596993" title="【Gemini 3 Flash】画像認識は「見る」から「調査する」へ。新機能Agentic Vision完全解説 - エンジニアの思い立ったが吉日" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn.user.blog.st-hatena.com/default_entry_og_image/159598337/1752537432377033 Hatena Blog https://hatena.blog 2026-01-28 19:43:13 【Gemini 3 Flash】画像認識は「見る」から「調査する」へ。新機能Agentic Vision完全解説 rich https://engineer-kichizitsu.net/entry/20260128/1769596993 1.0 100%