<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>hiros1192</author_name>
  <author_url>https://blog.hatena.ne.jp/hiros1192/</author_url>
  <blog_title>エンジニアの思い立ったが吉日</blog_title>
  <blog_url>https://engineer-kichizitsu.net/</blog_url>
  <categories>
    <anon>AI</anon>
    <anon>AI画像</anon>
    <anon>Gemini</anon>
    <anon>ツール</anon>
    <anon>生成AI</anon>
    <anon>ニュース</anon>
  </categories>
  <description>マルチモーダルAIを活用した開発を行っていると、こんな課題に直面したことはありませんか？ 「高解像度の図面を渡したのに、細かい寸法を読み間違えられた」 「画像内のオブジェクト数を数えさせたら、毎回結果が違う」 これまでのAIは、画像を「パッと見て」回答する静的な処理が主流でした。人間で言えば、チラッと見ただけで記憶を頼りに答えるようなものです。これでは微細な情報の見落としは避けられません。 しかし、2026年1月27日にGoogleがGemini 3 Flash向けに発表した新機能「Agentic Vision（エージェンティック・ビジョン）」は、この常識を覆しました。AIが自らPythonコ…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fengineer-kichizitsu.net%2Fentry%2F20260128%2F1769596993&quot; title=&quot;【Gemini 3 Flash】画像認識は「見る」から「調査する」へ。新機能Agentic Vision完全解説 - エンジニアの思い立ったが吉日&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://cdn.user.blog.st-hatena.com/default_entry_og_image/159598337/1752537432377033</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2026-01-28 19:43:13</published>
  <title>【Gemini 3 Flash】画像認識は「見る」から「調査する」へ。新機能Agentic Vision完全解説</title>
  <type>rich</type>
  <url>https://engineer-kichizitsu.net/entry/20260128/1769596993</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
