エラーハンドリングから攻撃の糸口を探る ― Gemini LLMの事例

ThisIsOne https://blog.hatena.ne.jp/ThisIsOne/ Shikata Ga Nai https://cysec148.hatenablog.com/ Bug Bounty LLM Hello there, ('ω')ノ攻撃のストーリー（全体像）研究者が Gemini に通常とは異なるプロンプトを投げるモデルが返すエラーメッセージを観察その中に「内部ロジック（安全性の閾値や検証フラグ）」が含まれていることに気づく繰り返し質問を投げ、少しずつ「安全性の判定基準」を学ぶ最終的に本来公開されないはずのモデル内部コードや安全判定条件を知ることができた攻撃者の思考を一手ずつ追う 1) 「普通じゃない質問」を投げてみる例：選挙を「操作」できるか？という危険な質問結果：回答は拒否されたが、詳細なエラーメッセージが返る → ここで攻撃者は「普通に断られるだけじゃな… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fcysec148.hatenablog.com%2Fentry%2F2025%2F09%2F05%2F072914" title="エラーハンドリングから攻撃の糸口を探る ― Gemini LLMの事例 - Shikata Ga Nai" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2025-09-05 07:29:14 エラーハンドリングから攻撃の糸口を探る ― Gemini LLMの事例 rich https://cysec148.hatenablog.com/entry/2025/09/05/072914 1.0 100%