ドメイン特化型AIエージェントの品質をどう測るか？ MLflow 3とLLMジャッジによる実践的アプローチ

Kazumain https://blog.hatena.ne.jp/Kazumain/ APC 技術ブログ https://techblog.ap-com.co.jp/ Databricks DAIS2025 ※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部ドメイン特化型AIエージェントの品質をどう測るか？ MLflow 3とLLMジャッジによる実践的アプローチ生成AI、特に特定の業務領域に特化したドメイン特化型AIエージェントの開発が急速に進んでいます。しかし、その自由で創造的な性質ゆえに、「品質」をどう定義し、どう測定するかは多くの開発者が直面する大きな課題です。本記事では、Databricksのソフトウェアエンジ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftechblog.ap-com.co.jp%2Fentry%2F2025%2F06%2F27%2F110721" title="ドメイン特化型AIエージェントの品質をどう測るか？ MLflow 3とLLMジャッジによる実践的アプローチ - APC 技術ブログ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/K/Kazumain/20250627/20250627102704.jpg Hatena Blog https://hatena.blog 2025-06-27 11:07:21 ドメイン特化型AIエージェントの品質をどう測るか？ MLflow 3とLLMジャッジによる実践的アプローチ rich https://techblog.ap-com.co.jp/entry/2025/06/27/110721 1.0 100%