Langfuse の Datasets 機能を利用した AIエージェント機能の性能評価のためのデータセット構築

yu-ya4 https://blog.hatena.ne.jp/yu-ya4/ LayerX エンジニアブログ https://tech.layerx.co.jp/ AI Agent 機械学習 LayerX の提供するバクラクAIエージェントを題材に、Langfuse を利用したAIエージェント機能の性能評価の取り組みについて紹介します。今回は、性能評価の肝であるデータセット構築について紹介します。次回は、そのデータセットを用いて実際に性能評価を実施する仕組みについて紹介します。バクラクは、バックオフィスに特化したAIエージェントによって、日常業務の中で自然にAIを活用いただけるような体験を提供しています。 bakuraku.jp こちらは LayerX AI Agent ブログリレー 17日目の記事です。前回は @ta1m1kam による『CopilotKitでアプリをAI化し… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftech.layerx.co.jp%2Fentry%2F2025%2F10%2F02%2F200000" title="Langfuse の Datasets 機能を利用した AIエージェント機能の性能評価のためのデータセット構築 - LayerX エンジニアブログ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/y/yu-ya4/20251003/20251003010402.png Hatena Blog https://hatena.blog 2025-10-02 20:00:00 Langfuse の Datasets 機能を利用した AIエージェント機能の性能評価のためのデータセット構築 rich https://tech.layerx.co.jp/entry/2025/10/02/200000 1.0 100%