<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>dcm_fujimoto</author_name>
  <author_url>https://blog.hatena.ne.jp/dcm_fujimoto/</author_url>
  <blog_title>ENGINEERING BLOG ドコモ開発者ブログ</blog_title>
  <blog_url>https://nttdocomo-developers.jp/</blog_url>
  <categories>
    <anon>アドベントカレンダー2025</anon>
    <anon>エンジニア向け</anon>
    <anon>テスト自動化</anon>
  </categories>
  <description>はじめに 負荷試験とは 概要 今回使ったツール：Locust オープンソースLLMとは 概要 （補足）Amazon Bedrock との比較 今回使ったモデル：Qwen2.5-7B-Instruct-AWQ 実験 アーキテクチャ 開発環境 (VS Code + Session Manager) 推論エンジンの設定 (vLLM) テストシナリオ ユーザー挙動のシミュレーション (思考時間) 負荷試験の設定 結果 レスポンス内容の確認（定性的評価） 追加実験1：実用的な限界点の検証 追加実験2：過負荷耐性の検証（50人 vs 100人） まとめ はじめに はじめまして。サービスイノベーション部の藤…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fnttdocomo-developers.jp%2Fentry%2F2025%2F12%2F23%2F090000_0&quot; title=&quot;AWS T4インスタンスでプライベートLLMはどこまで通じる？Locust負荷試験で見えた「性能の限界」 - ENGINEERING BLOG ドコモ開発者ブログ&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://cdn-ak.f.st-hatena.com/images/fotolife/n/nttdocomord/20251223/20251223090005.png</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2025-12-23 09:00:00</published>
  <title>AWS T4インスタンスでプライベートLLMはどこまで通じる？Locust負荷試験で見えた「性能の限界」</title>
  <type>rich</type>
  <url>https://nttdocomo-developers.jp/entry/2025/12/23/090000_0</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
