<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>karaage</author_name>
  <author_url>https://blog.hatena.ne.jp/karaage/</author_url>
  <blog_title>karaage. [からあげ]</blog_title>
  <blog_url>https://karaage.hatenadiary.jp/</blog_url>
  <categories>
    <anon>人工知能</anon>
  </categories>
  <description>Stable Diffusionで遊ぶ Stable Diffusion関連の話題はつきませんね。日進月歩で新たなテクニックや技術が出てきますが、私はハイクオリティな絵を描くのは諦めて、早々におもしろアプリをつくる方法に舵を切っています。 とりあえず、高精度な音声認識技術（Whisper）とStable Diffusionを組み合わせて、召喚獣を呼び出す詠唱ごっこをしたりしています。Whisperの使い方は以下記事参照ください。 使用感は以下みたいな感じです。 whisperとStable DiffusionでVoice to imageを自作ソフトで試してみる。whisperの精度がイマイチ…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fkaraage.hatenadiary.jp%2Fentry%2F2022%2F10%2F26%2F073000&quot; title=&quot;画像生成AI（Stable Diffusion）と音声認識AI（Whisper）を組み合わせたエンターテイメント - karaage. [からあげ]&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://cdn-ak.f.st-hatena.com/images/fotolife/k/karaage/20221026/20221026004938.png</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2022-10-26 07:30:00</published>
  <title>画像生成AI（Stable Diffusion）と音声認識AI（Whisper）を組み合わせたエンターテイメント</title>
  <type>rich</type>
  <url>https://karaage.hatenadiary.jp/entry/2022/10/26/073000</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
