画像生成AI（Stable Diffusion）と音声認識AI（Whisper）を組み合わせたエンターテイメント

karaage https://blog.hatena.ne.jp/karaage/ karaage. [からあげ] https://karaage.hatenadiary.jp/ 人工知能 Stable Diffusionで遊ぶ Stable Diffusion関連の話題はつきませんね。日進月歩で新たなテクニックや技術が出てきますが、私はハイクオリティな絵を描くのは諦めて、早々におもしろアプリをつくる方法に舵を切っています。とりあえず、高精度な音声認識技術（Whisper）とStable Diffusionを組み合わせて、召喚獣を呼び出す詠唱ごっこをしたりしています。Whisperの使い方は以下記事参照ください。使用感は以下みたいな感じです。 whisperとStable DiffusionでVoice to imageを自作ソフトで試してみる。whisperの精度がイマイチ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fkaraage.hatenadiary.jp%2Fentry%2F2022%2F10%2F26%2F073000" title="画像生成AI（Stable Diffusion）と音声認識AI（Whisper）を組み合わせたエンターテイメント - karaage. [からあげ]" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/k/karaage/20221026/20221026004938.png Hatena Blog https://hatena.blog 2022-10-26 07:30:00 画像生成AI（Stable Diffusion）と音声認識AI（Whisper）を組み合わせたエンターテイメント rich https://karaage.hatenadiary.jp/entry/2022/10/26/073000 1.0 100%