HMMより更に一歩先の音声合成技術

netcc https://blog.hatena.ne.jp/netcc/ ひとりCeVIO祭り https://netcc.hatenablog.jp/ HOYA VoiceText HOYAのVoiceTextは、ディープラーニングの技術を追加導入して、さらに表現力が凄いことになっているようです。以前SinsyやHTSに導入されたDNN(deep neural network)と同種の技術なのか、私には見当がつきませんが、従来よりも更に自然な話し声を生成できるポテンシャルを感じ取ることができます(T-T) HTS(http://hts.sp.nitech.ac.jp/)のページには、DNNによってフレーム単位のモデリングを行うと書かれているような気がします。（英語なうえに内容が難しすぎて私には良く分かりませんが…） HMMを基本にしつつも、従来は１つの音素につき５つ？だ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fnetcc.hatenablog.jp%2Fentry%2F2018%2F02%2F03%2F235651" title="HMMより更に一歩先の音声合成技術 - ひとりCeVIO祭り" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2018-02-03 23:56:51 HMMより更に一歩先の音声合成技術 rich https://netcc.hatenablog.jp/entry/2018/02/03/235651 1.0 100%