技能情報学研究ステーション

第４２回　関東「音楽と脳勉強会」のご案内

スケジュール †

日時　　平成３０年３月２３日（金）　１９：００～２１：００
会場　　電気通信大学西10号館2F 大会議室;　(地図はこちら）

発表者 †

藤岡拓也（日立製作所)

内容 †

隠れ状態を仮定したDNNベース声質変換

音声の声質を特定話者の声質に変換する技術として，声質変換技術がある。統計ベースの声質変換技術として主に，混合ガウスモデル(GMM)，非負値行列因子分解(NMF)，ディープニューラルネットワーク(DNN)を用いたものが多く提案されている。その中でもDNNベースの手法は，モデルの柔軟性が高いこと，高次元のデータを扱うことができることから近年注目を集めている。その反面，学習データ量が十分でない場合に過学習が起こりやすいことが問題の一つとしてある。本発表においては，変換元話者音声の中に複数の隠れ状態を仮定したDNNベースモデルの構成を述べる。この構成を採用することにより，DNNベース声質変換モデルの汎化性能向上が確認された。

ステーションの概要

イベント

研究成果

研究結果の紹介?
研究費
発表文献

お問い合わせ／アクセス

アクセス

訪問者数

本日：1
昨日：0
累計：289

本日：1 昨日：0 累計：289