第42回 関東「音楽と脳勉強会」のご案内

スケジュール

日時  平成30年3月23日(金) 19:00~21:00
会場  電気通信大学 西10号館2F 大会議室; (地図はこちら

発表者

藤岡 拓也(日立製作所)

内容

隠れ状態を仮定したDNNベース声質変換

音声の声質を特定話者の声質に変換する技術として,声質変換技術がある。統計ベースの声質変換技術として主に,混合ガウスモデル(GMM),非負値行列因子分解(NMF),ディープニューラルネットワーク(DNN)を用いたものが多く提案されている。その中でもDNNベースの手法は,モデルの柔軟性が高いこと,高次元のデータを扱うことができることから近年注目を集めている。その反面,学習データ量が十分でない場合に過学習が起こりやすいことが問題の一つとしてある。本発表においては,変換元話者音声の中に複数の隠れ状態を仮定したDNNベースモデルの構成を述べる。この構成を採用することにより,DNNベース声質変換モデルの汎化性能向上が確認された。

新規作成編集コピー名前の変更凍結アップロード添付ファイル一覧バックアップ