JAISTホームページへ

情報科学研究科

お問合せアクセスリンク集学内情報サイトマップEnglish
研究科概要 入学・進学情報 教育システム 研究 産学連携 社会人コース
ホーム 研究研究室一覧>人間情報処理領域【赤木研究室】

人間情報処理領域【赤木研究室】

写真:教授:赤木 正人

音声信号処理:
機械の耳・口を賢くしよう

教授:赤木 正人

mail : メール(クリックするとメールソフトが立ち上がります)

URL : http://gelgoog.jaist.ac.jp:8000/home-j.html

■ 基本路線

 赤木研究室では,音声信号処理の研究を行っています。音声によるコミュニケーション(聞く・話す)は人間の基本的な営みなので,まず人間を知り,そして営みを模擬して計算機上に記述することで,高度の音処理システムの実現を目指しています。

 

■ 研究範囲

 図1は,音声によるコミュニケーション(聞く・話す)がどのような過程を経て行われているかを示しています。当研究室では,赤線で囲った部分(話す:音声発話,実環境での音声伝播,聞く:音声知覚)を研究対象としています。このために,工学(ディジタル信号処理)だけではなく,医学・生理学・心理学・音響物理学,音声学などの分野との連携をとりながら研究を行っています。

図1:音声コミュニケーションの基本(ことばの鎖)
図1:音声コミュニケーションの基本(ことばの鎖)

 

■ 研究内容

話す: 機械の口がより賢くなるように,より自然な合成音をつくることを目的として,音声スペクトルと声道形状の関係,合成音への個人性・感情などの非言語情報の付与,歌声らしい歌声の合成(図2)などの研究を行っています。
聞く: 雑音とか残響が存在する実環境でのヒトのすばらしい聴取能力を,少しでも機械の耳に与えて賢くするために,カクテルパーティ効果の実現,雑音中の音声強調(図3)などの研究を行っています。また,“歌声らしさ”などの心理量とこれに関連する物理量の関係も研究しています。関係がわかれば,歌声らしい声の合成に応用することができます。

図2:(上)話声(“からすなぜなくの”),(下)話声から合成した歌声。本人が歌っているように聞える。
図2:(上)話声(“からすなぜなくの”),
(下)話声から合成した歌声。本人が歌っているように聞える。

 

図3:4人の同時発話(真中)から1人の音声を強調する(下)。上が取り出された音声の元音声。
図3:4人の同時発話(真中)から1人の音声を強調する(下)。
上が取り出された音声の元音声。

 

■代表的な著書・論文

  • Akagi, M., Mizumachi, M., Ishimoto, Y., and Unoki, M.(2002): Speech enhancement and segregation based on human auditory mechanisms, in Enabling Society with Information Technology, Springer Tokyo, 186-196
  • Saitou, T., Unoki, M. and Akagi, M.(2005): Development of an F0control model based on F0dynamic characteristics for singing voice synthesis, Speech Communication 46, 405-417.
  • Li, J. and Akagi, M.(2006): A noise reduction system based on hybrid noise estimation technique and post-filtering in arbitaary noise environments, Speech Communication, 48, 111-126
 

研究科概要ダウンロード
↑ページの先頭へ