人間情報処理領域【赤木研究室】
■ 基本路線
赤木研究室では,音声信号処理の研究を行っています。音声によるコミュニケーション(聞く・話す)は人間の基本的な営みなので,まず人間を知り,そして営みを模擬して計算機上に記述することで,高度の音処理システムの実現を目指しています。
■ 研究範囲
図1は,音声によるコミュニケーション(聞く・話す)がどのような過程を経て行われているかを示しています。当研究室では,赤線で囲った部分(話す:音声発話,実環境での音声伝播,聞く:音声知覚)を研究対象としています。このために,工学(ディジタル信号処理)だけではなく,医学・生理学・心理学・音響物理学,音声学などの分野との連携をとりながら研究を行っています。

図1:音声コミュニケーションの基本(ことばの鎖)
■ 研究内容
| 話す: |
機械の口がより賢くなるように,より自然な合成音をつくることを目的として,音声スペクトルと声道形状の関係,合成音への個人性・感情などの非言語情報の付与,歌声らしい歌声の合成(図2)などの研究を行っています。 |
| 聞く: |
雑音とか残響が存在する実環境でのヒトのすばらしい聴取能力を,少しでも機械の耳に与えて賢くするために,カクテルパーティ効果の実現,雑音中の音声強調(図3)などの研究を行っています。また,“歌声らしさ”などの心理量とこれに関連する物理量の関係も研究しています。関係がわかれば,歌声らしい声の合成に応用することができます。 |

図2:(上)話声(“からすなぜなくの”),
(下)話声から合成した歌声。本人が歌っているように聞える。

図3:4人の同時発話(真中)から1人の音声を強調する(下)。
上が取り出された音声の元音声。
■代表的な著書・論文
- Akagi, M., Mizumachi, M., Ishimoto, Y., and Unoki, M.(2002):
Speech enhancement and segregation based on human auditory
mechanisms, in Enabling Society with Information Technology,
Springer Tokyo, 186-196
- Saitou, T., Unoki, M. and Akagi, M.(2005): Development of
an F0control model based on F0dynamic characteristics for singing
voice synthesis, Speech Communication 46, 405-417.
- Li, J. and Akagi, M.(2006): A noise reduction system based
on hybrid noise estimation technique and post-filtering in
arbitaary noise environments, Speech Communication, 48, 111-126
|