人間情報処理領域【鵜木研究室】
■研究概要
私達人間は,雑音や残響がある実環境において,いともたやすく狙った音を聴き取ることができます。しかし,同じことを計算機で実現することは非常に難しい問題です。もし計算機上に聴覚と機能的に等価な信号処理システムを構築することができれば,音声認識や補聴システムといった様々な音信号処理に応用することができます。鵜木研究室では,聴覚の優れた能力に着目し,聴覚的な音信号処理の実現を目指しています。
■聴覚特性に基づいた信号分析
聴覚の主な機能は,図1に示すように音信号を周波数分析すること(周波数選択性)です。この分析は,信号音に対し非線形処理であることが知られています。本研究室では,図2に示すような研究手法で,聴覚心理物理実験から聴覚の優れた周波数選択性の機能を解明し,その実験結果に基づいて,聴覚による信号分析と機能的に等価な聴覚フィルタバンクの構築を試みています。
図1:聴覚フィルタバンクによる信号分析

図2:聴覚心理物理実験と聴覚フィルタバンクの構築

図3:残響音声回復の例:(a)原音声/aikawarazu/,
(b)残響時間1.0秒の残響音声,
(c)回復音声のサウンドスペクトログラム
■聴覚特性を考慮した音声信号処理
聴覚フィルタバンクを利用した音声信号処理の応用として,選択的音分離法(狙った音を聴き取る“聴き耳”モデル)や雑音除去法,変調伝達関数に基づいた残響音声回復法(図3),骨導音声の明瞭度回復の研究を行っています。ここでは,非線形フィルタバンクの一次近似として線形ガンマトーン聴覚フィルタバンクを利用しています。将来的に,非線形聴覚フィルタバンクとその後段の信号処理を確立することで,カクテルパーティ効果のモデル化にも応用することができます。
■代表的な著書・論文
- Unoki, M., Irino, T., Glasberg, B., Moore, B. C. J. and Patterson,
R. D. "Comparison of the roex and gammachirp filters as
representations of the auditory filter", J. Acoust. Soc.
Am., vol. 120, no. 3, pp. 1474-1492, 2006
- Unoki, M., Ito, K., Ishimoto, Y., and Tan, C-T. "Estimate
of auditory filter shape using notched-noise masking for various
signal frequencies," Acoustical Science and Technology,
vol. 27, no. 1, pp. 1-11, 2006
- Unoki, M., Sakata, K., Furukawa, M., and Akagi, M. "A
speech dereverberation method based on the MTF concept in power
envelope," Acoustical Science and Technology, vol. 25no.
4, pp. 243-254, 2004
|