研究目的

 近年、聴覚は能動的な環境把握システムの一環として考えられるようになり、Marrが構築した視覚の計算理論に対応する聴覚の計算理論の構築が試みられている。 聴覚の計算理論とは、「聴覚が何を計算し、何故それをするのか」を情報科学の立場から説明するものである。 従って、この計算理論を構築することができれば、聴覚系がどのような処理過程で能動的に環境を把握しているのか明らかにできる。 また、これは様々な聴覚心理現象のモデル化だけでなく、工学的に頑健な音声認識システムや雑音除去技術にも応用できる。
 これに関する基礎的研究として、Bregmanによって提唱された聴覚の情景解析に基づいた信号分離に関する計算モデルを構築する研究がある。 代表的なものとしてSheffield大学のBrownやCookeのモデル、MITのEllisのモデル、NTTの中谷らのモデルが報告されているが、計算理論の構築に必要な情報表現と制約条件に関する議論がほとんどされていない。
 本研究では、聴覚が雑音中から望みの信号を分離・抽出できるという優れた機能に着目し、音の分離・抽出に関する聴覚の計算理論の構築を目指す。 情報表現と制約条件に関しては、特に単耳に到来した音響信号の物理的情報表現を考え、Bregmanによって提唱された発見的規則を定量的な制約条件にとらえ直す。 そして、この制約条件の必要十分条件を導くことで、音の分離・抽出に関する聴覚の計算理論の構築を目指す。 


Masashi Unoki(unoki@jaist.ac.jp) Apr 14, 1995