5.音色[29][30] (研究期間:1996 - )

 聴覚情報は、視覚情報のように時間に無関係に存在する“対象”の存在が重要なのではなく、対象がどのように変化するかという“事象”の内容が重要である。このため、聴覚は時間的に変化しているものを情報として受け取ることに優れている。たとえば、人間は時間の揺れに対する感度には敏感であり、100 Hzのパルス列に対して1 ms以下の時間ジッターでも検出できる。また、合成用の励振音源として用いるパルス列をオールパスフィルタに通し群遅延を与えた場合、合成音声はより自然な音質となる。これは、位相が揃うという不自然性に対して、人間が敏感である証拠であろう。

 一方、永らく人間は時間軸方向の情報の一つである位相に鈍感であると信じられていた。このため、スペクトル構造のみを保存するような符号化方式が多く使われてきた。しかし、これらの音質が“機械くささ”を伴うのも確かである。

 そこで、時間軸方向の情報の一つである位相に関して、人間の知覚特性について心理物理実験を行なっている[30]。この研究は、人間の位相知覚特性の測定のみならず、音声の自然性についての議論へも貢献する。