本文へジャンプ

音声信号処理:機械の耳・口を賢くしよう

赤木研究室 AKAGI Laboratory
教授:赤木 正人(Akagi Masato)

E-mail:akagijaist.ac.jp
[研究分野]
聴覚音声機構、音声情報処理、音声認識・合成
[キーワード]
音声の知覚と生成、表現豊かな音声の認識と合成、感情音声、歌声、音声の個人性

研究を始めるのに必要な知識・能力

研究では、ディジタル信号処理を道具として使います。このため、その基礎となる微分・積分、線形代数の知識(授業科目「基礎情報数学」程度)は必要です。加えて「音が好き」というのも重要な要素です。

この研究で身につく能力

赤木研究室では、音声の生成・知覚機構を数理モデルとしてとらえ、ディジタル信号処理の手法を用いて、数理モデルから有益な音声信号処理システムを構築しています。これを行うためには、ヒトの発声発話に対する生理学的・心理学的観測、観測結果にもとづいた数理モデ ル化、そして、計算機上でヒトと同じように動くシステムの実装が必要となります。これら一連の過程を実際に考え経験することで、音(声)のみならず、自然界で生じる時間波形の計測、分析、変形、合成ができるようになり、産業界での応用範囲は非常に広いものとなります。

【就職先企業・職種】 情報通信(電話会社)、製造業(車メーカー、音響機器メーカー) など

研究内容


図1.音声コミュニケーションの基本(ことばの鎖)

図2.研究内容概観

<基本路線>

赤木研究室では、音声信号処理の研究を行っています。音声によるコミュニケーション(聞く・話す)は人間の基本的な営みなので、まず人間を知り、そして営みを模擬して計算機上に記述することで、高度の音処理システムの実現を目指しています。

<研究範囲>

図1は、音声によるコミュニケーション(聞く・話す)がどのような過程を経て行われているかを示しています。赤木研究室では、赤 線で囲った部分(話す:音声発話、実環境での音声伝播、聞く:音声知覚)を研究対象としています。このために、工学(ディジタル信号処理)だけではなく、医学・生理学・心理学・音響物理学、音声学などの分野との連携をとりながら研究を行っています。

<研究内容>

図2に研究内容を科学⇔工学・話す⇔聞くの2軸で示しています。 話す:機械の口がより賢くなるように、より自然な合成音をつくることを目的として、音声スペクトルと声道形状の関係、合成音への個人性・感情などの非言語情報の付与、歌声らしい歌声の合成などの研究を行っています。 聞く:雑音とか残響が存在する実環境でのヒトのすばらしい聴取能力を、少しでも機械の耳に与えて賢くするために、カクテルパーティ効果の実現、雑音中の音声強調などの研究を行っています。

主な研究業績

  1. Li, X. and Akagi, M. (2015). “Toward Improving Estimation Accuracy of Emotion Dimensions in Bilingual Scenario Based on Three-layered Model,” Proc. O-COCOSDA2015, Shanghai, 21-26.
  2. Akagi, M., Han, X., Elbarougy, R., Hamada, Y., and Li, J.(2014).“Toward Affective Speech-to-Speech Translation: Strategy for Emotional Speech Recognition and Synthesis in Multiple Languages,”Proc. APSIPA2014.
  3. Akagi, M. and Irie, Y.(2012). “Privacy protection for speech based on concepts of auditory scene analysis,” Proc. INTERNOISE2012, New York, 485.

使用装置

防音室,無響室,AVルーム 等

研究室の指導方針

赤木研究室では、研究テーマ持ち込み方式を採用しています。学生自らがやりたいと思った研究を、指導教員とディスカッションしながら、修士研究あるいは博士研究として育てていきます。自らが提案したテーマであるからこそ、自らその進捗に責任を持ち、成し遂げられると確信しています。また、皆さんが研究で競争する相手は世界中にいるので、博士後期課程だけではなく前期課程においても、できるだけ国際会議などで世界に挑戦してほしいと願っています。

[研究室HP] URL:http://www.ais.jaist.ac.jp/index-j.html

ページの先頭へもどる