北陸先端科学技術大学院大学 [JAIST] - 研究者総覧
現在ページ トップページ 所属別一覧表> 研究者紹介

研究者紹介

研究室
情報研究棟IS Building I 8F
TEL:1235
研究室ホームページ
 
 

Japanese

リポジトリ公開資料

共同研究等のお問い合わせは, 産学官連携総合推進センター

 

 

党 建武 (トウ タケシ) 教授
情報科学研究科(情報科学専攻・人間情報処理領域)

■学位

中国清華大学工学士 (1982),中国清華大学工学修士(1984),静岡大学工学博士(1992)

■職歴

中国天津大学コンピュータ科学と工学科助手(1984),同学科講師(1986),ATR人間情報研究所客員研究員(1992),同研究所主任研究員(1998)

■専門分野

音声情報処理,音声生成モデル,言語音声に関する認知機能,音声合成,音声認識

■研究テーマのキーワード

音声生成,音声合成,音声認識,生成と聴覚との相互作用、認知科学,

■研究課題

聴覚・調音・生理学的特徴を考慮した音声認識に関する研究
本研究では、従来の隠れマルコフモデル(HMM)に人間の優れた認識機能を取り入れて新しい音声認識方法の開発を図る。そのなか、人間の聴覚的特徴(周波数ごとに音声・雑音識別機能)を用いて雑音に頑健な認識方法の開発と、調音的特徴(調音結合の制約)を用いるMissing Speechの認識方法の検討及び、生理学的特徴(形状学的個人差)を利用した話者認識方法の研究を行う。
音声生成のメカニズムとそのモデル化に関する研究
人間の音声生成(特に感情を込めた会話音声の生成)のメカニズムはまだ十分に解明されていない。それを解明するため、MRIデータに基づいて構築した三次元的発話機構モデルを用い、発話目標から音声合成への過程、または音声波から発話目標への逆過程を模擬することにより、生理学的レベルと運動計画レベルの両面から、人間のメカニズムの真実に漸近する。生理学的な見地に基づいてその発話機構モデルを改善するのもこの研究の課題である。
音声認知科学に関する研究
音声認知は音声生成の逆過程とされている。人間の音声生成過程では、多数(理論的に無数)の発話状態が同じ音を生成することが可能であるため、音声認知過程には多意性の問題が生じる。この多意性問題の根本的な解決は音声研究の重大な課題の一つである。本研究室では、発話機構モデルを用い発話状態の安定性と生理学・形態学的制限などの観点から多意性問題の本質を考察しながら解決策を求める。
脳における言語音声のコミュニケーションに関する研究
脳における言語音声のコミュニケーションに関する仮説である音声知覚の運動理論により、音声の知覚過程は調音動作の内部表象あるいは知識を参照しながら実現している(Libermanら,1960, 1985)。本研究では、音響分析や生理学的計測と調音運動の観測などの手法を用いて音声知覚系と生成系との相互作用を解明することにより、その理論を検証すると共に発展させることを図る。

個性のある感情音声合成に関する研究
声の個性を決めるものは,生まれつき備わったもの(生理学的要素)と,習慣として身についたもの(社会的要素)とがある。本研究は,前者の要素をはじめとするすべての要素の表現とモデル化を行う。また、感情音声とは話者が意図的な制御による言語以外の情報を音声に添加されたものである。本研究では、我々が日常感情音声を生成するときの経験を発話機構モデルに適用することによって、分析・合成により感情音声に関する研究を行なう。
音声コミュニケーションのためのサイエンスとテクノロジ:音声生成過程とその逆過程ー認知
音声生成および音声知覚は人間同士の間での基本的な通信方式のひとつである。人間の上記のメカニズムを信号処理、生理学的観点、脳の活動などの側面から解明しその機能をコンピュータにより実現するのは、我々の究極目標である。

■研究業績

◇著書

  • Speech Analysis: The Production-Perception Perspective/Advances in Chinese Spoken Language Processing,C. H. Lee, et al.,,L. Deng and J. Dang,World Scientific ,2007,1-32
  • Physiological Articulatory Model for Investigating Speech Production: modeling and Control ,Qiang Fang, Jianwu Dang,ISBN-NR. 978-3639173871, VDM Verlag,2009/7

◇発表論文

  • Comparison of Emotion Perception among Different Cultures,J. Dang, A. Li, D. Erickson, A. Suemitsu, M. Akagi, et. al,coustics of Science and Technology,31,6,394-402,2010, 12
  • 発話機構モデルに基づく音声と調音状態との一対多の関係に関する考察,錦戸信和, 党建武,日本音響学会誌,67,1,1-12,2011, 1
  • Study of Control Strategy Mimicking Speech Motor Learning for a Physiological Articulatory Model,Xiyu Wu, Jianguo Wei and Jianwu Dang,Journal of Signal Processing,15,4,295-298,2011, 7

全件表示

◇講演発表

  • A method of speaker identification based on phoneme mean F-ratio contribution,Songgun Hyon, Hongcui Wang, Chen Zhao, Jianguo Wei, Jianwu Dang,Interspeech,Portland USA,2012,9
  • Discrimination between Natural and Unnatural Articulations based on Articulatory Structure,A. NISHIKIDO, S. KAWAMOTO and J. DANG,Proc. ISCSLP 2010,,Tainan, Taiwan,2010,12
  • Acoustic and Articulatory Analysis on Mandarin Chinese Vowels in Emotional Speech,A. LI, Q. FANG, F. HU, L. ZHENG, H. WANG and J. DANG,Proc. ISCSLP 2010,Tainan, Taiwan,2010, 12

全件表示

■学外活動

◇所属学会

  • アメリカ計算機学会,会員,2010-
  • 中国計算機学会,学術通信委員,2010-
  • 天津市計算機学会,副理事長,2010-

全件表示

◇国際会議主催状況

  • Symposium on Modeling of Speech and Audiovisual Mechanism,情報科学研究科・教授・党 建武; 情報科学研究科・教授・赤木,February 20-21, 2011,Ishikawa Lifelong Learning Center, Kanazawa, Ishikawa, Japan
  • The international academic exchange forum,情報科学研究科・教授・党 建武情報科学研究科・教授・赤木正人,2010,2,23-24,HighTech Center, Nomi, Ishkawa, Japan
  • The Third International Symposium on Biomechanics, Human Function and Information Science,情報科学センタ・教授・松澤照男情報科学研究科・教授・党 建武情報科学研究科・教授・赤木正人,2009,2,20-22,Ishikawa Lifelong Learning Centger, Kanazawa, Ishikawa, Japan

全件表示

◇その他の国際・国内貢献等

  • カナダのWaterloo大学,客員研究員,1998/08/01 - 1999/07/31
  • ATR人間情報科学研究部,非常勤研究員(2001-)
  • 仏国立科学研究センター音声通信研究所、グルノーブル工科大学、ステンダル大学,主任研究員,2002/10/01 - 2003/09/30

全件表示

■共同研究等希望テーマ

  • 生理学的モデルに基づいた摂食嚥下障害のシミュレーションとリハビリテーション
  • 発話運動シミュレータを用いた発話障害予測および発話訓練支援システムの研究
  • 音声生成メカニズムの観点から合成音声の音質の改善

全件表示