北陸先端科学技術大学院大学 [JAIST] - 研究者総覧
現在ページ トップページ 系別一覧表> 研究者紹介

研究者紹介

研究室
情報研究棟IS Building I 8F
TEL:1235
研究室ホームページ
領域ホームページ
 

Japanese

リポジトリ公開資料

共同研究等のお問い合わせは, 産学官連携総合推進センター

 

 

党 建武 (トウ タケシ) 教授
情報科学系、ヒューマンライフデザイン領域

■学位

中国清華大学工学士 (1982),中国清華大学工学修士(1984),静岡大学工学博士(1992)

■職歴

中国天津大学コンピュータ科学と工学科助手(1984),同学科講師(1986),ATR人間情報研究所客員研究員(1992),同研究所主任研究員(1998)

■専門分野

音声情報処理,音声生成モデル,言語音声に関する認知機能,音声合成,音声認識

■研究テーマのキーワード

音声生成,音声合成,音声認識,生成と聴覚との相互作用、認知科学,

■研究課題

聴覚・調音・生理学的特徴を考慮した音声認識に関する研究
本研究では、従来の隠れマルコフモデル(HMM)に人間の優れた認識機能を取り入れて新しい音声認識方法の開発を図る。そのなか、人間の聴覚的特徴(周波数ごとに音声・雑音識別機能)を用いて雑音に頑健な認識方法の開発と、調音的特徴(調音結合の制約)を用いるMissing Speechの認識方法の検討及び、生理学的特徴(形状学的個人差)を利用した話者認識方法の研究を行う。
音声生成のメカニズムとそのモデル化に関する研究
人間の音声生成(特に感情を込めた会話音声の生成)のメカニズムはまだ十分に解明されていない。それを解明するため、MRIデータに基づいて構築した三次元的発話機構モデルを用い、発話目標から音声合成への過程、または音声波から発話目標への逆過程を模擬することにより、生理学的レベルと運動計画レベルの両面から、人間のメカニズムの真実に漸近する。生理学的な見地に基づいてその発話機構モデルを改善するのもこの研究の課題である。
音声認知科学に関する研究
音声認知は音声生成の逆過程とされている。人間の音声生成過程では、多数(理論的に無数)の発話状態が同じ音を生成することが可能であるため、音声認知過程には多意性の問題が生じる。この多意性問題の根本的な解決は音声研究の重大な課題の一つである。本研究室では、発話機構モデルを用い発話状態の安定性と生理学・形態学的制限などの観点から多意性問題の本質を考察しながら解決策を求める。
脳における言語音声のコミュニケーションに関する研究
脳における言語音声のコミュニケーションに関する仮説である音声知覚の運動理論により、音声の知覚過程は調音動作の内部表象あるいは知識を参照しながら実現している(Libermanら,1960, 1985)。本研究では、音響分析や生理学的計測と調音運動の観測などの手法を用いて音声知覚系と生成系との相互作用を解明することにより、その理論を検証すると共に発展させることを図る。

個性のある感情音声合成に関する研究
声の個性を決めるものは,生まれつき備わったもの(生理学的要素)と,習慣として身についたもの(社会的要素)とがある。本研究は,前者の要素をはじめとするすべての要素の表現とモデル化を行う。また、感情音声とは話者が意図的な制御による言語以外の情報を音声に添加されたものである。本研究では、我々が日常感情音声を生成するときの経験を発話機構モデルに適用することによって、分析・合成により感情音声に関する研究を行なう。
音声コミュニケーションのためのサイエンスとテクノロジ:音声生成過程とその逆過程ー認知
音声生成および音声知覚は人間同士の間での基本的な通信方式のひとつである。人間の上記のメカニズムを信号処理、生理学的観点、脳の活動などの側面から解明しその機能をコンピュータにより実現するのは、我々の究極目標である。

■研究業績

◇著書

  • 進化するヒトと機械の音声コミュニケーション・第3編音声合成:(総説)音声合成技術の現状と展望,党 建武,株式会社ニッケイ印刷,2015,125-140
  • Speech Analysis: The Production-Perception Perspective/Advances in Chinese Spoken Language Processing,C. H. Lee, et al.,,L. Deng and J. Dang,World Scientific ,2007,1-32
  • "Observations About Articulatory, Acoustic and Perceptual Characteristics of Laugh and Smile Speech in Comparison with Sad and Neutral Speech” In Trouvain, Jürgen & Campbell, Nick (eds.), Phonetics of Laughing, ,,Donna Erickson, Takaaki Shochi, Caroline Menezes and Jianwu Dang,Universaar – Saarland University Press: Saarbrücken, Germany.,2014/5/18,1–29

全件表示

◇発表論文

  • Chinese speech information processing in the Internet age: From representation to understanding,Jianwu Dang, Qinghua Hu, and Hui Feng,Science,Supplement,53-58,2014/12
  • Correlation between three-dimensional visual depth and N2 component: Evidence from event-related potential study,Baolin Liu, Xianyao Meng, Guangning Wu, Jianwu Dang,Neuroscience,Vol. 237,161-169,2013/05
  • Strength of syllabic influences on articulation in Mandarin Chinese and French: Insights from a motor control approach,Liang Ma, Pascal Perrier, and Jianwu Dang,J. Phonetics,,(Accepted)

全件表示

◇講演発表

  • Multiple Language Processing based on the Mechanism of Speech Production,Jianwu Dang,The 14th symposium on Chinese Minority Language Information Processing,Lanzhou, China,2013/09/13-15
  • Discrimination between Natural and Unnatural Articulations based on Articulatory Structure,A. NISHIKIDO, S. KAWAMOTO and J. DANG,Proc. ISCSLP 2010,,Tainan, Taiwan,2010,12
  • An MRI-based Acoustic Study of Mandarin Vowels,Yuguang Wang, Jianwu Dang, Xi Chen, Jianguo Wei, Hongcui Wang, Kiyoshi Honda,INTERSPEECH 2013,Lyon, France,2013/08/26-29

全件表示

■担当講義

基礎情報数学

■学外活動

◇所属学会

  • 中国自動化学会,学会誌編集委員,2013-2015
  • 天津市計算機学会,副理事長,2010-
  • アメリカ計算機学会,会員,2010-

全件表示

◇国際会議主催状況

  • International workshop on perception and representation of intention involved in spoken language,情報科学研究科・教授・党建武,2013/02/05,HighTech Center, Ishikawa, Japan
  • Symposium on Modeling of Speech and Audiovisual Mechanism,情報科学研究科・教授・党 建武; 情報科学研究科・教授・赤木,February 20-21, 2011,Ishikawa Lifelong Learning Center, Kanazawa, Ishikawa, Japan
  • The international academic exchange forum,情報科学研究科・教授・党 建武情報科学研究科・教授・赤木正人,2010,2,23-24,HighTech Center, Nomi, Ishkawa, Japan

全件表示

◇その他の国際・国内貢献等

  • 日本音響学会,会員(1989−)
  • アメリカ音響学会,会員(1993-)
  • カナダのWaterloo大学,客員研究員,1998/08/01 - 1999/07/31

全件表示

■共同研究等希望テーマ

  • 発話運動シミュレータを用いた発話障害予測および発話訓練支援システムの研究
  • 生理学的モデルに基づいた摂食嚥下障害のシミュレーションとリハビリテーション
  • 音声生成メカニズムの観点から合成音声の音質の改善

全件表示