Laboratory

HOME > Laboratory

Missions

Missions

Projects

Projects

Schedule

Schedule

Members

Please join "@jaist.ac.jp" to the following account.

Staffs

Name title Email
Masashi UNOKI Professor unoki
Shunsuke KIDANI Lecturer kidani
Yasufumi UEZU Research Assistant Prof. y-uezu
Kai LI Researcher kai-li
Fumiyo AOYAMA Assistant fumiyo-a

Students

D = Doctor Course
M = Master Course

Name Grade Email
Takuto ISOYAMA D3 isoyama-t
Taiyang GUO D3 s2020009
Yuning LIU D3 s1920041
Huy Quoc NGUYEN D3 s2120430
Anuwat CHAIWONGYEN D3 s2120414
Khalid ZAMAN D1 s2220406
ZHOU Xiajie D1 s2420031
Yosuke MIYAZAKI M2 s2110167
WATANABE Rui M2 s2210191
OGURA Ryoya M2 s2310029
FUSANO Saki M2 s2310140
MURAKAMI Shogo M2 s2310159
ADILA Aulia M1 s2310401
LI Nopparut M1 s2310431
HOSHI Taiki M1 (Tokyo Sate.) s2330409

Internship

Name Period University Research topic
Rahmi Yuwan (Ami-san) 2013/9/9 - 2013/10/13 Bandung Institute of Technology, Indonesia Study of Speech Enhancement Techniques Based on Human Auditory Characteristics
Pongsathorn Panyanithisakul (Mick-kun) 2014/3/24 - 2014/5/31 Chulalongkorn University, Thailand
Nontawat Charoenphakdee (Nutt-kun) 2014/3/24 - 2014/5/31 Chulalongkorn University, Thailand
Varun KUMAR 2014/5/19 - 2014/7/25 IIT Kampur, India
Dipen SOMANI 2015/3/3 - 2014/3/6 IIT Gandihinage, India
Akshay Gadi Patil 2016/1/5 - 2016/2/22 IIT Gandihinage, India Study on Two Tone Suppression for Audio Watermarking Methods
Candy Olivia Mawalim 2017/1/10 - 2017/3/9 Institut Teknologi Bandung Study on Inaudible Audio Watermarking based on Phase Modulation on Gammatone Filterbank
Aouameur Cyran 2017/6/19 - 2017/8/17 LORIA, Universite de Lorraine Comparative evaluation of watermarking technique

Alumni

FY2023

  • ZHOU Di (D)
    Speech Encoding and Decoding Processing in the Brain During Speech Perception
  • OTA Yasuji (D)
    音質評価指標による産業機器の異常音検知に関する研究
  • LI Kai (D)
    Advanced Feature Representations Based on Spectro-Temporal Modulation Analysis and Its Applications
  • PUTRI Fanda Yuliana (M)
    Study on noise suppression based on spectro-temporal modulation
  • CHENG Haowei (M)
    Study on Deep-fake Speech Detection Based on Spectro-temporal Modulation Analysis
  • SHINTANI Koume (M)
    耳音響放射を用いた聴覚末梢系の時間分解能の評価
  • HIMEKOMATSU Yosuke (M)
    遅延聴覚フィードバックが日本語文章読み上げ課題における発話リズムに与える影響
  • TANIGUCHI Ryotaro (M)
    音質評価指標を用いた感覚的快さと感覚的快くなさの評価に関する調査
  • ZHOU Xiajie (M)
    Leveraging Equalization-Cancellation Model in Speech Intelligibility Prediction for Hearing Aids

FY2022

  • TRAN Kim Dung (D)
    Auditory Representation Using Matching Pursuit and Sparse Coding for Speech Fingerprint
  • ZHANG Kaili (M)
    Study on expressiveness of speech synthesis using multi-resolution modulation-filtered cochleagram
  • HOU Jie (M)
    Study on Lipreading Performance in Speech Learning for Hearing Impaired People
  • TANAKA Soichiro
    Investigation of the relationship between sound quality metrics and auditory saliency using Spectro-Temporal Modulation analysis
  • WANG Lijun (M)
    Method for blindly estimating stochastic model of room impulse response from reverberant speech
  • WANG Sicheng (M)
    Improvement of consonant emphasis method for bone-conduction speech intelligibility
  • ICHIKAWA ATSUKI (M)
    聴覚的スペクトル表現に基づいた音響ゼロ電子透かしと音声改ざん検出への応用
  • TITALIM Benita Angela (M)
    Study on Speech Intelligibility Prediction Method for Hearing-Impaired Listeners
  • INOUE Shunsuke (M)
    Study on the suppression method of the air-conducted sound by the bone-conducted sound
  • MIYAKE Kazuma (M)
    Estimate of selective listening ability using otoacoustic emission measured by different awareness

FY2021

  • ZHANG Zhuo (M)
    Study on EEG-based method for detecting short time auditory attentions
  • NGUYEN Quoc Huy (M)
    Study on auditory-filterbank-based features on improving sound quality and intelligibility of bone-conducted speech
  • GALAJIT Kasorn (D)
    Singular Spectrum Analysis-based Auditory Information Hiding with CNN-based Parameter Estimation for Speech Seccurity
  • DUANGPUMET Suradej (D)
    Blind Estimation of Room Acoustic Parameters and Speech Transmission Index Based on the Concept of the Modulation Transfer Function
  • ZHAO Bin (D)
    Investigation on the neural oscillatory mechanism of oral sentence reading
  • MAWALIM, Candy Olivia (D)
    Content and privacy protection methods for secure speech communication and its applications
  • ZHU Wenyu (M)
    Improvement of speech intelligibility of bone conduction devices by consonant emphasis
  • LIU Xioating (M)
    Study on relationship between modulation frequency range in temporal amplitude envelope and urgentcy perception of speech

FY2020

  • WIN La Pyae (M)
    Study on blind speech watermarking method based on spread-spectrum using linear prediction residue
  • Teruki TOYA (D)
  • Takami SAKAMOTO (M)
    Study on speech privacy protection with locally time-reversaing temporal amplitude envelope
  • Akitoshi KIDOKORO (M)
    Relationship between auditory saliency and spectro-temporal modulation informatoin
  • Shuhei FUJITA (M)
    A Study on a Method for Improving Word Comprehension of Presented Speech Using a Bone Guide Device
  • Rui WANG (M)
    Method for estimating monaural DOA and distance using modulation spectrum analysis
  • Seigo KURA (M)
    Study on anomaly sound detection using objective indices related to timbral attribute

FY2019

  • Candy Olivia MAWALIM (M)
    Study on audio information hiding based on cochleardelay characteristics
  • Toshihiro YAMAGUCHI (M)
    Study on method for estimating fundamental frequency using instantaneous amplitude and frequency in the time-frequency domain
  • Yukina HOSAKA (M)
    Study on pitch perception of noise-vocoded harmonic complex tones
  • Kosuke MIZUNO (M)
    Study on Abnormal Sound Detection Using Sound Quality Metrics
  • Nan LI (M)
    Study on robust voice activity detection using CNN encoder-decoderbased on MTF concept under noisy conditions
  • Mimbo CHEN (M)
    Study on the interactive patterns of dynamic functional network inauditory perception during listening task of utterance

FY2018

  • Kentaro MIWA(D)
    Robust F0 estimation based on amplitude modulation under noisy reverberant environments
  • Takuto ISOYAMA (M)
    Study on noise suppression method based on modulation perception mechanism
  • Miho KAWAMURA (M)
    How the temporal amplitude envelope of speech contributes to urgency perception
  • Reiya NAMIKAWA (M)
    Speech information hiding method based on spread spectrum using linear prediction residue
  • Tatsuya HATAKEYAMA (M)
    Study on the age perception focuses on the auditory perception mechanism

FY2017

  • Zhi ZHU (D)
    Contribution of temporal modulation cues on the perception of spkeaker individuality and vocal emotion
  • Surasak BOONKLA (D)
    Speech Analysis Method Based on Source-Filter Model Using Multivariate Empirical Mode Decomposition
  • Khanh Ngyuen BUI (M)
    Study of estimating DOA in 3D space using monaural modulation spectrium
  • Dung Kim TRAN (M)
    Study on speech fingerprints based on spikegram using sparse coding technique
  • Daisuke ISHIKAWA (M)
    Study on model of stochastic room impulse response and method for estimating parameters of its model

FY2016

  • Jessada KARNJANA (D) (NECTEC, Researcher)
    Audio Information Hiding Based on Singular-Spectrum Analysis with Psychoacoustic Model and Its Applications
  • Shota MORITA (D) (Fukuyama Univ.)
    Power-envelope processing systems for barrier-free communication under noisy reverberant environments
  • Teruki TOYA (M)
    Study on Effects of Auditory Feedback by Air-Conducted and Bone-Conducted Speech on Singing
  • Yuta KASHIHARA (M)
    Study on privacy protection for speech based on speech transmission index

FY2015

  • Nhut Minh NGO (D) (Ho Chi Minh City University of Science, Lecturer)
    Robust Audio Data Hiding Based on Dynamic Phase Manipulation and Its Applications
  • Shengbei WANG (D) (Tianjin Polytechnic University, Lecturer)
    Techniques for Speech Information Hiding and Its Applications
  • Yang LIU (D) (Tianjin University, Lecture)
    Restoration scheme of instantaneous amplitude and phase for speech enhancement based on modulation analysis

FY2014

  • Shogo MASAYA (M)
    Tensor factorization of complex modulation spectrogram using complex NMF for single-channel source separation
  • Akikazu MIYAZAKI (M)
    Study on Blind Method of Estimating Room Acoustic Characteristics from Noisy Reverberant Speech Signals
  • Zhi ZHU (M)
    Study on Speaker Individuality Contained in Temporal Envelope of Speech
  • Katsuhiko YAMAMOTO (M)
    Study on Perceptual Characteristics of Bone-Conducted Sound

FY2013

  • Masaru Ando (M)
    Study on DOA estimation method based on human ability of sound localization
  • Yasutaka Nishino (M)
    Study on redundancy contained in temporal amplitude envelope of Japanese speech
  • Kenichiro Miwa (M)
    Study on Fundamental Frequency Estimation of Noisy Reberverant Speech

FY2012

  • Kyohei Sasaki (M)
    Study on Estimation of Speech Transimission Index and Room Acoustics Without Measurement of Acoustics in Room
  • Nhut Minh Ngo (M)
    A study on data hiding scheme for digital audio in amplitude-modulati on domain
  • Yang Liu (M)
    Study on power envelope subtraction based on modulation transfer function

FY2011

  • Shunsuke KIDANI (D)
    「選択的聴取下における周波数選択性の変化に関する研究」
  • Yasuaki KANAI (M)
    「経験的モード分解と変調スペクトルを用いたロバストな音声区間検出 法に関する研究」
  • Yuta YANO (M)
    「背景雑音に対する報知音の振幅包絡の動きの違いが報知音検知に与え る影響」
  • Ryotaro HAYASHI (M)
    「表面筋電位信号からの前腕の動作・速度推定に関する基礎研究」
  • Takahiro IWAMOTO (M)
    「異常発火を起こす神経細胞群のトポロジーと学習に関する基礎研究」
  • Huu THIEN (M)
    「Effect of adaptive coupling on enhancement of cerebellar learning」
  • Hideaki FUJII (M, Tokyo)
    「位相応答曲線を用いた植物の時計遺伝子発現ネットワークモデルのパ ラメータ推定」

FY2009

  • Tomoki SAWAGUCHI (M)
    A study on a method of speech signal analysis using the Empirical Mode Decomposition
  • Shota MORITA (M)
    A survey of a method of restoration noisy reverberation for improving speech intelligibility

FY2008

  • Kota KINUGASA (M)
    A study on an MTF-based blind restoration method for bone-conducted speech
  • Yutaka YAMASAKI (M)
    A study on the noise suppression method based on the MTF concept

FY2007

  • Shunsuke KIDANI (M)
    Influence on frequency selectivity by existence of the cue sound
  • Misa KUSABA (M)
    A study on detectability of target signal in background noise by utilizing similarity of temporal envelopes in auditory search
  • Daiki HAMADA (M)
    Audio watermarking method based on the cochlear delay
  • Sota HIRAMATSU (M)

FY2006

  • Hideaki UCHIYAMA (M)
    A study on perception of alarm signals in car noise
  • Yohei SHIBANO (M)
    An examination of possibility of speech dereverberation using instantaneous amplitude
  • Toshihiro HOSOROGIYA (M)
    A study on a fundamental frequency estimation for reverberant speech based on the complex cepstrum analysis
  • Akiko MINOWA (M)
    A study on physical conditions for perceptual integration of speech signals based on auditory scene analysis
  • Yasuki MURAKAMI (M)
    A study on the input-output function of a nonlinear cochlear model based on a function of outer hair cell models

OTHERS

  • Toshizo KOSUGI (2010)
    Study on information hiding based on cochlear-delay characteristics for sound signals
  • Petrick, Rico
  • Ryota MIYAUCHI
  • Tan, Chin-Tuan
  • Vu, Tat Thang A Study on the Restoration of Bone-conducted Speech
  • Masato TOI (2004)
    A speech dereverberation method for improving speech intelligibility
  • Kenji KIMURA (2004)
    Study of improvement of Bone-conducted sound quality based on envelope processing
  • Keigo SAKATA (2002)
    A study on extracting speech features from reverberant speech and re-producting speech signal
  • Masaaki KUBO (2002)
    A study on the selective segregation of the target instrument sound from the mixed sound
  • Masakazu FURUKAWA (2001)
    Research on recovery of reverberation waveform power envelope by automatic estimation at reverberation time

Student Award

  • Atsushi Haniu (D2), Masashi Unoki, and Masato Akagi, "A study on a speech recognition method based on the selective sound segregation in noisy environment," Student Paper Award, 2005 RISP International Workshop on Nonlinear Circuits and Signal Processing, 2005/03/06
  • Josaku Nakanishi (M2), Masashi Unoki, and Masato Akagi, "Effect of ITD and component frequencies one perception of alarm signals in noisy environment," Student Paper Award, 2006 RISP International Workshop on Nonlinear Circuits and Signal Processing, 2006/03/05
  • Thang tat Vu (D3), Masashi Unoki, and Masato Akagi, "A study on blind model for restoring bone-conducted speech based on linear prediction scheme," Student Paper Award, 2008 RISP International Workshop on Nonlinear Circuits and Signal Processing, 2008/03/08
  • Daiki Hamada (M2) and Masashi Unoki, "An audio watermarking method based on the cochlear delay characteristics," Student Paper Award, 2008 RISP International Workshop on Nonlinear Circuits and Signal Processing, 2008/03/08
  • Sota Hiramatsu (M2) and Masashi Unoki, "A study on the blind estimation of reverberation time in room acoustics," Student Paper Award, 2008 RISP International Workshop on Nonlinear Circuits and Signal Processing, 2008/03/08
  • Kota Kinugasa (M2), "An MTF-based blind restoration method for improving intelligibility of bone-conducted speech," Student Paper Award, 2009 RISP International workshop on Nonlinear Circuits and Signal Processing (NCSP09), 2009/03/03
  • Yutaka Yamasaki (M2) "A study on the noise suppression method based on the MTF concept," 2009 RISP International workshop on Nonlinear Circuits and Signal Processing (NCSP09), 2009/03/03
  • Shota Morita (M2), "A study on the IMTF-based filtering on the modulation spectrum of reverberant speech," Student Paper Award, 2010 RISP International workshop on Nonlinear Circuits and Signal Processing (NCSP09), 2010/03/05
  • Tomoki Sawaguchi (M2) "A study on a method of speech signal analysis using the empirical mode decomposition and its applications," 2010 RISP International workshop on Nonlinear Circuits and Signal Processing (NCSP10), 2009/03/05
  • Tomohiro Ikeda (M2), "Study on blind estimation of Speech Transmission Index in room acoustics," Student Paper Award, 2011 RISP International workshop on Nonlinear Circuits and Signal Processing (NCSP11), 2011/03/01
  • Yasuaki Kanai (M2), "Study on Robust Voice Activity Detection Using Empirical Mode Decomposition and Modulation Spectrum Analysis," Student Paper Award, 2012 RISP International workshop on Nonlinear Circuits, Communications, and Signal Processing (NCSP12), 2012/03/04
  • Kyohei Sasaki (M2), "Study on Method of Estimating MTF/STI Using Generalized Room Impulse Response," Student Paper Award, 2013 RISP International workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP13), 2013/03/07

Brochures

For Students(PDF 3.1MB, in Japanese)

For Companies(PDF 1.8MB, in Japanese)

Lab Summary (PDF 0.7MB)

FAQ

Q.研究室を見学したいのですがどうすればよいですか?

まずは私にメールで連絡してアポをとってください. 都合が付けば私が案内します.私の都合が悪いときでも研究室メンバーが親切に研究室を案内します. 研究室にふらりと遊びにきてもらっても問題ありませんが,私が必ず居る保証はありません. 場所は情報1棟9Fです.エレベーターを降りてすぐのところです.

Q.赤木研究室との違いはあるのですか?

あります.研究プロジェクトや研究指導の仕方などですが非常に表現が難しいところです. 詳しくは研究室メンバーにお尋ねください(^^;).

Q.音や信号処理,プログラム等の知識がありませんが興味があるので入れますか?

君のやる気さえあれば配属できます.研究室配属後にしっかりと勉強してくれれば問題ありません. 必要な知識をつけるためのゼミなどを用意していますので安心してください.ただし,興味はあるけどゼ ミなどをやる気がまったく無い場合は,本人が非常に苦労することになるだけなので私としてはあまりお薦 めできません.m(_ _)m

Q.配属を希望しますがどのようにしたらいいですか?

まずは研究室に遊びにきて雰囲気を是非掴み取ってください.研究テーマだけで なく,指導教官・研究室メンバーとの相性も非常に重要なことだと思います.それで, もし気に入ってくれれば,配属希望の書類で第一希望を選んでください(^^;)

Q.研究室に入る前にどのような知識が必要ですか?

教官側の希望としては,I112, I114, I119, I212, I213, I225の知識を もっていてくれると非常にありがたいです(単位を取っているかどうかという 意味ではなく知識をもっているかどうかということです).必要な知識は配属後 からでも大丈夫ですので安心してください.それよりも,研究に取り組む姿勢や ガッツが一番重要な気がします.

Q.研究テーマはどのように決めているのですか?

原則,本人に自由に決めてもらっています.具体的テーマを絞り難い場合も ありますので,私の研究プロジェクトを紹介し,興味があれば一緒に研究す ることもあります.後期課程進学の学生には必ず本人に研究テーマを発見し てもらい,決めてもらっています.もちろんテーマ決めまでの間,じっくりと 話し合い決めていますので心配しないでください.例年ですと12月までに具 体的なテーマを決めています.

Q.ゼミやミーティングはどれくらいの頻度でありますか?

是非発表して欲しいと思います.修士(前期課程)の学生には義務づけして いませんが,博士後期課程の学生には義務付けています(論文がないと学位 をとれません).修士の学生も就職後にどのような研究をやっていたのか, 対外発表があるかどうかで印象がかなり違うと思います.余談ですが,鵜木 研1期生から現在まで,だいたい全員が日本音響学会春季研究発表会(3月 中旬)and/or NCSP(国際会議,3月上旬)で発表してもらっています.もち ろん研究室の成果発表ですので私の研究費で旅費等をサポートしています.

Q.学会での対外発表をするのですか?

原則,週1回のミーティングを行っています.主に進捗報告会になります. ゼミ(輪講)は,不定期になりますが時期を決めて週1,2回のペースで行 っています.配属後はしばらくゼミなどありませんが1-2期終了後から少しず つゼミなどをはじめていき,3月末の研究計画書を提出できるまでに必要な 知識を可能な限りつけてもらっています.

Q.どのような研究室行事(オフィシャル・アンオフィシャル)がありますか?

「研究室のスケジュール」をみてください。左側の黒文字が主な行事です. 右側の青文字が研究室のオフィシャル行事になります.アンオフィシャル な行事としては,ボーリング大会,飲み会などあります.主に体を動かす こととおいしいものを食べる・飲むことには研究と同様のエネルギーを使 っていると思います.詳しくは研究室メンバーに問い合わせてください.

Q.研究室の雰囲気はどのような感じですか?

遊びも本気

こんな感じです.和気あいあい楽しくやっています.

Q.休みはありますか?

原則,教員の休みにあわせて休暇をとってもらっています. もちろんカレンダーに合わせた祝日・土日はお休みですが, 研究室で研究・勉強することを妨げたりしません.例年です と,GW,8月上旬,お盆の夏季休暇,年末年始の冬季休暇は 比較的長めの休みをとらせてもらっています.

Q.アルバイトはできますか?している人はいますか?

家庭教師や塾講師などアルバイトをしている人はいます.本業の支障 にならない範囲であれば問題ないと思います.LA(ラボラトリ・アシ スタント:修士向け)やRA(リサーチ・アシスタント:博士後期課程 向け), TA(ティーチングアシスタント)などもありますので,運が よければ学内のアルバイトでそれなりの収入を得られます.赤木・鵜 木研究室は音を利用した研究をしているので,実験参加者として謝礼 をもらうこともあります.研究・勉強をしてお金をもらえるのですか ら一石二鳥ですよね!
(参考情報)私の研究プロジェクトに入ってもらった場合は,かなり 高い確率でLA/RAになってもらっています.

Q.就職活動は自由にできますか?

自由にしてもらってかまいませんが,学業(研究)に支障がでない 範囲でお願いできればと思います.お互い大人ですので,責任をも って自分の意思で行動してもらえればと思います.特に修士の学生 の場合,修了のための重要なイベント(研究計画書提出〆切,中間 審査,学位申請書提出〆切,修士論文提出〆切,最終審査会発表)と 就職活動が非常に高い確率で重なることが多いため,本人以上に私も 非常に心配しています.経験的にみて,研究成果をすごくあげた人ほ ど就職活動でもうまくいっていてすぐに優良企業から内定をとってき ているように思います.逆に就職活動をうまく出来ていない人は研究 も上手くできていない傾向にあるように思います.研究室メンバーOB /OGのところを一度みてもらえれば修了生がどういうところにいってい るかわかるかと思います.面接指導等については私のほうでも研究発 表を通じて指導しています.これは, 非常に心配な点でもあるでしょうから,ぜひ研究室メンバーとも相談 して鵜木研究室での就職活動の情報を正しくつかんでください.いろ いろなデマが飛び回っているかもしれませんのでだまされることがな ようにお願いします. m(_ _)m

Q.博士後期課程への進学も可能ですか?

もちろん可能です.私の研究室の後期課程学生はみな前期課程からの進 学者です.学外からの進学受け入れも可能です.興味がある場合は早め に声をかけてください.

Q.卒業後の進路は?

修了生のコーナーをご覧ください.修士修了になりますが, 皆よいところに就職していると思います.一番の誇りは1回 の就職活動で内定を得てきた人が非常に多いことかと思います. 後期課程の修了生をまだ輩出していませんが,みなアカデミッ クポジションを取れるように頑張っています.私も是非皆にそれ を掴み取ってもらいたいたいと思い,「熱く」応援しているところです.

TOP