(a) わたり音の除去(ターゲット予測モデル)
[1] 赤木、古井(1986).”音声知覚における母音ターゲット予測機構のモデル化”、電子情報通信学会論文誌、J69-A, 10, 1277-1285.(電子情報通信学会論文賞受賞)
[2] Akagi, M. (1990). "Evaluation of a spectrum target prediction model in speech perception", J. of Acoust. Society of America, 87, 2, 858-865.
[3] Akagi, M. and Tohkura, Y. (1990). "Spectrum target presiction model and its application to speech recognition", Computer Speech and Language, 4, Academic Press 325-344.
[4] Aritsuka, T., Akagi, M. and Katagiri, S. (1991). "Speech recognition using spectrum target prediction model as a front-end processor", Speech Group Tech. Report, IEICEJ, SP91-36
(b) なまけ音の回復(文脈効果モデル)
[5] Akagi, M. (1992). "Psychoacoustic Evidence for Contextual Effect Models", In Tohkura, Y., Vatikiotis-Bateson, E. and Sagisaka, Y. Eds., Speech Perception, Production and Linguistic Structure, pp.63-78.
[6] Akagi, M. (1993). "Modeling of contextual effects based on spectral peak interaction", J. of Acoust. Society of America, 93, 2, 1076-1086.
[7] Akagi, M., van Wieringen, A. and Pols, L. C. W. (1994). "Perception of central vowel with pre- and post-anchors", Proc. Int. Conf. Spoken Lang. Process. 94, 503-506.
[8] 米沢、赤木(1997).”文脈効果のモデル化とそれを用いたワードスポッティング”、電子情報通信学会論文誌、J80-D-II, 1, 36-43.
(c) 音による情景解析のモデル
[9] 赤木正人(1995).”カクテルパーティ効果とそのモデル化”、電子情報通信学会誌解説, 78, 5, 450-453.
[10] 鵜木、赤木(1997).”雑音が付加された波形からの信号波形の一抽出法”、電子情報通信学会論文誌、J80-A, 3, 444-453.
[11] Unoki, M. and Akagi, M. (1997). "A method of signal extraction from noisy signal based on auditory scene analysis", Proc. CASA97, IJCAI-97, Nagoya, 93-102.
[12] Unoki, M. and Akagi, M. (1997). "A method of signal extraction from noisy signal", Proc. EUROSPEECH97, 2587-2590.
(d) 雑音除去
[13] Mizumachi, M. and Akagi, M. (1998). “Noise reduction by paired-microphones using spectral subtraction,” Proc. ICASSP98, II, 1001-1004
[14] Akagi, M. and Mizumachi, M. (1997). "Noise Reduction by Paired Microphones", Proc. EUROSPEECH97, 335-338.
(e) スペクトル包絡に含まれる個人性
[15] Kitamura, T. and Akagi, M. (1995). "Speaker individualities in speech spectral envelopes", J. Acoust. Soc. Jpn. (E), 16, 5, 283-289.
[16] Kitamura, T. and Akagi, M. (1996). "Relationship between physical characteristics and speaker individualities in speech spectral envelopes", Proc ASA-ASJ Joint Meeting, 833-838.
[17] 北村、赤木(1996).”連続音声中の母音に含まれる個人性について”、音響学会聴覚研究会資料、H-96-98
[18] 北村、赤木(1997).”単母音の話者識別に寄与するスペクトル包絡成分”、日本音響学会誌、53, 3, 185-191.
[19] 北村、赤木(1996).”単純類似度法による話者識別に適した周波数帯域の検討”、平成8年秋季音響学会講演論文、1-6-17.
(f) 基本周波数に含まれる個人性
[20] Akagi, M. and Ienaga, T. (1995). "Speaker individualities in fundamental frequency contours and its control", Proc. EUROSPEECH95, 439-442.
[21] Akagi, M. and Ienaga, T. (1997). "Speaker individuality in fundamental frequency contours and its control", J. Acoust. Soc. Jpn. (E), 18, 2 73-80.(日本音響学会論文賞受賞)
(g) 側音化構音の診断
[22] 赤木正人、高木直子、北村達也、鈴木規子、藤田幸弘、道健一(1996).”側音化構音の知覚と物理関連量”、電子情報通信学会技術報告、SP96-34.
[23] Akagi, M., Kitamura, T., Suzuki, N. and Michi, K. (1996). "Perception of lateral misarticulation and its physical correlates", Proc ASA-ASJ Joint Meeting, 933-936.
(h) 聴覚モデル
[24] 赤木正人 (1994).”聴覚フィルタとそのモデル”、電子情報通信学会誌解説, 77, 9, 948-956.
[25] Maki, K. and Akagi, M. (1997). "A functional model of the auditory peripheral system", Proc. ASVA97, Tokyo, 703-710.
[26] 牧、赤木、廣田(1998).“モデルに基づいた前腹側蝸牛神経核における母音に対するチョッパー型応答に関する検討”、音響学会聴覚研究会資料、H-98-50
[27] 伊藤、赤木(1998).”音源方向定位のための聴覚モデルの検討”、電子情報通信学会技術報告、SP97-138.
[28] 赤木正人(1998).”聴覚特性を考慮した波形分析”、日本音響学会誌, 54, 8, 575-581.
(i) 位相の知覚
[29] 赤木正人(1997).”位相と知覚 −人間ははたして位相聾か?−”、平成9年秋季音響学会招待講演論文、1-2-2.
[30] 赤木、安武(1998).“時間方向情報の知覚の検討 −位相変化の音色知覚に及ぼす影響について−”、電子情報通信学会技術報告、EA98-19.
(j) 符号化
[31] Nandasena, A.C.R. and Akagi, M. (1998). “Spectral stability based event localizing temporal decomposition,” Proc. ICASSP98, II, 957-960