1. HOME
  2. 電気・情報関連(専門)
  3. 研究情報(登録番号894)

音声認識技術の研究開発

DPマッチングによる時間正規化

図1 DPマッチングによる時間正規化

連続単語音声認識装置DP-100

図2 連続単語音声認識装置DP-100

不特定話者音声認識装置SR-1000

図3 不特定話者音声認識装置SR-1000

 従来の実用レベルの単語音声認識装置は、特定話者用で、かつ単語間に休止を置いて発声された単語音声(離散単語)を対象とするものに限られていた。このため、応用分野は限定され、音声認識装置が広く普及する上での障害の一つとなっていた。

 加藤康雄氏、千葉成美氏、迫江博昭氏は、このような状況にあった単語音声認識技術を、連続単語認識の方向および不特定話者用音声認識の方向に拡張すべく研究開発を行い、所期の目標どおり、それぞれ連続単語認識装置および不特定話者用音声認識装置として製品化に成功した。

 連続単語認識に関しては、当初から一貫して単語標準パターンとの時間正規化マッチングにより、連続的に発生された単語列を認識する方式を追求し、その過程でDPマッチング法、およびそれらを更に発展させた2段DPマッチング法を開発した。これは、動的計画法(DP)の原理を利用して、単語レベルの最適な時間正規化マッチングと、その上位の単語列レベルのマッチングの2段階にわたり最適化を行う方式である。これにより信頼度の高い連続単語認識が実現された。

 この方式は、1978年(昭和53年)にDP-100音声入力装置として製品化された。これは世界で初の連続音声認識装置として、より自然な音声入力用、あるいは高速音声データ入力用に用いられ、内外で高い評価を得ている。

 不特定話者用音声認識に関しては、単語音声の統計的に独立な特徴パラメータに関してベイズ判定を行う認識方式を開発し、その後さらに柔軟性に富む識別関数による認識方式を開発した。これは、特徴パラメータ空間における多数の話者の発生による各単語の学習サンプルの分布を、互いに完全に分離するような区分的線形認識関数を線形計画法を利用して計算しておき、それを用いて未知単語音声の認識を行う方式である。これによって、比較的簡単な特徴パラメータ抽出によっても、多数の学習サンプルを使用すれば原理的に高い認識率が実現できることを示した。

 この方式をベースとする不特定話者用音声認識方式研究が通産省の大型プロジェクトの一環として行われた外、平行して実用化の検討が進められ、1980年(昭和55年)にSR-1000シリーズとして製品化された。これは、初の本格的な不特定話者用音声認識装置として、銀行の電話サービスに利用された。

 この技術に対して、電子通信学会は、1981年、加藤康雄氏、千葉成美氏、迫江博昭氏に業績賞を贈った。


文献

[1] 加藤康雄, 千葉成美, 永田邦一、数字音声認識装置、1964年、電気通信学会雑誌, 47巻, 9号, pp.172-178
[2] 迫江博昭, 千葉成美、動的計画法を利用した音声の時間正規化に基づく連続音声認識、1971年、日本音響学会誌, 27巻, 9号, pp.483-490
[3] 千葉成美, 亘理誠夫, 渡辺隆夫, 鶴田七郎, 迫江博昭, 加藤康雄、特定音声認識の研究開発、1977年、大型プロジェクトパターン情報処理システム講演会論文集, 135-143 (1977年7月)
[4] H. Sakoe and S. Chiba、A Dynamic Programming Algorithm Optimization for Spoken Word Recognition、1978年、IEEE Trans. on Acoust., Speech and Signal Proc., Vol. ASSP- 26, No. 1, pp. 43-49
[5] H. Sakoe、Two-Level DP-Matching --- A Dynamic Programming Based Pattern Matching Algorithm for Continuous Speech Recognition、1979年、IEEE Trans. on Acoust., Speech and Signal Proc., Vol. ASSP-27, No. 6, pp. 588-595
[6] 千葉成美,亘理誠夫,渡辺隆夫、音声認識システム、1980年、大型プロジェクトパターン情報処理システム研究開発成果発表会論文集,157-165(1980年10月)
[7] S. Tsuruta, H. Sakoe, S. Chiba and T. Nakada、Connected Speech Recognition System DP-100、1981年、NEC Rsearch & Development No. 56, pp. 89-94
[8] 千葉成美,亘理誠夫,渡辺隆夫他、バンキング用電話音声認識応答システム、1981年、電子情報通信学会情報システム部門全国大会,652(昭和56年10月)
[9] Y. Kawakami, H. Ishizuka, M. Watari, H. Sakoe and T. Iwata、A Microprocessor for Speech Recognition、1985年、IEEE Journal on Selected Areas in Communications, Vol. SAC-3, No.2, pp.377-383
[10] Seibi Chiba, Masao Watari and Takao Watanabe、A speaker-independent word-recognition system using multiple classification functions、1987年、Computer Speech and Language(1987),2,13-26

関連する研究を検索

分野のカテゴリ

通信
(ヒューマンコミュニケーション技術)
通信
(情報システム)

関連する出来事

1973年4月1日
通産省大型プロジェクトパターン情報処理システム(PIPS) 特定音声認識の研究
1977年4月1日
通産省大型プロジェクトパターン情報処理システム(PIPS) 音声認識サブシステムの開発

世の中の出来事

1981
神戸で博覧会「ポートピア’81」が開幕する。
1981
スペースシャトル初飛行

Webページ

データなし

博物館等収蔵品

データなし

キーワード

音声認識、DPマッチング、識別関数法、音声ヒューマンインタフェース、2段DPマッチング、線形計画法、音声・聴覚、パターン認識・理解
Page Top