1. HOME
  2. 電気・情報関連(専門)
  3. 研究情報(登録番号1044)

音声認識技術の実用化に関する研究

 近年、社会のネットワーク化、グローバル化が進展する中で、音声インタフェースへの期待は、だれにでも使いやすい情報アクセスの手段を与えるものとしてますます高まっている。渡辺隆夫氏の研究は、こうした期待にこたえる音声インタフェース実現のための基盤技術に関する先駆的な研究であり、その研究成果は様々な用途で進められた音声インタフェースシステムの実用化のベースとなったものである。

 音声認識の研究は長い歴史を持ち実用化の試みは1980年代から行われていた。しかしながら、利用者が事前に認識対象単語をすべて発声して登録する必要があることや、不特定話者音声認識ではあらかじめきめられた10語程度の固定の離散単語認識に限られること等の技術的制約から、音声認識の実用化は一部の特定用途に限定されていた。こうした中で、ニーズにこたえて幅広く音声認識を利用できるようにするには、大語彙あるいは語彙を自由に設定・変更できる音声認識、特に不特定話者の連続音声認識技術の実現が望まれていた。

 同氏の研究では、大語彙の不特定話者の連続音声認識を実用レベルで実現することを目指し、コンパクトかつ高精度の音声認識方式である半音節を単位とする音声認識方式を提案、これを基本として実用に必須の次のような技術を確立した。
 ・事前に単語を登録発声する必要がなく自由に語彙を設定可能な大語彙音声認識
 ・自由に語彙を設定可能な大語彙認識をだれの声でも行える不特定話者音声認識
 ・不特定話者の大語彙認識を連続音声に対して行える高速コンパクトな連続音声認識
 ・不特定話者の大語彙連続音声認識を専用のハードなしにソフトウェアで実現できる高速コンパクトマッチング
 ・対象外の入力による誤動作を防止する対象外入力棄却
 ・利用者の少量の発声を用いて認識精度を向上させることができる話者適応、周囲雑音や電話回線ひずみなどがあっても認識性能を保つ環境適応
 本研究の成果をベースとして各種の音声認識システムの実用化が進められ、以下に示すように、様々な用途での音声インタフェースの利用の道が開かれた。不特定話者・大語彙・連続音声認識機能を実現した組み込み用途向け音声認識チップは携帯電話におけるネームダイヤル・音声操作、カーナビにおける音声操作、音声入力を利用したTVゲームなどに応用された。また、音声認識サーバは情報案内や予約サービスなどの電話音声応答システムに応用され、音声認識ソフトウェアはパソコン音声インタフェースや対話ロボットに応用された。耐騒音型の業務用音声認識装置はオークションや検査などオエーダエントリーシステムに応用された。

 特に、同氏の研究は、音声認識技術を自然言語処理技術と統合した自動通訳システムの実用化の進展に多大の貢献をし、音声認識・音声合成・翻訳技術を統合した旅行会話向けパソコン自動通訳ソフトや自動通訳携帯端末の実現に道を開いた。

 以上のように、同氏が音声認識の実用化に向けて先駆的に行った研究は音声インタフェースの実現に多大な貢献をもたらした。

 この技術に対して、電子情報通信学会は、2004年、渡辺隆夫氏に業績賞を贈った。


文献

[1] 渡辺隆夫、音声認識システムの構築における諸問題とその解決、1996年、信学論 (DII), J79-D2 No.12, pp.2022-2031
[2] 篠田浩一、磯健一、渡辺隆夫、音声認識のためのスペクトル内挿を用いた話者適応化、1994年、信学論(A), vol.J77-A, no.2, pp.120-127
[3] 渡辺 隆夫, 塚田 聡、音節認識を用いた尤度補性による未知発話のリジェクション、1992年、信学論(DII) Vol.J75-D-2 No.12 pp.2202-2009

関連する研究を検索

分野のカテゴリ

情報処理
(ヒューマン情報処理)

関連する出来事

データなし

世の中の出来事

2004
スマトラ沖で地震(M9.0)が発生し、死者・行方不明者数が30万人以上に上る。

Webページ

データなし

博物館等収蔵品

データなし

キーワード

音声認識、大語彙音声認識、連続音声認識、不特定話者認識、ヒューマンインタフェース、パターン認識・理解
Page Top