1. HOME
  2. 電気・情報関連(専門)
  3. 研究情報(登録番号967)

文字・音声認識の研究開発と実用化

手書き郵便番号の認識方法:文字"8"の例

図1 手書き郵便番号の認識方法:文字"8"の例

郵便宛名住所認識の流れ

図2 郵便宛名住所認識の流れ

不特定話者電話音声認識方法

図3 不特定話者電話音声認識方法

 情報化社会の進展につれて一般の人々がコンピュータと直接、間接にかかわる機会が増え、両者間の情報交換・アクセスを人間主体で円滑に行う手段の実現が強く望まれている。パターン認識はこの要請にかなうものであるが、人間が生成する文字や音声のパターンはその変形が非常に多様であり、一面的な方法では高精度で安定な性能を出すことは困難である。

 渡辺貞一氏、坂井邦夫氏は、この問題に早くから取り組み、変形の多い手書き文字、数千種からなる漢字パターン、更に不特定多数者の音声パターンの認識を通じて上記の問題を解決する新しい方法論を提唱し、文字と音声を高い精度で統一的に認識することを可能にすると共に、これを実用装置に組み込んでその有効性を明かにした。

 渡辺貞一氏は、パターン認識の大きな流れである重ね合せ法と構造解析法が、パターンの変形や雑音に対して長短相補う性質を持つことに着目し、両者を組み合せれば高性能で信頼性の高い認識システムを構築できることを提案した。そして、重ね合せ法を用いて候補パターンを選択し、選択された候補パターンを構造解析法を用いて詳細に判別する新しい認識方式を開発し、文字と音声の認識に応用した。同氏はまず手書き文字と活字文字とが混在して現れる郵便番号の読取りに活用され、郵便番号読取装置の開発と実用化を促進した。

 一方、坂井邦夫氏は、上記の認識方法を活字漢字認識にも適用し、階層構造認識システムという漢字パターン認識の基本的枠組みを構築した。この方法は文字種が多く形状が複雑で類似文字が多い漢字認識を候補文字選択、個別認識、後処理の3階層で解決している。特に後処理は、文字パターン認識のあいまいさを言語レベルの知識を使って取り除こうとするもので、文字認識の範囲を個々の文字から文字列に拡張させたところに大きな意義がある。

 両氏は、その後、漢字認識の研究成果を広く社会に実用化することに尽力され、現在、金融機関の窓口事務処理や生命保険・損害保険の入力に使われている手書き漢字OCRの実現の礎を作った。

 渡辺貞一氏は、また前記の認識方法を音声認識の分野にも拡張し、同一手法で不特定話者の音声単語認識が可能なことを示した。すなわち、ハイブリッド構造マッチング法と称する汎用な方式を開発し、電話回線を経て入力される不特定多数の単語音声を高精度に認識することを可能にした。両氏は、この成果を、銀行業務における各種の問合せ応答の電話サービスに応用し、電話音声認識応答システムとして実用化し、その普及に尽力した。

 以上のように、文字・音声認識の基礎的な方式の研究と幅広い応用開発に取り組み、世界に先がけ新しい応用分野を開いた。

 この技術に対して、電子情報通信学会は、1989年、渡辺貞一氏、坂井邦夫氏に業績賞を贈った。


文献

[1] H. Genchi, K. Mori, S. Watanabe, and S. Katsuragi、Recognition of Handwritten Numerical Characters for Automatic Letter Sorting、1968年、Proc. of IEEE, Vol.56, No.8, pp.1291-1301, 1968
[2] S. Watanabe, Y. Nakamura, M. Suda, K. Ohi, K. Yura, H. Sasaki, N. Takagi, and A. Tanaka、Kanji Character Recognition and its Application to Address Reading、1988年、Proc. of Advanced Technology Conference, pp.828-841, 1988
[3] Y. Takebayashi, H. Shinoda, H. Asada, T. Nitta, S. Hirai, and S. Watanabe、Telephone Speech Recognition Using a Hybrid Method、1984年、Proc. of IEEE International Conference on Pattern Recognition, pp.1232-1235, 1984

関連する研究を検索

分野のカテゴリ

情報処理
(ヒューマン情報処理)

関連する出来事

データなし

世の中の出来事

1989
昭和天皇が崩御する。
1989
消費税がスタートする。

Webページ

データなし

博物館等収蔵品

データなし

キーワード

文字認識、音声認識、パターン認識・理解
Page Top