1. HOME
  2. 電気・情報関連(専門)
  3. 研究情報(登録番号980)

高速高精度知的文字認識システムの開発

 情報化社会の中で計算機の利用が日常化するに伴い、従来から蓄積されてきた大量の文書の電子化が要請されている。実際、電子化辞書、論文データベース、特許情報データベースが作られ、また、計算機を介した点字翻訳が試みられるなど、この要請に答えるべく種々の研究が行われてきた。しかし、それらの研究は必ずしも十分でなく、まだ人手に頼るところが多く、文書として蓄積されているものをだれもが簡単に電子化できる状況に至っていない。文書の電子化を自動化する文字認識の研究は、パターン認識の典型的課題として既に20年余にわたって活発に行われてきた。しかし、字種数が多く字体が複雑な漢字に対しては正確で速い認識が得られているとは言い難く、満足すべき性能を得るために解決すべき課題が多く残されていた。

 木村正行氏と阿曽弘具氏は、このような現状を打開すべく研究を進め、従来の性能を大幅に上まわる認識精度および処理速度をもった文字認識システムを開発し、文書認識の基礎技術の確立に多大の貢献をした。

 文字認識の手法はパターン整合法と構造解析法とに大きく分けられる。パターン整合法は文字の大局的な特徴を把握するイメージ型の情報処理であり、入力文字パターンに加わる局所的外乱には強いが、パターンの細かな違いが決定的な影響を与える類似文字の区別には弱い。他方、構造解析法は文字を構成する線分間の局所的構造をとらえる論理型の情報処理で、パターンのわずかな違いも区別できる反面文字のつぶれやノイズに弱く、多数の候補字種との比較のために膨大な計算量を必要とし、高精度であっても実用的ではなかった。両氏は、このような現状に対して、人間の脳がイメージを処理をする右脳と論理的処理をする左脳と分担しつつ協調して情報処理を行っていることに着目し、文字認識においても両者を相互補完的に統合して実用的で高精度な認識を実現するというアイデアを提唱し、新しい認識システムとして実現した。本システムでは、イメージ型処理により未知文字の候補を絞り込んだ後論理型処理によりその候補の正しさを検証するという知的認識法を用いて、認識の高精度化を達成している。

 システムの高速化に関して、両氏は並列処理アーキテクチャの一つであるシストリックアレーに注目して、その設計法を研究してきており、この技術によりイメージ型情報処理の専用装置を設計している。すなわち、イメージ型処理アルゴリズムの各段階をシストリックアレーにより実現し、それらを縦続接続することでパイプライン的処理を実現し、二重の意味の並列処理により高速化を達成している。

 開発された知的認識システムSEIUNの主装置であるイメージ型処理装置は、印刷文書認識において3位までの累積認識率99.99%以上、最高毎秒約200文字の処理速度を達成している。これは、コピー機と同程度の速度で正確な文書認識を実現するものであり、文書の電子化の実用化に大きく貢献するものである。

 以上のように両氏は、認識率と処理速度の両面で従来のシステムより性能を1けた向上させた画期的な文字認識システムを開発し、イメージ型処理と論理型処理の統合という新たな文字認識技術を確立した。この成果は文書認識技術の進歩に大きく寄与している。

 この技術に対して、電子情報通信学会は、1992年、木村正行氏、阿曽弘具氏に業績賞を贈った。

関連する研究を検索

分野のカテゴリ

情報処理
(ヒューマン情報処理)

関連する出来事

データなし

世の中の出来事

1992
山形新幹線が開業する。
1992
ボスニア・ヘルツェゴビナが内戦状態となる。(ユーゴスラビア)

Webページ

データなし

博物館等収蔵品

データなし

キーワード

知的文字認識システム、パターン認識・理解
Page Top