1. HOME
  2. 電気・情報関連(専門)
  3. 研究情報(登録番号1033)

音・映像信号の高速探索技術に関する先駆的研究

 近年、インターネットの爆発的な普及や、ディジタル放送を初めとする放送の多チャンネル化などにより、膨大な音や映像コンテンツが我々の身の回りにはん濫するようになった。そのため、特定の音や映像がどこにあるかを探す技術へのニーズが急速に高まってきている。更に、この技術は、音や映像などのコンテンツが正しく流通しているかを監視する情報セキュリティの観点からも非常に重要である。

 従来、音や映像でコンテンツを探索する手法として、音響スペクトルや画像特徴を用いた特徴ずらし照合法が提唱されていた。しかしこれらの手法では計算量が膨大となるため、長時間の音や映像に対して実用的な処理時間で高精度の探索を行うことは困難であった。高速化のために、近似を導入したり、場当たり的に対象の性質を入れる手法が考えられるが、対象の性質が少し変化しただけで適用できなくなったり、そのパラメータの調整に手間取ったりすることが多かった。一方、透かし技術を用いてコンテンツを管理する技術もあるが、IDコードの付与や管理が必要である。そのため既存のコンテンツを含めてすべてのコンテンツにIDを付与し、それを管理することを早期に実現することは困難である。

 「学習アクティブ探索法」は、長時間の音や映像から、特定の音や映像がどこにあるかを超高速に探す手法である。従来とは異なる開発アプローチが取られ、総当たりで探索した場合と厳密に同じ精度を保証したまま、数学的な原理によりどこまで高速化が可能かを追求した。その結果、音や映像などのマルチメディアに対し、パラメータ調整も不要な非常に使いやすい高速、高精度な探索アルゴリズムが達成できた。また、音や映像のパターンそのものを用いた手法であるので、既存の音や映像の探索にもすぐに適用可能である。本手法は以下に示す性質を同時に満たすという革新的な特長を持つ。
 (1)高速な探索
 探索に用いる特徴の代数学的な性質を用いて、照合のスキップ量を理論的に決定する原理を導出した。これにより精度を保証したまま、従来法(特徴照合法)の600倍の速度で探索が可能である。例えば60時間分の音や映像を1秒以下で探索することができる。
 (2)高精度な探索
 品質の変化を学習する原理を考案したことにより、品質の劣化した信号(例えばAMラジオ品質の音や、コマ落ちした映像)に対しても正しく高速探索可能である。
 (3)音にも映像にも対応可能
 任意の時系列信号に対して適用可能な技術であるため、音、映像のいずれでも、またその両方を用いての探索も可能である。

 本手法は、インターネット、映像アーカイブ、テレビ放送、ラジオ放送、携帯電話を通した映像や音響信号検索などコンテンツ業界や通信業界において幅広い応用範囲がある。現在、この手法を用いたシステムは多くの分野で実際に利用されている。例えば、テレビ放送中のCMを調査しCM関係の統計分析を行うシステムが24時間体制で稼働中である。また全国40局以上のFM局においてそのときの流れている音楽を数万曲の音楽データベースからリアルタイムで検索しその情報を配信するサービスも運用されている。また、インターネットなどでのコンテンツの著作権管理システムへの利用も検討されている。

 以上のように、村瀬洋氏、柏野邦夫氏、黒住隆行氏の開発した音や映像の高速探索法は、新しい発想に基づき、従来法では達し得なかった高速性と高精度の両立を実現したものであり、本技術によりコンテンツ業界や通信業界における新しいサービスを開拓し、世の中に大きなインパクトを与えた。

 この技術に対して、電子情報通信学会は、2001年、村瀬洋氏、柏野邦夫氏、黒住隆行氏に業績賞を贈った。

関連する研究を検索

分野のカテゴリ

情報処理
(情報処理理論)

関連する出来事

データなし

世の中の出来事

2002
日韓で第17回サッカーワールドカップが開催される。
2002
欧州単一通貨「ユーロ」が12カ国で流通開始する。

Webページ

データなし

博物館等収蔵品

データなし

キーワード

音・映像信号の高速探索技術、パターン処理
Page Top