1. HOME
  2. 電気・情報関連(専門)
  3. 研究情報(登録番号948)

音声分析合成方式の研究

 情報通信サービスの高度化に伴い、情報内容を音声の形で人間に伝えるための音声応答装置、ならびに効率的に音声を伝送する音声圧縮伝送方式の実現が望まれている。これを実現するためには、音声波形の分析により特徴パラメータを抽出し、これを基に再び音声波形を合成する技術(音声分析合成方式)が必要である。従来、音声分析合成方式として、PARCOR方式に代表される線形予測符号化方式が広く研究・開発されてきたが、情報伝送容量が4,800bit/s以下での合成音品質に問題があり、低ビット領域において高品質合成音の得られる新しい方式の出現が待たれていた。

 このような状況の中で、板倉文忠氏、管村昇氏は、PARCOR方式の諸問題を深く検討し、音声の特徴パラメータの一つとして、新たに線スペクトル対(Line Spectrum Pair,略してLSP)という概念を導出し、これを基礎にした音声分析合成方式を考案すると共に、その有効性を実証した。

 LSP方式においては、声道の周波数伝達関数を特徴づけるパラメータとして、従来のPARCOR係数の代りにLSPパラメータを用いる。LSPパラメータは、PARCOR係数で表現される格子形声道フィルタにおける声門での反射係数を±1(すなわち完全反射)とした場合の共振周波数の対として定義される。LSPパラメータからの音声の合成は、帰還路に一対の2次反共振セクションを含むディジタルフィルタをピッチパルス、あるいは雑音で駆動することにより行われる。

 本研究では、LSPパラメータの量子化と時間的補間(平滑化)の合成音品質に及ぼす影響に関して実験的検討を行い、LSP方式がPARCOR方式に比較して情報伝達量を約40%削減できることを定量的に予測し、これを合成音受聴による主観評価実験によって確認した。LSP音声合成用ディジタルフィルタは、PARCOR方式と同様にハードウェア化に適しており、そのLSI化が既に実現し、各種音声応答装置に導入されている。

 以上のように、LSP音声分析合成方式は、情報圧縮効果が高く、低い情報伝送量においても高品質な合成音声が得られる画期的方式である。又、LSP方式は従来の線形予測分析理論に新たな1ページを加えるものであり、今後の音声情報処理分野の発展に大きく寄与するものと考えられる。

 この技術に対して、電子通信学会は、1982年、板倉文忠氏、管村昇氏に業績賞を贈った。

関連する研究を検索

分野のカテゴリ

通信
(ヒューマンコミュニケーション技術)

関連する出来事

データなし

世の中の出来事

1982
ホテルニュージャパンで火災が起こる。
1982
東北新幹線・上越新幹線が開業する。

Webページ

データなし

博物館等収蔵品

データなし

キーワード

音声分析合成方式、LSP方式、PARCOR方式、音声・聴覚
Page Top