1. HOME
  2. 電気・情報関連(専門)
  3. 研究情報(登録番号882)

PARCOR形音声分析合成方式の発明開発

 情報化社会の進展に伴い、コンピュータの利用分野は著しく拡大され、情報案内サービスの充実がますます高まっている。従来の情報案内サービス、たとえば電話計算による回答サービスでは、各種のことばを磁気ドラムに記録し、これから回答文を編集する方式が実用化されてきたが、これでは記憶容量から数百語が限度であった。そこでより多くの種類の情報案内サービスを行なうには、より多数の記憶と、情報の効率的な圧縮方法とが必要となってくる。斎藤収三氏、板倉文忠氏らは上記の技術的要請にこたえるものとして、音声の特徴パラメータとして、部分自己相関係数(Partial AutoCorrelation Coefficients,略してPARCOR係数、偏自己相関係数ともいう。)を用いた新しい音声分析合成方式を考案し、研究・開発を行なってきたものである。

 音声は、声帯や乱流によって生じた音源が、口や鼻などの共振で固有のスペクトル包絡をもつ音響信号に変わる過程で出ると考えられるので。よい音声を得るためには音源情報とスペクトル包絡情報を精度よく抽出し、合成することが必要となる。

 抽出を効率よく行なうために二氏らはPARCOR係数なる音声情報の相関係数を導入した。PARCOR分析器で音声信号を125μsごとにサンプリングして、一連のn個の信号から最小二乗法によってその直前および直後の信号振幅を予測し、この予測値と実際の値との差を求める。これを一定の時間(1フレーム15ms)に対して8個の情報として取出すもので、この情報がPARCOR係数である。PARCOR係数1個当り5ビットで表わすと合計8×5=40ビット、これに音源情報17ビットを加えて総計57ビットに圧縮できる。これは3,800b/sに相当し、PCM方式の56,000b/sと比較して約1/15となり、きわめて効率のよい圧縮をしたこととなる。

 音声合成は抽出と逆の過程をたどらせればよいわけで、可変周期のパルスと雑音を音源として加え、多段接続の遅延帰還ディジタルフィルタで相関を逐次加えてゆけば音声出力が得られる。このような方式は従来のパラメータ編集合成方式に比べて品質がよく、合成器を高速論理素子で構成すれば、多数の回線に同時応答することも可能なのが特徴である。

 以上のようにPARCOR形音声分析合成方式は、従来の録音編集形に比べて応答語彙数が多く、柔軟性に富む音声応答サービスが可能となる。また、この分析法は音声認識、話者識別等を用いた新しいサービスの生み出すことや、今後の情報案内サービスなどにおける技術向上へ寄与することが期待される。

この技術に対して、電子通信学会は、1973年、斎藤収三氏、板倉文忠氏に業績賞を贈った。


文献

[1] 板倉文忠,斎藤収三、偏自己相関関数による音声分析合成系、1969年、日本音響学会,音講論集,1969年10月
[2] 板倉,斎藤,西川,小池、PARCOR形音声応答装置、1970年、日本音響学会,音講論集,1970年5月
[3] F. Itakura and S. Saito、On the optimum quantization of feature parameters in the PARCOR speech synthesizer、1972年、On the optimum quantization of feature parameters in the PARCOR speech synthesizer", Proc. 1972 Conf. Speech Commun. Process. 434-437.

関連する研究を検索

分野のカテゴリ

通信
(ヒューマンコミュニケーション技術)

関連する出来事

1966年
音声スペクトルの自己回帰(全極型)モデルの最尤推定法の提案
1969年
偏自己相関係数(PARCOR)による音声分析合成系の発明
1979年
線スペクトル対(LSP)による音声分析合成方式の発明

世の中の出来事

1973
石油ショックが起こり、ガソリン・紙などが品不足となる。
1973
第4次中東戦争が始まる。

Webページ

データなし

博物館等収蔵品

データなし

キーワード

音声分析合成方式、PARCOR、偏自己相関係数、スペクトル包絡、線形予測、音声・聴覚、音声合成
Page Top