音声合成(読み)オンセイゴウセイ(英語表記)speech synthesis

翻訳|speech synthesis

デジタル大辞泉 「音声合成」の意味・読み・例文・類語

おんせい‐ごうせい〔‐ガフセイ〕【音声合成】

人工的に人間の音声を生成すること。録音された人の音声の断片を組み合わせる方法と、人の音声のスペクトルを模した波形を人工的に作る方法がある。機器類の操作ガイダンス、交通機関アナウンスパソコンなどによるテキストの読み上げなど、幅広い分野で利用される。

出典 小学館デジタル大辞泉について 情報 | 凡例

改訂新版 世界大百科事典 「音声合成」の意味・わかりやすい解説

音声合成 (おんせいごうせい)
speech synthesis

音声を人工的に作り出す処理を音声合成といい,これを実行する機械を音声合成器と呼ぶ。音声合成器は,その原理から,人の音声器官の動作を模擬する方法とそれ以外に大別される。

 記録に残る最初の音声合成器は1779年に作られた母音合成器で,ドイツのクラッチェンシュタイン,C.Kratzensteinによる。子音,母音ともに合成できたのは1791年で,ハンガリーのケンペレン,W.von Kempelenによる(図2)。これらは人の音声器官の動作を模擬する構造をもっている。この機械的構造の合成器が電気回路構造に代わったのは1939年で,アメリカのダッドリー,H.Dudleyによる(図3)。口腔の共鳴特性は数個の強勢な周波数成分,すなわちフォルマントで表されるので,共振周波数が変化できる数個の共振回路を帯域フィルターの代りに用いて,口腔の共鳴特性を模擬できる。この形式をフォルマント形音声合成器と呼ぶ。最近は口腔の共鳴特性を分析するのに線形予測分析が使われる。これは,音声波の現時点の振幅値が過去の複数個の時点での振幅値の重みつき線形和として予測できる,とする数学的モデルに基づくものである。そしてこのモデルの周波数特性は複数個の共振周波数をもつ電気回路の特性に等しい。よって音声入力の口腔の共鳴特性が簡単な演算により,統計的に最尤さいゆう)に推定できることになる。この線形予測形音声合成器の代表例にパーコールPARCOR形音声合成器がある。この合成器に用いる制御信号の情報量は,音声波形をそのまま表す場合の約1/20以下に減らすことができる。

 音声器官の動作を模擬する形式の合成器のほかに,音声波形における波形的冗長性を利用する音声合成器がある。音声波形ではほぼ同じ形の波形が繰り返されたり,音声パワーの急激な変動が少ないからである。これの代表例に適応形パルス符号変調形式や,適応形差分パルス符号変調形式の合成器がある。これは音声パワーの変動が緩やかであることを利用して情報量を波形のおよそ数分の1まで減らしている。前記の音声器官の動作を模擬する形式の合成器に比べると情報量の圧縮率は少ないが,合成された音声の音質が優れている。

 最近はいずれの形式の合成器もLSI化され,コンピューター音声出力や種々のアナウンス用に広く利用されている。このような装置を音声応答装置と呼ぶ。これでは,応答に用いる単語や文節を人間に発音させ,それを分析して,応答装置内の記憶装置に制御信号の形で記憶しておき,これで音声合成器を動作させている。しかし単語や文節を単位として記憶すると,語彙(ごい)数に応じた記憶容量が必要となる。少ない記憶容量で語彙数を増やすには単語の代りに音素や音節を単位にして制御信号を記憶することが考えられる。この応答装置を使うと書物に書かれた文字系列を読み取って音声を合成できる。このような合成を〈テキストからの音声合成〉とか,〈規則による合成〉と呼ぶ。この合成法では文字系列で表した単語や文節に,自然音声に類似のアクセントや抑揚などを付ける必要がある。この韻律的特徴を付与する規則が,現在まだ不完全であるので,この合成法の合成音質は一般に良くない。しかし盲人や聾啞者(ろうあしや)には有用である。
執筆者:


出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報

百科事典マイペディア 「音声合成」の意味・わかりやすい解説

音声合成【おんせいごうせい】

機械装置(音声合成器)を用いて文章を音声に変換すること。会話音は複雑な情報(アクセント,口調,男女年齢差,なまりなど)を含むが,微妙な差を一応捨象するとしても,文字を対象とする文法には含まれない各言語特有の音韻の配列規則を明らかにすることが基本的な前提となる。合成の技術的手段は2種類に分かれる。(1)言語音形成の物理的機構をまねる方式。たとえば声門からくちびるに至る声道部を,絶えず変化し制御される一つの音響回路として扱い,それに相似な制御可能電気回路を用いてスピーカーから人間そっくりの声を出す。米国のベル電話研究所では,こうした回路を数学的にモデル化し,音韻記号のようなものをコンピューターに与えて音波の波形を計算させる方式に成功。(2)音声分析に用いるソナグラフの図形を,逆に,また音になおすタイプの方式(プレーバック型合成)。音声の波は数十Hzから6000Hzぐらいまである。これを細かく小波長領域ごとに分解したものを音源波とし,制御図形を用いて各領域ごとに時々刻々強めたり弱めたりして母音・子音のフォルマント,音色,時間変化などを与え,再び合成する。最近はいずれの形式の合成器もLSI化され,コンピューターの音声出力や種々のアナウンス用に利用。
→関連項目ボコーダー

出典 株式会社平凡社百科事典マイペディアについて 情報

ブリタニカ国際大百科事典 小項目事典 「音声合成」の意味・わかりやすい解説

音声合成
おんせいごうせい
speech synthesis

コンピュータなどのシステム内にある文字情報から,それに対応する音声信号を電子工学的な手段によって合成してスピーカから出し,人に聞かせるための技術。使用する装置を音声合成装置 speech synthesizerという。ワードプロセッサで入力したテキストを読み上げさせて文章の校正に用いたり,電話を介しての情報サービス,視覚障害者用読書器のような福祉機器などに用いられている。高品質化と小型化・低価格化が進めば,オフィスや家庭のコンピュータのインターフェースとしての利用が期待される。音声合成には,あらかじめ録音した単語をつなぎ合わせる録音編集方式,単位の音声素片を連結する素片編集合成方式,音声を一度分析して情報要素に分解し,元の音声に復元する分析合成方式などがある。録音編集方式は任意の文章の出力が困難であるが,定型的な応答で十分な音声応答装置に使われる。コンピュータの処理能力が上がるにつれて,音と音のつながり部分のなめらかさの問題が解決された分析合成方式が使われるようになっており,文体のイントネーションをどのように与えれば自然に聞こえるかという問題もかなり解決された。分析合成方式は多くのシステムの研究,実用化が行なわれ,各種ボコーダ (voice coderからの派生語。音声信号からの符号化・復号化装置) ,パーコル方式などの方式がある。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

ASCII.jpデジタル用語辞典 「音声合成」の解説

音声合成

機械やコンピューターなどを利用して音声を人工的に生成すること。音声を合成するには、録音編集方式、分析合成方式、テキスト合成方式などがある。

出典 ASCII.jpデジタル用語辞典ASCII.jpデジタル用語辞典について 情報

世界大百科事典(旧版)内の音声合成の言及

【音声情報処理】より

…スペクトル分析は,通常フーリエ変換か線形予測分析により行われ,ピッチ抽出は自己相関分析により行われることが多い。
[音声合成]
 調音器官を円筒形の縦続接続で近似し,電気回路のシミュレーションで音声を生成したり,スペクトル包絡を特徴づける少数の強い周波数成分(低い方から第1フォルマント,第2フォルマント……という)から音声を生成する方法(声道アナログ方式,ターミナルアナログ方式)が研究されてきたが,このような近似的な生成法では,鼻にかかったような機械的な音になってしまう。そこで,最近では多数の典型的な音声波形(数千~数万種類)を蓄積しておき,これらを適当につなぎ合わせて音声を合成する手法が中心となっている(素片編集方式)。…

※「音声合成」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社「世界大百科事典(旧版)」

今日のキーワード

青天の霹靂

《陸游「九月四日鶏未鳴起作」から。晴れ渡った空に突然起こる雷の意》急に起きる変動・大事件。また、突然うけた衝撃。[補説]「晴天の霹靂」と書くのは誤り。[類語]突発的・発作的・反射的・突然・ひょっこり・...

青天の霹靂の用語解説を読む

コトバンク for iPhone

コトバンク for Android