自然言語処理(読み)シゼンゲンゴショリ(英語表記)natural language processing

デジタル大辞泉 「自然言語処理」の意味・読み・例文・類語

しぜんげんご‐しょり【自然言語処理】

人間が日常的に使っている日本語や英語などの自然言語コンピューターで扱う処理技術の総称。機械翻訳音声認識などをさす。自然言語技術NLP(natural language processing)。

出典 小学館デジタル大辞泉について 情報 | 凡例

改訂新版 世界大百科事典 「自然言語処理」の意味・わかりやすい解説

自然言語処理 (しぜんげんごしょり)
natural language processing

コンピューターや情報科学の分野では,プログラム言語などの人口言語に対立させて,人間の言語のことを自然言語と呼び,自然言語をコンピューターで取り扱う技術をひろく自然言語処理と称している。自然言語をコンピューターで処理するためには,まず文字をコンピューター端末装置から打ちこんだり,自動文字読取装置を用いたりする。自然言語処理の例としては,コンピューターに入れた文字データから単語を切り出してアイウエオ順にならべなおしたり,文字や単語の出現頻度を計数したりする,いわゆる字づら処理string processingと,さらに高度な処理として文の構造や意味の解析をしたり,他言語へ自動翻訳したりする仕事がある。その結果はブラウン管に表示したり,印字出力したり,音声出力したりする。自然言語処理をコンピューターで行うことは,言語データが大量である場合の整理に必要となるばかりでなく,これからの情報化社会において情報を種々の観点から活用しようとする場合の機能として必要欠くべからざるものとなりつつある。言語の機械翻訳や人間と機械との間で自然な形の対話を行うシステムを考えることは,人間の知的機能の代行として興味あるテーマである。

コンピューターが発明された1940年代中ごろに,すでにコンピューターは数字だけでなく文字が扱え,英語とフランス語との間などで言語の機械翻訳が可能であるということが提唱され,60年代の中ごろまでの間,機械翻訳は活発に研究された。その後一時中断したが,最近または活発に研究されるようになってきた。機械翻訳のように文の構造や意味を扱わねばならない難しい言語処理のほかに,先に述べた字づら処理に関する研究も着実に進展してきた。最近はワードプロセッサーの発達によって,あらゆる言語情報をコンピューターに入れて取り扱う時代となってきており,自然言語処理はこれからの情報化社会の中心的技術となってきている。新聞や本など編集,組版などもコンピューターで行われるようになってきたし,キャプテン・システムなどのマス・メディアにおいても自然言語処理が重要であり,膨大な言語情報の検索システム,各種問合せシステムも使われるようになってきつつある。

大量の言語データ中に現れる異なった単語をすべて取り出し,それらの出現頻度を計数すること,単語をアイウエオ順にならべなおすこと(ソーティング)が字づら処理の基本である。英語の単語についてはジップZipfの法則と呼ばれる経験則がある。これは単語を出現頻度の大きい順に1から順位をつけると,順位×頻度=一定という関係がほぼ成りたつというものである。テキスト中に現れる単語をアルファベット順にならべるとき,その単語の前後の単語列をいっしょに付けて打ち出すKWIC(keyword in context)は,文脈の中で単語をみたいという場合によく用いられる。文の解析は,形態素解析構文解析,意味解析,文脈処理などの異なったレベルが考えられる。形態素解析は単語の活用語尾や複数形,接頭語接尾語などを認識し,単語の原形を確定するプロセスである。構文解析は主語,述語,目的語,補語,修飾語など,文の構造を確定することである。意味解析,文脈処理は,単語の意味,文の指す内容などを確定するために必要な処理であるが,この部分はまだよく研究されていない。文の生成は文の解析の逆のプロセスであるとみなせる。

ワードプロセッサーは自然言語処理技術の応用システムとして最も普及したものである。印刷するときのテキストの形式をととのえるテキストエディターのほかに,日本語の場合は,かな鍵盤入力から漢字かなまじり文の列に変換するために,膨大な単語辞書と単語相互間の接続表をもっている。情報検索システム,機械翻訳システム,コンピューターの中に入れて使われる電子辞書などのほかに,人間が情報システムに自然言語の文で話しかけたときに,うまく対話をしながらその人の要求をみたす対話システムなども研究されている。
執筆者:

出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報

日本大百科全書(ニッポニカ) 「自然言語処理」の意味・わかりやすい解説

自然言語処理
しぜんげんごしょり

コンピュータの出現により、プログラミングのための「言語」がつくられ、利用されるようになった。その文法や意味は人為的に正確に定められているため、これを人工言語とよぶならば、日本人が昔から使っている日本語などは自然発生的にできたものなので、自然言語とよぶことになる。この自然言語をコンピュータに入力し、目的に応じてなんらかの情報処理を施すことを自然言語処理という。

 1950年代後半にFORTRANフォートラン)など、いわゆる高級プログラム言語が出現してまもなく始められた機械翻訳の試みが、自然言語処理の始まりである。日本では、ローマ字で届いた電文をかな漢字交じり文に変換する研究が早くから始められており、これが現在のかな漢字変換処理につながり、日本語の表記法に革命をもたらした。しかし、人間の行う翻訳などの自然言語処理に比べると、コンピュータの能力はいまだにはるかに非力である。人間と同程度に行うには、正しい意味理解が不可欠である。ここでいう理解とは、入力文を内部モデル(内部に構築した外部世界のモデル)に照応することによって適切な反応を返すことである。この課題は、いまもってコンピュータ技術にとっての難問である。たとえば、イギリスの数学者チューリングが人工知能の実現度判定問題としたように、詩の音韻やニュアンスについて、コンピュータが人間と同じように自然言語で議論できるプログラムが実現できるかどうか。少なくともチューリングが予言した2000年までの実現は達成されていない。

[田村浩一郎]

『岡田直之著『自然言語処理入門』(1991・共立出版)』『田中穂積監修『自然言語処理――基礎と応用』(1999・コロナ社)』

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

図書館情報学用語辞典 第5版 「自然言語処理」の解説

自然言語処理

日本語や英語など人間が日常的に使っている言語(自然言語)をコンピュータで処理する技術,またその技術に関する研究領域.基礎技術として形態素解析,構文解析,意味解析,文脈解析があり,応用技術として機械翻訳,質問応答,情報抽出,情報検索,自動要約,テキストマイニングなどがある.これらの技術は仮名漢字変換や音声認識など多くのソフトウェアに利用されている.研究領域としては言語学,教育学,計算機科学等と関わる学際的側面が強く,図書館情報学とは情報検索で接点がある.近年では大量の電子テキスト(コーパス)から機械学習により言語に関する規則や知識を自動獲得する研究方法が主流である.

出典 図書館情報学用語辞典 第4版図書館情報学用語辞典 第5版について 情報

ブリタニカ国際大百科事典 小項目事典 「自然言語処理」の意味・わかりやすい解説

自然言語処理
しぜんげんごしょり
natural language processing

日本語や英語のようにわれわれが日常使う自然言語で表現された情報をコンピュータで解析,変換,生成して活用するための技術。解析には,(1) 文章中に出現する単語の活用形を見つけて,元になる単語とその活用形(→活用)を同定する形態素解析,(2) 人名,地名などの固有名詞や日時を表す表現を同定する固有表現抽出,(3) 文の構造を推定する構文解析,(4) 文の構成要素の間の意味的な関係を解析する意味解析,(5) 文章における省略や照応表現を解析する談話解析などがある。自然言語を用いて人間にわかりやすく伝えるために,コンピュータの内部表現(→解読マトリックス)から伝えたい情報の意味を表す意味表現を生成し,聞き手の背景知識と談話の流れを考慮しつつ,自然言語の単語と構文を使って目的とする文章を生成する技術も研究開発されてきた。さらに文章の自動要約,情報抽出,情報検索,質問応答,会話,機械翻訳など,タスクに応じた技術も発展した。当初は,自然言語の文法や意味にかかわる理論に基づき文法ルールを人の手で定義する手法が用いられたが,インターネットによる豊富な言語資源が利用できるようになった今日は,統計的な手法やニューラルネットワーク,特にディープラーニングを用いてルールを導く自然言語処理技術が広く用いられるようになった。(→自然言語理解

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

百科事典マイペディア 「自然言語処理」の意味・わかりやすい解説

自然言語処理【しぜんげんごしょり】

情報科学の分野ではプログラム言語などの人工言語に対して,人間の言語を自然言語と呼ぶ。自然言語をコンピューターで取り扱う技術を広く自然言語処理という。コンピューターに入れた文字データから単語を切り出して五十音順に配列しなおしたり出現頻度を計数したりすること,文の構造や意味の解析,他言語への自動翻訳などがある。ワードプロセッサーは自然言語処理技術の応用システムとしてよく普及した例。人が自然言語で話しかけて,それに対応できる情報システムなども研究が進められている。→人工知能
→関連項目かな漢字変換機械翻訳シソーラス

出典 株式会社平凡社百科事典マイペディアについて 情報

IT用語がわかる辞典 「自然言語処理」の解説

しぜんげんごしょり【自然言語処理】

人間が日常的に使っている自然言語をコンピューターで取り扱う技術の総称。日本語のかな漢字変換機械翻訳・構文解析など。◇「自然言語技術」ともいう。

出典 講談社IT用語がわかる辞典について 情報

ASCII.jpデジタル用語辞典 「自然言語処理」の解説

自然言語処理

コンピューターを用いて、日本語や英語のような日常的に使われている言語を処理すること。代表的なものに、英和翻訳や音声認識、文書の要約などがある。

出典 ASCII.jpデジタル用語辞典ASCII.jpデジタル用語辞典について 情報

今日のキーワード

脂質異常症治療薬

血液中の脂質(トリグリセリド、コレステロールなど)濃度が基準値の範囲内にない状態(脂質異常症)に対し用いられる薬剤。スタチン(HMG-CoA還元酵素阻害薬)、PCSK9阻害薬、MTP阻害薬、レジン(陰...

脂質異常症治療薬の用語解説を読む

コトバンク for iPhone

コトバンク for Android