tf・idf(読み)てぃーえふあいでぃーえふ(英語表記)term frequency - inverse document frequency

図書館情報学用語辞典 第5版 「tf・idf」の解説

tf・idf

統計的な情報検索手法において,文献を特徴付ける語を特定するために,文献のタイトル抄録本文などを語単位に分割し,各語の重みを計算する方法.あるいは重み付けの統計尺度.tf(term frequency)はある1件の文献内におけるその語の出現頻度を意味し,idf(inverse document frequency)はその語が出現する文献数の逆数を指す.基本的にはこれらの二つの値を掛け合わせてその語の重みとする.tfは文献内におけるその語の重要度,idfはその語の索引語としての有用性を表している.ベクトル空間モデルを始めとして,統計的検索モデルにおいて幅広く利用されている.

出典 図書館情報学用語辞典 第4版図書館情報学用語辞典 第5版について 情報

今日のキーワード

排外主義

外国人や外国の思想・文物・生活様式などを嫌ってしりぞけようとする考え方や立場。[類語]排他的・閉鎖的・人種主義・レイシズム・自己中・排斥・不寛容・村八分・擯斥ひんせき・疎外・爪弾き・指弾・排撃・仲間外...

排外主義の用語解説を読む

コトバンク for iPhone

コトバンク for Android