日本大百科全書(ニッポニカ) 「推定(数学用語)」の意味・わかりやすい解説
推定(数学用語)
すいてい
数学用語。母集団の確率分布について、その型(たとえば二項分布とかポアソン分布とか正規分布などのように)はわかっているが、それに含まれる母数θ(たとえば、B(n, p)の場合のp、P(λ)の場合のλ、N(m,σ2)の場合のm、σ2など)が未知であるとき、この母集団から取り出された大きさnの標本の値x1、x2、……、xnからθの値をどのように推定するかという問題をいう。
この場合、二つの方法がある。一つは点推定といって、未知母数を一つの値で推定する方法であり、もう一つは区間推定といって、1に近いある確率で未知母数の値がある区間に含まれることを主張する方法である。
(1)点推定 たとえば母集団分布の平均値が未知の場合にそれを標本の値x1、x2、……、xnの算術平均(x1+x2+……+xn)/nによって推定するのは常識的な方法である。一般に母集団分布の未知の値θは標本の値x1、x2……、xnの適当な関数f0(x1, x2,……, xn)によって推定される。θは未知であるが定数である。一方、標本の値x1、x2、……、xnは標本のとり方によって変わるものであるから、標本の値はそれぞれ確率変数X1、X2、……、Xnの実現値と考えられる。ただしX1、X2、……、Xnは独立で各Xiの確率分布は母集団分布である。一般にこれらの確率変数X1、X2、……、Xnの関数として表される確率変数は統計量とよばれる。このように考えると、母数θの値をf0(x1, x2,……, xn)によって推定することは、θの値を統計量f0(X1, X2,……, Xn)の実現値として推定することである。この場合の統計量f0(X1, X2,……, Xn)を母数θの推定量という。θの推定量Xに対して、Xの平均値がθに等しいとき、すなわちE(X)=θが成り立つとき、Xをθの不偏推定量という。
例1 母集団の平均値をmとする。この場合=(X1+……+Xn)/nはmの不偏推定量である。
例2 母集団の分散をσ2とする。このとき
と置けばE(S2)=((n-1)/n)σ2となって、S2はσ2の不偏推定量ではない。U2=(n/(n-1))S2はσ2の不定推定量である。
(2)有効推定量・最尤(さいゆう)推定量 母数θの推定量はいくつもあるが、推定量としてはその分散が小さいものが望ましい。θの不偏推定量のうちで分散が最小であるものを有効推定量という。有効推定量がある場合にはそれを次の最尤法で求めることができる。すなわち、母集団分布の確率密度をf(x ;θ)とするとき、標本値{x1, x2,……, xn}に対して次の関数
L(x1, x2,……, xn ;θ)
=f(x1 ;θ)f(x2 ;θ)……f(xn ;θ)
を考え、x1、……、xnを与えたとき、θ=で関数Lが最大値をとるとするとはx1、……、xnの関数である。この関数を=(x1,……, xn)と書く。この場合、確率変数=(X1,……, Xn)をθの最尤推定量という。有効推定量が存在すればそれは最尤推定量である。
(3)区間推定 実際に推定を行う立場としては、点推定よりも区間による推定のほうが実践上の意味をもつ。ここでは比率の推定を例にとって説明する。ある都市の市長選挙で、A候補の支持率をみるため、有権者100人を無作為に選んで調べたところ、40人がA候補の支持者であった。A候補の支持率はどのくらいか? この問題で有権者の総数をN、A氏の支持者の数をN1とすると、支持率はp=N1/Nであるが、N1が未知であるからpも未知である。有権者全体からn人(ここではn=100)を無作為に選んでそのうちA氏の支持者がX人であるとする。このXはn人の選び方によって変動するから確率変数である。ここでは確率変数Xの値が40であったということである。Xの確率分布は二項分布B(n, p)であるから、nが大きいとき
となる。この関係式からX/n=として、pが区間
に含まれる確率がほぼ0.95であることが導かれる。この区間を信頼係数0.95に応ずるpの信頼区間といい、信頼区間の端点を信頼限界という。ここで注意すべきは、pは未知ではあるが定数であり、が確率変数であって、信頼区間は標本ごとに変動することである。初めの例ではn=100, =0.4であり、信頼係数0.95に応ずる信頼区間は(0.30, 0.50)となる。またこの例で100人中40人のかわりに1000人中400人であったとすると同じ信頼係数に応ずる信頼区間は(0.37, 0.43)となる。
[古屋 茂]