统计量是由样本加工而成的,在用统计量代替样本作统计推断时,样本中所
含的信息可能有所损失,如果在将样本加工为统计量时,信息毫无损失,则称此统计量为充分统计量。例如,从一大批产品中依次抽出n个,若第i次抽出的是合格品,则xi=0,否则xi=1(i=1,2,…,n)。总体分布取决于整批产品的废品率p,可以证明:统计量,即样本中的废品个数,包含了(x1,x2,…,xn)中有关p的全部信息,是一个充分统计量。若取m<n,令Tm(x1,,则Tm仍是一个统计量,不过不是充分的。
充分性是数理统计的一个重要基本概念,它是R.A.费希尔在1925年引进的,费希尔提出,并由J.奈曼和P.R.哈尔莫斯在1949年严格证明了一个判定统计量充分性的方法,叫因子分解定理。这个定理适用面广且应用方便,利用它可以验证很多常见统计量的充分性。例如,若正态总体有已知方差,则样本均值塣是充分统计量。若正态总体的均值、方差都未知,则样本均值和样本方差S合起来构成充分统计量(塣,S)。一个统计量是否充分,与总体分布有密切关系。
将样本加工成统计量要求越简单越好。简单的程度的大小,主要用统计量的维数来衡量。简单地讲,若统计量T2是由统计量T1加工而来(即T2是T1的函数),则T2比T1简单。在此意义上,最简单的充分统计量叫极小充分统计量。这是E.L.莱曼和H.谢菲于1950年提出的。前例中的充分统计量都有极小性。在任何情况下,样本x1,x2,…,xn本身就是一个充分统计量,但一般不是极小的。
关于统计量的另一个重要的基本概念是完全性。设T为一统计量,θ为总体分布参数,若对θ的任意函数g(θ),基于T的无偏估计至多只有一个(以概率1相等的两个估计量视为相同),则称T为完全的。