我们的抽样调查结果,它的实际误差究竟有多大的可能性会落在我们计算的平均误差范围内呢?这就要应用概率论和大数定律才能回答。
大数定律的正态分布定理表明,大量随机现象的分布,总是遵从正态分布,即多数单位都是围绕在它的平均数两侧这样一种分布状态的。正态分布是概率论中的一种最常见的和最重要的分布,随机事件就是这样的分布规律,不是随机现象就不可能呈正态分布。
根据大数定律的正态分布定理,抽样误差范围的大小和概率的关系是:
1 |
68.27% |
2 |
95.45% |
3 |
99.73% |
4 |
99.994% |
5 |
99.9999% |
这就是说,如果进行10次抽样调查,有68.27次的抽样误差将不超过正负一个误差即1个μ的范围,其余31.73次将超出这个范围,有95.45次的抽样误差将不超过正负二个误差即2个μ的范围,其余4.5次将超过这个范围,有99.73次将不超过正负三个误差即3个μ的范围,其余0.27次将超过这个范围;依此类推。
但是,通常只作一次抽样调查,对这一次调查来说,在正负一个误差范围内的把握程度就应是66.27%;在正负二个误差范围内的把握程度就应当是95.45%;在正负三个误差范围内99.73%;依此类推。如果还要提高把握程度,还可以扩大到正负四个或五个误差范围。但是这样,把握程度虽然提高了,误差范围也就扩大了。因此,通常搞抽祥调查,一般都只要正负二到三个μ误差范围就行了,因为这样把握程度已经可以达到95.45~99.73%。也就是说,在正负二个μ误差范围内,把握程度已经达到95%以上,在正负三个μ误差范围内,把握程度已经达到99.73%以上,即此时的置信度很高。
调查结果落在一定平均误差范围的概率,就叫把握程度;而一定的平均误差范围就叫做容许误差或可能误差。在一些统计教科书上,也有将把握程度叫做置信程度,而将在一定把握程度下的容许误差或可能误差范围叫做置信区间的。
设用△表示容许误差,t表示误差范围: