选择特殊符号
选择搜索类型
请输入搜索
数据挖掘本质上作为一类数据分析方法,和统计学有着共同的目标:发现数据中的结构川。因而,基于数据挖掘的视角,对抽样调查数据采用一些数据挖掘的方法进行分析,是可行的。然而,将数据挖掘方法应用于抽样调查数据,有一个问题通常无法回避,那就是样本数据所对应的权数如何处理。
一般而言,数据挖掘问题常常针对总体数据,例如关于一个公司的所有职工数据,银行信用卡中心数据库的所有客户数据,一家大型超市一个季度以来的所有顾客购买记录等。在这种情形下,每一条记录都是总体数据中的一个单元,得到的观察值可以直接计算总体参数,无需进行统计推断。
但数据挖掘方法也越来越多地应用于抽样调查数据。与总体数据不同的是,抽样调查当中,每个样本单元的观测值都是有权数的,权数表示的是每个样本单元代表了总体中一定数目的单元,所以整个样本就“代表”了整个总体。样本单元的权数取决于抽样设计。
因此,谢佳斌等提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PewwR再抽样,来实现“事后‘自加权设计。实现“事后”自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学家质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本且问题,发现max( n,5% N)(n为样本大小,N为总体单元的个数)是一个比较合适的样本量。这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。
在分层抽样中,采用分层比例抽样可以提高样本的代表性,及对总体数量指标的估计值的确定,避免出现简单随机抽样中的集中于某些特性或遗漏掉某些特性。
它是根据某些特定的特征,将总体分为同质、不相互重叠的若干层,再从各层中独立抽取样本,是一种不等概率抽样。分层抽样利用辅助信息分层,各层内应该同质,各层间差异尽可能大。这样的分层抽样能够提高样本的代表性、总体估计值的精度和抽样方案的效率,抽样的操作、管理比较方便。但是抽样框较复杂,费用较高,误差分析也较为复杂。此法适用于母体复杂、个体之间差异较大、数量较多的情况。
比例抽样是指不考虑试样变异性的大小,都按统一的比例进行抽样。
首先,你应该明确:抽样检测法和样方法都是种群密度的调查方法。它们之间的不同在于:调查对象的不同,调查方法也不同。调查植物和活动能力弱的动物的种群密度时要用样方法;微生物要用抽样检测法。而活动能力强的动...
先要把图纸看明白。先从建筑图纸看,平面图、立面图、剖面图,然后在看结构图,根据结构图,在钢筋算量软件计算钢筋。
抽样又称取样。从欲研究的全部样品中抽取一部分样品单位。其基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。抽样的目的是从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。
一般抽样的过程如下:
1、界定总体
界定总体就是在具体抽样前,首先对从总抽取样本的总体范围与界限作明确的界定。
2、制定抽样框
这一步骤的任务就是依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框。
3、决定抽样方案
4、实际抽取样本
实际抽取样本的工作就是在上述几个步骤的基础上,严格按照所选定的抽样方案,从抽样框中选取一个个抽样样单位,构成样本。
5、评估样本质量
所谓样本评估,就是对样本的质量、代表性、偏差等等进行初步的检验和衡量,其目的是防止由于样本的偏差过大而导致的失误。
釉面砖抽样方案及抽样方法
筑神-建筑资料下载:http://www.zhushen.com.cn 通用图集,规范,工程表格,施工组织设计,CAD 图块,工程论文,建筑模型等全部免费下载 釉面砖抽样方案及抽样方法 本标准适用于釉面砖的产品质量检验。 1 符号和代号 N:检查批大小、批量; n:样本大小; c:合格判定数; p:批不合格品率 p0:合格批中允许出现不合格品率的上限,即 p≤p0 为合格批; p1:不合格批中规定的不合格品率的下限,即 p≥p0 为不合格批; D:批中不合格品总数; W:每箱产品的检查单位数; n:各检查项目所需的试样总和。 2 抽样检验程序 2.1 确定质量标准 规定检查单位是合格品与不合格品的标准。 2.2 确定批量大小 以同一条件下生产的产品为一批。如果批量过大,也可分成若干小批。 2.3 确定检查项目 确定应
几种抽样方法
1 / 5 第八讲 几种抽样方法 (1)随机抽样 新知 1:简单随机抽样的概念 一般地,设一个总体含有 N个个体,从中逐个不放回地抽取 n 个个体作为样本 (n≤N), 如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简 单随机抽样,这样抽取的样本,叫做简单随机样本。 【说明】 简单随机抽样必须具备下列特点: (1) 简单随机抽样要求被抽取的样本的总体个数 N是有限的。 (2) 简单随机样本数 n小于等于样本总体的个数 N。 (3) 简单随机样本是从总体中逐个抽取的。 (4) 简单随机抽样是一种不放回的抽样。 (5) 简单随机抽样的每个个体入样的可能性均为 n/N。 新知 2:抽签法和随机数法 抽签法的定义 : 一般地,抽签法就是把总体中的 N个个体编号,把号码写在号签上, 将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取 n 次,就 得到一个容量为
1.验收抽样检查
验收检查是指需方(即第二方)对供方(即第一方)提供的检查批进行抽样检查,以判定该批是否符合规定的要求,并决定对该批是接收还是拒收。验收检查也可以委托独立于供需双方的第三方进行。
2.监督抽样检查
监督抽样检查类似于验收检查对孤立批的抽样,但由于质检机构能力的限制,往往不可能采用计数标准型那样的大样本,而只能采用小样本抽样的方法。鉴于对检查不合格的企业可能采取较严厉的处罚措施。因此,对受监督方的保护必要时予以优先考虑,即把供方风险控制为较小的数值,在此前提下只能放松对需方风险的控制。
01
抽样调查概述
本章对抽样技术的涵义、作用、产生历史和实际应用等作简要介绍,为以后各章的学习奠定基础。具体要求:①正确理解抽样技术的科学涵义、基本分类和特点,对抽样调查的基本程序和作用有初步的认识;②对抽样技术产生与发展的历史有一般的了解;③对抽样技术的实际应用有大致的认识。
课时
1.1 什么是抽样调查
1.2 抽样技术的产生与发展
1.3 抽样技术的应用
02
抽样调查基本概念
本章对抽样技术的基本概念进行阐述和介绍,为以后各章的学习奠定理论与方法基础。具体要求:①掌握总体、单位、抽样框、样本等概念,理解它们之间的内在关系,熟知常用的总体指标和样本指标;②系统了解估计量、抽样分布、抽样误差、估计精度、置信区间等概念的内涵和作用,能够运用它们进行实际的抽样估计;③基本掌握和理解样本设计的内容、原则和效果衡量指标。
课时
2.1 总体与样本
2.2 估计量与抽样分布
2.3 抽样误差与置信区间
2.4 样本设计
03
简单随机抽样
简单随机抽样是抽样中最基本、最成熟、也是最简单的抽样设计方式,是所有概率抽样方法发展、比较的基础。因此,掌握本章的内容对于学好其他各章将起到基础性的作用。具体要求:①通过学习熟练掌握简单随机抽样的抽样方式和样本抽选方法;②熟知总体均值、总体总值和总体比例的简单估计;③掌握样本量的确定;④了解子总体的估计。
课时
3.1 抽样方式
3.2 总体均值与总体总值的简单估计
3.3 总体比例的简单估计
3.4 样本量的确定
3.5 子总体估计
04
分层抽样
本章主要对分层抽样的方式、估计量及其性质、样本量的确定及分配、设计效果等进行系统介绍。具体要求:①正确理解层与分层抽样的涵义、特点及作用;②掌握分层抽样的估计量及其性质;③掌握分层抽样样本量的确定方法;④了解分层抽样的设计效果;⑤了解分层抽样其他有关理论问题,包括层权偏差、最优分配偏差、事后分层等。
课时
4.1 抽样方式
4.2 简单估计量及其性质
4.3 样本量的分配
4.4 样本量的确定
4.5 分层抽样设计效果分析
4.6 进一步讨论的问题
05
比率估计与回归估计
本章讨论了简单随机抽样和分层随机抽样下比率估计量和回归估计量的构造及性质。具体要求:①掌握总体比率、比率估计量及回归估计量的概念。②了解比率估计量、回归估计量的偏差、方差及方差的估计量。③掌握应用比率估计量及回归估计量的条件。
课时
5.1 问题的提出
5.2 比率估计
5.3 回归估计
5.4 分层比率估计与分层回归估计
06
不等概率抽样
前面各章介绍的抽样方法都是等概率抽样,本章则对不等概率抽样方法进行介绍,具体要求:①熟练掌握不等概率抽样的概念和分类,了解不等概率抽样的应用意义;②了解放回与不放回不等概率抽样的各种估计量构造及其方差估计;③能够在实际抽样中运用不等概率方法,尤其是PPS等常用的方法。
课时
6.1 问题的提出
6.2 放回不等概率抽样
6.3 不放回不等概率抽样
07
整群抽样
本章给出整群抽样的定义,讨论了群大小相等和群大小不等的整群抽样方法及与之匹配的估计量、估计量的方差及方差的估计量。具体要求:①掌握群大小相等情形对群进行简单随机抽样简单估计量的无偏性、方差及方差的无偏估计,了解群内方差、群间方差概念及其对整群抽样精度的影响,掌握群的划分原则。②掌握群大小不等情形与简单随机抽样相匹配的简单估计量、比率估计量及与 抽样相匹配的汉森-赫维茨估计量及其性质。③掌握估计总体比例的整群抽样方法及简单估计量、比率估计量。
课时
7.1 抽样方式
7.2 群大小相等的整群抽样
7.3 群大小不等的整群抽样
7.4 估计总体比例的整群抽样
08
系统抽样
本章将对系统抽样这种具有简便易行、样本分布均匀、估计效率较高等多方面优点的抽样组织方式进行介绍,以便在实践中灵活加以应用。具体要求:①正确理解系统抽样的基本思想和方式;②掌握系统抽样的估计量及其性质;③熟知系统抽样估计量方差的样本估计方式;④对系统抽样的相关问题有所了解。
课时
8.1 抽样方式
8.2 等概率系统抽样的估计量及其方差
8.3 估计量方差的样本估计
8.4 进一步探讨的问题
09
多阶段抽样
本章介绍多阶段抽样的方式、优点和初级单位大小相等或不等时的两阶段抽样的估计量及其性质,并对相关一些问题进行讨论。具体要求:①正确理解多阶段抽样的科学涵义,对多阶段抽样的性质及优点有初步的认识;②掌握初级单位大小相等时两阶段抽样的估计量及其性质和初级单位大小不等时两阶段抽样的估计量及其性质;③了解有关多阶段抽样的其它相关问题。
课时
9.1 抽样方式
9.2 初级单位大小相等的两阶段抽样
9.3 初级单位大小不等的两阶段抽样
9.4 进一步讨论的问题
10
其它抽样方法技术
本章主要对样本轮换、双重抽样、随机化装置、交叉子样本等抽样技术原理、方法、特点及应用条件进行了较为全面的介绍。具体要求:①掌握本章所介绍的几种抽样技术的特点及应用条件;②在抽样实际工作中能够正确运用该种技术,提高估计的精度与效果。
课时
10.1 样本轮换
10.2 双重抽样
10.3 随机化装置
10.4 交叉子样本
11
非抽样误差
本章对非抽样误差的构成和各种非抽样误差的影响进行分析。具体要求:①正确理解非抽样误差的涵义、来源和特点;②对抽样框误差、无回答误差和计量误差的成因及其对抽样的影响有比较系统的理解;③掌握控制非抽样误差的基本思想。
课时
11.1 非抽样误差构成
11.2 抽样框误差分析
11.3 无回答误差分析
11.4 计量误差分析
在验收方案中,适用于连续的生产情况的一种抽样方案。其特点是接收或拒收基于某批逐个产品的检查;以及交替使用100%的检验和抽样检验,100%检验的相对数量取决于对交付产品质量的把握性。连续抽样方案通常所表示的特点是:要求100%检验的每一期间要延续到连续检查规定数量(i)个被检单元没有发现不合格品时为止。对一个水平的连续抽样方案,抽样时采用一个抽样比例。对多水平连续抽样方案,要采用两个或多个抽样比例。某一时期的抽样比例取决于该时期交验产品质量的可靠性。