选择特殊符号
选择搜索类型
请输入搜索
极差亦称为全距或误差范围,它是测定数据中最大值与最小值之差,说明数据的伸展情况。优点是计算简单,缺点是没有反映观测值离散情况。在相同实验次数下的两组数据,极差大的一组数据要比极差小的一组数据更为分散。
标准偏差也称为标准离差、标准差或均方差,它是衡量样本数据波动性(离散程度)的指标。 标准偏差有两点不同于误差的平均值:①不必考虑误差的正、负号;②增强了大的误差数据的作用,所以能较好地反映测定数据的精密度,因此也用标准偏差来量度精密度。
标准偏差有两个重要的作用:
(1)测定研究对象变异程度的大小。变异程度就是各个数值相差的程度。其他条件相同,标准偏差大,变异程度大;标准偏差小,变异程度小。标准偏差的这种作用在比较两个或多个样本变异程度的大小上可以清楚地看出。
(2)作为量度误差的标准单位。标准偏差还可以作为检验不同样本是否有本质差别的标准单位。许多重要的统计方法,如显著性检验法,都是以标准偏差的应用作为基础的。
标准偏差是反映样本数据的绝对波动状况。当测量较大的量值时,绝对误差一般较大:测量较小的量值时,绝对误差一般较小,因此,用相对波动的大小,即变异系数更能反映样本数据的波动性。
变异系数将有限次测定次数的标准偏差除以对测定值的平均值,得到一个相对值。标准偏差的单位与平均值相同,所以变异系数与测量的单位无关,是个纯数。
算数平均值是一组数据集中位置最有用的统计特征量,经常用样本的算数平均值来代表总体的平均水平。
在一组数据中,按其大小次序排序以排在正中间的一个数表示总体的平均水平,称之为中位数,或中值。 平均值有时会因极值的影响而出现虚假的集中位置。人们把观测值按大小顺序排列,将排在中间的数称为中位数。观测次数为奇数时,中位数有1个;当观测次数为偶数时.中位数为中间两个数的平均值。例如某实验室的每天药品消耗的中位数为6瓶,物理学家用半衰期来衡量放射性同位数的衰变速度,用的就是放射性原子蜕变时间的中位数,如果要计算某种放射性原子蜕变所需时间的平均值,必须等所有原子蜕变完毕才有可能。显然,这是不能办到的,因为这需要漫长的时间。
众数是指一组数据中,出现次数最多的变量值,众数不一定是平均值。例如,某实验室最近18天每天药品的消耗量分别为8,7,6,7,5,4,5.6,8,7,5,6,4,7,6,5,7,4瓶,7瓶出现次数最多,所以众数为7。 2100433B
统计特征是统计学的基本概念之一,在用数理统计方法研究总体时,人们所关心的实际上并非组成总体的各个个体本身,而主要是考察与它们相联系的某个(或某些)特征。研究有关特征在总体的各个个体间的分布情况,称所要考察的特征为总体的统计特征。
无论是在空域,还是频域,在进行隐写分析时,除了使用一阶统计特征之外,还可以使用共生矩阵,这时高阶统计特征。灰度共生矩阵是分析空间关系的一种统计方法,当对图像中像素对中的分布进行统计时。
整栋楼统计
图形里面有,将钢筋导入图形,汇总计算,全选你要统计的构件,在状态栏的左下角就能看到个数了。
基于WVD交叉项统计特征的桅杆结构损伤识别
基于WVD交叉项统计特征的桅杆结构损伤识别——提出了利用Wigner—Ville分布交叉项统计量相对变化量识别桅杆结构损伤的方法,以涪陵导航桅杆为对象进行了数值分析和试验研究。数值分析表明,利用测点损伤识别指标WCS的相对变化量,除对不同位置、不同程度的杆身...
论随机—模糊统计方法在岩土特征参数指标统计中的应用
在岩土工程中,人们普遍应用统计方法计算岩土的物理力学参数。统计学方法在对离散岩土的实验数据进行处理时,将与中值差异性较大的数据称之为孤值,并认为其代表性较差,对其忽略不计,取剩余数据平均值为岩土特征值。应用这种方法处理数据结果,剔除孤值会导致结果存在人为偏差现象,不剔除孤值又会导致结果出现系统误差。基于此类问题的干扰,相关学者逐渐应用数学理论分析岩土特征,随机模糊统计方法应运而生。
水文特征统汁的内容一般包括3个方面:
①主要河流的特征资料,如流域或水系的集水面积、河流长度、测站的地理位置、资料年限以及流域或水系多年平均的降水量(以水深mm表示)、径流深、径流系数、降水和径流总量(以立方米表示)、径流模数等统计值;
②多年的和逐年的水文特征统计资料,如各测站年、月的降水、蒸发、水位、流量、泥沙、水化学成分、水温、冰情等各种特征统计值;
③其他有关综合性的参考资料,如主要河流入海水量和出入国境水量的统计值,全国的、流域的、地区的水资源评价成果等。
水利(电力)部水文局于1956年第1次组织汇编《全国主要河流水文特征统汁》,1975年和1982年(含台湾省水文特征资料)两次修订。20世纪50年代后期至70年代,各流域、省、直辖市、自治区以及部分地区和县,相继汇编了各流域和各地区的水文特征统汁并经数次修订补充,总数达百余册。为了便于应用,在全国性水文图集、地区性水文图集以及水文手册中也曾刊载主要河流的水文特征统计资料,有些水文实验站为专门目的(如官厅水库水文泥沙的实验研究),也出版过特征资料,提供生产和科研部门应用。
分配数列有两个构成要素。即总体按某标志所分的组和各组对应的次数或频率。
分配数列的第一个构成要素就是总体按某标志所分的组。根据分组标志的不同,分配数列可分为品质分配数列和变量分配数列。按品质标志分组形成的分配数列叫品质分配数列,简称品质数列;按数量标志分组形成的分配数列叫变量分配数列,简称变量数列。变量数列又可以分为单项式数列和组距式数列,组距式数列又可以分为等距数列和不等距数列。它们都是由相应的统计分组形成的。
对品质数列来说,由于用品质标志来区分事物的各种类型表现得比较明确,因此,品质数列一般比较稳定,能较好地反映总体各单位的分布特征。但对变量数列来说,因为事物性质的差异是用数量界限来表现的,而数量界限往往会受人们主观认识的影响,同一数量标志分组可能会出现多种分布状态。这就涉及各组频数和频率的问题。
分配数列的第二个构成要素就是各组对应的单位数——次数,次数也叫频数,常用
在变量分配数列中,频数或频率表明对应组标志值的作用程度。频数或频率数值越大,表明该组标志值对总体水平所起的作用也越大;反之,频数或频率数值越小,表明该组标志值对总体水平所起的作用越小。
分配数列中各组的频数或频率不能为0,如果某一组的频数或频率为0,应删除这一组。
有时候,为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。累计方法有向上累计和向下累计两种。
向上累计就是向变量的上限方向累计,是指将各组频数或频率由变量值较低的组向变量值较高的组累计,各累计数的意义是各组上限以下的累计频数或频率。当我们关注标志值较小的各组分布情况时,可采用向上累计方法。
向下累计就是向变量的下限方向累计,是指将各组频数或频率由变量值较高的组向变量值较低的组累计,各累计数的意义是各组下限以上的累计频数或频率。当我们关注标志值较大的各组分布情况时,可采用向下累计方法。
分析变量的分布状况,一般应采用等距数列。此时,各组的频数或频率就能很好地反映变量的分布状况。如果是不等距数列,则应采用各组的次数密度或频率密度才能正确反映变量的分布状况。次数密度和频率密度的计算公式如下:
次数密度=某组次数/该组组距;频率密度=某组频率/该组组距
社会经济现象总体的性质不同,其次数分布的特征也不同。各种社会经济现象总体的次数分布,归纳起来主要有钟型分布、U型分布、J型分布和洛伦兹分布四种类型。
钟型分布
钟型分布是正态分布的俗称,其特征是“中间高,两头低”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,形如古钟(见图1)。
在社会经济现象中,钟型分布多表现为对称分布。对称分布的特征是中间的变量值分布的次数最多,以标志变量中心为对称轴。两侧变量值分布的次数随着与中心变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布。这种分布在统计学中称为正态分布。在社会经济现象中,许多变量的分布近似于正态分布类型。如从业人员的年收入、农作物单产、零件尺寸、学生考试成绩、社会财富分布等。正态分布在社会经济统计学中具有重要意义。这是因为,一方面。社会经济现象中大部分分布呈近似正态分布;另一方面,正态分布理论是抽样推断的基础。
U型分布
U型分布的特征与钟型分布正好相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,形成“两头高,中间低”的U字型分布。例如,人口死亡现象按年龄分布便是如此。由于人口总体中幼儿和老年人死亡人数较多,而中年人死亡人数较少,因此,死亡人数按年龄分组便近似地表现为U型分布,如图2所示。
J型分布
在社会经济现象中,一些统计总体分布曲线呈J型,即次数随着变量值的增加而增加。如农作物产量按土地面积分布、人口数按零售商品销售额分布、工人数按总产值分布、库存量按库存费用分布等,如图3所示。也有次数随着变量值的增加而减少的倒J型分布。如企业数按投资额分布、人口数按年龄大小分布等,如图4所示。
洛伦兹分布
洛伦兹分布曲线是美国统计学家洛伦兹(M.Lorenz)提出来的,专门用以研究社会收入分配的平等问题。
在图5中。横轴OH表示人口的累计百分比,纵轴OM表示收入的累计百分比,弧线OL为洛伦兹曲线。洛伦兹曲线的弯曲程度有着重要的意义,它反映了收入分配的不平等程度。弯曲程度越大,收入分配越不平等,反之亦然。
洛伦弦曲线与对角线之间的部分A 叫做“不平等面积”,直角三角形OHL的面积(A B)叫做“完全不平等面积”。不平等面积与完全不平等面积之比,就是基尼系数,也称集中系数:基尼系数=
基尼系数等于1,表示收入分配绝对不平等;基尼系数等于0,表示收入分配绝对平等。基尼系数是衡量,一个国家或地区贫富差距的标准之一。按照联合国有关组织规定:基尼系数若低于0.2表示收入平均;0.2-0.3表示比较平均;0.3=0.4表示相对合理;0.4-0.5表示收入差距较大;0.5以上表示收入差距悬殊。通常把0.4作为收入分配差距的“警戒线”。发达国家的基尼系数在0.26-0.38之间,我国2013年全国居民收入的基尼系数为0.473。
洛伦兹曲线的拓展可以运用于其他社会经济现象,研究总体各单位标志变异状况——变量分布的均匀性或分布的集中程度,因此,洛伦兹曲线又称集中曲线。如研究产品市场份额在各企业的集中度以及分析固定资产投资额在各地区的集中度等 。
随着水文资料系列的增长,特征统计值逐渐趋于相对稳定,应用价值也愈大。鉴于水文年鉴一般要隔一两年才能刊印出来,为弥补这一缺陷,自1980年起水利(电力)部水文局专门选编一批具有代表性的重点测站的资料, 于每年年初发布上一年的《全国主要河流水文公报》。20世纪80年代以来,水利部水文局组织各流域机构建立了水文和水资源数据库,其中包括了各种水文特征统计资料,可通过计算机网络形式随时提供给用户使用。