大多数科研活动是通过试验研究来定量探明问题中的因子效应、因果关系或相关关系的,一般涉及试验设计和统计分析两个基本过程。手工处理数据已难于完成设想的任务,尤其是多变量大规模样本的海量数据处理。鉴于SAS软件在数据处理方面的突出优势,借助SAS进行试验设计和统计分析是非常必要的。
SAS(Statistical Analysis System)是一款非常优秀的统计软件,由美国SAS软件研究所(SAS Institute)研制和发布。SAS具有强大完备的数据存取、数据管理、数据分析和数据展现功能,能有效解决试验设计、统计分析、规划决策、质量控制、经济计量、金融财务等方面的数据处理问题,广泛应用于大学教育、科学研究、产品研发、企业生产、行政管理、经济管理等领域。目前,SAS被公认为数据处理方面的标准软件,它与SPSS、BMDP并称为国际上最有影响的三大统计软件。
SAS采用多窗口集成操作环境,每个窗口均配置标题栏、菜单栏、工具条和注释栏,根据需要还配置列表框、滚动条、选项框等控件,布局美观易用。用SAS进行数据处理时,既可采用菜单驱动方式,又可采用程序驱动方式。采用菜单驱动方式处理数据操作虽较为简单,容易使用户掌握SAS的用法,但操作过程需要较多的选项步骤,在统计原理不太清楚时仍难免造成数据分析错误。另外,菜单驱动方式处理数据未包含SAS的许多统计方法,因而其应用有一定的局限性。相比之下,采用程序驱动方式处理数据的方法具有较强的建模能力和适应性,能灵活用于复杂多样背景下的试验数据处理,对于解决各种实际问题更加有效。再者,SAS程序仅有数据步(DATA STEP)和过程步(PROC STEP)两种类型,两种程序的格式结构基本相同且用法较简单,几个语句就能实现丰富的统计功能,而且程序驱动方式处理数据囊括了SAS的全部统计方法。
本书是为“试验设计与统计分析”课程教材配套的上机练习指导书。全书共分12个单元,每个单元又按问题类型划分出若干节。每个单元的练习对象均以实例展开,以问题、试验、数据、程序、结果、分析的基本架构由浅入深陈述,对于较难的问题还介绍了数学模型和统计方法。掌握这些内容后,读者还可以通过举一反三实现更为复杂的统计分析。
本书前8个单元为SAS应用的基础性练习。第1单元为SAS基本操作,主要使读者熟悉SAS软件和它的基本操作,进而为后续单元的试验设计和统计分析做好准备;第2单元为SAS试验设计,主要使读者掌握试验的主要设计方法,并为后续单元的试验分析做好准备;第3单元为SAS数据整理,主要使读者掌握试验数据的格式整理和数据表管理,并为后续单元中试验分析的SAS编程做好准备;第4单元为SAS统计绘图,主要使读者掌握SAS统计数据的展现方法;第5单元为SAS统计推断,主要使读者掌握参数估计及假设检验的概念和方法;第6单元为单因子试验统计分析,主要使读者掌握单因子试验的因果分析方法;第7单元为多因子试验统计分析,主要使读者掌握多因子试验的因果分析方法;第8单元为回归试验统计分析,主要使读者掌握变量间相关关系的分析方法;后4个单元为SAS应用的高级统计实践。第9单元为主分量分析,主要使读者掌握变量集的化简技术和问题的综合评价技术;第10单元为因子分析,主要使读者掌握问题的潜在因子分析技术;第11单元为聚类分析,主要使读者掌握研究对象的数值分类技术;第12单元为判别分析,主要使读者掌握研究对象的判别分类技术。
本书自2000年起先后在山西农业大学园艺学院“生物统计学”(后改名为“试验设计与统计分析”)、工学院“试验设计与多元分析”的实验课上使用,课程对象既有本科生又有研究生。本书历经10余届的教学应用和多次大的修改、增删和调整,从最初的仅服务于课程教学到现在的教学与科研兼顾,其凝聚了很多学生的学习经验和编著者的教学科研体会。
本书具有由浅入深、系统性强、层次分明、实例丰富、适合自学、易学易懂、不需较强计算机基础等特点,旨在使读者通过“模仿"para" label-module="para">
限于编著者水平,教材中一定存在不妥之处,恳切希望广大读者批评指正。