确定随机变量的分布函数,通常包括两个方面。
①假设检验:即用假设检验的方法选择分布函数的类型。先选择一种假设,然后根据样本资料对于所选的假设,算出有关的统计量的数值。将这一数值与由相应表格查得的临界值进行比较,从而决定接受或拒绝所选的假设。常用的检验分布函数的统计量有:柯尔莫哥洛-斯米尔诺夫统计量、库泊统计量、克莱姆-冯·米赛斯统计量、瓦特逊统计量及安德逊-达令统计量等。假设检验,可能出现两种错误,水文学中称为模型不确定性。第一种错误,是假设为真,决定拒绝;第二种错误,是假设不真,决定接受。采用的统计量应使在给定的第一种错误的概率下,出现第二种错误的概率最小。
②参数估计:选用某种参数估计方法,根据样本资料计算出分布函数中所含的参数值,称为参数的估计值。因为它一般不等于参数的真值,有一误差,称为抽样误差,或称为参数不确定性。选用的参数估计方法,应使其抽样误差较小且计算简便。常用的参数估计方法有矩法、极大似然法、概率加权矩方法、适线法等。中国在水文统计的实际工作中,长期使用一种图解适线法。在此基础上,20世纪70年代初,中国水文学者提出了一种客观适线法,用于皮尔逊-Ⅲ型曲线(见水文随机变量),有较其他方法为好的性能。此种方法于1987年被写进中国参数估计方法的国家标准。80年代,美国水文学家在这一领域又有新的发展。参数估计的工作在水文学中常称为频率分析。
模型不确定性和参数不确定性一方面与所用的方法有关,另一方面与所用资料的数量有关。一般资料数量越多,不确定性越小;反之,资料数量越少,不确定性越大。由于水文资料的数量往往有限,很少超过百年,在统计上属于小样本。因此,加强小样本假设检验与参数估计理论的研究是十分必要的。水文统计学当前主要属于统计学范畴,难以考虑水文现象的物理联系,通过引进随机微分方程的有关内容,可将水文统计学发展到一个新的阶段。