什么是非参数方法?

发表于 2021-10-30 13:34:55
非参数方法是指一种统计量,它不对样本的特征(其参数)或观察到的数据是定量的还是定性的做任何假设。

非参数统计可以包括某些描述性统计、统计模型、推理和统计检验。非参数方法的模型结构不是先验指定 的, 而是根据数据确定的。

术语“非参数”并不意味着这样的模型完全没有参数,而是参数的数量和性质是灵活的,不是预先固定的。直方图是概率分布的非参数估计的一个例子。

相比之下,ANOVA、Pearson 相关性、t 检验等众所周知的统计方法确实对所分析的数据做出了假设。最常见的参数假设之一是总体数据具有“正态分布”。

关键要点
非参数方法是统计学的一个分支,其中不假设数据来自由少量参数确定的指定模型。
非参数分析通常最适合考虑事物的顺序,即使数值数据发生变化,结果也可能保持不变。
这与参数方法形成对比,参数方法对数据的形状或特征进行假设。这种方法的例子包括正态分布模型和线性回归模型。
非参数方法的工作原理
参数和非参数方法通常用于不同类型的数据。参数统计通常需要区间或比率数据。这种类型的数据的一个例子是年龄、收入、身高和体重,其中的值是连续的,并且值之间的间隔有意义。

相比之下,非参数统计通常用于名义或有序数据。名义变量是其值没有定量值的变量。例如,社会科学研究中常见的名义变量包括性别,其可能值是离散类别“男性”和“女性”。 (就业与失业)。

序数变量是那些值暗示某种顺序的变量。序数变量的一个例子是,如果调查受访者问:“在 1 到 5 的范围内,1 表示非常不满意,5 表示非常满意,您如何评价您在有线电视公司的体验?”

然而,参数统计也可以应用于具有其他已知分布类型的总体。非参数统计不要求总体数据满足参数统计所需的假设。因此,非参数统计属于一类有时称为无分布的统计。当总体数据具有未知分布或样本量较小时,通常会使用非参数方法。

特别注意事项
尽管非参数统计的优势在于必须满足很少的假设,但它们不如参数统计强大。这意味着当实际上存在一个变量时,它们可能不会显示两个变量之间的关系。

非参数统计因其易用性而受到赞赏。随着对参数的需求减少,数据变得更适用于更多种类的测试。当没有这些信息可用时,可以在没有平均值、样本大小、标准偏差或任何其他相关参数的估计的情况下使用这种类型的统计。

由于非参数统计对样本数据的假设较少,因此其应用范围比参数统计更广。在参数检验更合适的情况下,非参数方法效率较低。这是因为与参数统计不同,非参数统计会丢弃数据中可用的一些信息。

常见的非参数检验包括卡方检验、Wilcoxon 秩和检验、Kruskal-Wallis 检验和 Spearman 的秩序相关性。
非参数方法的例子
考虑一位希望估算投资的风险价值 (VaR) 的金融分析师。分析师从相似的时间范围内从数百个类似的投资中收集收益数据。她没有假设收入服从正态分布,而是使用直方图以非参数方式估计分布。该直方图的第 5 个百分位数为分析师提供了 VaR 的非参数估计。

再举第二个例子,考虑一位不同的研究人员,他想知道平均睡眠时间是否与一个人生病的频率有关。因为很多人很少生病,如果有的话,偶尔其他人生病的频率比大多数人要高得多,所以患病频率的分布显然是非正态的,是右偏的并且容易出现异常值。

因此,研究人员决定使用非参数方法,例如分位数回归分析,而不是像经典回归分析那样使用假设患病频率呈正态分布的方法。

帮助中心|标签云|免责声明|申请修改|世界地图|锐阔网

Copyright©GMT+8, 2024-5-20 23:21

京ICP备2021033201号

京公网安备11010502050698号

快速回复 返回顶部 返回列表