什么是同方差定义?

发表于 2021-10-30 13:32:16
同方差定义是指回归模型中残差或误差项的方差恒定的条件。也就是说,误差项不会随着预测变量值的变化而变化很大。另一种说法是,所有数据点的数据点方差大致相同。这表明了一定程度的一致性,并使通过回归建模和处理数据变得更容易。然而,缺乏同方差性可能表明回归模型可能需要包括额外的预测变量来解释因变量的表现。

同方差的工作原理
同方差是线性回归建模的一种假设,这种类型的数据与最小二乘法配合得很好。如果回归线周围的误差方差变化很大,则回归模型可能定义不明确。同方差的反面是异方差,就像“同质”的反面是“异质”一样。是指回归方程中误差项的方差不恒定的情况。

当考虑方差是给定情况的预测结果与实际结果之间的测量差异时,确定同方差性有助于确定需要调整哪些因素以确保准确性。

特别注意事项
一个简单的回归模型或方程由四项组成。左边是因变量。它代表了模型试图“解释”的现象。右侧是一个常数、一个预测变量和一个残差或误差项。误差项显示因变量中未被预测变量解释的变异量。

同方差的例子
例如,假设您想使用每个学生的学习时间来解释学生的考试成绩。在这种情况下,测试分数将是因变量,而学习所花费的时间将是预测变量。

误差项将显示未由学习时间量解释的测试分数的差异量。如果该方差是均匀的或同方差的,那么这表明该模型可能是对测试性能的充分解释——用学习时间来解释它。

但方差可能是异方差的。误差项数据图可能会显示大量学习时间与高测试分数非常接近,但低学习时间测试分数差异很大,甚至包括一些非常高的分数。因此,仅用一个预测变量——学习时间——并不能很好地解释分数的差异。在这种情况下,可能有其他一些因素在起作用,可能需要增强模型以识别它或它们。

进一步的调查可能会发现,一些学生提前看到了测试的答案,或者他们之前参加过类似的测试,因此不需要为这个特定的测试而学习。就此而言,结果可能是,学生的考试通过能力水平不同,与他们的学习时间和他们在以前的考试中的表现无关,无论学科如何。

为了改进回归模型,研究人员必须尝试其他可以更准确地拟合数据的解释变量。例如,如果一些学生提前看到了答案,那么回归模型将有两个解释变量:学习时间以及学生是否对答案有先验知识。有了这两个变量,可以解释更多的测试分数方差,然后误差项的方差可能是同方差的,这表明模型是明确定义的。

帮助中心|标签云|免责声明|申请修改|世界地图|锐阔网

Copyright©GMT+8, 2024-5-20 21:59

京ICP备2021033201号

京公网安备11010502050698号

快速回复 返回顶部 返回列表