什么是卡方(χ2)统计量？

*发表于 2021-10-29 18:42:45* · 发表于 2021-10-29 18:42:45

卡方 ( χ 2 ) 统计量是一种测试，用于衡量模型与实际观察数据的比较情况。用于计算卡方统计量的数据必须是随机的、原始的、互斥的、从自变量中提取的，并且是从足够大的样本中提取的。例如，掷一枚公平硬币的结果符合这些标准。

卡方检验常用于假设检验。给定样本大小和关系中的变量数量，卡方统计量比较预期结果与实际结果之间的任何差异的大小。

对于这些测试，根据实验中的变量和样本总数，利用自由度来确定是否可以拒绝某个零假设。与任何统计数据一样，样本量越大，结果越可靠。

卡方的公式是

在哪里：
C=自由程度
O=观察值
乙=预期值

卡方统计量告诉您什么？
卡方检验有两种主要类型：独立性检验，它提出关系问题，例如“学生性别和课程选择之间是否存在关系？”；以及拟合优度测试，它会询问诸如“我手中的硬币与理论上公平的硬币的匹配程度如何？”

卡方分析适用于分类变量，当这些变量是名义变量时（其中顺序无关紧要，如婚姻状况或性别）尤其有用。

独立
当考虑学生发生性关系，当然选择，一个χ 2可用于测试的独立性。为了进行这个测试，研究人员将收集关于两个选定变量（性别和所选课程）的数据，然后使用上面给出的公式和χ 2统计表比较男女学生在所提供课程中选择的频率。

如果性别和选课之间没有关系（也就是说，如果他们是独立的），那么男女学生选择每门课程的实际频率应该大致相等，或者相反，男学生和女学生的比例应该大致相等。任何选定课程的女学生应大致等于样本中男女学生的比例。

一个χ 2测试的独立性可以告诉我们它是如何可能是随机的机会可以解释数据的实际频率，这些理论预期之间的任何观察到的差异。

拟合优度
χ 2提供了一种测试数据样本与样本打算代表的较大总体的（已知或假设的）特征匹配程度的方法。这就是所谓的拟合优度。如果样本数据不符合我们感兴趣的总体的预期属性，那么我们就不想使用这个样本来得出关于更大总体的结论。

例子
例如，考虑一个假想的硬币，正面或反面的几率正好为 50/50，而一枚真实硬币你掷了 100 次。如果这枚硬币是公平的，那么它也有相等的概率落在两边，抛硬币 100 次的预期结果是正面会出现 50 次，反面会出现 50 次。

在这种情况下，χ 2可以告诉我们掷硬币 100 次的实际结果与公平硬币将给出 50/50 结果的理论模型相比有多好。实际的投掷可能会达到 50/50、60/40，甚至 90/10。100 次抛掷的实际结果离 50/50 越远，这组抛掷对 50/50 的理论预期的拟合越差，我们就越有可能得出结论，这枚硬币实际上不是一枚硬币。公平的硬币。

何时使用卡方检验
卡方检验用于帮助确定观察结果是否与预期结果一致，并排除观察结果是偶然的。当被分析的数据来自随机样本并且所讨论的变量是分类变量时，卡方检验适用于此。分类变量是由诸如汽车类型、种族、教育程度、男性与女性、某人喜欢政治候选人的程度（从非常到非常少）等选择组成的变量。

这些类型的数据通常是通过调查回复或问卷收集的。因此，卡方分析通常在分析此类数据时最有用。
卡方检验有什么用？
卡方是一种统计检验，用于检查来自随机样本的分类变量之间的差异，以判断预期结果和观察结果之间的拟合优度。

谁使用卡方分析？
由于卡方适用于分类变量，因此研究调查响应数据的研究人员最常使用它。这类研究的范围可以从人口统计学到消费者和营销研究，再到政治科学和经济学。

当自变量是名义变量还是有序变量时，是否使用卡方分析？
名义变量是质量不同的分类变量，但其数值顺序可能无关紧要。例如，询问某人他们最喜欢的颜色会产生一个名义变量。另一方面，询问某人的年龄会产生一组有序的数据。卡方最适用于名义数据。