系统抽样与集群抽样有什么区别?

发表于 2021-10-30 11:31:53
系统抽样和整群抽样是研究人员、分析师和营销人员用来研究总体样本的两种不同类型的统计度量。

系统抽样和整群抽样从总体中抽取样本点的方式不同。系统抽样使用较大总体的固定间隔来创建样本,而整群抽样将总体划分为不同的群。

系统抽样从总体中随机选择一个起点,然后根据总体规模从总体的固定间隔中抽取样本。集群抽样将总体划分为集群,然后从每个集群中抽取一个简单的随机样本。1 2 在本文中,我们将介绍这两种采样类型的差异、它们的优缺点、何时最好使用一种,以及每种类型的示例。

系统抽样
系统抽样是一种随机概率抽样方法。它是研究人员和分析师最流行和最常用的方法之一。这种方法涉及从更大的组中选择样本。虽然起点可能是随机的,但抽样涉及使用每个成员之间的固定间隔。

这是它的工作原理。研究人员首先从更大的人群中选择一个起点。这通常采用整数形式,该整数必须小于较大群体中的受试者数量。然后分析师选择每个成员之间的间隔;这是每个成员之间的一致差异。这是一个假设的例子。假设研究中有 100 人。研究人员从第 10 位的人开始。然后他们决定此后每七个人选一个。这意味着在抽样中选择了以下地点的人:10、17、24、31、38、45 等。

系统抽样的优缺点
这种类型的统计抽样相当简单,这就是为什么它普遍受到研究人员的青睐。它对于金融中的某些目的也非常有用。使用这种方法的人假设结果代表了大多数正常人群。这个过程也保证了整个群体被均匀采样。1 但是,这种采样可能存在问题。例如,操纵数据的风险可能更大,因为使用这种方法的人可能会根据所需的结果选择主题和间隔。

系统抽样易于进行且易于理解。可能有预算或时间限制的统计学家发现使用系统抽样在创建、比较和理解他们的样本方面是有利的。此外,由于其过程,与其他抽样方法相比,系统抽样提供了更高程度的控制。

系统抽样还消除了聚类选择,即群体中随机选择的样本不自然地靠近在一起。随机样本与系统样本相反,只能通过进行多次调查或增加样本数量来消除这种情况;两者都可能既费时又费钱。系统抽样还具有低风险因素,因为数据被污染的可能性很小。

尽管有许多优点,但系统抽样确实有缺点。系统抽样的主要限制是需要人口规模。如果没有群体中特定数量的参与者,系统抽样就不能很好地工作。例如,如果统计人员想检查特定地区无家可归者的年龄,但无法准确获得有多少无家可归者,那么他们将没有人口规模或起点。

另一个缺点是人口需要具有自然数量的随机性。如果不是,则选择相似实例的风险会增加,从而违背样本的目的。

系统抽样的例子
系统抽样的目标是获得无偏样本。实现这一目标的方法是为总体中的每个参与者分配一个数字,然后在总体中选择相同的指定区间来创建样本。

例如,您可以选择每 5 个参与者或每 20 个参与者,但您必须在每个群体中选择相同的参与者。选择第 n 个数字的过程是系统抽样。

例如,一家牙膏公司创造了一种新口味的牙膏,并希望在将其出售给公众之前在样本人群中进行测试。测试是为了确定新口味是否被样品接受。该公司将 50 人放在一起,并决定使用系统抽样来创建一个由 10 人组成的样本,他们将考虑对牙膏的意见。

首先,营销团队为人群中的每个参与者分配一个数字。在这种情况下,它在该组中有 50 人,因此它将为每个参与者分配一个从 1 到 50 的数字。接下来,它必须确定它希望拥有多大的样本,并确定了样本大小10. 因此,50 / 10 = 5。五将是它的采样位数;这意味着它将选择人口中每五分之一的参与者来获得其样本。下表概述了这一点,其中每五名参与者以粗体表示,并为样本选择了一名参与者。

1         2         3         4         5
6         7         8         9         10
11         12         13         14         15
16         17         18         19         20
21        22        23        24        25
26        27        28        29        30
31        32        33        34        35
36        37        38        39        40
41        42        43        44        45
46        47        48        49        50
整群抽样
整群抽样是另一种类型的随机统计量度。当较大的群体中存在不同的组子集时,使用此方法。这些组被称为集群。整群抽样通常被营销团体和专业人士使用。

由于人口规模庞大,在尝试研究城市、城镇或地区的人口统计数据时,最好使用整群抽样。
整群抽样是一个两步程序。首先,选择整个种群并分成不同的集群。然后从这些子组中选择随机样本。例如,研究人员可能会发现很难构建杂货店的整个顾客群体以进行访谈。但是,他们可能能够创建商店的随机子集;这是该进程的第一步。第二步是采访这些商店的顾客的随机样本。

聚类抽样的类型
有两种类型的整群抽样:一阶段整群抽样和两阶段整群抽样。

一级整群抽样涉及选择一个随机的群样本并从该群中的每个主题中收集数据。两阶段整群抽样是随机选取多个群,并在每个群内随机选择某些主体形成最终样本。两阶段抽样可以看作是单阶段抽样的一个子集:从创建的集群中抽样某些元素。

集群抽样的优缺点
如上例所示,当难以完成整个总体的列表时,可以使用这种抽样方法。这是一个简单的手动过程,可以节省时间和金钱。2

事实上,与其他方法相比,使用集群抽样可能相当便宜。这是因为通常相关的成本和费用较少,因为整群抽样需要随机选择选定的群,而不是评估整个群体。同样的过程也允许增加样本大小。由于统计学家只从一组选定的集群中进行选择,他们可以增加要从该集群中抽样的受试者数量。

整群抽样的主要缺点是与它相关的抽样误差较大,使其不如其他抽样方法精确。这是因为集群中的受试者往往具有相似的特征,这意味着集群抽样不包括不同的人口统计数据。这通常会导致集群内的代表性过高或不足,因此可能是有偏见的样本。

集群抽样示例
例如,假设正在进行一项学术研究,以确定投资银行有多少员工拥有MBA学位,在这些 MBA 学位中,有多少来自常春藤盟校。统计学家很难去每家投资银行询问每一位员工的教育背景。为了达到这个目标,统计学家可以采用整群抽样。

第一步是组建投资银行集群。统计学家可以选择研究前三大投资银行的收入,而不是研究每家投资银行,形成第一个集群。从那里,不是采访所有三个投资银行的每个员工,统计员可以形成另一个集群,其中将只包括来自某些部门的员工,例如,销售和交易或并购。

这种方法允许统计人员缩小抽样规模,使其更有效率和成本效益,但仍然有足够多的样本来衡量所寻求的信息。

特别注意事项
尽管系统抽样和整群抽样都是随机抽样的形式,但它们以完全不同的方式得出样本大小。系统抽样根据总体中的固定间隔选择样本,而整群抽样从总体中创建一个集群。

整群抽样更适用于特定总体中存在不同子集的情况,而系统抽样更适合在整个列表或总体数量已知的情况下使用。然而,两者都将总体分成更小的单位进行抽样。

对于系统抽样,重要的是确保组中没有模式,否则,您可能会选择类似的主题而不能代表整体人口。对于集群抽样,重要的是确保每个集群与整个样本具有相似的特征。

系统抽样        整群抽样
通过间隔选择对象来选择样本        通过创建集群来选择样本

必须知道整个人口的名单或人数        创建集群不需要整个人口

必须避免群体中的模式以确保准确性        集群应该与整个样本具有相似的特征

集群抽样常见问题

集群抽样是什么意思?
聚类抽样是随机抽样的一种形式,它将总体划分为聚类以创建样本。还可以从初始集群创建更多集群以缩小样本范围。

为什么要使用集群抽样?
整群抽样最适用于研究分散的大群体,在这种情况下,采访每个对象既昂贵又耗时,而且可能是不可能的。聚类抽样允许创建具有相似特征的较小代表被评估总体的聚类。

集群抽样如何工作?
整群抽样只是将被研究的人口分成更小的组。可以研究这些亚组或进一步随机分为其他亚组。

聚类抽样和分层抽样有什么区别?
整 群抽样和分层抽样之间的主要区别在于,整群抽样中创建的集群是异质的,而分层抽样的组是同质的。

底线
有多种抽样方法可供寻求研究组内信息的统计人员使用。由于群体或群体往往很大,因此很难从每个主题中获取数据。为了克服这个问题,统计学家使用抽样,创建更小的组来代表更大的人口。

创建这些较小样本的一个重要方面是确保它们是随机选择的,并且是较大总体的真实代表。系统抽样和整群抽样是统计学家可以用来研究总体的两种方法。

两者都是随机抽样的形式,可以节省时间和成本,将人群分成更小的组以便于分析。当整个总体已知时,系统抽样效果最好,而当整个总体难以衡量时,整群抽样效果最好。

帮助中心|标签云|免责声明|申请修改|世界地图|锐阔网

Copyright©GMT+8, 2024-5-21 02:57

京ICP备2021033201号

京公网安备11010502050698号

快速回复 返回顶部 返回列表