最新文章
Latest Articles【假设检验秒懂指南】假设检验中的第一类错误和第二类错误
发布时间:2023/08/11 最新文章 科学研究 第1章 临床研究设计 第2章 医学伦理 第3章 生物样本库建设 统计学 浏览次数:208 欢迎阅读!
由于抽样误差等因素,在零假设为真时,样本检验量也有5%(α= 0.05)的机会落在临界域。相应的,当零假设为假时,样本检验量也可能恰好落在接受域。所以,你会错误的拒绝或接受它。从而,产生2种可能的错误:
第一类错误:零假设为真,你却拒绝了它(弃真)。
第二类错误:零假设为假,你却接受了它(存伪)。
请仔细品味下图:
即错误地拒绝了正确的零假设(弃真)。第一类错误发生的概率是由α 来表示,在生物学和医学研究中常常设置为0.05(等于显著性水平)。
假如,你研发了一种防晒霜,想要检验其防晒效果。那么,假设检验的两个假设是:
H0:新的防晒霜没有防晒效果
H1:新的防晒霜有防晒效果
假如,事实上,新的防晒霜真的没有防晒效果。但是,恰巧,使用新防晒霜的实验组的人不怎么爱出门,吃饭也时常叫外卖,而对照组则喜欢天天出去浪!这样一来,你拒绝了零假设,自豪地宣布新的防晒霜具有防晒效果。那么,不好意思,你犯了第一类错误。
▼
第一类错误出现的原因:小概率事件的出现!
即从总体中随机抽样会产生无数个版本的样本,而当你刚好抽到极端样本的时候,小概率事件出现了。但是,你自己又不知道变异是由于小概率事件导致的,还以为处理产生了显著的效果,从而拒绝了零假设,第一类错误便发生了。
接受了错误的零假设(存伪)。第二类错误的概率用β表示。
假设我们正在检测一种新的抗癌药,看看它是否能延长患者的预期寿命。安慰剂组显示平均寿命5年,而新药组平均寿命略高一些,6年。貌似药物产生了效果。那么,这种差异是随机产生的?还是新药的效果?
H0:新药不能帮助延长预期寿命
H1:新药能够帮助延长预期寿命
假设真正的事实是:新药确实能延长患者的预期寿命。通过收集数据进行假设检验,发现P值足够小,那么我们正确地拒绝了原假设,并得出结论,新药可以延长患者的预期寿命。当我们的新药得到推广后,大量患者使用我们的新药后延长了预期寿命。
如果P值不够小,无法拒绝零假设。因而错过了「新药可以延长患者预期寿命」这一事实,那么我们就犯了第二类错误。
这对我们意味着什么呢?
我们可能会(错误地)认为我们的新药并没有期望的作用。从而会放弃研发结果,重新开始,因此错过了可以拯救患者的良药。
第二类错误出现的原因:
1、处理效应本身比较小,小的变化更难发现,更容易被忽略。
2、样本量较小,如果实验对象的数量不够多,真正的改变仍然会导致P值太大而不能拒绝零假设,导致II类错误。
3、研究对象的随机变异太大;本来应该很明显的真实变化没有出现,或者没有大到足以将其与随机变异区分开来。
2)如果将α从0.05提高到0.10,那么将更频繁地拒绝零假设,第二类错误的几率会降低。
但是,降低一种错误的概率,会增加另一种错误的概率。即,α愈小,β愈大;α愈大,β愈小。虽然错误不能完全消除,但我们可以将一种错误最小化。因此,在研究中必须确定哪种错误类型更危险,并尽量避免这种错误的发生。
【假设检验秒懂指南】假设检验中的第一类错误和第二类错误 | |||||||
举例说明: | P=0.03 | P=0.08 | |||||
如果将α从0.05降低到0.01,那么将更少拒绝零假设,第一类错误的几率会降低。 | 如果将α从0.05提高到0.10,那么将更频繁地拒绝零假设,第二类错误的几率会降低。 | 如果将α从0.05降低到0.01,那么将更少拒绝零假设,第一类错误的几率会降低。 | 如果将α从0.05提高到0.10,那么将更频繁地拒绝零假设,第二类错误的几率会降低。 | ||||
α: | 0.01 | 0.05 | 0.1 | 0.01 | 0.05 | 0.1 | |
【一类错误例子】 【实际上:防晒霜是无效的】 假如,你研发了一种防晒霜,想要检验其防晒效果。那么,假设检验的两个假设是: H0:新的防晒霜没有防晒效果 |
接受H0,在α从0.05降低到0.01后拒绝H0的机会降低,第一类错误【弃真:零假设为真缺拒绝了它】的几率降低。
同理第二类错误概率会增加 |
拒绝H0,在α从0.05降低到0.1后拒绝H0的机会频繁发生,第二类错误【存伪:零假设为假却接受了它】的几率降低。
同理第二类错误概率会增加 |
接受H0,在α从0.05降低到0.01后拒绝H0的机会降低,第一类错误【弃真:零假设为真缺拒绝了它】的几率降低。
同理第二类错误概率会增加 |
拒绝H0,在α从0.05降低到0.1后拒绝H0的机会频繁发生,第二类错误【存伪:零假设为假却接受了它】的几率降低。
同理第二类错误概率会增加 |
|||
举例说明: | P=0.03:接受H0 因为α=0.01,P>α |
P=0.03: 拒绝H0 |
P=0.03:拒绝H0 因为α=0.1,P<α |
P=0.08:接受H0 因为α=0.01,P>α |
P=0.08: 接受H0 |
P=0.08:拒绝H0 因为α=0.1,P<α |
|
结论: | 新的防晒霜没有防晒效果 | 新的防晒霜有防晒效果 | 新的防晒霜有防晒效果 | 新的防晒霜没有防晒效果 | 新的防晒霜没有防晒效果 | 新的防晒霜有防晒效果 | |
犯一类错误【弃真】概率低 | 犯二类错误【存伪】概率低 | 犯一类错误【弃真】概率低 | 犯二类错误【存伪】概率低 |
假设检验
-
原假设 (H0) 是假设总体数据中的现状(无关系或无差异)的中性假设。 -
H1 是 H0 的备选项,称为备择假设也被称为对立假设。
-
观察到的 P 值 ≤ 预选 Alpha 级别 → 拒绝 H0 -
观察到的 P 值 > 预选的 Alpha 级别 → 不拒绝 H0
假设检验:可能性
-
H0 是真,但是拒绝 H0 -
H0 是真,不拒绝 H0 -
H0 是假,拒绝 H0 -
H0 是假,不拒绝 H0
如果你对统计学不了解,但是知道一些机器学习的理论的话,可以使用下面的类比方法:上面的1-4其实就是我们一直说的混淆矩阵,2,3是分类正确的值,即 TP 和 TN,1,4则是FP和FN。
Type-I 第一类错误
-
真实情况H0 对总体为真 -
观察结论拒绝H0
Type-II 第二类错误
-
H0 对总体为假 -
观察结论不拒绝H0
几个例子
-
Type-I 错误 → 断定新药有效,但实际上无效。 -
Type-II 错误 → 断定新药无效,而实际上它对治愈疾病有效。
-
Type-I 错误 → 断定一个人是有罪的,而实际上他是无辜的。(即一个无辜的人被送进监狱) -
Type-II 错误 → 断定一个人是无辜的,但实际上他是有罪的。(即释放有罪的人)
I 和 II 错误之间的权衡
-
在真实情况中 H0 为True的情况下,拒绝 H0 的可能性较小会导致Type-I错误比以前更少。 -
在真实情况中 H0 为 False 的情况下,更可能不拒绝 H0 将导致比以更多的 Type-II 错误。
-
在真实情况中 H0 为True的情况下,更有可能拒绝 H0 将导致以更多的 Type-I错误。 -
在真实情况中 H0 为 False 的情况下,不太可能不拒绝 H0 将导致Type-II错误比以前更少。
总结
- Type-I错误:False-Positive
- Type-II错误:False-Negative