最新文章

Latest Articles

密码保护：EXCEL授权

2024/04/17 浏览次数：65 评论：0

赛事方轨迹导入佳明手表方法（含KML和GP...

2023/11/29 浏览次数：232 评论：0

【假设检验秒懂指南】假设检验中的第一...

2023/08/11 浏览次数：208 评论：0

IDSA:2016年新版曲霉菌病诊治指南

2023/05/28 浏览次数：178 评论：0

2016年美国感染病学会新版《曲霉菌病诊...

2023/05/28 浏览次数：221 评论：0

临床检验微生物检验真菌形态学

【假设检验秒懂指南】假设检验中的...

2023/08/11 浏览次数：208 评论：0

样本推断总体，永远无法100%正确。由于抽样误差等因素，在零假设为真时，样本检验量也有5%（α= 0.05...

IDSA:2016年新版曲霉菌病诊治指南

2023/05/28 浏览次数：178 评论：0

曲霉菌病是感染曲霉菌引起的一种真菌病，可累及皮肤、黏膜、眼、鼻、支气管、肺、胃肠道、神经系统、骨...

2016年美国感染病学会新版《曲霉菌...

2023/05/28 浏览次数：221 评论：0

曲霉菌感染是一种免疫相关性疾病，包括3种主要形式，即：侵袭性曲霉菌病(invasive aspergillosis，IA)、...

密码保护：NEJM综述：碱剩余在酸碱...

2023/05/01 浏览次数：190 评论：0

这是一篇受密码保护的文章，您需要提供访问密码：密码：

密码保护：乳酸酸中毒的相关研究进展

2023/05/01 浏览次数：206 评论：0

这是一篇受密码保护的文章，您需要提供访问密码：密码：

密码保护：【专题】教你如何进行血...

2023/04/30 浏览次数：136 评论：0

这是一篇受密码保护的文章，您需要提供访问密码：密码：

密码保护：NEJM-酸碱平衡紊乱的评...

2023/04/30 浏览次数：173 评论：0

这是一篇受密码保护的文章，您需要提供访问密码：密码：

乙肝病毒DNA检查单，copies和IU傻...

2022/09/21 浏览次数：237 评论：0

在治疗/检测乙肝病毒的过程中，很多患者在看到结果的时候会有这样的疑问，为什么HBV DNA有时候的单位是...

密码保护：还有人不会用Sci-Hub神...

2022/08/09 浏览次数：170 评论：0

这是一篇受密码保护的文章，您需要提供访问密码：密码：

密码保护：Unpaywall：文献免费下...

2022/08/09 浏览次数：197 评论：0

这是一篇受密码保护的文章，您需要提供访问密码：密码：

IDSA:2016年新版曲霉菌病诊治指南

2023/05/28 浏览次数：178 评论：0

曲霉菌病是感染曲霉菌引起的一种真菌病，可累及皮肤、黏膜、眼、鼻、支气管、肺、胃肠道、神经系统、骨...

2016年美国感染病学会新版《曲霉菌...

2023/05/28 浏览次数：221 评论：0

曲霉菌感染是一种免疫相关性疾病，包括3种主要形式，即：侵袭性曲霉菌病(invasive aspergillosis，IA)、...

第一代头孢、第二代头孢、第三代头...

2022/05/08 浏览次数：299 评论：1

头孢类是一大类抗菌药物，常用药物超过30种，按照发明年代的先后顺序，以及抗菌谱作用特点的不同，可...

Geotrichum candidum地丝菌属

2017/05/02 浏览次数：658 评论：0

Geotrichum candidum (yeast/fungus) Ecology: Ubiquitous worldwide distribution. Has...

A simple and low-cost paper-brid...

2017/04/08 浏览次数：603 评论：0

Article (PDF Available) in Diagnostic Microbiology and Infectious Disease 54(4):315-7 · May 2006 ...

祸起非结核分枝杆菌，您对它了解多...

2017/02/25 浏览次数：746 评论：0

整理：杜凤霞（内蒙古包钢医院）审稿：王玉兰/刘玉岭这几起医院感染暴发事件是不是耳熟能详？---1...

Yeast Infections in Pregnancy: R...

2017/02/25 浏览次数：658 评论：0

Question: Which treatment options for vaginal yeast infections are safe and effective in the preg...

细菌（Bacterium）的结构

2017/01/21 浏览次数：560 评论：0

常见丙酸杆菌（Propionibacterium...

2017/01/21 浏览次数：1048 评论：0

诺卡菌属（Nocardia）鉴定

2017/01/21 浏览次数：915 评论：0

专性需氧，在血琼脂平板和巧克力平板上生长良好,先将菌落放在盐水调0.5麦氏浊度的菌液再接种再Blood ...

IDSA:2016年新版曲霉菌病诊治指南

2023/05/28 浏览次数：178 评论：0

曲霉菌病是感染曲霉菌引起的一种真菌病，可累及皮肤、黏膜、眼、鼻、支气管、肺、胃肠道、神经系统、骨...

2016年美国感染病学会新版《曲霉菌...

2023/05/28 浏览次数：221 评论：0

曲霉菌感染是一种免疫相关性疾病，包括3种主要形式，即：侵袭性曲霉菌病(invasive aspergillosis，IA)、...

Geotrichum candidum地丝菌属

2017/05/02 浏览次数：658 评论：0

Geotrichum candidum (yeast/fungus) Ecology: Ubiquitous worldwide distribution. Has...

Yeast Infections in Pregnancy: R...

2017/02/25 浏览次数：658 评论：0

Question: Which treatment options for vaginal yeast infections are safe and effective in the preg...

常见丙酸杆菌（Propionibacterium...

2017/01/21 浏览次数：1048 评论：0

真菌孢子发生

2017/01/11 浏览次数：1032 评论：0

真菌孢子是怎么产生的？笔者整理了资料，想就真菌孢子发生来一期科普。先强调一点，本期所讲的孢子...

短尾帚霉（Scopulariopsis brevica...

2016/12/22 浏览次数：911 评论：0

帚霉属以前是归在青霉属里的（Scopulariopsis species previously belong to pencillium species.） ...

马尔尼菲青霉菌（penicillin marni...

2016/12/21 浏览次数：1060 评论：0

温度双相性真菌（产红色色素），主要存在于免疫力收损的病人，多见于此类病人的血培养标本...

耶氏肺孢子菌（Pneumocystis jirov...

2016/12/21 浏览次数：1960 评论：0

命名由来：耶氏肺孢子菌（Pneumocystis jiroveci）其实就是以前的卡氏肺孢子菌肺炎(Pneumocystis carini...

须毛癣菌Trichophyton mentagrophytes

2015/07/18 浏览次数：872 评论：0

致病：侵犯皮肤、指甲、毛发，引起手足癣、体股癣、脓癣，毛发感染时呈发外型，局部...

【假设检验秒懂指南】假设检验中的第一类错误和第二类错误

发布时间：2023/08/11 最新文章科学研究第1章临床研究设计第2章医学伦理第3章生物样本库建设统计学 浏览次数：208 欢迎阅读！

样本推断总体，永远无法100%正确。

由于抽样误差等因素，在零假设为真时，样本检验量也有5%（α= 0.05）的机会落在临界域。相应的，当零假设为假时，样本检验量也可能恰好落在接受域。所以，你会错误的拒绝或接受它。从而，产生2种可能的错误：

第一类错误：零假设为真，你却拒绝了它（弃真）。

第二类错误：零假设为假，你却接受了它（存伪）。

请仔细品味下图：

第一类错误

即错误地拒绝了正确的零假设（弃真）。第一类错误发生的概率是由α 来表示，在生物学和医学研究中常常设置为0.05（等于显著性水平）。

假如，你研发了一种防晒霜，想要检验其防晒效果。那么，假设检验的两个假设是：

H0：新的防晒霜没有防晒效果

H1：新的防晒霜有防晒效果

假如，事实上，新的防晒霜真的没有防晒效果。但是，恰巧，使用新防晒霜的实验组的人不怎么爱出门，吃饭也时常叫外卖，而对照组则喜欢天天出去浪！这样一来，你拒绝了零假设，自豪地宣布新的防晒霜具有防晒效果。那么，不好意思，你犯了第一类错误。

▼

第一类错误出现的原因：小概率事件的出现！

即从总体中随机抽样会产生无数个版本的样本，而当你刚好抽到极端样本的时候，小概率事件出现了。但是，你自己又不知道变异是由于小概率事件导致的，还以为处理产生了显著的效果，从而拒绝了零假设，第一类错误便发生了。

第二类错误

接受了错误的零假设（存伪）。第二类错误的概率用β表示。

假设我们正在检测一种新的抗癌药，看看它是否能延长患者的预期寿命。安慰剂组显示平均寿命5年，而新药组平均寿命略高一些，6年。貌似药物产生了效果。那么，这种差异是随机产生的？还是新药的效果？

H0：新药不能帮助延长预期寿命

H1：新药能够帮助延长预期寿命

假设真正的事实是：新药确实能延长患者的预期寿命。通过收集数据进行假设检验，发现P值足够小，那么我们正确地拒绝了原假设，并得出结论，新药可以延长患者的预期寿命。当我们的新药得到推广后，大量患者使用我们的新药后延长了预期寿命。

如果P值不够小，无法拒绝零假设。因而错过了「新药可以延长患者预期寿命」这一事实，那么我们就犯了第二类错误。

这对我们意味着什么呢？

我们可能会（错误地）认为我们的新药并没有期望的作用。从而会放弃研发结果，重新开始，因此错过了可以拯救患者的良药。

第二类错误出现的原因：

1、处理效应本身比较小，小的变化更难发现，更容易被忽略。

2、样本量较小，如果实验对象的数量不够多，真正的改变仍然会导致P值太大而不能拒绝零假设，导致II类错误。

3、研究对象的随机变异太大；本来应该很明显的真实变化没有出现，或者没有大到足以将其与随机变异区分开来。

如何避免错误？

1）如果将α从0.05降低到0.01，那么将更少拒绝零假设，第一类错误的几率会降低。

2）如果将α从0.05提高到0.10，那么将更频繁地拒绝零假设，第二类错误的几率会降低。

但是，降低一种错误的概率，会增加另一种错误的概率。即，α愈小，β愈大；α愈大，β愈小。虽然错误不能完全消除，但我们可以将一种错误最小化。因此，在研究中必须确定哪种错误类型更危险，并尽量避免这种错误的发生。

【假设检验秒懂指南】假设检验中的第一类错误和第二类错误
举例说明：	P=0.03			P=0.08
	如果将α从0.05降低到0.01，那么将更少拒绝零假设，第一类错误的几率会降低。		如果将α从0.05提高到0.10，那么将更频繁地拒绝零假设，第二类错误的几率会降低。	如果将α从0.05降低到0.01，那么将更少拒绝零假设，第一类错误的几率会降低。		如果将α从0.05提高到0.10，那么将更频繁地拒绝零假设，第二类错误的几率会降低。
α：	0.01	0.05	0.1	0.01	0.05	0.1
【一类错误例子】【实际上：防晒霜是无效的】假如，你研发了一种防晒霜，想要检验其防晒效果。那么，假设检验的两个假设是： H0：新的防晒霜没有防晒效果 H1：新的防晒霜有防晒效果	接受H0，在α从0.05降低到0.01后拒绝H0的机会降低，第一类错误【弃真：零假设为真缺拒绝了它】的几率降低。同理第二类错误概率会增加		拒绝H0，在α从0.05降低到0.1后拒绝H0的机会频繁发生，第二类错误【存伪：零假设为假却接受了它】的几率降低。同理第二类错误概率会增加	接受H0，在α从0.05降低到0.01后拒绝H0的机会降低，第一类错误【弃真：零假设为真缺拒绝了它】的几率降低。同理第二类错误概率会增加		拒绝H0，在α从0.05降低到0.1后拒绝H0的机会频繁发生，第二类错误【存伪：零假设为假却接受了它】的几率降低。同理第二类错误概率会增加
举例说明：	P=0.03：接受H0 因为α=0.01，P>α	P=0.03：拒绝H0	P=0.03：拒绝H0 因为α=0.1，P<α	P=0.08：接受H0 因为α=0.01，P>α	P=0.08：接受H0	P=0.08：拒绝H0 因为α=0.1，P<α
结论：	新的防晒霜没有防晒效果	新的防晒霜有防晒效果	新的防晒霜有防晒效果	新的防晒霜没有防晒效果	新的防晒霜没有防晒效果	新的防晒霜有防晒效果
	犯一类错误【弃真】概率低		犯二类错误【存伪】概率低	犯一类错误【弃真】概率低		犯二类错误【存伪】概率低

——————————————————————————————————————————————————

本文对统计假设检验期间发生的 Type-I和 Type-II 错误的直观而详细的解释。

我们每天都在为选择进行自己的假设，并且按照自己认为最好的方向做出选择，所以假设在我们的生活中是无处不在的，例如：A 路是否会比 B 路花费更少的时间，X 的平均投资回报率是否高于 Y 的投资，以及电影 ABC 是否比电影 XYZ 好。在所有这些情况下，我们都在对我们做出的假设进行检验。

建立假设，使用数据证明/反驳它们，帮助企业做出决策，这是数据科学家的实际工作。人们通常依靠概率来理解偶然观察数据的可能性，并利用它围绕假设得出结论。概率永远（几乎！）不会 100%，这反过来意味着我们永远无法 100% 确定我们的结论。所以在围绕我们假设的假设得出结论时，总是会出现错误的情况。

下面的本文就是对统计假设检验期间发生的 Type-I和 Type-II 错误的直观而详细的解释。

假设检验

假设检验是通过观察样本数据来检验围绕总体参数的假设的领域，因为我们很少有整体的数据，所以只能从整体中进行抽样观察。

这通常是通过从假设的中性状态（称为原假设、零假设、虚无假设）开始并根据观察到的样本数据证明或反驳这一点来完成的。

原假设 (H0) 是假设总体数据中的现状（无关系或无差异）的中性假设。
H1 是 H0 的备选项，称为备择假设也被称为对立假设。

假设检验的基本思想是概率性质的反证法。根据所考察问题的要求提出原假设和备择假设，为了检验原假设是否正确，先假定原假设是正确的情况下，构造一个小概率事件，然后根据抽取的样本去检验这个小概率事件是否发生。

假设检验过程如下：

假设 H0 → 观察样本数据 → 拒绝或不拒绝 H0

我们假设中性 H0 为真，并在观察到的数据中寻找“拒绝”或“不拒绝”H0 的证据。根据观察到的样本数据，我们计算观察到的统计量和观察到的 P 值；例如：从我们观察到的样本中获得的假设 H0 为真的概率。

然后将该观察到的 P 值与预先确定的显著性水平（或 Alpha 值）进行比较。此 Alpha 值充当阈值，超过该阈值会认为观察到的结果具有统计显着性。基于观察到的 P 值与预先选择的阈值 alpha 值的比较，就可以就假设的 H0 得出结论：

观察到的 P 值 ≤ 预选 Alpha 级别 → 拒绝 H0
观察到的 P 值 > 预选的 Alpha 级别 → 不拒绝 H0

由于观察到的 P 值是一个概率，因此总是有可能对“拒绝”或“不拒绝”原假设做出错误的判断。

在下图 1 中，左侧是假设的原假设 (H0) 总体分布，右侧是备择假设 (H1) 总体分布。（两者都是未知的和假设的，因为没有整体的数据，只是根据抽样的样本判断）。观察到的样本将位于这些分布的某个位置，基于此我们将得出关于我们的零假设 (H0) 的结论。

图1 ：零假设(H0)分布和备选假设(H1)分布

如果分布没有重叠，我们将永远不会在结论中观察到错误。但是在实际情况中，它们几乎总是重叠的。Type-I 和 Type-II 错误发生在这两个分布重叠的地方。

需要说明的是：对于原假设，我们可以根据在数据中观察到的证据“拒绝它”，也可以“不拒绝它”，因为观察到的数据没有带来足够的重要证据。

假设检验：可能性

实际上，H0 只有两个选项——它可以是 True 或 False。同样，根据观察到的数据，我们只能得出两个可能的结论——我们可以拒绝 H0 或不拒绝 H0。

其实这就变成了一个二分类的问题，H0是正确的还是错误的

H0 是真，但是拒绝 H0
H0 是真，不拒绝 H0
H0 是假，拒绝 H0
H0 是假，不拒绝 H0

（2）和（3），我们正在根据观察到的数据做出正确的结论。

（1）和（4），我们得出了错误的结论，因为观察到的数据发现与现实背道而驰。在场景 (1) 和 (4) 中，就是本文要解释的 Type-I 和 Type-II 错误。

如果你对统计学不了解，但是知道一些机器学习的理论的话，可以使用下面的类比方法：上面的1-4其实就是我们一直说的混淆矩阵，2，3是分类正确的值，即 TP 和 TN，1，4则是FP和FN。

Type-I 第一类错误

Type-I错误是指当原假设实际上为真时拒绝原假设的场景。根据我们观察到的数据得出结论是观察到的结果在现实中具有统计意，但是我们认为它是无意义的。

如上所述，“拒绝”或“不拒绝”零假设取决于观察到的 P 值和预先确定的 alpha 值。所以在某些情况下，真实的原假设将被拒绝，因为观察到的 P 值将小于预先选择的 Alpha 水平。这就是Type-I错误的内容：False-Positive

对于Type-I错误场景：

真实情况H0 对总体为真
观察结论拒绝H0

对于对总体正确的原假设，如果我们反复采样，可以得到原假设分布曲线，显示所有可能观察到的样本结果的概率。（下图2左侧H0分布）

当我们观察一个样本时，我们拒绝 H0，这意味着这个观察到的样本必须位于 H0 分布曲线的最右侧，与 H1 分布曲线重叠。下图 2 表示这种情况：

图2：Type-I错误的概率

Type-I错误的区域，称为临界区域，表示在零假设分布曲线的右尾端。这是由我们预先选择的 Alpha 值决定的。

如果我们观察到的结果落在这个区域，我们将拒绝零假设（对于这些场景，观察到的 p 值<Alpha）。由于 H0 在现实中是正确的，我们会得出False-Positive结论。

Type-II 第二类错误

Type-II错误是指当原假设实际上是错误的时不拒绝它的场景。根据我们观察到的数据得出的结论是，观察到的结果在实际上并不具有统计学意义，但是我们认为它是有意义的。Type-II错误：False-Negative

这可能由于缺乏证据而发生，即我们的研究可能没有足够的统计能力来检测一定的效应大小。

犯Type-II错误的概率用Beta 表示。统计研究的功效（Power ）定义为，Power = 1 – Beta

所以可以通过确保的研究具有较高的统计功效来减少犯Type-II错误的机会。

对于 Type-II 错误：

H0 对总体为假
观察结论不拒绝H0

对于对总体错误的零假设，如果我们反复从总体中抽取样本，我们将得到一条备择假设分布曲线，显示所有可能观察到的样本结果的概率。（下图3右侧H1分布）

由于我们正在观察一个样本，因此我们没有证据拒绝 H0。这意味着这个观察到的样本必须位于 H1 分布曲线的最左侧，与 H0 分布曲线重叠（请参见下面的图3 代表这种情况）

图3：Type-II错误的概率

Beta 是 Type-II错误率，由左侧的阴影区域表示。右边的剩余区域代表统计功效（Power）。

如果观察到的结果落在该区域内，将无法拒绝零假设，即使我们知道 H0 对于总体而言是错误的。所以得出一个False-Negative结论。

几个例子

1、测试新药以帮助治疗疾病：H0新药无效、 H1新药有效

Type-I 错误 → 断定新药有效，但实际上无效。
Type-II 错误 → 断定新药无效，而实际上它对治愈疾病有效。

2、刑事审判：H0无辜、 H1有罪

Type-I 错误 → 断定一个人是有罪的，而实际上他是无辜的。（即一个无辜的人被送进监狱）
Type-II 错误 → 断定一个人是无辜的，但实际上他是有罪的。（即释放有罪的人）

I 和 II 错误之间的权衡

在假设检验中通过将观察值与预先确定的截止值 (Alpha) 进行比较来“拒绝”或“不拒绝”假设。所以考虑以下使 Alpha 越来越低的情况：

情况1：如果 Alpha变得更严格（即 Alpha 的值越小），在拒绝 H0 方面的限制就会更严格，而在不拒绝 H0 方面的限制会更小。这会导致不太可能拒绝 H0，更有可能不拒绝 H0。

在真实情况中 H0 为True的情况下，拒绝 H0 的可能性较小会导致Type-I错误比以前更少。
在真实情况中 H0 为 False 的情况下，更可能不拒绝 H0 将导致比以更多的 Type-II 错误。

情况2：如果 Alpha 级别变得不那么严格（即更高的 Alpha 值），在拒绝 H0 方面的限制将更少，而在不拒绝 H0 方面的限制更大。这会导致更有可能拒绝 H0，不太可能不拒绝 H0。

在真实情况中 H0 为True的情况下，更有可能拒绝 H0 将导致以更多的 Type-I错误。
在真实情况中 H0 为 False 的情况下，不太可能不拒绝 H0 将导致Type-II错误比以前更少。

因此显然存在二者的权衡，因为2类的错误是相关的，当一个增加另一个减少时，反之亦然。

从下图 4 可以看出，如果 Alpha 增加，则 Beta 减少，如果 Beta 减少，则 Alpha 将增加。

图4：发生Type-I和 Type-II 错误的概率

哪个类的错误更糟糕呢？没有简单的答案，因为都取决于被检验的假设和做出错误结论的成本评估：如果Type-I 的成本较高，则应尽量避免如果制作Type-II成本高，也应该优先考虑。

但是通常认为Type-I误会产生更多后果，因为 Type-I错误意味着违背现状（H0）的假设，并可能导致引入新的变化，现有的状况产生更坏的影响。而 Type-II 错误意味着无法拒绝对现状 (H0) 的假设，并且可能只会导致错失机会。

总结

假设检验是数据科学中一个非常重要的概念。统计的力量使我们能够对总体做出假设，观察数据样本以使我们能够拒绝或不拒绝我们的假设并得出结论。假设检验有两种可能的错误——Type-I错误和Type-II错误。

假设检验过程：假设一个中性 H0 → 观察数据（将观察到的 P 值与预先确定的 alpha 水平进行比较）→ 拒绝或不拒绝 H0。

Type-I错误：False-Positive
Type-II错误：False-Negative

Type-I 和 Type-II 错误相互影响相反。减少一个总是增加另一个，反之亦然。一般来说，Type-I 错误被认为Type-II 错误更重要。但是，也要取决于被检验的假设以及围绕我们的假设得出这些错误结论的成本。

编辑：王菁

上一篇: 赛事方轨迹导入佳明手表方法（含KML和GPX格式）

下一篇: IDSA:2016年新版曲霉菌病诊治指南

相关推荐