肥宅钓鱼网
当前位置: 首页 钓鱼百科

统计预测的实验总结(统计学3AB测试)

时间:2023-06-18 作者: 小编 阅读量: 1 栏目名: 钓鱼百科

在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立。这种根据统计量落入的区域做出是否拒绝原假设的决策。参数估计和假设检验都是利用样本对总体进行推断。如果将构造置信区间的步骤重复多次,置信区间所包含总体参数真值的次数所占的比例称为置信水平。

我是ZZ,点击上方“关注”,每天为你分享数据分析干货;私信我回复数字01,送你一份新手入门数据分析大礼包。

统计学(2)|A/B测试—理论基础中,我们理清了AB测试的理论基础——假设检验的思想,并且严格推导了为什么现在公司做AB测试基本全都使用统计量。这篇文章,我们来介绍一下如何对AB测试的实验结果进行分析。在进行结果分析之前,我们先简单回顾一下假设检验的相关知识。

1.假设检验1.1 假设检验的定义

假设检验是先对总体的参数提出某种假设,然后利用样本数据判断假设是否成立的过程。

具体到A/B测试里的假设检验,就是指假设实验组的总体参数等于对照版本的总体参数,然后利用这两个版本的样本数据来判断这个假设是否成立。如果样本数据拒绝原假设,我们说检验的结果是显著的;反之,我们则说结果是不显著的。

1.2 假设检验的流程
  • 提出原假设与备择假设
  • 构造检验统计量
  • 进行决策

了解了假设检验的流程之后,我们一一介绍一下这个里面的一些基本概念。

1.3 假设检验中的基本概念

1.3.1 原假设H0和备择假设H1

我们常把没有把握不能轻易肯定的命题作为备择假设 ,而把没有充分理由不能轻易否定的命题作为零假设 ,或者说我们将希望通过实验结果推翻的假设记为零假设 。

原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立。

1.3.2 检验统计量

在AB测试涉及的假设检验中,我们所构造的检验统计量稍微有一丢丢复杂,因为假设检验想要比较两个总体参数是否存在显著差异,所以对应的两个样本的统计量相比单个样本的统计量复杂一些。但有了上一篇文章的推导之后,我们了解了 统计量是如何构造的,所以可以直接用一张图来表示不同情况下对应的不同统计量的形式。

2. 实验结果分析

当我们提出假设,并且构造完统计量之后,我们就要进行决策了,在统计学中,进行决策通常有两种方式:

一种是将统计量的值与给定显著性水平下统计量的分布的临界值作比较,以此来判断是否接受原假设。这种根据统计量落入的区域做出是否拒绝原假设的决策。确定显著性水平 以后,拒绝域的位置也就确定了。(显著性水平就是我们后文中要提到的犯第一类错误的概率)

但实际进行AB测试时,我们使用的是以P值为主的实验结果评估体系。

2.1 P 值

p值当原假设为真时,出现样本观察结果或者更极端结果出现的概率。

如果P 值很小,说明发生这种情况的概率很小,而一旦发生了,根据小概率原理,我们就有理由拒绝原假设,P 值越小,拒绝的理由越充分。

举个例子:假设 ,那我们随机抽取一个样本,其均值大于0 的概率就是P 值。通常,我们将P 值与事先确定的显著性水平进行比较,如果 ,则拒绝原假设。

在实际进行AB测试时,我们需要判断两个不同版本之间是否存在差异,P 值就是告诉我们两个版本的实验结果之间存在显著差异的概率。

2.2. 两类错误和统计功效

(1)两类错误

当我们提出原假设之后,我们需要根据样本信息判断原假设对不对。但是这种判断不是百分之百对的,我们可能会犯错误,错误有两种类型:

两类错误

第 I 类错误(弃真错误):原假设为真时拒绝原假设;第 I 类错误的概率记为α ,也好就是我们前文提到的显著性水平。

第 II 类错误(取伪错误):原假设为假时未拒绝原假设。第 II 类错误的概率记为β 。

(2)统计功效

一般情况下,我们在做假设检验时候,希望拒绝原假设,得到新的结论。比如我们做AB测试,我们当然希望实验组的效果要好于对照组。也就是我们希望不要出现应该拒绝原假设时,我们却没有拒绝的情况,这就是刚才说的第二类错误。

统计功效Power 就是我们没有犯第II类错误的概率1-β ,也就是原假设不成立时,被我们拒绝的概率。

实际进行AB测试时,统计功效就是,当两个不同版本之间存在显著差异时,实验能正确做出存在差异判断的概率。

该值越大则表示概率越大、功效越充分。一般来说,我们期待并设置的最低的统计功效值为80%。

2.3 置信区间

统计学中用样本去推断总体有两个工具:参数估计与假设检验。

这里我们稍加笔墨来介绍一下参数估计,目的是为了引出在AB测试中最关注的元素之一:置信区间。

参数估计和假设检验都是利用样本对总体进行推断。但是推断的角度有所不同。

参数估计是用样本统计量去估计总体参数,总体参数在估计前未知;

而假设检验,则是先对总体参数的值提出一个假设,然后利用样本统计量去检验这个假设是否成立。

参数估计又分为点估计和区间估计。

点估计,顾名思义就是用样本统计量的某个值作为总体参数的估计值。

区间估计,就是基于点估计,给出总体参数估计的一个区间范围,这个区间通常由样本统计量加减估计误差得到。这个区间也就是我们所说的置信区间, 我们给它一个官方的定义:

由样本量所构造的总体参数的估计区间称为置信区间

在上文构造统计量的表格中,已经列举出了置信区间的计算公式,这里我们也不过多的介绍了。

由于置信区间是一个估计区间,但是我们不能保证它一定包含总体参数。我们只能说构造的是一定置信水平下的置信区间。什么是置信水平呢?

如果将构造置信区间的步骤重复多次,置信区间所包含总体参数真值的次数所占的比例称为置信水平。

举个栗子:

我们有100个样本,由100个样本构造了100个置信区间,其中有95%的区间包含总体参数,5%没有包含,这个95%就是置信水平。

介绍完置信水平之后,我们就可以用一张图来表示置信区间与置信水平:

在实际进行AB测试时,置信区间可以辅助确定版本间是否有存在显著差异的可能性:如果置信区间上下限的值同为正或负,认为存在有显著差异的可能性;如果同时有负值和正值,那么则认为不存在有显著差异的可能性。

2.4 实验结果分析体系

在实际进行AB测试时,我们的实验结果分析体系就是由上述的P 值、统计功效和置信区间所构成的。

(1)P值

判断两个不同版本的实验结果之间存在显著差异的概率。如果 p值<α(显著性水平,一般取0.05),就表示存在显著差异。

(2)统计功效

当两个不同版本之间存在显著差异时,实验能正确做出存在差异判断的概率。可以理解为我有多少的把握认为版本之间有差别。

(3)置信区间

置信区间可以辅助确定版本间是否有存在显著差异的可能性。

综上,我们认为当AB测试实验数据在95%的置信水平区间内,P值小于0.05,功效大于80%的情况下,实验结果是可信赖的。当然,这是一个严格的理想标准。在使用的实际过程中,我们会遇到多种情况,比如P值符合标准,功效还差一些,此时,我们就要根据实验背景与经验,具体问题具体分析。

通过这两篇文章,整个AB测试所涉及的统计学原理,以及如何将相关统计学概念应用到AB测试实验结果的分析中,我们已经介绍完了。之后我们会更新AB测试在实际工作中的流程,如何确定最小样本量等内容,感兴趣的可以继续关注~

作者:ZZ数据分析,网易资深数据分析师,专注数据分析、数据科学知识分享。关注之后私信我,回复数字“01”,送你一份数据分析师大礼包。

同系列文章:

  • 统计学(1)|白话统计学发展(含统计学必知必会)
  • 统计学(2)|AB测试—理论基础
  • 统计学(3)|AB测试—实验结果分析(本文)
  • 统计学(4)|AB测试—实验流程
  • 统计学(5)|AB测试—方差分析与卡方检验
    推荐阅读
  • 家里最旺气的十种花(家里种哪十种花能旺财)

    前者花小而下垂,称垂笑君子兰;后者花大而向上,称大花君子兰,是目前栽培最普遍的一个种。仙客来是一种普遍种植的鲜花,适合种植于室内花盆,冬季则需温室种植。果多为椭圆形,金黄色,有光泽,部分品种可食用。文竹又称云片松、刺天冬、云竹,为多年生常绿藤本观叶植物,著名的观赏植物。以根入药,有治疗急性气管炎和止咳作用,具有润肺功能。

  • 闽p是哪个城市的车牌(闽t是哪个城市的车牌)

    目前国内没有闽P机动车车牌。福建代表福建,是福建省的简称。一旦在路上看到这个车牌,可以直接报警。机动车辆号牌丢失怎么办机动车号牌丢失后,可以到车站管理处或者公安机关交通管理部门办理,也可以通过手机软件交管12123办理。车辆号牌丢失后,一定要及时补办,以免影响机动车的正常使用。每次驾驶机动车前,都要检查车辆号牌是否正常使用,避免违法行为的发生。

  • 大连市最大中心公园(大连这座百年公园开新馆了)

    从1899年始建至今,劳动公园已走过122年的发展历程,不仅见证大连城市的出生与成长,也在共和国从诞生、成长到壮大的不同时期,完成浴火重生、凤凰涅盘的蜕变,成为人民当家作主人的象征。为进一步挖掘劳动公园的历史文化价值,经过一年多的不懈努力,劳动公园史展馆于9月底完成所有工程建设、环境美化、设计布展工作,于今日揭幕并向公众开放。

  • 房产遗产遗嘱公证书样本是什么(房产遗嘱公证书怎么写)

    查被继承人_____于_____年_____月_____日因_____在_____死亡。死者生前无遗嘱。根据《民法典》第1127条和第1130条的规定,被继承人______的遗产应由其配偶、子女、父母共同继承。因_____的父亲_____、母亲_____分别在_____年_____月_____日和_____年_________日先于_____死亡,被继承人的遗产应由其妻子_____、儿子_____、女儿_____共同继承。本编所称子女,包括婚生子女、非婚生子女、养子女和有扶养关系的继子女。

  • 四川公交爆炸案被告上诉求判死刑 四川公交爆炸案被告上诉求判死刑人格分析

    由于这两天四川公交爆炸案被告上诉求判死刑在网上的关注热度是相当之高的,很多小伙伴或许也都在关注四川公交爆炸案被告上诉求判死刑,那么这当中当然还是有部分的小伙伴们并不太了解四川公交爆炸案被告上诉求判死刑,那么没有关系,如果说大家现在想要了解四川公交爆炸案被告上诉求判死刑,大家可以点击下方的点击(前往)进行了解哦。

  • 王者荣耀幻想奇妙夜稀有吗(王者荣耀王昭君介绍)

    王者荣耀幻想奇妙夜稀有吗《王者荣耀》幻想奇妙夜是英雄王昭君的一款限时出售的皮肤,所以很稀有。王昭君,《王者荣耀》中的一位女性法师英雄角色,原型是西汉著名美女王昭君。王昭君是一位绝世美女,梅花是她的象征。曾被狼旗人送往他们的圣地—凛冬之海,将她献祭给神明作为新娘。王昭君是一个对单非常强力的中单法师,有控制有减速,AOE爆发超高,擅长团控,在团战中有很大的作用。

  • 白萝卜羊骨汤简单做法(白萝卜羊骨汤简单做法步骤)

    白萝卜羊骨汤简单做法准备用料。羊棒骨、白萝卜、白胡椒粉、姜、葱、香菜、料酒、水。白萝卜洗净切滚刀块,大葱切段,姜切片,香菜洗净切末。90分钟后下白萝卜,调入盐,继续小火煲30分钟。等电炖锅发出“滴滴”提示音后,拔掉电源调入适量的白胡椒粉,喝前可以根据自己的喜好加香菜、葱末、醋、辣椒油等即可。

  • 抖音很火的睡前晚安的句子(抖音非常火的晚安优秀句子)

    抖音很火的睡前晚安的句子如果你不愿意改变,那也别指望你的生活会有所变化。不要质疑你的付出,这些都是一种累积一种沉淀,它们会默默铺路,只为让你成为更优秀的人。时间会告诉我们,简单的喜欢最长远,平凡中的陪伴最心安,懂你的人最温暖。人的幸运在于,做错事总有人鞭策于你,时时告诫,不浪费每一刻时光,不做令自己后悔的事。要知道我们交的不是学费,而是青春。

  • 生肖表情包(绘画十二生肖)

    绘画十二生肖#绘画##国庆来了#​#你对现在的自己满意吗#​,。

  • 杂粮煎饼加什么料脆(杂粮煎饼做的时候都用到了什么)

    杂粮煎饼加什么料脆用料:面粉500g、玉米面200g、杂粮100g、甜面酱300g、黄豆酱100g、辣椒面400g、盐10g、十三香10g。先准备一台小型压面机,准备205克面粉,加适量的盐,小茴香,芝麻和适量的水搅拌均匀。将压好的面皮切成20*10cm规格大小的面片。将面皮中间用刀子切开一个小口子入180度的油锅进行炸制。两面焦黄后就可以捞出,将炸好的薄脆整齐的放入篓子中,记得不能放在盘子里。这样他的油滴不下去,会导致薄脆不酥脆。