肥宅钓鱼网
当前位置: 首页 钓鱼百科

一文搞懂正态分布所有知识点(终于有人把正态分布和二八法则讲明白了)

时间:2023-08-16 作者: 小编 阅读量: 7 栏目名: 钓鱼百科

用惯了随机函数的程序员会误以为“随机”就代表了均匀分布的数据,即等概率事件。在现实生活中,绝大多数的随机不是均匀分布的。二是标准差,通常用希腊字母σ来表示,它代表了这组数据的离散程度。也就是说,虽然每个人或者每件商品都会受到大量随机因素的影响,这些因素会对最终状态产生一定影响,但我们不必关心这些因素的细节,而只要把人或商品看成一个整体。该整体的统计规律服从正态分布。

导读:在现实生活中,绝大多数的随机不是均匀分布的。

作者:徐晟

来源:华章科技

如果你是一位程序员,编程时就一定用过随机(random)函数。它的功能是在特定取值范围内随机生成一些数。这个函数在很多编程语言中是预置的,可以直接调用。

例如,要从1到100之间随机生成一个整数,写程序时就要事先定义一个1到100的取值范围,然后调用随机函数,得到一个该取值范围内等概率的随机数,就是说这100个数中出现任何数字的概率都是1/100。

用惯了随机函数的程序员会误以为“随机”就代表了均匀分布的数据,即等概率事件。这是一个误区。在现实生活中,绝大多数的随机不是均匀分布的。

举个例子,我们知道抛硬币正反两面朝上的概率各有一半,但如果你真的抛上10次硬币,就会发现硬币正好有5次正面朝上的概率既不是50%,也不是10%,而是在25%左右。因为在自然界中,最普遍的“随机”是正态分布(也称为高斯分布),其分布曲线呈“钟形”,如图1-1所示。

▲图1-1 正态分布数学函数图

正态分布是一组数据在正常状态下的概率分布。描述这种分布只需要两个参数:一是这组数据的平均值,通常用希腊字母μ来表示,它位于函数图像正中间的坐标位置。二是标准差,通常用希腊字母σ来表示,它代表了这组数据的离散程度。标准差越小,数据就越集中,反之说明数据越分散。

假如一组数据服从正态分布,根据分布特性,其中有68%的数会集中在平均值正负1个标准差区间内,有95%的数会集中在平均值正负2个标准差区间内,有99.7%的数会集中在平均值正负3个标准差区间内。由于3个标准差的区间几乎涵盖了大部分数据,因此它在数学中有着非常广泛的运用,适用于很多场景下的推导和估计。

概括地讲,正态分布说明了“一般的很多,极端的很少”的现象。这种现象生活中很常见。比如,大部分人的身高都在一个区间范围内,太高或太矮的人不多。仔细观察身边的人,可以发现非常聪明或者非常愚笨的人很少。统计全社会范围内的收入,中档次收入的人比较多,特别贫穷和特别富裕的人较少。

人们常说的二八法则(也称帕累托法则),只是换种方式来描述正态分布现象。二八法则告诉我们,20%的富人拥有世界上80%的财富;只要掌握字典中20%的文字就能理解文章80%的内容;20%的超大城市中居住了80%的人口,等等。

正态分布的特性还有其他广泛应用。我们知道,利用多次抽样可以从相对较少的数据中得出令人信服的总体结论。比如只要调研100个人,就能大致了解人类普遍的心理认知。只要抽查100件商品,就能得出这批次商品的质量结论。

这些民意调查、商品抽样,都在运用抽样样本对总体进行估计,其背后的数学原理是中心极限定理。中心极限定理从理论上证明了,无论随机变量总体呈现什么分布,只要抽样次数足够大,样本的平均值将近似服从正态分布。

也就是说,虽然每个人或者每件商品都会受到大量随机因素的影响,这些因素会对最终状态产生一定影响,但我们不必关心这些因素的细节,而只要把人或商品看成一个整体。该整体的统计规律服从正态分布。

而上述这些情况,才是真实世界中的“随机”。

关于作者:徐晟,某商业银行IT技术主管,毕业于上海交通大学,从事IT技术领域工作十余年,对科技发展、人工智能有自己独到的见解,专注于智能运维(AIOps)、数据可视化、容量管理等方面工作。

本文摘编自《大话机器智能:一书看透AI的底层运行逻辑》,经出版方授权发布。(ISBN:9787111696193)

《大话机器智能:一书看透AI的底层运行逻辑》

推荐语:AI是什么?机器如何拥有“智能”?“智能”如何起作用?本书以通俗易懂的方式,勾勒人工智能的全貌,展现AI的底层运行逻辑,即AI是如何工作的。

    推荐阅读
  • 岳阳至襄阳高铁时间表(岳阳至咸宁专线开通啦)

    随着新冠肺炎疫情防控形势积极向好,全力复工复产正有序开展。岳阳、咸宁两地积极对接,开通了岳阳—咸宁“点对点、一站式”包车临时接返专线运行。据悉,返咸人员必须持有省外认可流动的健康证明和咸宁所属单位或居住地社区(村)接收证明,在网上报名乘车。本次专线服务将持续到3月19日。

  • 简单有效去眼袋方法(要认真按摩眼部)

    接下来我们就一起去了解一下吧!简单有效去眼袋方法先以无名指按于眼头位置,在以指腹沿下眼睑轻轻按摩。用手指轻轻的按摩太阳穴,之后再由太阳穴按回到眼角的位置,这样的动作重复五到十次。接着将拇指置于眼头位置。以拇指按压下眼角位置,后如画圆圈般向外移至太阳穴两侧,重复按摩5-10次。

  • 石字旁一个占(石字旁一个占读什么)

    下面希望有你要的答案,我们一起来看看吧!石字旁一个占石字旁一个占:砧读音:[zhēn]。形状和作用像砧子的:砧骨。笔画数:10,部首:石,笔顺编号:1325121251,五行:土,繁体:砧,五笔:DHKG。

  • 中秋节经典句子语句大全(中秋节精美语句大全)

    许许多多的神话传说塑造了今天的中秋节而又因为这一天月亮满圆,象征团圆,所以又称为团圆节。食月饼,赏婵娟,合家欢乐庆团圆;月皎洁,风翩跹,幸福快乐满心田;秋虫鸣,情缱绻,短信祝您中秋节快乐美满。中秋离愁,年年又岁岁,轮回哀怨,辗转凉冷之秋。1中秋节后祝福少,剩下月饼无人咬,我以信息代美酒,送给知心老朋友,月圆月缺不忘友,真挚友情到永久,愿友幸福多安康,喜迎国庆心情畅。

  • 高一孩子怎么学数学(怎么学数学)

    有的高中学生感到。因此,每天在做作业之前,一定要把课本的有关内容和当天的课堂笔记先看一看。能否坚持如此,常常是好学生与差学生的最大区别。如果自己又不注意对此落实,天长日久,就会造成极大损失。做题之后加强反思。配合老师主动学习。小学生,常常是完成作业就尽情的欢乐。初中生基本也是如此,听话的孩子就能学习好。准备向将来的大学生的学习方法过渡。

  • 懒惰的惰组词(懒惰的惰组词平衡的衡组词)

    即氦、氖、氩、氪、氙、氡。分子由一个原子组成。很不活泼,难与其它元素化合。

  • 运城购买2022年冬残奥会金银纪念币通道

    发行时间:2021年11月24日数量:该套金银纪念币共2枚,其中金质纪念币1枚,银质纪念币1枚,均为中华人民共和国法定货币。5克圆形金质纪念币背面图案为冬残奥会吉祥物,辅以雪花元素组合设计,并刊“北京2022年冬残奥会”字样及面额。(二)15克长方形银质纪念币为精制币,含纯银15克,规格32毫米×20毫米,面额5元,成色99.9%,最大发行量10000枚。

  • 氢氧化钠是碱吗(氢氧化钠是否是碱)

    以下内容大家不妨参考一二希望能帮到您!氢氧化钠,无机化合物,化学式NaOH,也称苛性钠、烧碱、固碱、火碱、苛性苏打。氢氧化钠具有强碱性,腐蚀性极强,可作酸中和剂、配合掩蔽剂、沉淀剂、沉淀掩蔽剂、显色剂、皂化剂、去皮剂、洗涤剂等,用途非常广泛。

  • 猪肚怎么炒家常做法(生炒猪肚的做法介绍)

    主料:800g猪肚配料:适量油,适量盐,100g蒜苗,适量小米辣椒,下面我们就来聊聊关于猪肚怎么炒家常做法?猪肚怎么炒家常做法主料:800g猪肚。猪肚买来翻过里面,把油脂去掉。然后翻回正面放点米粉醋,去洗干净。洗好的猪肚,用点食用油揉揉。然后切成丝,越细越好,然后放酱油去腌制下!锅里烧热油温90度左右下肚丝去爆炒断生。把小米椒与蒜苗一同放下翻炒撒料酒。加热开水下去,待烧开翻腾的时候调盐,和鸡精下锅,就可以出锅了。

  • 涂记油酥饼的做法和配方(涂记油酥饼怎样做)

    涂记油酥饼的做法和配方食材:小麦面粉500克,花生油150克,白砂糖100g,糖桂花10克,玫瑰花5克,梅脯10克。取面粉1/3,加油拌匀、揉透,制成酥面。冷却后,甩上冷水15毫升左右,加油,拌揉至柔软光滑,调制成水油面。油酥面、水油面两块面团各摘成10个剂子。将锅置中火上,油面继续用手勺轻轻推旋,以防油饼焦底。待油饼炸至浮起,两面成玉白色时,即捞起沥尽油,装盘。每只酥油饼放上绵白糖、青梅末、糖桂花少许及玫瑰花瓣碎片即可。