肥宅钓鱼网
当前位置: 首页 钓鱼百科

正态分布详细讲解(你不知道它诞生之路是多么)

时间:2023-06-29 作者: 小编 阅读量: 1 栏目名: 钓鱼百科

你不知道它诞生之路是多么神说,要有正态分布于是便有了正态分布正态分布(Normaldistribution),相信各位模友都很熟悉,不过,相对于课本直接将概念砸出来,超模君更想跟大家谈谈这些正态分布是最重要的一种概率分布,超。

神说,要有正态分布

于是便有了正态分布

正态分布(Normal distribution),相信各位模友都很熟悉,不过,相对于课本直接将概念砸出来,超模君更想跟大家谈谈这些。。。

正态分布是最重要的一种概率分布,超模君今天也打算从早期的概率论说起。

/前方高能,数位著名数学家轮番出场。/

如何分赌金

早期概率论,永远离不开赌场上的那些事,可以说早期概率论的发展都是得益于当时有点泛滥的赌博活动。

那时,惠更斯、帕斯卡、费马、雅各布·伯努利等这些早期概率论的奠基人,所研究的概率问题基本都是来自于赌场。

最早的概率论问题就是赌徒梅类在1654年向帕斯卡提出的“如何分赌金”的问题。

甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。

当比赛进行到第四局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才算比较公平?

根据我们学过的概率论知识,易知,甲获胜就有两种情况:①甲赢了第四局,比赛结束;②甲输掉了第四局而赢了第五局。于是有,概率P(甲)=1/2 (1/2)*(1/2)=3/4。

而乙获胜的情况就只有一种,同时赢下第四局和第五局,那么,概率P(乙)=(1/2)*(1/2)=1/4。

因此,这100法郎就应该分给甲100*3/4=75法郎,分给乙100*1/4=25法郎。

这就是数学期望的雏形。

荷兰物理学家、天文学家、数学家惠更斯:

不好意思,来客串一下

1657年,惠更斯发表了《论赌博中的计算》,在当时还没有完全明确的关于“概率”的概念的情况下,从一条“公平赌博值”的公理出发,首次推导出3个关于“数学期望”的基本定理,具有划时代的意义。

每个公平博弈的参与者愿意拿出经过计算的公平赌注冒险而不愿拿出更多的数量。即赌徒愿意押的赌注不大于其获得赌金的数学期望数。

①若某人在赌博中以等概率1/2获得赌金a元、b元,则其数学期望值为:a*1/2 b*1/2,即( ab)/2元;

②若某人在赌博中以等概率1/3获得赌金a 、b 元和c元 ,则其数学期望值为( abc)/3元;

③若某人在赌博中以概率p 和q ( p ≥0 , q ≥0 , pq = 1) 获得赌金a元、b元 ,则获得赌金的数学期望值为p*aq*b 元。

不过,有点遗憾的是,惠更斯对概率论的讨论仅仅局限在掷筛子等赌博活动中,并没有将其扩展运用到其他概率事件里。

瑞士数学家雅各布·伯努利:

没错,就是伯努利家族里最红的那个

直到1713年,雅各布·伯努利的代表作《猜度术》终于出版(此时,伯努利已经去世有8年了)。

在《猜度术》中,伯努利不仅对惠更斯的关于赌博中出现各种情况的概率进行了大量计算,还提出了著名的“大数定律”。

伯努利大数定律:概率论历史上的第一个极限定理,指“当试验次数足够多时,事件发生的频率无穷接近于该事件发生的概率”。

大数定律自诞生开始,便产生了极其深远的影响,为后来的很多统计方法和理论的建立奠定了坚实的基础。

/模友:说好的正态分布呢!正太在哪里了??/

/超模君:来了来了。。。/

正态分布的发现

超模君说了怎么多,正态分布的发现者终于表示受不了,要自己出场了。。。

他就是法国数学家棣莫弗

棣莫弗:终于到我出场了

虽然伯努利得出了“无限地连续进行试验,我们终能正确地计算任何事物的概率,并从偶然现象之中看到事物的秩序”这样的结论,但并没有表述出这种偶然现象中的秩序,而棣莫弗便是第一个将这种秩序表述出来的人。

其实,在伯努利《猜度术》出版之前,棣莫弗就对概率论进行了广泛且深入的研究,已于1711年在英国皇家学会的《哲学学报》上发表了《抽签的测量》,这就是早期概率论史上三大著作之一的《机遇论》的前身。

早期概率论历史上的三部里程碑式的著作:伯努利的《猜度术》、棣莫弗的《机遇论》、拉普拉斯的《分析概率论》。

不过,比较搞笑的是,棣莫弗关于概率论的研究依然离不开赌博问题。。。

偶然的一天,一赌徒向棣莫弗提出了一个与赌博有关的问题。

甲乙二人在赌场里赌博,他们获胜的概率分别是p和q=1−p,赌n局,如果甲赢的局数X>np,则甲就得付给赌场X−np元,否则就是乙付给赌场np−X元。问:赌场挣钱的数学期望是多少?

这是一个二项分布问题,可知答案是2npqb(n,p,np),其中b(n,p,np)为二项概率。

不过,这只是理论结果,而对于具体的n值(尤其是n值较大时),计算实际的期望值并不是一件容易的事,于是,棣莫弗决定找出一个更方便计算的近似公式。

只见棣莫弗直接令p=½,尝试攻破这一特定概率的近似公式,就这样几年过去了,在1733年,终于取得了重要进展。他结合斯特林公式

,进行了一系列研究,然后出现了神奇的一幕:

正态分布的概率密度函数就这样出现了

,由此可知,二项分布的极限分布就是正态分布。

当时,棣莫弗是瞥见了正态曲线的雏形的,而最后正态分布的主要功劳给了高斯(正态分布也称高斯分布),很大程度是因为棣莫弗不是一个统计学家,他当初的这项工作也没有得到重视,他也从来没有从统计学的角度上考虑过这个问题。。。

不过,棣莫弗虽然“无视”了正态分布(当时也还没叫正态分布),但这几年的研究也不是没有收获,概率论中的“首席定理”——中心极限定理就是他首次提出的。

接着,拉普拉斯在他发表的《分析概率论》对棣莫弗的结论进行了拓展(对于p≠½的情况的更多分析结果),人们称之为棣莫弗-拉普拉斯中心极限定理。

棣莫佛-拉普拉斯(de Movire - Laplace)定理,即服从二项分布的随机变量序列的中心极限定理。它指出,参数为n, p的二项分布以np为均值、np(1-p)为方差的正态分布为极限。

拉普拉斯:这里不可能没有我。

1780年,拉普拉斯建立了中心极限定理的一般形式,随后,中心极限定理又被其他数学家推广到不限于二项分布的其他任意分布,再后来,统计学家发现,一系列的重要统计量,当样本量 N 趋于无穷时, 其极限分布均有正态的形式。

作为概率论的大牛,拉普拉斯表示既然来了,就不会轻易退场。于是,他开始捣鼓人们一直疑惑的随机误差

(这在当时需要处理大量测量数据的天文学界是一个很棘手的问题)。

遗憾的是,研究了好几年,拉普拉斯仍然没法搞定误差分布的问题,尽管他已经假定了误差分布函数,但由于计算过于复杂只好放弃。

拉普拉斯误差分布曲线

这时,终极大佬高斯姗姗来迟,大手一挥便解决了这个问题。。。。

高斯:不好意思,我来晚了。

也许他天才的直觉准得有点过分了,正当别人费尽脑筋都想不出的时候,高斯有点鸡贼地选择将问题反过来想。

只见高斯提出了极大似然估计的思想,并猜想人们公认的“算术平均是不会错的估计”等价于对真值的极大似然估计,然后反过来寻找怎样的误差分布能使这一猜想成立。

与常人颠倒的思路竟然让高斯一路畅通无阻,很快,他便证明了在所有的概率密度函数中,使得猜想成立的只有以下一种情况:

正态分布密度函数就这样被高斯推出来了,与此同时,高斯根据他的正态误差理论,确立了最小二乘法的概念。

有了高斯的认证,正态分布迅速活跃在误差分析中,人们可以轻松对误差大小的影响进行统计度量,由于高斯的这几项关键性工作,人们将正态分布命名为“高斯分布”。

正态分布的完善

虽然说,要成为一个好的数学家,你首先必须得是一个好的猜想家。尽管高斯得出的结论是正确的,但当初推导的思路确实有点“鸡生蛋,蛋生鸡”的嫌疑。(人们都说高斯是接受了神的旨意。)

于是,正态分布的理论完善就交给了其他数学家。

拉普拉斯看到了高斯发表的理论之后,惊奇地发现这个密度函数分明在自己之前的研究里出现过,并且认定这肯定不是巧合!

拉普拉斯马上将自己的中心极限定理与正态分布理论联系起来:如果将误差看成许多的微小量(称为“元误差”)叠加的总和,根据中心极限定理,随机误差便服从正态分布。

随着中心极限定理的不断完善,高斯的结论也得到了越来越多的理论支持,正态分布逐渐在误差分析中确立了地位,称霸于其他一切概率分布。

正态误差态分布律

而关于它的命名,自它火了之后,各国人民都争先恐后帮它起名字:由于拉普拉斯是法国人,于是,法国人民称之为“拉普拉斯分布”;高斯是德国人,当时德国就喜欢叫它“高斯分布”;其他国家的人们呢,嗯,不知道站哪边,便直接叫它“拉普拉斯-高斯分布”。

俺明明叫正太!

正当人们吵得不可开交的时候,庞加莱站了出来,他建议改用正态分布这一中立名称,后来,统计学家卡尔·皮尔森也说了一句公道话,使得人们接受了正态分布这个名字:

Many years ago I called the Laplace-Gaussian curve the normal curve, which name, while it avoids an international question of priority, has the disadvantage of leading people to believe that all other distributions of frequency are in one sense or another “abnormal”.

不过,高斯的名气实在太大了,高斯分布的名字并不是想去掉就去掉的,因此,现在数学界正太分布、高斯分布两个名字通用。

最后,超模君只想感叹一下,高斯的力量一如既往的强啊!

本文系网易新闻·网易号“各有态度”特色内容

部分资料来源于《正态分布的前世今生》

转载请在公众号中,回复“转载”

-----这里是数学思维的聚集地------

“超级数学建模”(微信号supermodeling),每天学一点小知识,轻松了解各种思维,做个好玩的理性派。50万数学精英都在关注!

,
    推荐阅读
  • 宁夏泾源县农村面貌(甘肃泾川乡村变迁)

    图为6月下旬白家村牛角沟一角。陈斌摄白家村牛角沟是典型的陇东黄土高原沟壑区,1974年,发现今约5万年的“泾川人”化石,被国务院确定为全国重点文物保护单位。如今被列为甘肃千村美丽示范村,乡村旅游重点村。据了解,白家村共645人,耕地面积1980亩。2014年,该村贫困人口100户445人,贫困发生率69%,现在的白家村已然成为国家3A级旅游景区、甘肃省乡村旅游示范村。目前,村里只剩1户贫困户,预计今年实现全村整体脱贫。

  • 吃牛油果真的能丰胸吗 吃牛油果真的能丰胸吗女

    而鲜奶和核桃中含有的蛋白质和脂质能增进乳房海绵体膨胀,也有丰胸功效。

  • 干桂圆吃多了会怎么样(干桂圆吃多了有什么坏处)

    干桂圆吃多了会怎么样干桂圆吃多会上火干桂圆属于比较滋补的干果,其实桂圆和荔枝一样都是不能多吃的,有些人吃多了干桂圆可能在第二天脸上就长了好几颗痘痘,还有可能出现喉咙痛的问题。干桂圆吃多会胖干桂圆每100g的热量为273大卡,每100克干桂圆的热量大概占到了一个成年人每天摄入总热量的12%。所以贪吃干桂圆要小心堕落成折翼的天使。

  • 汽车如何防止侧滑(防止汽车侧滑的方法)

    汽车如何防止侧滑雨天在有积水和泥泞的路段行车,更要稳住油门,控制车速,用中低挡通过。一旦遇上途中有急弯的坑洼路面,制动时极易造成车辆跑偏、横甩甚至翻车的重大事故。交会时不要乱打方向和踩制动,以免车辆侧滑产生碰撞事故。遇下坡中后轮侧滑时,可适当点一下油门,提高车速,待侧滑消除后再按原车速行驶。

  • 白色耳机线脏了怎么清理(如何清洁易脏的白色耳机线)

    但是由于酒精属于有机物,会造成耳机线老化,可以使用含有酒精的湿纸巾来代替,这样效果也不错。用棉花滴上白醋,顺着耳机线擦拭。同时,千万不要用白醋清洗接口部位。于此同时,汗渍还会氧化耳机线,所以尽量不要将耳机线放在裤兜里或者攥在手里。

  • 板栗小米粥的功效与做法步骤(板栗小米粥的做法和功效)

    板栗小米粥是生活中的常见,祝它既能当早餐食用,也可以在晚餐时供大家使用这种粥不但口感好,而且营养丰富,能滋补身体,也能调理脾胃。板栗小米粥的功效1、调理脾胃板栗小米粥最主要的功效就是调理脾胃,板栗这种食材含有丰富的碳水化合物和多种微量元素,它们能补脾益气,也能调节肠胃,可以修复受损的胃粘膜可以缓解胃痛和胃胀以及消化不良等多种,不良症状。

  • 韩国电视剧隧道结局(此剧的相关介绍)

    韩国电视剧隧道结局电视剧隧道的最后结局是男主历经转折终于回到他的时代,并把罪犯绳之于法。《隧道》是韩国OCN有线电视台于2017年3月25日起在周末档播出的科幻刑侦连续剧,由申勇辉执导,李恩美编剧,崔振赫、尹贤敏、李裕英主演。该剧改编自韩国三大悬案之一的“韩国华城连环杀人案”,主要讲述了1986年正在寻找女性连续杀人案犯人的刑警,穿越时间到达2016年,发现过去与现在的连结点,并再次开始调查、解决30年前连续杀人案的故事。

  • 奶酪制作传统的阿塞拜疆硬奶酪(味道掌门老北京的传统小吃)

    宫廷奶酪,是三元梅园出货量最大的产品,没有之一。米酒中含有十多种氨基酸,其中有八种是人体不能合成而又必需的。每升米酒中赖氨酸的含量,比葡萄酒和啤酒要高出数倍,这在其他营养酒类当中较为罕见,因此人们称其为液体蛋糕。米酒与牛奶按照一定比例进行混合,然后便需要放入70℃烤箱。但烤箱的目的,并不是把奶酪烤熟,而是为奶酪和米酒的发酵提供最佳的温度,这叫半烤半发酵。陈宇航来到三元梅园后,第一个任务就是研发产品。

  • 惠州温泉度假村有哪些(惠州又一顶级温泉度假村放大招)

    在走向接待中心的时候,前台瓦片建筑,路边野象雕塑,路边各式植被,小草鲜花等,都能充分感受到巴厘岛的风情。多达117个温泉池,错落有致地分布在园区里,润杨溪谷带来的是不出国门即可享受的纯正巴厘岛风情。还有户外超大的东南亚风情泳池,宛如镶嵌在泳池中的按摩躺椅独具特色,两侧的沙滩椅和太阳伞独具异国风情。

  • 什么是语义场(语义场的解释)

    什么是语义场语义场是在同一个语义系统中,在共时条件下,若干个具有共同义素的义位聚合起来的聚合体。语义场是借用物理学中“场”的概念而来的,是指语义的类聚。语义场强调的是一个词跟全体词在语义上存在着密切的联系,只有通过比较、分析词与词之间的语义关系,才能确定这个词真正的内涵。语义场必须在一个共同语义要素的支配下组成,例如在“家畜”这一语义要素的支配下,由“牛、羊、马、猪、骡”等构成了一个语义场。