迅雷白金会员加速器:闲话概率

来源:百度文库 编辑:九乡新闻网 时间:2024/04/27 16:40:29
闲话概率
之一:印象中的概率
什么是概率。有没有学过概率论,对于“概率”这个词的含义好像大家都比较清楚。比如,十年前,在与李昌镐争夺围棋世界冠军的五番棋决赛前,马晓春说了这么一句话,他说,如果前面两盘棋能够下成平手,那么他夺冠的概率就有51%。由于马晓春前一年夺得的两个世界冠军都不是从公认为世界围棋第一人的李昌镐手中赢得的,因此那一年他们两个之间的决赛非常令人期待。果然,前面两盘下成了一比一。于是,媒体根据此前马晓春的那一句话,开始了乐观的预测。虽然马晓春没有学过概率,但他还是用了概率这个词,并且用51%这个超过二分之一的数表示了自己的一种决心以及比赛的可能前景。其实细细分析这句话就会发现,其实马晓春说的只是一个条件概率,而且还可以发现他对能从李昌镐手中夺得世界冠军并没什么信心。他说,如果能够在前面两盘打成一比一,也就是说,如果李昌镐还是会输棋的话,那么在接下来的三盘中自己能够战胜他的概率就超过五成。因此,赛前对于马晓春这句话中所蕴含的信心应该用乘法公式来计算,即事件“前两盘打成平手”的概率再乘以51%。这样一乘,概率就小于50%了。于是,通过我们的分析,马晓春其实在赛前就已经对李昌镐有点心怯了。马晓春是一个绝顶聪明自视甚高的天才,他是绝对不会承认自己比人家差的,这句话表面上显得很自信,但还是隐藏不住他内心深处的蛛丝马迹。正是觉得李昌镐十分强大,使得他在第三盘比赛中非常令人意外的以非常低级的方式自损一目而导致了半目负,并由此开始了在李昌镐面前的连败。概率是衡量一个事件发生可能性大小的一个量,但这只是一种直观的说法。细细的分析起来,发现还是会有很多细节让人感到困惑。比如,抛一枚质地均匀的硬币,有可能出现正面也有可能出现反面。在试验前,谁也不知道结果到底会是什么。如果说:“正面和反面朝上的概率各占50%”,相信应该是没有人会反对的。但是现在,我把硬币放在抽屉里,要大家猜硬币的那一面朝上。这时如果再说刚才那句话,可能就会有人反对了。反对的理由很简单:抽屉里的硬币要么朝上要么朝下是已经被确定了的事件,不存在任何随机性和不确定性。因此,正面朝上的概率要么是1要么是0,怎么也不会出现50%这个数字。但是为什么很多人还是会说正面朝上的概率是50%呢?其实,这里的50%,只是人们在没有关于这枚硬币的任何信息的情况下的一种主观信心的度量。有一年,我到武汉电视台作节目,主持人问我,如果我们说有70%的把握做成某一件事。是不是也可以说有70%的概率做成这件事。我想了想,说,可以这么说。由此看来,人们在使用概率这个词时还是有很多不同的理解的。主要的不同集中在对这么一个问题的回答上,即概率到底是一个事件的客观属性还是主观属性(人在不完全信息下的一种主观判断)?。另外一个问题是,既然人们对概率有很多不同的理解,那么数学上又是怎么来统一的呢?
下一次再继续讨论这些问题。之二:上帝掷骰子吗?要想弄清概率的本质,首先要弄清什么是所谓的“不确定性”。一种观点认为,不确定性是内生于事件本身的。比如,重复抛一枚质地均匀的硬币,你会发现每次的结果并不确定,时而正面时而反面,试验的结果是不以人的意志而转移的。但是这种“不确定性”并不是就不能理解,它像面积、体积一样也是可以“测量”的。测量的方式,就是重复试验。比如皮尔逊将硬币重复抛了24000次,得到正面朝上的次数为12012次,所占的比例为50.05%。一般的,如果将某个试验做了很多次后,某事件发生的次数所占的比例我们称之为该事件的频率。如在NBA转播过程中播音员不时播报的运动员的投篮命中率就是一种频率。由于在大量试验中,频率具有稳定性(如随着抛硬币的次数的增加正面朝上的比例将稳定于50%),因此,所谓对事件不确定性大小进行度量的概率就有了其客观的基础。另一种观点认为,不确定性在很大的程度上是由人的有限理性以及信息的不完全等因素造成的。比如说,很多年前人们普遍相信火星上有高等智慧的生命,而随着科学技术的发展,随着人们认知手段和能力的逐步提高,现在还持有这种观点的人可能已经是凤毛麟角寥寥无几了。很显然,在这几百年的时间里,火星上并没有发生什么大的变化,但是人们认为火星上有高等生命的可能性却在不断的变化,这种不确定性显然是来自于人们的主观世界。抛硬币这一类试验是可以重复进行的,但是像“如果三峡大坝被导弹击毁后会产生什么样的后果”、“现在火星上有没有生命”、“陨石撞击地球是不是恐龙毁灭的原因”之类的试验是不可重复,人们更多是通过主观的信念来把握。这里还有一个哲学终极层次上的问题。如果你信仰上帝,那么所有的不确定性就是主观的。你身体感到不适,上帝知道你得了什么病,但你不知道,医生也不知道。所以你就要上医院,医生就要进行望、闻、问、切,以及做各种各样的化验,最后医生根据自己的信念(经验、知识的积累所形成的)给出一个很有说服力但还是有可能是错误的诊断。上帝其实已经将一切安排好了,只是由于我们不知道,所以还一直觉得“人是自由的”,并在该信念的指引下乐此不疲的生存在这个世界上。但还是有人相信上帝相信神的。这样就有了形形色色的宗教以及迷信活动。一切皆命,一切皆缘。 即使不相信有真实的上帝存在的科学家中也有很多是决定论的。拉普拉斯建立了完整优美的分析力学形式化体系。拿破仑对其成果相当敬佩,但还是有一个问题没弄清楚,于是他问拉普拉斯,在你这么一个完整的理论体系中,上帝在哪里?拉普拉斯的回答很干脆,我们不需要这个假设。但是他却有一个著名的拉普拉斯决定论。拉普拉斯说:“我们应当把宇宙的现状看作它先前状态的结果以及它的后继状态的原因。假定在某一时刻,有一种智慧能够把握自然界所有的力以及组成自然界的一切事物的特定状况——这种智慧博大精深足以对所掌握的资料进行分析——那么,它就将宇宙间从最庞大的物体到最微小的原子的运动全都囊括于同样的公式之中,对于它来说,没有什么是不确定的,未来,一如过去,都出现在它的眼前。”一个逻辑的上帝还是出现了!当然,相信上帝并不必然地导致决定论。因为你可以信仰上帝,认为世界上的一切都是由上帝安排的,但是上帝并没有一个关于这个世界的完整规划,他常常通过某个随机试验(比如掷骰子)的结果来决定世界在下一个时刻的状态。但是这样又会碰到一个逻辑难题。因为他既然是上帝,那么他就是全知全能的。对于一个全知全能的上帝来说,根本就不存在什么随机的试验,试验的结果完全是可以由他来控制的。如果你哪天看见上帝在掷骰子,那么很有可能那只是你的一种幻觉,或者那天上帝闲着没事在掷骰子玩。爱因斯坦的一个著名的观点是:上帝不掷骰子。爱因斯坦提出这个观点是针对玻尔的玻尔关于量子力学的概率论解释不论是在理论上还是实践上都取得了相当的成功。更重要的一点是,玻尔是以频率为基础来理解概率的。这一点让爱因斯坦感到很厌恶,却又无可奈何。于是晚年的爱因斯坦一直试图解决这个问题,即将不确定性赶出物理学。
关于量子力学与概率的关系问题,下次再讨论。最后,以盖尔曼在《夸克与美洲豹》的一个问题结束今天的讨论——  给定过去和现在,会成为真实未来的那些陈述的概率到底是什么?之三:概率的公理化定义 
由于概率本质属性的主客观之争经常会涉及到哲学中决定论与非决定论之争,甚至会涉及到对上帝以及人的自由意志的看法等,这就使得概率论很长时间里无法作为一门独立的数学学科而存在。数学是建立一系列假设之上的逻辑符号体系。每一门学科都有其最基本的假设,它们也是该学科最原始的出发点。从这些假设出发,再进行演绎推理,最后形成一套相对完整的符号体系,这就是数学。撇开关于概率本质的哲学争议,不管怎样理解不确定性,即不管它是主观还是客观的,概率作为事件不确定性的一种“度量”或“测度”(measure)却是没有争议的。“测度”,是我们每天都在做的事。长度是线段的测度,面积是平面图形的测度,重量也是物体某种属性的测度。如果我们把概率理解为事件不确定的一种测度,那么我就必须首先弄清楚“测度”应该满足的最基本性质是什么。其实,不管我们在数学上和实际中如何使用这测度这个概念,我们所用到的性质只有两条。第一,非负性——测度总是非负的;第二,可加性——由两两不相交集合合并而成的和集或并集的测度等于每一个集合的测度之和,这两条性质是显然的,即使你没有学过作为现代数学分支的“测度论”,你也很清楚它们的含义甚至在实际中不自觉地实践着。比如说,“曹冲称象”的故事就是很好的利用可加性的案例。由于大象的重量与一堆石块的重量相等,因此要知道大象的重量只需知道这一堆石块的重量。当时的衡器是能够称出每一小块石头的重量的,因此最后所需要做的就只是加法而已。大部分测度是没有上界的,比如实轴的长度,第一象限的面积等都是无穷大。但是,概率是一种特殊的测度,它是有上界的。很显然这个上界就是1。概率是不可能大于1的,并且必然事件的概率为1。这就是所谓的规范性。到了上个世纪三十年代,测度论作为现代数学的一个分支已经发展得相当得成熟了。前苏联数学家科尔莫哥洛夫在此基础上把概率定义为具有非负性、可加性和规范性的测度。这就是著名的概率公理化定义。这个定义搁置了所有关于概率本质的哲学争议。不管你是主观派还是客观派,你都会承认这三条性质,因此这三条性质就像公理一样成为了概率论的最原始的出发点。概率论实际上就是在这三条公理的基础上建立的一套无矛盾的逻辑体系。十几年前我有一个学生概率统计考了不及格,这影响了他竞争学生会主席。假期在家期间,他专门给我写了一封信,信中与我讨论概率论的问题。他说,概率论根本就不是科学,是强加在我头上的一套谬论。不过,他假期还是用了一点功,回来补考考了八十多分。记得他交卷的时候还特别向我强调了一点,即使考100分也不承认概率论是科学。其实,正像我刚才说的,数学是建立一系列假设之上的逻辑符号体系。只要在逻辑上不存在问题,它就有在科学体系中的一席之地。你要是不承认概率论,那么你要做的不是在哲学上如何雄辩,而是要能够在这套逻辑体系中找出自相矛盾的地方。如果你说,连这几条公理我也不承认,那么你也可以建立新的公理,自己去建立一套逻辑体系。我的学生中可能还真的有人在试图超越这个公理,因为在考试时他们经常会算出概率是负的,最离谱的一个甚至达到了负一百二十。平面几何就有三套逻辑体系。这三套逻辑体系的差异就在关于第五公设上。欧几里德几何认为,过直线外一点有且只有一条与其平行的直线。与其等价的一个命题是,三角形三内角之和等于一百八十度。很多人认为这是显然的。但问题是,什么是直线本身就是不定义的,也是无法定义的,而且在自然界根本就不存在我们心目中的直线。在一个平面内是否存在两条永远不相交的直线这本身就是个问题。因此,非欧几何中的一派认为,过直线外一点的任何一条直线都不可能与其平行,也就是说根本就不存在这样一条平行线。还有一派认为,过直线外一点的可以有至少两条与其平行的直线,这就意味着在这两条直线之间的无穷多条直线都与其平行。于是,承认三角形三内角之和等于180o,还是大于180o,或者是小于180o,就构成了不同的学派。问题是,这三种几何的逻辑体系都是无矛盾的,只是出发点不同而已。而且,有人还证明了,这三种几何中任何一种出现逻辑体系内在的矛盾,那么另外两种也会出现对应的问题,这就是说,他们是一荣俱荣,一损俱损的。实际上,我们可以这样来看一个三角形。如果在地球上画一个小三角形,那么对于这个三角形的三内角之和可以认为是一百八十度(这样理解不会给我们带来致命的问题)。但是严格的来说,如果你是在地层底下看这个三角形,那么他的三内角之和是小于一百八十度的,但如果在地球外面看,则是大于一百八十度的。就一般尺度的空间内,欧几里德几何已经够用了,但是如果涉及到宇宙的尺度,就必须考虑到引力给空间造成的弯曲,这样非欧几何就派上用场了。这就是所谓的相对论效应。想起庄子里的一段话:庖丁释刀对曰:“臣之所好者,道也;进乎技矣。始臣之解牛之时,所见无非牛者;三年之后,未尝见全牛也。方今之时,臣以神遇而不以目视,官知止而神欲行。”伟大的数学家黎曼40岁那年因极度贫困死于肺病。三十九年以后,人类历史上最伟大的科学家爱因斯坦以黎曼几何作为数学工具在他26岁那一年创立了狭义相对论。天才只是比常人看得远一点。看得远一点,再远一点,“以神遇而不以目视”,你就会发现,原来光走的不是直线。之四:古典概率 
客观概率有两种形式,或者说有两种决定方法,第一种就是依据该事件在试验大量重复中出现的频率。对于客观派来说,就像长度之于线段,面积之土地一样,概率是事件的一个客观属性。对事件概率的测量方法比较特殊,其手段就是重复试验。因此,我们可以认为频率是概率的一个“测量”。客观概率的第二种形式是:试验的结果只有有限个,且根据对称性的考虑,各结果有同等出现的机会。若总的可能结果有n个,而某一事件包含其中的k个结果,则该事件的概率为k/n。例如掷一颗骰子,共有6种可能,出现偶数的可能有三种,所以出现偶数这个事件的概率为1/2。古典概率的模型很简单,但是在概率论成为现代数学的分支之前,这个模型是数学家们主要的研究对象。因此古典概率中有很多经典的模型,并且其解答大都比较难。 有些问题很有意思,解答也不难,但与我们的直觉又好像有点相悖。比如,我们经常要上两合班的课, 学生有六七十个。每当我说他们之间至少有两个人生日相同时,学生们往往会露出怀疑的神色。有的甚至会说,不可能的!运用简单的排列组合就可以算出,50个人中至少有两个人生日相同的概率为97%,而64个人中至少有两个人生日相同的概率为99.7%,已经非常接近于1了。对这个结果,很多人都觉得有点吃惊。记得有一次,我们学院统计教师的生日。我问办公室主任有没有生日相同的,他想也不想就说,这怎么可能呢?我于是对着教师的表格认真地统计了一下,结果发现有三个日子里有生日相同的教师,其中居然有三个教师是同一天的生日。换一种模型去想,有的时候会觉得好想一些。比如一个宾馆里有365个房间,有50个人要住这个宾馆,每个人随机的选一个房间进入,那么这50个人居然全部选在不同房间的概率直觉上应该比较小,因此至少有两人选在同一个房间的概率就比较大,而这个概率就是任选的50个人中至少有两个人生日相同的概率。 还有抽签问题。很多人都很关心抽签结果与抽签顺序之间的关系。我的一个中学同学有一次对我忿忿不平的说,他们单位的领导不像话,单位分房子的时候为了体现公平决定由抽签决定住房,结果领导要先抽。他说,先抽的好处是显然的,因为总共就那么几套好房子,等他们抽完了我们后面还抽个屁。我于是说,后抽也有好处,如果前面的人把差房子都抽完了,那等待你的不就是好房子了吗?同学想想也觉得有理,于是问我,到底是先抽还是后抽好?其实,抽签的结果与抽签顺序是无关的,无论什么顺序都不会影响得到任何结果的概率。比如,有10个人,但只有一张足球票。大家决定由抽签来决定谁去看足球。任选一个人,比如他是第5个抽签的,我们来看看他抽到足球票的概率是多少。我们还是选择一个适当的模型来考虑。设想把10个签随机地排列在桌子上,这样第5个人抽到足球票的概率与桌子上第5个位置上放的是足球票的概率应该是相同的。很显然,这10个签中的每一个都有可能放在这个位置上,从对称性的角度来看,没有哪一个签更有可能放在这个位置上,因此它们是等可能的,只能是1/10。有人可能会争辩说,如果前面9个人中有一个人把足球票抽走了,那最后一个人不是很吃亏吗?但这涉及到了另外一个问题,这就是条件概率的问题。关于条件概率,下次再谈。 抽签问题告诉我们,概率像蛋糕,也是可分的,只是分法有点不一样。10个人分一块蛋糕,只需将其十等份就行了,没有人会说不公平。但是足球票就不一样了,你不能把足球赛的90分钟分成十等份,每个人看9分钟。这时分的就是概率。由于抽签结果与顺序无关,因此在抽之前每个人都分得了1/10的概率。对于这个分配规则,相信也没有人会说不公平。分蛋糕的规则强调结果公平,而分足球票的规则强调的是机会公平但结果却是不公平的。一个好的社会制度应该是在适当兼顾结果公平的前提下,强调机会公平,这样才能做到人尽其才物尽其用。 最后提出一个分赌本的经典问题。甲、乙两人赌博,各出注金a元。每局个人获胜的概率都是50%,约定:谁先胜6局就赢得全部注金 2a元,现进行到甲胜4局乙胜2局时赌博因故停止。问此时注金2a应如何分配给甲、乙,才算公平?此问题的文字最早出现于1494年帕西奥利的一本著作中。
之五——公平的含义 
先把上一次的问题一般化然后复述如下:甲、乙两人赌博,各出注金a元。每局个人获胜的概率都是50%,约定:谁先胜S局就赢得全部注金 2a元,现进行到甲胜S1局乙胜S2局时赌博因故停止。问此时注金2a应如何分配给甲、乙,才算公平?此问题的文字最早出现于1494年帕西奥利的一本著作中。由于对“公平分配”一词的意义没有一个公认的理解,在早期文献中出现过关于此问题的种种不同的解法,如今看来都不正确。例如帕西奥利本人提出因按两人获胜局数的比例来分配,即按S1:S2的比例来分配。泰塔格利亚在1556年很干脆地认为这件事是不能通过数学来解决的,应该交给法官来裁决。不过他还是尝试着提出了一种解法。泰塔格利亚认为,若S1>S2,则甲取回自己下的注a,并取走乙下的注的(S1-S2)/S。法雷斯泰尼在1603年根据某种理由,提出按(2S-1+S1-S2):(2S-1-S1+S2)的比例分配。卡丹诺在1539年通过较深的推理提出了一种解决方法,它的这个解法现在看来还不算是正确的,但又一个重要之点,就是他注意到真正起作用的并不是他们各自已经赢的局数,而是所赢的局数S1和S2与最终胜利所需的局数S的差距。我们在“抽签问题”时曾经说到,“公平”分为两种:结果公平与机会公平。如果按照结果公平的原则来分配,则每个人各自取回自己的赌本,即各得一半。但很显然,那个已经赢了较多局数的人肯定不会认为自己受到了公平的待遇,因为他认为自己获胜的机会要更大一些。其实,要让那个赢的局数多一点的人多得一点注金的想法,大多数的数学家都已经考虑到了,所不同的只是具体以什么比例来分配的问题。 精确的阐述还需要用到数学期望的概念,但我们可以这样来理解这个问题,其出发点就是,谁成功的机会大,谁应分得的份额就大。设甲最终获胜的概率为p,乙最终获胜的概率为q,则显然有p+q=1。所谓“机会公平”的含义是指,每个人应该按照其最终获胜的概率来分配注金,即甲应该得2ap,乙得2aq。能够想到这一点,那么这个问题就好解决了。由于这里的页面不能显示数学公式(因为要用到排列组合),所以回到上一次的问题,即S1=4,S2=2时的简单情形,提供两种解答方式。
解法一。 乙只有在下面两种情形下才有可能获胜:1)连胜四局,其概率为1/16。2)在接下来的四局中至少要赢3局,并且第五局一定要赢,这样运用伯努利概型算下来,应该等于4/32或1/8。最后由概率的可加性,得乙最终获胜的概率为3/16。于是甲获胜的概率为13/16。 解法二。由于最多只要再进行5局就可以定出胜负,而甲只需要再胜至少两句就可以获胜,于是由伯努利概型或二项分布,可以算得甲获胜的概率还是13/16。 于是,最后甲应该分得注金2(13/16)a = 1.625a,乙应该分得0.375a。昨天梅梅在评论中给出的解答是正确的。祝贺你一下子就超越了那么多古代的数学家。 关于解法二很多人颇有微词,因为这种解法的前提是要赌满五局,而事实上只要甲连胜两局赌博就结束了。关于这个问题的解答,要说清楚还需要用到全概率公式。我在这里只是说明一点,这就是——如果比赛是五局三胜的,那么不管规则是不是要求打满五局(如网球团体赛一般要求打满五局而不管是不是有一方已经提前赢了3局,而排球则是如果有哪一方先胜三局比赛就提前结束),任何一方获胜的概率都不会有变化。 分赌本问题在概率史上起的作用,在于通过这个在当时来说较复杂的问题的探索,对数学期望及其与概率的关系,给出了一定的启示。从社会分配领域来说,从这个例子我们可以看出,机会公平体现着如下两层含义。其一是强调起点的公平。在这个例子中,开始的时候每个人获胜的概率是一样的。其二是重视因为历史发展过程中出现的分化和个体的差异性。就本例而言,由于一些偶然的原因,某一方获得了较大的成功机会,那么分配规则的制定必须考虑这种机会的差异。 体育比赛的规则都是对强队有利的。比如说,巴西足球队与中国足球队的比赛,规则规定谁进球多谁就获胜,这显然对中国队不利,因为巴西队更会射门。但是在几百年以前,当大家都不会踢足球的时候,这条规则对大家而言是公平的,由于一些历史上的偶然原因,导致了国家与国家之间的差异,这就导致了双方比赛结果上的不平均,但大家似乎都承认这种不平等,还是认为这种规则是公平的。之六——条件概率  问题1、一个家庭有两个孩子,问都是女孩的概率是多少?答:1/4问题2、一个家庭有两个孩子,已知其中有一个是女孩,问另一个也是女孩的概率是多少? 我每次问这个问题,学生的回答几乎都是1/2。于是我就会问一个类似却又不同的另一个问题:问题3、一个家庭有两个孩子,已知大的孩子是女孩,问小的孩子也是女孩的概率是多少?这个问题的正确答案是1/2。于是,马上就会有人开始认真地审视问题2与问题3之间的区别了。 同样是问这个家庭的两个孩子都是女孩的概率,问题1因为没有告诉你更多额外的信息,因此答案就是1/4,但问题2和问题3却附加了一些信息或条件,因此概率就发生了变化而不再是1/4。问题2与问题3的条件看上去很相似,但其实是不一样的。问题2只是告诉你,这个家庭的两个孩子不全是男孩,于是便有三种可能:姐弟、兄妹、姐妹,而姐妹只是其中的一种,于是问题2的答案应该是1/3。而问题3的条件将这个家庭限制在只有两种可能:姐弟和姐妹,答案自然就是1/2。 一般将试验所有可能的结果组成的集合称为样本空间,记为S。如果关于试验的结果你得到了一些信息,那么在此信息下,试验的所有结果就会发生变化。变化后的样本空间有时称之为缩减的样本空间。比如问题1的样本空间有四个元素,但问题2和问题3的样本空间则被缩减为只包含3和2个元素了。这种在缩减的样本空间中计算的概率就是条件概率。 我们在第一篇文中提到的马晓春那段话中的概率(51%)就是一个条件概率——在前面两盘比赛的结果已经是一比一平的条件下他能获得世界冠军的条件概率。 条件概率是在已有的信息或条件下对事件发生概率的一个调整。从概率的直观意义出发,若事件A已经发生,则要使事件B发生当且仅当试验的结果既属于B又属于A,即属于AB,因此P(B|A)应为P(AB)在P(A)中的“比重”.由此,我们给出条件概率P(B|A)的定义.           P(B|A)=P(AB)/P(A)其中P(B |A)就是事件A发生的条件下事件B发生的条件概率。关于条件概率,也可以引出很多有趣的讨论。
问题4:对以往数据分析的结果表明,当机器调整得良好时,产品的合格率为90%,而当机器发生某一故障时,其合格率为30%.每天早上机器开动时,机器调整得良好的概率为75%.已知某日早上第一件产品是合格品,问机器调整得良好的概率是多少? 当今天的机器开动时,机器的状态就已经给定,如果有上帝,那么他是知道机器处于什么状态的。但是我们不是上帝,因此我们只能根据已有的数据做出判断。根据以往的数据,当机器开动时我们有75%的把握确定机器处于良好的状态。但是我们现在有了一点额外的信息,即第一件产品是合格品,这个信息对于判断机器正常是有利的。运用条件概率公式可以算得此时机器处于良好状态的概率为90%。这样我们就有了两个概率,一个是P(B)=0.75,这是在试验前根据以往的数据分析得到的,称为先验概率;另一个是P(B|A)=0.9,这是在通过试验得到信息(即早上第一件产品是合格品)后重新加以修正的概率,称为后验概率.机器还是那台机器,前后并没有发生变化,但是随着所掌握的信息的不同,我们得到了关于机器状态的不同概率。这个概率并不反映机器的真实状态而是反映了我们的一种信念。正是在这个意义上我们可以说:概率是人们对客观事件的信念的一种度量. 但是就这个问题来说,概率的客观派也会用频率的观点来反驳:如果我们每次在第一件产品是合格品时就判断机器处于良好状态,那么平均地说每100天里有90天是被我们判断对了。 从这个例子我们可以看出,为什么概率会有主客观学派之分且互相代替不了谁的部分原因。 下面以一个问题结束今天的讨论在一著名的电视游戏节目里,台上有三扇门,记为A,B,C,其中二扇门后面没有奖品,而第三扇门后有大奖.如果你能准确的猜到那扇门后有大奖,则你就赢得此大奖.节目开始后,你选择了某扇门,比如A,在门A被打开之前,节目主持人打开了另外两扇门中的一扇,比如B,发现门后什么也没有.                    问题5:如果此时改变原来的决定而选择C门,会不会增加获奖的概率?
之七——问题的解答 
先把上一次的问题复述如下:在一著名的电视游戏节目里,台上有三扇门,记为A,B,C,其中两扇门后面没有奖品,而第三扇门后有大奖.如果你能准确的猜到那扇门后有大奖,则你就赢得此大奖.节目开始后,某人首先选择了A门,在门A被打开之前,节目主持人打开了B门,发现门后什么也没有.                   问题:如果此时改变原来的决定而选择C门,会不会增加获奖的概率? 印象中这个问题曾经登在十二年前《读者》上。《读者》来饶有兴趣的介绍说,那个观众在犹豫了片刻后,决定不换,因为他认为换不换都一样,即A门和B门后有大奖的概率都是1/2。主持人很遗憾的告诉这位观众,说他答错了,从而失去了进一步选择的权利。节目播出后,这个主持人收到了几千封大学博士的来信,他们都一致的认为是主持人错了。于是问题就转换为:到底是谁错了? 有一次我的两个同事在一起研究这个问题,结果意见出现了分歧,进而开始了激烈的争论。虽然争得脸红耳赤,可还是无法分出胜负。于是决定,请一位专家来做裁判。我被他们的电话请到了现场。开始我以为这是一个脑筋急转弯的问题,仔细分析以后发现这还确实是一个问题。下面我来分析这个问题。 认为换不换都一样的理由:既然已知B门后已经没有大奖,那么大奖就只有可能在A门和C门后,而我们看不出这两个门有什么区别,因此它们后面有大奖的概率应该是一样的,即1/2。 认为应该换的理由:A门后有大奖的概率是1/3,B门和C门后至少有一个门后有大奖的概率应该是2/3,并且这两个门总有一个是空的。为什么主持人不开C门而开B门呢?说明C门后很可能有大奖。
为了使大家对这两个理由的正确性有一个初步的判断,我先陈述一个正确的解答:如果在游戏开始前主持人打开了B门,那么A门和C门后有大奖的概率相同,即都为1/2。但现在主持人是在观众选择A门之后,才打开B门的。有区别吗?当然有区别。既然条件不一样,条件概率就不会一样! 事实上,在本游戏中,A门和C门是有区别的:A门是观众随机选的,而C门是主持人有意留下的。有感觉了吗? 将问题转换一下:甲选择了A门,而乙选择了剩下的两个门,即B门和C门。显然乙认为自己获奖的概率大。但是此时,主持人告诉乙一个信息,说,其实你选两个门与选一个门是一样的。乙会相信主持人吗?除非乙是笨蛋,否则绝不会相信主持人。但是现在,主持人换了一种陈述方式,他说,之所以说你与甲获奖的概率相同,是因为你虽然选了两个门,但可以肯定的是你至少有一个门是白选的,因为你选的两个门中至少有一个门是空的。既然有一个门肯定是空的,那么能不能获奖的概率实际上就是剩下的一个门后有没有大奖的概率,既然只剩下一个门了,那么你与甲获奖的概率有什么不同呢?此时,即使乙是个数学博士,相信也会开始犯迷糊了。 依据主持人上述的逻辑,即使台上有100扇门,甲选择了1个门,而乙选择了99个门,甲乙获奖的概率也是相同的,因为乙的选择中至少有98个门是空的,于是最后只剩下第99个门是不是有奖的问题了,这不是与选一个门是一样的吗?现在你可能开始有点相信语言的迷惑力了。即使你再聪明,在语言所设的美丽陷阱面前,你都可能会一往情深地栽进去。这就是广告的魅力。
还是条件概率的问题。 认为换不换都一样的人认为此时的条件概率应为:在已知B门后无大奖的条件下,A门后有大奖的概率。这个概率确实等于1/2。但我们现在的条件概率却是:选择A门后,在剩下的两个门中已知有一个是空的以后另一个门后有大奖的概率。此时的概率就不是1/2了。 在剩下的两个门后,只有三种可能:(无,有),(有,无),(无,无)。那么在已知其中一个是“无”的情况下有三种可能,而另一个门后有大奖的可能性有两种,所以其条件概率就是2/3。因此,本文开头提出的问题的正确答案是:换一种选择获奖的概率是2/3。 但是我相信,我的这种解答方式还是有人会不服气的,它们还会提出很多似是而非的理由加以反驳。有一次我与两位研究生的同学讨论这个问题,最后我的同学得出了一个结论,这就是我这么多年的概率算是白教了。语言的陈述总是不能让人信服的,这时,我们就会发现数学的力量了。由于本页面不能显示复杂的数学公式,所以我只是在这里说明一下,运用贝叶斯公式可以给出无懈可击的解答。 如果那几千个大学博士都用一下贝叶斯公式,就不会犯这样的错误了。问题是,即使是科学家,他们在很多的时候也会特别相信自己的第一感觉,从而犯下很低级的错误。