马桶c起床战争的地址:逃出你的肖申克(4)

来源:百度文库 编辑:九乡新闻网 时间:2024/04/29 19:47:15
仁者见仁智者见智?从视觉错觉到偏见
我们再来回顾一个经典的视觉现象——色彩恒常性(Color Constancy)。我们已经知道,同一个物体,在不同光照条件下我们知觉到它的颜色是基本不变的。一个青苹果在中午的白炽光线下看上去是青的,在斜阳西下暗红色的光照下是青的,在清晨淡蓝色的雾霭中还是青的。你可能觉得这很正常,青的本来就是青的,有什么好奇怪的。但问题是如果将我们的眼球换成一个光线接收器,从而客观记录下从苹果表面反射出来的光线的RGB值(红、绿、蓝三色的比例),会发现在不同环境光照条件下,实际从苹果表面反射出来的光线差异是很大的;例如环境光只有长波(红色)的话,那么不管苹果表面的反射比如何,反射出来的光也只能是长波,但为什么我们看起来仍还是青色的呢?
如果我们在一个封闭的箱子中放置一张白纸,让观察者透过暗箱上的一个孔洞来观察这张白纸。那么当我们在箱子内用黄光照的时候,观察者会看到黄纸,用红光照的时候会看到红纸。但如果打开箱子,则不管用什么光照,我们看到的还是白纸。
为什么会出现这种现象?目前为止已经有了一个理论解释框架:尽管同一物体在不同光照条件下反射的光线差异很大,即视网膜接收到的光线差异很大,但视觉皮层对视网膜接收到的光线又进行了一层处理,这层处理就是从视网膜接收到的光线中“抽取”出物体的“真实颜色”。但我们的神经回路如何计算目前还并不最终明确,但有靠谱的逼近算法(被称为retinex algorithm),其中一个简洁版本是这样的:假设目标物体周围的邻近环境中存在完全反射光线中的绿光成分的物体、也存在完全反射光线中的红光成分的物体、也存在完全反射光线中的蓝光成分的物体,那么只要将眼睛采集到的环境光线中最强的绿光成分Gmax,最强的红光成分Rmax,最强的蓝光成分 Bmax分别记录下来,然后算一下目标物体所反射的光线的RGB对(Rmax、Gmax、Bmax)的比例即可。
这里,再一次,我们的大脑从一个具有多义性的信息源中抽取出了一种最靠谱的解释。从物体表面反射出来的光线并不能唯一确定物体的反射比,一个方程无法解出两个未知数(光照、反射比)。但我们的大脑仍然还是聪明地利用了环境中的evidence,靠谱地解决了这个问题。
然而,接下来的才是我真正想说的,在刚才提到的算法中,一个先验假设是“目标物体周围的邻近环境中存在完全反射光线中的绿光成分的物体…...”,问题是如果这个假设不满足呢?戏剧性的错觉就出现了,见下图:(Mauro Vecchi/图)
图中白线所指的两个小方块的颜色一样吗?如果你觉得不一样的话,不妨用软件把这两个色块的像素摘取出来对比一下。(注:这里还有一个关于Color Constancy的不错的视频:多亏色彩恒常性,多彩世界不混乱。色彩恒常性只是我们体验到的一系列主观知觉恒常性中的一种)
以上这些错觉与实际生活多少有点脱离,但我打赌以下这个现象每个人都看到过——只要你去过理发店,因为这个错觉也被叫做(理发店门口的)“旋转彩柱错觉”:
透过条柱看到的黑白条块在往下移动,而透过孔隙看到的黑白条块则往右下方移动。然而,实际上孔隙背后的黑白条纹纸可能正在往下移动,也可能往左移动,实际上其移动的角度有无穷多种可能,为什么我们的大脑只看到了一种可能?
我们的视觉系统通过大量的先验假设来解释投射到我们视网膜上的二维图像,从中推断出三维结构,类似的例子还有:Kinetic Effect、Aerial Perspective、Parallax Scrolling等等。视觉系统感知到的三维图像只是我们的大脑给我们玩的一个小把戏,或者,严格来说,一系列小把戏之一。
在一般人看来,视觉错觉只是拿来哄MM开心的小伎俩,是魔术师的小把戏,“不登大雅之堂”,然而在心理学家和认知神经科学家们眼里,视觉错觉是一个迷人的研究领域,是研究人脑如何处理信息的窗口,正如数学家们透过悖论对数学的奥秘一窥端倪,心理学家们也在透过形形色色的错觉现象探索大脑对信息的处理机制。
以上这些错觉现象实质上揭示了一个深刻的原理,这个原理不仅适用于视觉现象,同样适用于其他心理现象:我们的大脑从外界接受到的信息其实是满含着歧义的,单单从这些信息本身来看,我们应该感到无所适从才是,然而我们的大脑几乎每次都能够从富含歧义的信息中找出最靠谱的解释,作出无比牛B的点估计,这得益于漫长的进化过程,以及我们平常生活中积累的大量先验假设,然而,接下来我们要说到,这些先验假设是双刃剑,其锋刃的另一面就是我们常说的“偏见”。
《Probability Theory, the Logic of Science》上讲了这么一个故事:
一个月黑风高的夜晚,你是一位警察,在一条荒无人烟的街上巡逻,忽然听到入室盗窃自动警报,你转头望去,发现街对面的珠宝店的玻璃窗户破了个大洞,一个蒙面的家伙背着一个鼓鼓囊囊的的包正从窗户中爬出来,此时,你一定毫不迟疑地断定这个人就是强盗。你是怎么推断的呢?
《疯狂的赛车》里,耿浩到庙里取了骨灰,一出门看到几个黑社会老大模样的家伙,以为是殡仪馆的人,而对方却以为耿浩是杀了泰国佬的地头蛇,并把耿浩手里的骨灰盒当成了藏毒品的工具,还一通佩服,结果一桩阴差阳错的生意就做成了。他们又是怎么推断的呢?
正如以前听过的一句话所说:对于日常生活中的事件,总有一个平凡的解释,和一个疯狂的解释。
例一中的那个背着包的人可能是珠宝店的老板,从假面舞会回来,身上没带钥匙,当他走过自己的珠宝店的时候,一辆卡车呼啸而过,轧飞的石子把他的珠宝店窗玻璃打碎了,为了保护他自己的珠宝,他只能进去把珠宝收起来带走。
TopLanguage上的一位朋友li kai讲了这么一个故事:
我有个朋友前些日子刚结完婚,这里有一个故事。他本身并不富裕,因此呢,就跟媳妇商量,咱能不能一切从简,什么三金,(就是金项链、金戒指、金耳环)也就都免了吧,媳妇说这是家里规矩,不能同意,这边老丈人当然就更不同意了,非逼着我这穷哥们买三金,给一万元礼钱。
最后,没办法,我这朋友东挪西借把东西弄齐了,婚礼上,老丈人也给新郎一个红包,可我这哥们却始终憋着一股气,接过来之后终于没按耐住,爆发了,你猜怎么?他把红包给撕了扔地上,后来大家就劝他别这样,结婚呢,好不容易安抚下来,有人就说,你把彩礼捡起来吧,看看到底给你多少钱,结果他捡起来一看,是一张存折,上面显示有十万元存款。
原来老丈人并不是想要从男方家捞什么钱,只不过就是认为按照自家风俗这些时必须的,否则女儿嫁的太不风光了。仅此而已。
故事中的这位朋友又是怎么推断的呢?他所得到的信息仅仅是他的丈人坚持要他给礼钱,他并没有得到关于丈人这么做的意图的信息。丈人的意图只是他自己的推断,他对丈人意图的推断只是一种可能性,并非唯一的可能性。然而他仍然还是不可避免地陷入了对自己推断的过分信任的陷阱,一旦脆弱的自尊被触发,接踵而来的便是一连串情绪化的、自动化的行为(仿佛汽车挂上了自动挡)。
想一想生活中有多少误解是由于自以为是地对别人的意图的误读而导致的呢?
我们总是混淆“事实”和“推断”,尤其是当我们对推断的确信度很高的时候,或者某种推断对我们有利的时候,或者当这个推断源于大脑天生的偏见的时候,例如,将关联误当做因果就是我们的认知死穴之一:(xkcd/图)
松鼠会的新书发布的时候,姬十三发布了一个页面作了简介,我跳转过去浏览了一下,看到介绍的结尾跟着一段话:
作者简介
姬十三
姬十三,神经生物学博士,供职于美商百科网站博闻网(http://www.bowenwang.com.cn)。为《新发现》、《外滩画报》、《时尚健康》等报刊撰写科学专栏。个人博客是:http://jshisan.yculblog.com
我就感到奇怪,《当彩色的声音尝起来是甜的》是松鼠会诸多作者的作品合集,为什么这里作者简介只写姬十三呢?我想当然地把这里的作者简介当作了是新书的作者简介,我心想:那难道还有什么可能呢?(这同样也是我们的认知偏差之一——把“想不出其他可能”当做“没有其他可能”)。然而老婆又适时地泼来一盘冷水(我为什么要说又呢?):这里的作者简介难道不可能是这篇博文的作者简介?我一想,也是啊。要证伪我原来的假设很简单,翻开另一篇博文就知道了。于是我随便打开松鼠会网站上的另一篇博文,果然这里的作者简介是博文的作者简介,而非(我原来所猜测的)新书的作者简介。
但是,关键是,原先我并不知道松鼠会的博文有这么一段作者简介,因而就我原来所持有的知识而言,我作出的推断是唯一靠谱的,这也是为什么我感到如此确信的原因之一。而且,由于我不知道松鼠会的博文有这么一段作者简介,因而我根本无法看到或设想另一种可能性。既然想不到另一种可能性,又怎么可能有机会去证伪我的猜测呢?当知识有硬性局限的时候,就算持有Open Mind甚至也是不够的:(Matrix67/图)
古罗马哲学家Lucretius认为,宇宙是无限的。让我们来看一看他的经典论证。假设宇宙是有限的。我们往宇宙的边界投掷一根标枪。则我们将看到以下两种情况之一:这根标枪穿过边界飞向远方,这说明宇宙并无边界,它是无限的;或者这根标枪一头装上宇宙边界停了下来,这说明边界外“有东西”挡住了标枪,同样说明宇宙是无界的。(来自Matrix67)
我想说的是,在我们的知识体系里面还不存在“有限无界”这个概念的时候,上面的推理真的很滑稽吗?我们现在的知识体系和古希腊相比固然得到了极大的进步,但是我们真的变得更“聪明”了吗?要知道推理的引擎(演绎和归纳)几十万年来却并没有变化,我们只是站在巨人(数千年知识的积累)的肩膀上,但这个巨人的高度并不属于我们自己,我们有什么理由五十步笑百步呢?
我们太可能因为受到知识的局限性而对事物的看法产生无法消除的偏见,有时候打破这种偏见的唯一途径就是开阔视野,多积累知识,以及和具有不同知识背景的人讨论,否则就算抱着“我可能是错的”这种信念,你也不知道怎么去证伪自己的一个猜测。
关于我们大脑中的先验假设能够对我们的日常推理和记忆造成多大的影响,有这样一个经典的实验:
1981年,两位心理学家Brewer和Treyens作了这么一个实验:
召集一些人,告知他们将会参加一项学术研究计划,实验者先带领他们来到一间办公室,让他们稍加等候,一段时间之后,叫他们出来,并询问他们记得办公室里面有哪些东西。一些人声称看到了书,然而实际上办公室里面根本没有书。
这里的原理是显而易见的,我们期望在一个学术机构的办公室里面看到典型的事物——书。当我们的直接记忆并不深刻或者我们当时等候的时候并没有刻意留心屋子内的摆设和物品时,我们会依靠之前生活中积累出来的先验假设进行推理,填充记忆的模糊或空白。关于虚假记忆的研究也表明,我们的记忆并不像电脑的存储设施那样,忠实记录,然后忠实读取,而是在记录和读取的时候都是相当程度上“构建性”的,而构建所用的“素材”则是我们之前在生活中积累出来的经验。这也是为什么同一个故事经不同的人口口相传之后会出现形形色色的版本的原因。
– 以下对了解机器学习的geeks插播一段八卦 –
对基于统计(特别地,基于贝叶斯)的垃圾邮件过滤的基本机制有所了解的同学应当知道,在判别公式里面有两项分别是P(S)和P(H),分别代表一封邮件是垃圾邮件和非垃圾邮件的(先验)概率,一项统计表明现实世界中这个比例是8/2,即80%的邮件是垃圾邮件。这个就是过滤器眼中的世界,“八成的人都是坏人”,这个就是过滤器的“偏见”,或者“先验假设”,来一封邮件不管三七二十一首先作一个最坏的打算。正如机器学习方法的偏见来源于训练数据集,我们头脑中的偏见也来源于我们大脑中神经网络的训练数据集——现实生活。
由于8/2的比例并非时间无关的稳定比例,或者其他什么原因(如保守起见),目前大多数贝叶斯垃圾过滤系统实际上将这个比例设为5/5,表示“无偏见”,不设先验。这就基本上将贝叶斯这个词扔掉了。但我个人觉得这并不能称为“无偏见”,如果现实就是“有偏”的,保持公平也是一种偏见,这让我忍不住想起P. Norvig讲的关于人工智能鼻祖Minsky的一则轶事:
In the days when Sussman was a novice, Minsky once came to him as he sat hacking at the PDP-6.
"What are you doing?", asked Minsky.
"I am training a randomly wired neural net to play Tic-Tac-Toe," Sussman replied.
"Why is the net wired randomly?", asked Minsky.
"I do not want it to have any preconceptions of how to play", Sussman said.
Minsky shut his eyes.
"Why do you close your eyes?", Sussman asked his teacher.
"So that the room will be empty."
At that moment, Sussman was enlightened.
根据P. Norvig的说法,Minsky是想告诉Sussman一个随机赋值的神经网络也是有模型(或偏见的),只是这很可能是一个极其复杂的模型,我们无法理解。你蒙上眼睛不代表这个屋子不存在,你不知道随机神经网络的模型是什么不代表它不存在。
但我忍不住YY了一把另一种解释:如果现实世界背后的模型本来就是“有偏”的,假装不引入“偏见”本身就是“偏见”。只不过我们所观察到的现实世界纷繁的表象往往只是一个局部有偏样本,导致我们看上去随机抽取的数据其实还是有偏的,如果我们蒙上眼睛骗自己说这就是真正随机的抽样,那么训练出来的模型肯定也是有偏的,为了补偿这种偏差我们有时候宁可扔掉从训练数据中得到的某些概率,这种方法往往导致长期来讲更靠谱(严格来说这里的术语是robust :P )的模型,尤其是在金融市场上,小聪明的人从短期趋势数据上自以为得到了靠谱的模型,把太多的赌注放在了一个建立在因在时间维度上没有随机采样而很可能有偏的数据集上得到的模型上,而真正智慧的玩家则会建议普通人最佳投资方法是无偏见地平均分配资金,避免因模型错误而导致的灾难,这一平均分配的极端形式就是——投资指数。
– 八卦结束,回归正文 –
最后再来一个例子,生动地说明了我们在平常生活中积累的偏见有多深:
问题:现在有两个孩子,张森和李梅,其中一个孩子有四个卡车玩具,你认为是谁?
问题:莉莉和丁丁谁将来更可能成为护士?
(注:以上问题演绎自《Making Up the Mind》p168页的英文版本)
尽管我们只拥有他们的名字,名字本身只是任意的汉字,自身并不携带信息(从一个角度来说),但就连三岁的小孩也能对这两个问题给出“靠谱”的答案。
当然我们也可以说偏见代表着长期积累的生活经验,能够使我们事先就对未知对象的属性进行靠谱的预测,但另一方面,偏见也很可能成为自我实现的预言和自我妨碍的篱笆:女孩和男孩的数学智商真的有显著差异吗?但受文化影响,女孩认为自己更不擅长数学和理科,这个自我信念从两个角度产生作用,第一,它会让女生倾向于投入更少地时间在理科上,从而导致更低的理科成绩,结果进一步强化了她的“我的数学不好”的信念。这几乎是一个死循环。第二,人们为了维护对自我的信念,会拒绝接受与之相反的信息,如果那一次她数学考得不错,她会寻找外部理由,譬如“只是凑巧罢了”,虽然这种把自己看低的心理过程有点不可思议,但这的确是心理学家们实验证实的结果。
在社会文化方面,人们常用“仁者见仁、智者见智”这个俗语来指代三种现象:
1) 偏见:不同的人戴着不同的有色眼镜,对同一现象产生不同的理解或解释。是平凡的解释还是阴谋论的解释?存乎一心。
2) 立场:例如对于“生活的意义”没有统一的标准公理,因此每种生活都是合理的,各人可以持有不同的价值观,优化不同的目标函数。
3) 选择性关注:对于同一事物,不同的人关注的点不一样,象有四腿,各摸一条。
与“仁者见仁、智者见智”这个俗语的褒义色彩相反,这里除了第二点是中性的之外,另外两点都不能算是好事,譬如程序员在做项目的时候经常只选择性地关注“使用的技术是否有意思,是否有挑战性,是否好玩,我能否从中得到乐趣,是否能学到新东西”,而并不是关注最应该关注的“如何以最小成本达成项目成功”。至于第一点——偏见——就不用多说了,前文已经说得够多了。如果还觉得不够的,不妨读一读社会心理学经典之作《社会性动物》的冲突和偏见部分。
偏见在我们解决问题、认识世界的过程中都起到了很大的影响,并且很多时候是不好的影响。因此,让我们经常和具有不同信念和知识背景的人讨论,弥补个人经验知识的局限性导致的偏差,并时常使用以下这句话来提醒自己keep an open mind吧:
“这只是一种解释(可能),未必是唯一的解释(可能)。想不出其他解释不代表就不存在其他解释。”
【南方周末】本文网址:http://www.infzm.com/content/62921