魔女的使命第二季:英语学习三大定律之二——聆听是语言学习的本原技能

来源:百度文库 编辑:九乡新闻网 时间:2024/04/28 21:25:18
“人类与生俱来的语言自学能力,完全建立在能听清语音流的基础上、建立在卓越听力的基础上,聆听是语言学习的本原技能”,这是外语学习的第二公理。为着深化对这一公理的领悟,我们简介当代心理语言学的前沿研究。

一. 计算机与婴儿谁更聪明

     若要评选20世纪人类科技最重大的突破,或许非信息科学莫属。且不说互联网带来人类生活方式翻天覆地的变化,早在1997年由IBM研发的计算机深蓝(Deep Blue)就击败了世界国际象棋冠军 G. Kasparov(5)。这意味着至少在国际象棋博弈这一领域,地球上50亿人中最聪明者都难与机器匹敌。

    棋类博弈属于信息科学的人工智能领域。如今人工智能的高科技电脑能够完成复杂无比的任务,令人类的种种智能相形见拙。人类语言理解亦是人工智能的重要研究领域。虽然人工智能在棋类博弈方面成就斐然,但在自然语言理解领域,包括口语的机器识别方面,人工智能进步缓慢。同时,心理语言学的研究为人类挽回了面子;

    这些研究发现在语言信息处理能力方面,每一个正常婴儿都比最先进的计算机更聪明。显然,婴儿所表现出的语言智能仅仅是人类语言智能的冰山一角。我们从人工智能与语言学常识这两个角度交叉对比,考察心理语言学领域的这些研究,以窥探婴幼儿语言智能习得的过程。

     试想让人或机器聆听一段话语、对这一段语音流加工、理解出其含义,它要完成哪些方面的智能化工作?简单地区分有六个层次的心理加工。

     第一个层次,基础语音层次的加工,将物理声波转换为语音元素,逐个解析出元音与辅音,拼组成音节,排列出音序,等等。

    第二个层次,在基本语音加工的基础上,探测出候选单词(candidate words),胜任单词切分。

    第三个层次,胜任加工语音流中各层次都蕴含的韵律(Prosody,包括节奏、强弱和语调等),它是大脑加工语音流的核心基础成分之一,但在书面语中通常无法表达。

   第四个层次,检索或激活或推测生成单词及词组的含义

   第五个层次,能够根据或生成内在的句法规则将单词与短语组合成更大的意义单位(句子的含义)

   第六,至少从第二个层次开始,都要同时调动和集成背景知识(存储在大脑中的长期记忆系统和环境线索),实施多重推理,最终把语音流的意义整合起来

     这六个层面中,首要的自然是前三个。前三个层面过不了关,他人的话语对于你就是噪音,其他一切免谈。

   迄今为止机器人工智能连单词切分语音层次的加工都过不了关。而10个月大的婴儿能够轻松完成这项任务。婴幼儿母语习得是人间最普通之事。然而往往越是司空见惯的事务,越蕴含无穷之秘密。我们熟知那则关于熟落的苹果激发牛顿思考、而返现万有引力的传说。这传说未必真实,但富于启发。没有对自然宇宙的惊异,没有对司空见惯的困惑,就不会有理性知识的进步。谈到人机对比,略微思索就会惊讶于人类婴儿的绝顶聪明。计算机处理人类语音时具备异常强大的装备。它可充分运用:A. 灵敏度极高的传感器;B. 运算速度极高的计算机的“大脑”,即中央处理器;C. 顶尖科学家研发的算法程序;D. 顶尖语言学家的语言语音理论模型知识;E. 庞大的语音语料数据库,如广泛采样的男女老少的实际话语,等等;通过这一系列高科技手段来应对这一任务。然而,由顶尖人工智能专家和计算机组成的人机团队,对口语的机器识别(Speech recognition)攻坚半个世纪之后,迄今仍旧障碍重重,甚至连完善切分单词这第一关都过不了(6)。

   人类新生儿远没有这么好的装备。按照17世纪哲学家John Locke 的看法,新生儿就是一张白纸(blank slate),按照20世纪行为主义科学家的看法,新生儿就是一部被外部条件所控制的动物机械,并不具备任何内生的先天智能。常识似乎也告诉人们,无论新生儿多么聪慧,远比不上计算机,遑论相比于科学家研究构造的语言学理论模型和知识库。同时亘古常识又令每一对父母知晓,大脑“一片空白”的新生儿可以毫不费力地习得母语。单词切分仅仅是母语习得这个大任务中的一桩“小”事,对婴儿当易如反掌。科学研究证实10个月的婴儿可以胜任切分单词,尽管他的大脑里还根本就不存在哪怕一个单词,遑论什么系统的语言学知识了。

    华盛顿大学的P. Kuhl 教授说:Cracking the speech code is child’s play for human infants but anunsolved problem for adult theorists and our machines (7)。解码人类的话语是婴儿的游戏,却又是成年理论家和计算机未解的难题。

二. 人类的语音系统

   计算机凭依详尽全面的语音语料库、复杂理论模型建构的算法程序等等,仍旧无法胜任通过声韵加工而解码话语,但婴儿能够轻松胜任。这充分证实人类物种所特有的的声韵加工天赋。新生儿大脑并非一片空白,而是天生就具备某种内在的人类语音声韵的普遍模板与获得机制。

   人类语言的语音包含约200个元音和约600个辅音(9)。若不考虑音调等元素,它们就是构成人类语言语音系统的基本元素之全集。而每一种语言平均仅仅运用约40种相互区别的被冠名为音素(或称音位phonemes )的语音单位,来构造其语音系统。准确地说一个音素实际上不止一种声音(non-identical sounds),而对应于一组不同的在语言学中称之为音元(phonetic units)的声音。不同的音元在特定的语言里可以归并为同一个音素,于是这组不同的音元成为功能上相互等价的语音构造单位。进而,一个音素所对应的物理刺激上不同的声音表达,比它所包含的音元数量更丰富。实际上每个音元本身都对应于众多不同的声音表达。通俗地说,每个人都有独特的嗓音,嗓音还有实际运用时的变异。同一个音素的发声,在男女老少的话语中、在不同的语速中、在不同语境前后相连的发音里,在不同的客观场景与主观情绪中,就其物理声波来分析都各各不同。如英语单词students 中的前后两个发音 /t/,虽属同一个音素,但受上下文语境的制约,实际发音完全不同。语音学中把这种现象称为“音变”。人类话语中丰富异常的音变,令语音的物理声波与语音音素之间根本不存在明晰的一一对应关系。

    婴儿语音知觉的学习任务,既需要辨别出各种细微的声学物理差别,从而区分出不同的音素,例如 /b/ 与 /p/,又需要把众多明显不同的声音感知归类为同一个音素。由此可初步窥见为什么高科技也犯难于人类语音识别。经过50年攻坚,高科技已经能制造出的语音识别应用系统,但它必须逐个适应特定的说话人,换一个人说话它往往立刻失灵,不得不重新采样。人类在母语对话场合听懂陌生人的话语并不需要预先采样来适应对方的嗓音。作为对比,外语学习中我们常常需要这种“采样”。

    语音的复杂性还不止于此,它是多层次的结构,在音素之上还有音序或音序规则、音节和韵律等构造。所谓音序(Phonotactic)是指每一种语言对音素的连用都有约束。例如,汉语音节的开首通常不允许辅音连用,如 /st/ ,而英语中普遍允许;现代英语音节开首不允许诸如/kn/ 和 /ɡn/ 的声音,而德语或古英语中存在这种辅音组合的发音。音调(tone)是众多语言语音系统的构成要素,如汉语普通话的四声。虽然印欧语系里多数语言属于非音调语言,但每一种语言都普遍运用音调传达信息。语音系统在音序、音节和音调之中以及之上的另一组多层次结构,是韵律或称韵律模式(Prosody or prosodic pattern), 它包括节奏、强弱模式和跨越音节和单词的音调变迁,等等。韵律同样是人类语言中令人着迷的部分,它跟音乐与诗歌关系密切。通过话语的韵律所传递的语义和情感信息,是人类语言的一个重要纬度,而且是书面语及语法难以记录表达的纬度。达尔文在其1871年的著作  The Descent of Man  中就指出过,语言韵律与情感表达密切相关,它本身又提示语言进化的起源。

   我们仅以单词切分为例进一步考察语言声韵的知觉。阅读表音文字时单词之间有空格隔开,不需要大脑再费事切分单词。中文汉字连写,其阅读时的单词切分比英文书面语略复杂,但也不困难,主要原因如下:“方块字”本身独立;汉字与单音节发音的对应性;绝大多数单音节汉字本身就是单词或词根;汉语中第一高频词(字)“的”具备词切分符的作用;等等。但口语交流时我们听到的话语是一个大体连续的物理声波刺激,而非逐个单词分离的声音。此时单词切分立刻成为一个难题——幸亏我们感觉不到——科学家感觉到了,倍感挫折之感觉。请读者尝试切分以下语句的单词,体会口语中单词切分的难度。

 

Infantsforgealinkbetweenspeechperceptionandproductionbasedonperceptualexperienceandale

arnedmappingbetweenperceptionandproduction. (词切分答案见章末)

     即使你成功切分了这两句话中的单词,仍旧无法完全体会口语单词切分的困难。口语交流中必须实时同步切分单词,而不能如阅读书面语那样时时回溯。进而,牙牙学语的婴儿切分单词按说应该比成人困难千百倍。原因浅显:婴儿不具备成人掌握的母语的语音和词汇知识!作为类比,未学过法语的读者请尝试切分以下法语句子的

单词:

Celasignifiequelescitoyenscanadiensontdenombreuxdroits.

    由此,对婴儿来说语言学习的第一步是包括单词切分在内的语音加工。这是人工智能领域顶尖科学家尚未攻克的难题,也是大脑“一片空白”的新生儿在出生后12个月内必须攻克的。这一任务对人类婴儿来说易如反掌,怎不令人惊讶!

    新生儿具有人类语言语音的普遍辨别能力,能够辨别任何一种音素,不论它是否属于母语,不论婴儿是否曾经接触过聆听过;但成人则根本做不到(12,17)。这是一种卓越的能力。某些音元物理刺激之间的差别非常小,例如只需要10毫秒的时间变化,就能令音元 /b/ 变化成 音元 /p/,而在频率上相似微细的变化,就能令音元 /p/ 变化成音元/k/。新生儿完全能胜任辨别这些差别细微的不同的音元(18)。同时,从约12个月开始,婴儿的语音知觉就开始收敛于母语,对母语的语音流知觉的敏锐性,继续持续提升直至童年期;而对非母语相关的语音流知觉,逐步钝化甚至蜕化。我们把这种基于天赋能力基础,在婴幼儿期充分定向发展的特定语言的聆听能力,称作语言的“童子功”。

   乔姆斯基认为,新生儿普遍具有先天语言获得天机制以语法能力为核心。科学界界对此仍争论不已。无论新生儿是否具有先天的语法获得能力,非常确凿的是,新生儿具有强大的人类语言的语音加工能力。如果不考虑通常为聋哑人运用的手势语(sign language),那么聆听,即话语知觉(speech perception),包括语音辨别能力(phonetic discrimination skills),是新生儿开启人生语言习得进程的先天武器。这一人类天赋的心理能力,自然构成语言学习的“公理”,外语学习的基石。

   科学家对早期语音知觉能力与后续语言整体能力发展之间的因果关系,做了如下图所示的解释。

   遗憾的是,国内主流的外语学习体系,严重忽略了人类语音加工的天赋能力,导致外语学习方法削足适履、南辕北辙。

词切分答案:

Infants forge a link between speech perception and production based on perceptual experience and a learned mapping between perception and production.

论坛帖子链接: http://bbs.homer-english.com/showtopic-2144.aspx