苏州校花刘萌萌迅雷:中国工程院院士 李幼平:无尺度现象引发的思考

来源:百度文库 编辑:九乡新闻网 时间:2024/05/03 01:18:15

 

——文化传播对网络的反作用

新华网专稿

    编者按:科学家和工程师的任务是不断从客观现象中找出规律,让人类与客观世界和谐相处。李幼平院士从人类文化活动对网络产生的反作用讲起,介绍了万维网中的无尺度现象,阐述了利用卫星广播与镜象收存实现文化网格的理想,并且延伸开去,得出看法:网络不仅是个人和个人交流的工具,也是个人与社会之间的文化媒介。本文最后的结论是:网络改变了人类的文化活动,文化活动也改变了网络。正作用和反作用,一推一挽,推动人类文明的车轮滚滚向前。这与李长春同志不久前的讲话精神十分吻合。李长春同志指出:“当代信息产业已不再是单纯的信息技术产业,而是信息技术与信息文化产业的统一”“要促进我国信息产业与文化产业的战略性合作,引导网络产业与内容产业相融合”(新华社2004年10月30日报导)。政治家和科学家从不同的角度出发,得出几乎相同的判断。希望本文能引起大家的兴趣和讨论。

(一)万维网演化为无尺度网络

    网络改变了文化传播,大家已经谈了很多。今天,我们从无尺度现象谈起,讨论文化对网络的反作用。

    十几年之前,web服务进入互联网,开始了网络的文化应用。正是从那个时候起,互联网的网站与网民才开始快速增长,网络才有兴旺发达的今天。这是人类的文化活动影响网络的第一种反作用。

    第二种反作用鲜为人知。最近几年,美国科学家A.L.Barabasi等人用统计物理学的实验方法发现,文化活动悄悄改变着网络运作的数学模型,由原先正态分布的随机模型转变为幂次分布的无尺度模型。

    “无尺度”是什么意思?这里需要做一点解释。原来,理论家把庞大复杂的网络,分解为“节点”(node)和“连接”(link)两大要素。提供内容的网站和接受内容的网民统称为“节点”,内容在节点间的运动称为“连接”。一个网站的社会作用或文化地位,可以用该网站与外界的连接数k来衡量。如果某个网站很长时间也没有人来连接,表明网站的社会影响不大,文化地位不高;反过来,如果连接频繁,作用就大,地位就高。

    网民对网站的访问,可以说是独立、自由的,完全取决于网民本人的主观意愿。在做大量统计实验之前,科学家预测,连接数k应当服从泊松分布或正态分布,即每个网站的被访问量差异不会太大,就像人类身高差异不会太大那样。然而,实测结果推翻了这个预测。Barabasi等人设计了一种软件,可以从一个节点跳到另一节点,收集并记录网上的所有连接。在对几十万个节点进行统计之后,发现了令人惊异的结果:当绝大多数网站的连接数很少的情况下,却有极少数网站拥有高于普通网站百倍、千倍甚至万倍的连接数。就像在茫茫人海中突然发现若干身高数百尺巨人那样,令人意外。巨人的身高之大,已不能用普通人高度的尺度来度量,于是想出了“无尺度”的用词,形容少数节点连接数大大超出普通节点的现象。

    上述实验结果可以用幂次定律表达:出现连接数为k的概率 p(k),反比于k的n次方。其中,n称为幂数,它是很接近于2的一个常数。

    幂次定律告诉我们,尽管万维网提供内容的网站很多很多,网页更是天文数字,但是,有能力长时间吸引众多网民大量访问的网站,为数非常有限。我们用连接数作判据,可以把少数对社会贡献特别大的热门网站从茫茫无边的信息海洋中分离出来。

    统计物理学家习惯于把服从幂律分布的现象称为无尺度现象。也就是说,人类的文化活动已使万维网演化成为无尺度网络(scale free network)。

    我们在实际网络中看到的现象正是如此。尽管中国向网民提供内容的网站有六十万个,但是,其中只有为数不多的网站,才拥有网民一次访问难以穷尽的丰富内容,拥有接纳许多人同时访问的足够带宽,有条件演化成热门网站。拥有大连接数的热门网站,除了新浪、Google、Yahoo等门户网站外,就是己经上网的报纸、期刊、通讯社、电台之类的专业“网络传媒”。在某种意义上可以说,正是网络传媒的客观存在,影响了网络运作的数学模型。    无尺度现象不仅仅出现在万维网中,在神经网络、细胞网络甚至人际网络中均有体现。可以说,凡有生命的地方,有进化、有竞争的地方都有不同程度的体现。社会学家所说的“马太效应”,《新约》圣经所说“凡有的,还要加给他,叫他有余”,同无尺度现象也有某种相通之处。

(二)无尺度现象的信息学意义


    无尺度现象的成因,可以从多种角度解释。

    Barabasi等人解释,优先连接性和网络的成长性是两个起因。所谓成长性指网民网页急剧增加,优先连接性指新网民总是优先选择前人经常访问的网站。随着时间的演进,某些热门的网站愈加热门,不知名的网站愈加冷门。计算机仿真可以演示验证,万维网如何由相对均衡分布的随机网络逐渐演化为极不均衡分布的无尺度网络。

    哲学家解释:存在决定意识。某人选择连接某一网站,虽然是一种个人意识。但人类生活在同一地球上,相同或者相似的客观境遇,使得人群中有相同或相似的个人意识。大量的统计,把深藏于个性中的共性强烈地反应出来了。充分的自由民主,在一定条件下,有可能转化为高度的集中统一,是“对立统一”的例证,一点也不值得奇怪。以DNA作例子,DNA虽然是个性的标志,但人与人之间的码元,99%以上是相同的,说明个性中潜在共性。

    无尺度现象给信息科技工作者带来很多启示。

    首先,让大家认识到,信息社会同时兼有“大世界”与“小世界”两种属性。一方面,网民、网页、带宽随时间快速成长,使得万维网成为名符其实的全球范围内的巨大网罗(world wide web)。另一方面,每个人一天之内所能接受的信息,受到生理带宽与生理精力的限制,又是一个不随时间变化的小世界。大世界与小世界之间,技术世界同“以人为本”的人文世界之间,存在明显的差异与矛盾。矛盾的主要方面在用户端。用户感觉到,数十万网站和数百亿网页,犹如“信息孤岛”,实在难以分别直接面对。他们希望能出现一种承大启小的“中间代理”,用户很容易对这个统一的中间代理表达自己的需求,有兴趣的内容又会通过中间代理主动地流入自己的家中。“中间代理”是什么?它正是无尺度现象所指出的、由热门网站构成群体。由数百或数千资源构成的热门群体,是网民通过民主的方法由大家“选举”出来的,是人类文明进程的自然产物,值得我们倍加珍惜。

    无尺度现象还从理论层次启发信息工作者:信息共享和物质共享存在本质差异。信息共享的本质,是信源母体不限数量(scale free)的复制(copy);物质共享的本质,只是资源母体有限量的瓜分(share)。

    这是人类对信息共享认识上的一次突破。在此之前,人类习惯于用“信息公路”比喻网络中的信息共享。皆然是公路,“车多路堵、人多网堵”便是不可避免的。好像限制享用的人数是天经地义的。当前不少专家仍旧认为,要增加享用人数,除了带宽化,就没有别的出路了。带宽是一种物质性资源,服从总量守衡,分给了你,别人可能就没有了。不管怎么配,享用的人数总是有限。我们认为,必须用科学的语言,揭示“信息高速公路”比喻的局限性。在2003年第五期《SCIENTIFIC AMERRICAN》发表的Barabasi等人的著名论文中,就用图1美国高速公路和航空运输的图形差异,来说明随机网络与无尺度网络的差异。

图1  引用《科学》第七期47页的图    也就是说,无尺度现象鼓励我们去寻找一种没有带宽瓶颈、不限制网民人数的个性化服务机制,把web服务推向一个全新高度。当今互联网的web服务,包括执行IPV6协议的下一代互联网,尽管网民地址数基本不限量了,但没有根本解决过多网民引起的带宽瓶颈问题。 三)整合上千网站,形成主流群体

    无尺度现象启示我们打造国家级文化群体的灵感。只要把几千个甚至几百网站整合起来,就可以形成满足社会上绝大多数人群需求的“普适化”主流媒体;如果技术上想出办法,能让主流群体普及下去,普及到每个村庄或家庭,就可以在普及数字文化的进程中实现历史性跨跃。

    下面简单介绍目前国人正在做的一些工作。

    北京应用物理与应用数学研究所的几位年青人,在水鸿寿、陈谋松研究员的带领下,根据中国互联网中心CNNIC发表的实测数据,初步建立我国万维网网站连接数、网站数、分流比的数学模型,验证了无尺度现象符合国情,并推算出幂律常数大约为2.124.

    依此模型推算,当99.5以上的网站连接数均低于100次时,却有万分之四的网站大于1000次,十万分之三的网站超出100000次。可见,网站的社会作用与文化地位差异悬殊,只要把总数千分之五(约三千个)的、有大众文化意义的网站整合起来,就可以形成某种主流文化群体,满足99%以上的访向需求。如果整合一千个网站大约能满足95%的访问要求。

    整合名列前茅的一千至三千个网站,相当是把全国最有影响力的报纸、期刊、网站、出版社统统并列起来,其内容极其丰富多样,每一个普通百姓,都可以从中找到自己有兴趣的读物,是一种普适(pervasive)于全民的新概念超级传媒。    如果我们能用现代科技手段,在2015年之前把这个巨无霸式的超级传媒向全国传播,对重振中华文化将有难以估量的战略意义。

(四)普及数字文化的网格年代

    人们把计算机的普及划分为Net、Web和Grid三个时代。如图2所示,纵座标p为普及指数(pervasive index),代表参加联网的计算机总数与人口总数之比。

图2

    在互联网诞生初期的Net时期,网络仅仅作为科学家之间的一种联络工具,联系数量不多的计算机。这个时期平均每一万人才有一台计算机,p值小于万分之一。 九十年代之后,Web的应用开始了网络的公众认可期,万维网作为搜寻信息的文化工具,采用一对多的client/server结构,p值跃升到0.01至0.1。2005年之后,将逐渐进入广泛应用计算机的Grid(网格)时代,目标是全人口通过计算机共享信息,采用pervasive/Grid结构,计算机成为一种遍及化的工具,联网的计算机总数将接近甚至超过人口总数,p接近或超过1。

    无尺度现象的发现,使人们认识信息共享与物质共享存在本质差异,认识到普及数字文化不应该像今天这样艰难,为网格理想的早日实现坚定了信心。    下面我们将进一步闸明,放弃仅仅依靠IP协议的单边主义思维,不难发现:卫星数字广播就是一种不限使用人数、满足scale free要求的技术手段,利用中间缓存环节,对最终用户构成双向互动的机制,就可以形成“规模无上限”的个性化服务网格。

(五)卫星广播定比实验的结果

    2004年六月,清华大学力合公司接受我们的建议,通过卫星进行码分并播定比实验。

    实验只利用DMB-S数十Mbps转发能力中的0.5Mbps,故称为定比下推(scaling down)实验。把0.5Mbps再划分为16个子信道,每个子信道32kbps。每一个子信道分工传输一种文化传媒(一种报纸,一个网站或一门课件),看每24小时能把多少字节的文化内容无差错地送到全国各地。实验表明:在三遍以上重覆广播条件下,每个子信道每天都能把超过100MB的多媒体内容无差错镜象落地。

    根据定比上推(scaling up)得知,每一个卫星转发器每天有能力把总数达100GB以上的文化内容无差错在全国镜象落地。

    这是一个十分鼓舞人心的数据。因为,我国已经在本世纪初基本完成“广播电视村村通”工程,只要把当今的视频内容改为符合多媒体格式的报刊、网站内容,就可以克服数字鸿沟,把“广播电视村村通”变成“报刊网站村村通”。数字文化通过卫星直接为全民服务,包括直接为农村、农民、农业服务的理想,出现了转机。

    剩下来需要回答的问题是:上千种报刊、网站,每24小时有多少兆字节的新增内容(日增量)需要卫星去镜象落地?

    北京应用物理与计算数学研究所联合国家图书馆,在对名列前茅的几家大牌传媒的日产量进行了考察之后,又研究了某些典型中、小媒体的日增量,得出一个猜测:全国主流传媒的日增量小于30GB

    如果这个猜测能够得到证实,就能证明通过卫星广播与镜象收存实现网格的理想是现实可行的。

    顺便向大家报告,西南科技大学和绵阳九洲公司已经在2004年度内完成了大规模码分并播研究的地面实验工作,证明用一种被称为“统一内容定位”(UCL)代码,可以有条不紊地把数千传媒整合在一个DMB载频上,地面用户可以用UCL按自己的兴趣选择数量任意的部份传媒下载镜象。    我们己经非常接近于完成一种文化网格的设想方案。  

(六)文化网格的一种设想方案

    什么是网格(Grid)?说法有很多种,如电力网格、计算机网格、军用网格等等,不管什么网格,核心思想都是“整合资源,广泛共享”这八个大字。

    什么是文化网格?“整合资源、广泛共享”思想在文化领域内的体现。首先,要把分散于各地的文化资源整合起来。不仅是为了改变媒体资源互不相连的“孤岛”或“烟囱”状况,而且要形成“一体化”的“普适”(pervasive)界面,只要同这一个界面打交道,任何人都很容易找到适合于自己的读物。

    其次是全社会广泛享用。所谓广泛,指网格一旦建成,就能在物理层面上克服数字鸿沟,让全国960万平方公里的城市乡村都有可能享用。

    请见图3,第一步,利用IP协议,把分散于全国各地的几千个网站当天的新鲜网页汇集于广播中心,形成一体化的普适资源;第二步,通过卫星码分并播的BP协议,把普适资源散发到全国城乡,实现遍布式镜象存储;第三步,再依靠IP协议,让已存储的内容对最终用户实现双向互动的按需服务,构成IP-BP-IP的网格结构。

图3  文化网格的初步设想

    镜象存储器同最终用户几乎是“零距离”,没有带宽瓶颈,双向互动成本极低。采用PC机作为终端的用户,可以利用机内硬盘作为镜象存储器。采用电视机作为终端的用户,可以若干台电视机共用一台带硬盘的服务器,现有的模拟电视机只需嵌入一个很简单的NC(网络计算机),就可以通过无线或有线的小局域网与服务器双向互动。服务器与各NC之间,可以按清华大学张尧学教授提出的“主动服务与透明计算”的方法实现遍及化运作。

    大容量存储器的成本过高,是阻碍实现图3理想的一个障碍。这几年,随着存储密度的进步,硬盘售价持续下降,市面上800GB硬盘已降至800元以下,存储1MB成本已低于人民币一分钱。降价的势头还在继续,再过几年,大容量硬盘进入村庄、进入家庭将日益现实。

    有了镜象存储器作中间媒介,广播系统将告别“单向、定时”的百年传统,转变为“随时、随意”的个性化按需服务。实现广电总局提出的“全面推进广播影视向现代传媒转变”的目标。

    网格在英语中称Grid,几何上的意思是“栅格”。图3中,横线代表资源,竖线代表用户,横竖两组平行线构成正交栅格,交点代表连接。这种表达方式同普通教科书上点代表资源或用户,线代表连接,正好相反。有意思的是,如果您问:一根线包含几个点?回答是:无上限(scale free)。图3几千个传媒的任何一个确实都可供没有数目上限的用户享用。这就是网格相对一般网络进步之处。

    应该指出,我们对文化网格的技术细节远未考虑成熟,欢迎大家献计献策,参与此项由中国人自主的创新活动。 

(七)结束语

    网络改变了人类的文化活动,文化活动也改变了网络。正作用和反作用,一推一挽,推动人类文明的车轮滚滚向前。

    Web投入应用之后,网络己经不再单纯是个人与个人之间的通信工具,已经成为个人与社会之间的一种文化媒介;信息产业已不再是单纯的信息技术产业,而是信息技术和文化产业的统一体。

    引导网络产业与内容产业相融合,引导电信行业与广电行业相融合,迎接普及数字文化的网格年代,这就是我们的结论。(作者:李幼平/单位:中国工程物理研究院)