艾因拉赫在哪:推荐引擎:未来互联网的发动机 | 知识分享 - 阿里味儿--品阿里之味, 修阿里之道 - ...

来源:百度文库 编辑:九乡新闻网 时间:2024/04/30 14:12:51

推荐引擎:未来互联网的发动机

管理提醒: 本帖被 张桥刚 从 知识分享 移动到本区(2011-01-22)
在群体交互的过程中,“内容”在不断地产生,比如浏览记录、点评数据;但这些“内容”的价值挖掘,才是最核心的东西


  段永朝/文
  登上《财富》杂志封面人物,历来是商界精英成功的一个显著标志。
  2010年11月,这期杂志的封面人物是50岁的里德•哈斯廷斯(Reed Hastings)。作为美国最著名的流媒体影视播放服务商Netflix的创始人和CEO,哈斯廷斯的名字排在了福特CEO穆拉利、苹果创始人乔布斯、Facebook创始人扎克伯格等50位业界叱咤风云的精英之前——他被誉为“群星中的俊杰”。
  对这家成立于1997年的老牌电影租赁服务商来说,过去的10多年里,Netflix更多的是应对“被挤出市场”的威胁,来自Blockbuster、沃尔玛、苹果公司或其他竞争的一次又一次的严峻挑战。《财富》周刊的封面报道中说,如狼似虎的对手们早就想把哈斯廷斯“赶出业界,让他绞尽脑汁重起炉灶,或让他提前退休,打发他回家消磨时光。”
  无独有偶,2010年12月11日,在《时代周刊》评选出iPhone十大流行应用中,Netflix提供的即时影视播放服务Instant Netflix名列榜首。
  能够在超过30万种iPhone应用中脱颖而出,拔得头筹,Netflix所依赖的法宝,正是其历经10余载打造的“秘密武器”——协同过滤推荐系统。
  截止2010年底,Netflix公司的年收入逾20亿美元,注册用户已经超过了1730万,付费用户则超过了500万。每天有400万部电影或电视节目,通过各类终端,呈现在消费者面前,并得到消费者的点评推荐。迄今为止,Netflix已经积累了30亿条点评数据,这座巨大的数据“金矿”,配上自行研发的推荐引擎Cinemath,正成为Netflix公司稳健财源的巨大引擎。
  交互没问题,问题是谁跟谁交互?
  2004年有两个概念响彻互联网界,一个是电子科技出版商Tim O’Reilly提出的Web2.0,另一个是《连线》杂志主编安德森提出的“长尾理论”。Web2.0让“交互”、UGC(用户产生内容,User Generation Content)成为互联网掘金者津津乐道的“法门”;长尾理论,则直观地把“个性化消费”诠释得淋漓尽致。
  越来越多的电子商务、娱乐、餐饮网站,迅即改变了他们聚集人气、吸纳眼球的方式,从不辞辛苦地“堆积材料”、“酷图快评”,转向了“让消费者做点什么”:“顶”和“踩”成了消费者意见表达的标准动作;热门榜单,成了页面边栏的“标准配置”;关联阅读和链接,成为黏着眼球、延长页面驻留时间的经常手段……
  不幸的是,在大大改善了网页的浏览体验之后,绝大多数互联网站的思路,被“吸引更多的眼球”所绑定,他们热衷于竞价排名、SEO(搜索引擎优化),热衷于把“交互”的火力更多地引向网站自身,沉醉于点击率、浏览量、驻留时间,甚至孜孜不倦地切分多个页面、制造更炫的Flash动画、制造更多的插件并相互攻讦。
  挖空心思堆积内容资源、变着法儿吸引客户眼球,却难以获得满意的“营业收入”,成为众多网站的“心头之痛与惑”,他们念叨着一个解不开的魔咒“商业模式”——殊不知,这“模式”并非是可以构造、设计出来,而是“涌现”出来的。
  Netflix的推荐引擎,是一个绝好的范例。
  让你喜欢的电影“跳”出来
  Netflix公司早期是做DVD租赁生意的。1997年公司成立两年后,他们才确立了这种看上去“其貌不扬”的生意模式:用低廉的价格,为消费者提供他所喜欢的电影DVD租赁服务。
  做这种生意很容易想到的是两点:一个是拥有巨大的片源;另一个就是拥有大量的潜在的消费者。剩下的事情,完全可以归之于标准版的MBA套路:制定价格、组建渠道、开展促销。
  Netflix早期的做法也正是这么做的。不过,在日益暴涨的电影库和消费者数据的刺激下,他们在思考一个根本性的问题:如何让消费者喜欢的电影“跳”出来?
  信息过载的直接后果就是,直截了当地得到所需要的信息,变得异常困难(这一点正是Google公司存在的理由)。即便千辛万苦地对信息进行分类、聚合、归档,也无法抵挡数据汹涌而来的恐惧(早期的Yahoo就是这么干的)。
  Netflix想到了“网民的力量”。
  按照最朴素的看法,人们接触电影、书籍、音乐的最佳途径,其实是“听朋友推荐”。这个看法一点都不新奇,日常生活就是这样。
  不过,Netflix把它变成了“算法”,从此走上了正确的道路。
  让消费者喜欢的电影,从海量的片库中“跳”出来,取决于三个因素:第一是消费者自身的口味和偏好;第二是某个电影的风格、剧情、艺术性、导演和演员;第三是环境的影响,比如当红的明星、密友的推荐、圈子的品位等等。
  这三个因素错综复杂的关系,让“推荐”这件事情,在网站的运转方式上变得微妙起来。
  在电影网站上,一旦你打算看点什么的话,让消费者感觉最爽的体验是:网站的绝大部分信息,自然地按照你所关注的方式,为你把喜欢的影片展现无遗,不必大费周折地东挑西选,你眼神所到之处,接触到的信息不多不少,善解人意。
  这种体验的获得,需要转变过去对“交互”的认识。交互,并非是消费者和网站之间“打交道”的过程(虽然这很重要),而是消费者群体之间“打交道”、“相互浸润”的过程(这个的重要性更多体现在后台)。
  Netflix推荐引擎的核心,叫做“协同过滤(CF)”。这种算法把过去沉积下来成千上万的用户点评数据,转化为对每一位消费者“口味偏好”、每一部电影“特征属性”的记忆,通过“猜出你的心思”来为你匹配最佳的“推荐列表”。
  “交互”这一过程,在不同年龄、不同区域、不同职业、不同爱好的人群中,自动地“弥散”开来,每一个独立的个体之间鲜有直接“对话”的可能,但他们通过遗留在电影观赏中的“足迹”,无形中透露出的彼此喜好的异同,让电影下载和观赏,并非在“寡居独处”的情境下进行,而是加了许多跨越虚拟时空的“神游和意会”的愉悦。
  群体智慧的价值
  “人是群居的动物。”100年前英国昆虫学家William Morton Wheeler通过研究蚂蚁发现,“群居的动物”有一种奇特的天性,就是单独的个体行为看上去弱智笨拙,整体的行为有时候也显得杂乱无章,但在一定的尺度上看,蚂蚁部落总是会显示出“有秩序”的行为模式,比如觅食、迁徙、逃避攻击。
  这种大量个体集聚的场合下,单独每个个体的能量其实十分有限,它们所采取的行动策略也十分简单:往往是参照左邻右舍,甚至有点“目光短浅”。
  但令学者惊奇的是,集聚在一起的个体,彼此之间的“关联”和简单的信息交换,让他们的行为产生出高度的复杂性,决定了这个群体的整体结构和演化的路径。
  这一点,是Netflix推荐算法的关键。
  Netflix的Cinemath推荐算法,本身没有什么“野心”,它并不试图通过缜密的推理,直接为消费者把他喜欢的电影“拎出来”;它只是不停地根据消费者流露出的“蛛丝马迹”,不动声色地推测他的“口味和偏好”,并做了一个简单的假设:“物以类聚,人以群分”。
  在群体交互的过程中,“内容”在不断地产生,比如浏览记录、点评数据;但这些“内容”的价值挖掘,才是最核心的东西。通过内容(数据)挖掘,抽取出映照消费者习性和物品属性的关联信息,抽取出群居的消费者之间的关联信息,这是营造信息生态的关键。
  所以说,“基于用户的推荐(UGR)”,将在未来的互联网发展中,扮演极其重要的角色,这个角色就是打通“群体行为”与“自组织演化”之间的通道,实现某种“闭环”的群体进化的良性循环。■