车身凹陷无痕修复:电子书格式标准研究 - 书业公共数据交换中心

来源:百度文库 编辑:九乡新闻网 时间:2024/04/27 13:34:41

电子书格式标准研究

发布: 2010-10-11 10:44 | 作者: 网络转载 | 来源: 出版科学 | 查看: 13次

[摘  要]  概述国内外电子书格式发展现状,分析EPUB格式及其应用情况,指出电子书开放格式标准的发展趋势及其难点,并提出相应的对策。

1  电子书格式概述

    电子书是指以数字形式制作、出版、存取和使用的出版物,通常需借助一定的阅读软件和设备进行读取。谈到电子书格式,一般是以阅读系统(Reading System)而非阅读设备作为对象的。阅读系统是指能够发布和存储电子书,并能为读者利用的软件与硬件统一体,主要包括属于硬件设备的专用阅读器和基于软件范畴的阅读器文件,前者如SonyReader、Kindle等,后者如Adobe Acrobat Reader、Microsoft Reader等。不同企业出于保护自身商业利益与内容资源等方面的考虑,开发的电子书阅读器与阅读软件在格式标准上并不统一,造成彼此之间兼容性较低。目前,国内外电子书格式多达数十种。国际上比较常用的格式包括Adobe的PDF、微软的LIT、亚马逊的Azw等,国内包括方正的CEB、超星的PDG,以及中国学术期刊网的CAJ和维普的VIP等。由于电子书格式领域缺乏真正统一的标准,导致资源重复开发问题严重,这己成为制约电子书产业发展的瓶颈之一。因此,规范电子书格式标准,实现阅读系统之间的互操作成为业界关注的焦点。

2  格式标准体系

    尽管从整体上看,电子书格式仍处于纷繁复杂的发展状况,但目前确实存在一些主导性的格式标准。下文将分述之。

    传统PC阅读时代,PDF格式一直是国内外应用最广泛的电子文档格式。由于数字出版发展初期面临由传统出版流程向数字出版流程过渡的问题,PDF文件作为一种面向印刷流程的电子书格式,因其能够比较真实地反映原文档的格式、字体、版式和图片等要素,获得众多出版商的认可,成为公认的行业标准。然而随着跨媒体出版的兴盛,尤其是目前电子书载体逐步向移动媒体终端过渡,PDF格式的诸多不适逐渐显现出来。首先,这种格式专门针对标准纸张打印设计,无法自动调整页面宽度以适应在不同尺寸屏幕上的显示;其次,PDF作为版式文档缺少很多文档逻辑结构信息,无法方便地实现图文分置等数据解析以适应日益复杂的应用需求。因此,尽管PDF是一种较为成熟的文档格式,但从未来发展方向看,它并不是一
种理想的电子书格式。

    目前在国际上,电子书格式标准处于封闭格式与开放格式标准共存的局面。前者以亚马逊Kindle阅读器的专有格式为主导,后者以EPUB格式为代表。作为一种专门针对kindle阅读器的专有格式,Azw格式一经推出就处于争议之中。但由于拥有网上书店庞大的内容资源与用户资源,亚马逊一直试图将该格式打造为电子书格式的行业标准,并以此统领整个电子书产业链上下游。据国外媒体报道,截至2010年1月,kindle销量己达到300万部[1]。kindle阅读器在电子书市场上日趋普及,Azw专有格式也在一定程度上成为业界的主导标准。但是,随着电子书产业的迅猛发展,
Kindle格式标准面临愈来愈多的挑战。微软等IT公司与出版商、出版物经销商等联合主导研发的开放格式EPUB在很大程度上影响和制约着Kindle格式的普及。近年来,随着索尼、谷歌、苹果等大型IT公司宣布其产品支持EPUB格式,该格式的国际影响力不断加强,业已成为国际电子书格式的通行标准。

    国内方面,电子书产业一直由IT等业外公司引领发展。其中方正公司因其与众多内容提供商长期的合作关系掌握了大量正版图书资源,它主导的电子书格式体系成为国内该领域的事实标准。方正早期针对在电脑上阅读数字图书馆内的电子书资源而推出了CEB格式,随后面向电子阅读移动终端研发了XEB格式,最近又推出一种独立于软件、硬件、操作系统、打印设备的CEBX文档格式规范。作为完全高保真的中文电子文档格式,CEBX文档格式能够保留原文件的字符、字体、版式和色彩等重要信息。另外该格式完全基于XML结构化描述,相比于PDF等格式具有更强的数据交换和解析能力。除了完善自身在数字出版产业链中的服务职能,方正公司也在积极地影响国内电子书开放格式标准的发展,如参加“电子书标准工作组”的标准制定工作等,以期逐步实现企业标准与国际通行标准接轨,扩大其格式在国内电子书市场的应用范围。尽管目前国内也有一些阅读器端选择支持EPUB开放格式,但尚无法与方正的格式标准形成规模竞争。

    在当前电子书市场条件下,以亚马逊为代表的独立格式占据较强的市场支配地位,但从发展趋势看,EPUB开放格式己获得越来越多的终端厂商、平台开发商的支持和认可,并实际参与EPUB格式的应用。这对未来电子书格式标准的发展将起到举足轻重的作用。

3  EPUB格式及其应用

    EPUB格式是在1999年开放电子书先导组织提出的OEBPS格式基础上,经过不断研究和改进而形成的开放格式标准。在更名为国际数字出版论坛(TheInternational Digital Publishing Forum, IDPF)之后,2006年10月该组织发布了开放容器格式1.0版(Open ContainerFormat V1.0,OCFV1.0),次年9月发布开放出版物结构(Open Publication Structure,Ops)2.0版和开放包裹格式(Open Packaging Format,OPF)2.0版。此三项标准共同组成EPUB开放格式标准,并取代原有的OEBPS标准。三项标准的具体内容包括:OPS2.0版提供开发开放式电子书内容的标准,促进电子书跨平台阅读;OPF2.0版提供描述电子书内容单元的标准,并提供更多结构和语义来描述电子出版物,它主要由元数据、文件清单、主线、指南与漫游组成,存放在Ops文件中;OCFV1.0将电子书所有相关的Ops文件、OPF文件按规范要求置入容器中,建成一个后缀名为.epub的压缩文件。

    EPUB是一种可以自动重新编排内容的开放格式,具备良好的平台兼容性。其中文字内容可以根据阅读设备的特性调整到最佳的屏幕显示效果。同时,作为一种基于XML的文件格式,EPUB文件允许出版商相对容易地转换成其他终端格式,并支持数字权利管理(DRM)方案。

    近年来,关于EPUB格式国内外已经出现一些较为成功的运用。在欧美等出版业发达的国家和地区,出现了大量有影响力的EPUB阅读软件和硬件终端。其中Adobe公司于2007年发布的Adobe DigitalEditions (ADE)是最早支持EPUB格式的阅读软件之一,也是最有影响的EPUB读取软件。ADE可以获取、管理并阅读电子书、数字报纸和其他数字出版物,适用于Windows和Mac系统平台。其他较有影响力的EPUB应用软件有黑莓手机阅读程序MobipocketReader,起源于Firefox阅读插件的OpenBerg Lector,Android平台阅读软件Aldiko,亚马逊子公司Lexcycle开发的著名阅读软件Stanza,苹果公司的阅读软件iBooks等。另外,谷歌于2009年8月宣布允许用户以EPUB格式下载100多万本已经进入公共领域的书籍,这对于EPUB格式的推广起到了非常重要的作用[2]。支持EPUB格式的阅读软件如表1。

  除丰富的软件支持外,随着近年来电子阅读器的兴起,国外支持EPUB格式的硬件和阅读终端也不断增加。由苹果公司开发的iPad、iPhone、iTouch等系列终端可通过苹果阅读软件iBooks或应用软件Stanza实现对EPUB格式的支持。罗技的阅读器Plastic Logic、巴诺的Nook、Sony Reader、COOL-ER Reader、艾利和公司的iriver story等阅读器均支持EPUB格式。另外,Android系统的手机或其他装置可使用FB Reader、Wordplayer、Aldiko等软件阅读EPUB电子书。

    与国外相比,国内距离格式标准真正意义上的开放统一应用仍有较大距离。不过,国内很多数字出版机构已经认识到开放式格式的重要性,如方正最新推出的电子书格式XEB即采用了OEBPS标准,国内的超星等公司也正在研究并准备采用它。在软件支持上,国内较早大规模采用EPUB格式的电子书网站是掌上书苑[5]。掌上书苑是针对手机阅读的电子书网站,网站上绝大部分电子书资源采用EPUB格式,推出了相应的阅读软件EPUB Reader,并逐步研发推出黑莓版和Android版等。另外,网站还推出EPUB制作工具EPUB Builder。

    在硬件支持上,国内较早宣布支持EPUB格式的阅读器是翰林eReader阅读器。它可存储千本以上图书内容,对多数文档(PDF、DOC等)的图片格式均具有版面解析及快速缩放功能。该阅读器的主显示屏是分辨率为800×600的电子纸显示屏,目前不支持无线网络功能,运行Linux操作系统。翰林eReaderV3是目前世界上支持格式最多的电子书阅读器,一共支持20多种主流格式、19种语言。除此之外,新近踏入电子书市场的联想推出的天玑iBook也宣布支持EPUB格式。

4  趋势及对策

    通过对国内外电子书格式发展现状的分析,我们认为无论是亚马逊坚持采用相对封闭的AZW格式,还是谷歌、索尼等选择支持的EPUB开放格式,其内在原因都是对各自内容资源整合实力的预期。亚马逊从网上书店转型而来,拥有强大的内容资源,尤其是畅销书资源,因此希望更多硬件设备适应Kindle格式;索尼等公司则希望利用EPUB格式的通用性来联合更多出版机构参与数字内容产业链的建设。但是从用户对内容资源和阅读终端多样化的选择需求,以及众多内容提供商期待降低数字出版进入门槛等行业共识看,统一开放的电子书格式标准是大势所趋,目前的核心问题在于如何选择合适的路径以达到电子书产业发展对开放格式标准的现实要求。

    就国内市场来看,要建立具有行业影响力的开放格式标准面临如下难点。首先,与国外相比国内缺少类似“开放电子书论坛”的企业联盟组织,格式标准的参与主体仍主要是方正、汉王、翰林等技术厂商,出版商参与度不高,并且由于它们本身在电子书产业链中的议价能力较低,因此建立的标准难以体现出版社等内容提供商的价值诉求。其次,基于商业前景的考量或对投资回报的关注,目前一些有实力的技术提供商投入大量精力开发独立的封闭格式,并期待将企业标准转化为行业标准。这也在很大程度上限制了电子书开放格式标准的建立。

    鉴于上述约束条件,我们认为比较合理的做法是由政府部门牵头,组织引导出版领域的企业、机构参与开放格式标准的制定,目的是形成一套相对合理的利益分享机制,包括阅读器厂商之间、技术提供商与出版商之间等,以减缓行业内部由于利益分配不平衡导致的格式标准恶性竞争。在此基础上,充分借鉴EPUB格式在信息描述上的开放特征,同时结合国内较为先进的格式标准如方正的CEBX格式,在全行业共同协商制定标准的前提下,最大限度实现对优质标准的兼容。除此之外,开放格式标准的制定需要与电子书产业的其他标准如终端标准、内容标准、编目标准等相协调,以实现对电子书产业发展的综合提升。(作者郑滢瑜、丛 挺、缪 婕)
                  

注  释
[1]传亚马逊Kindle销量已达300万[OL].[2010-04-10].http://tech.sina.com.cn/it/2010-01-29/21153819044.shtml

[2]Google Now Offers Over a Million Free Ebooks in EPUBFormat[OL].[2010-04-20].http://mashable.com/2009/08/27/
google-million-free-ebooks/

[3]EPUB[OL].[2010-04-20].http://en.wikipedia.org/wiki/EPUB

[4]www.cnEPUB.com