茅山捉鬼专家好看吗:标准化趋势撼动IT架构 电信级IA服务器乍现锋芒

来源:百度文库 编辑:九乡新闻网 时间:2024/04/29 22:25:45

标准化趋势撼动IT架构 电信级IA服务器乍现锋芒 更新时间:2006-4-29   王辉/文   重塑IT基础架构的呼声让一直身处幕后的服务器厂商们再也不甘沉默。业务应用日趋复杂、数据处理与整合压力愈加沉重,让运营商们的关注度在不经意间开始向服务器产品倾斜。而在这个过程中,基于工业标准的服务器产品被作为了改变市场格局的最有效武器。   标准服务器渐热   这种迹象从年初就已经开始。刚刚进入2006年,借助刀片服务器产品赢得四川移动呼叫中心改造项目的IBM对标准化架构服务器市场的热情就超出了以往任何时候,因为这也许是其挑战Sun在电信市场多年来统治地位的绝佳机会。   同样,已经坚定地与INTEL捆绑多年的HP,更是基于安腾架构提出了解决服务器虚拟化难题的答案。HP中国企业计算及专业服务集团市场营销事业部技术咨询部总经理彭玉龙甚至称:“尽管目前电信领域的大部分应用仍旧被专有架构服务器所占据,但是从长远来看,未来的市场势必将走向开放和标准化。从这个角度来看,专有架构服务器最终将退出市场也是一个可能的结局。”   不单单是国际巨头,国产服务器厂商们同样认为这场向标准化推进的大潮给了他们一个难得的切入电信等行业市场的机会。4月18日-19日,国产服务器厂商联想和浪潮分别发布了2006年服务器策略,而其中的主题,除了将继续加强在工业标准服务器产品上的拓展力度外,建立一个能够有效切入通信等行业市场的渠道机制也是一项重要内容。
  
  “在浪潮2006年的渠道策略中,以突破行业市场为核心的努力方向将是整个被命名为‘翔龙计划’渠道战略的首要一条,其目标就是要实现浪潮在关键行业的进一步突破。”浪潮渠道部蒋永昌表示,“其中,加强对电信增值市场的进一步拓展能力将是浪潮在通信市场的主要策略。”   运营商态度保守   庞大的电信市场是让众多服务器厂商如此心动的主要原因。据中国网通内部人士透露,随着近几年来在后台支撑系统改造投入的增加以及各类新业务的出现,网通的服务器采购量巨大。   该人士称,仅在山东省某地级市,用于包括小型机在内的服务器采购投入就在400万元人民币左右。如此推算,整个山东省用于服务器采购的金额应该不少于4000万元人民币。仅运营商一个省的需求就如此庞大,整个电信服务器市场的规模可想而知。   可服务器厂商们的热情并不等于运营商就会对工业标准服务器敞开大门。“对于运营商而言,由于历史的原因和多年来的习惯,基于UNIX平台的RISC架构服务器几乎是安全与可靠性的代名词。同时,基于X86架构的工业标准服务器在电信领域的大规模运算下缺乏实际案例的状况,也使得运营商们仅仅是将工业标准服务器应用在一些外围业务上。”一位运营商信息化部人士表示。   记者同样了解到,在运营商的服务器采购计划中,单纯用于小型机采购的资金占用比例就占到总体采购金额的70%多。也就是说,如果按照每个地市公司的服务器采购额为400万元计算,真正用于普通服务器的采购金额应该只是在100万元人民币上下,其余则主要用于购买小型机和高端服务器。   运营商的保守态度无可厚非,即便是已经在某省与运营商一起尝试利用标准化服务器进行服务器虚拟化与数据中心重新梳理的HP,也承认标准化将是一个并不短暂的过程。从HP目前推动标准化服务器的实际进度来看,虽然韩国电信等运营商已经在一些核心业务支撑系统领域采用了基于Windows平台的产品,但是由于其用户规模和业务复杂程度都与国内运营商的系统不可同日而语,因此HP以标准化策略切入国内电信级服务器市场的努力也并不轻松。
   
  相比之下,IBM则选择了一条看起来更为稳妥的道路,即在广泛合作的同时,继续延续自己固有的产品路线。“IBM一方面在工业标准服务器以及对开放系统支持方面格外关注,同时继续开拓基于POWER架构的RISC服务器产品市场。这种方式可以最大限度地保证IBM在市场中立于优势地位。”IBM系统与科技部某人士表示。他同时认为,HP这样将全部赌注压在工业标准服务器市场的做法有一定的冒险性。“该策略将HP与   INTEL紧紧捆绑在了一起,一荣俱荣,但一旦市场出现变化,也会造成很多的未知因素。”他说。   渠道决定胜负   不过标准化服务器无疑会迎来一个采购的高潮。来自易观国际的分析认为,由于近几年运营商支撑系统改造动作频频,因此在计费、网管等领域呈现出对RISC等专有架构服务器需求增长的状态。但是随着相关的改造完成,对此类服务器的需求会趋于平缓。与之相比,3G的临近以及各类电信新业务的产生,会对在灵活性和成本方面更具优势的工业标准服务器的需求量大幅增加。而据了解,目前运营商在增值业务应用服务器的选择上已然锁定在IA架构上。   除了这种标准化与专有架构之间的技术争论外,诸多其他的困扰也横在一些电信市场的新进入者面前。某电信系统集成商透露:“在项目实施过程中,服务器的选型和采购通常会由集成商提出建议,并最终由集成商向服务器厂商进行采购。因此,服务器厂商要切入电信市场,就必须与一批集成商结成联盟。”IBM某人士也认可了该说法,但强调类似于IBM、Sun、HP这样的服务器主导厂商会有一些直接与运营商的通道。也就是说,服务器的销售会有集成商和运营商直接采购这两种模式进行。   可对于那些市场的通信市场新进入者来说,状况则困难得多。“由于服务器巨头们已经与大的集成商捆绑多年,并形成了一定的品牌效应和用户基础,因此在传统领域撼动其地位并不现实。在这种状况下,新进入者应该加速与新业务应用提供商结盟。”易观分析师认为。   然而这更像是一场不在同一起跑线上的竞赛,对于新进入者而言,虽然机会存在,可是前景却并不乐观。042433

  PCI Express交换与桥接构架


2005-07-20

IDT公司产品市场经理 Matt Jones  摘自:今日电子

    性能的要求和物理层限制已经使并行总线互连架构成为昨日黄花。下一代设计正越来越多地让芯片到芯片 (chip-to-chip)的互连转到串行标准上来。由于上一代PCI-X和PCI架构在目前的计算和嵌入式系统中占有统治地位,基于现有协议的串行标准 PCI Expresstm (PCIetm) 已经在互连革命的早期阶段呈现出强劲势头。
除了数量不断增长的PCIe 处理单元和外设芯片,PCIe 交换和桥接器件正在成为解决早期采用者在服务器和存储应用方面遇到的主要系统问题的一个重要选择。为了给连接多系统单元和PCIe域内/外协议提供转换能力,要求交换和桥接器件具有优化的特性设置和架构,以保证它们满足对转换到串行互连架构的性能和系统成本目标的需求。

高性能互连需求

    目前的并行协议,例如 PCI-X 和 PCI,面临着为了维持系统需求的高数据传输速率,需要通过常规的系统设计和电路板布局技术提供有效的运算和外设资源的严峻挑战。总之,它们在增加交换速度、减少距离或布线长度方面都到了山穷水尽的地步。在速度和性能方面无止境的需求,以及由对电路板设计和布局越来越多的投入所导致的不断增加的系统成本和上市时间问题,共同推动着设计转向串行互连技术。

    高速串行互连解决了关键的性能、功耗、布局和成本问题。由于采用单一数据流传输时钟和数据信息,串行互连可在实现极快传输速率的同时,不必担心由于线路长度或负载不匹配导致的传统的时钟到数据或引脚到引脚相位差问题。由于采用了串行的、点对点的互连,数据能够以非常高的速率进行传输,一个单串行连接能够承载以前需要大量数据线和相关时钟及控制信号的数据量。这使需要的引脚数和电路板布局的复杂性相对减小,从而降低了系统成本。

PCI Express的出现和早期应用

    建立在PCI 和 PCI-X 基础之上的 PCIe 已经在设计师向串行互连架构转移的早期市场得到了公认。因为每个连接可提供带宽高达16 Gb/s的高性能、点对点串行互连,PCIe 正迅速成为需要高性能的服务器、工作站和存储应用的事实上的互连标准,而且如同PCI-X和 PCI 的采用过程一样,已经准备好进入通信和嵌入式应用市场。

    虽然PCIe 外设和处理器体系为下一代系统架构提供了关键的构建模块,交换和桥接解决方案的出现还是丰富了整个应用环境。这些解决方案同时解决了一系列关键课题,如为了优化匹配昂贵的运算资源和协议转换,使高性能的基于串行运算的单元与上一代外设进行连接(反之亦然)的外设和 I/O 连接性扩展。对系统拥有深刻理解的供应商能够提供可以解决这些问题的优化的 PCIe 产品,以及高性能、高性价比的解决方案。

针对 I/O 扩展和资源效率的 PCI Express 交换器

    虽然,在“北桥”中的高性能串行连接芯片组和系统 ASIC能够充分支持今天领先的处理器,然而这些资源经常受到限制,且很少可以满足当今服务器和存储应用中对高性能 I/O 外设的系统需求。在那些 I/O 和外设连接性需求超过北桥资源的系统中,系统设计师面临着两难的抉择。增加北桥器件可提供所需的连接性,然而系统成本的增幅无法接受。如果为可用的北桥资源匹配 I/O 插槽和外设,就会导致处理资源无法充分利用,并且限制了系统的灵活性、功能性,最终难以为市场所接受。图1描述了一个一流的解决方案。采用PCIe 交换器有助于使北桥端口实现多外设或插槽的扇出。

    PCIe 交换器可将有限的北桥资源分配到多个 I/O 端点,并可充分利用可用带宽。PCIe 交换器可使北桥以更小的带宽需求连接分享或共享多个资源。另一种选择是,交换器可使单个北桥端口的过量传输,为下游端口提供全部可用带宽,以实现管理突发或非持续性传输模式的设备或插槽间的有效负载平衡。

    在 PCIe 互连架构上增加交换单元的缺点是,这些附加的元件潜在地增加了系统成本,并且会引发电路板空间不足的问题。针对目标应用优化的有效的交换架构能够减少这些问题的影响。在服务器系统中,如图1所描述的例子,PCIe 交换器可以扩展、共享和充分利用有价值的北桥资源。这种扇出交换方法可转变为以下例子中的架构优化和优势。首先,该系统需要一个单上游端口对多下游端口的交换。通过设定一个固定的上游端口和为下游端口配置其余的交换端口,可大大改进交换核心架构的复杂性,使芯片的利用更为经济;其次,数据流几乎总是(90%或更高)从上游端口到下游端口和从下游设备到上游端口流动。下游端口(直接在 I/O 间传输)间的对等交换只占传输量的很小部分。在一些新兴系统中,禁止下游端口间的对等交换正在成为理想的需求,这样可防止对等端口间的数据失效,并可实现数字版权管理,从而确保不存在基于收入的数据的对等分配。与列举的上游和下游端口相关联的是,对从上至下和从下至上的端口传输的优化模式,可优化交换核心资源,减少这些路径的等待时间。另外,减少了对等性能方面的优先级可在器件中省掉缓存及其他昂贵的、性能驱动的结构。实现这些重要优化的器件在 PCIe 通道只增加少于200ns的延迟,同时,只需为附加的北桥器件付出很少的成本即可全面提升I/O 和外设的性能。

用于协议转换的PCI Express 桥接器

    虽然基于 PCIe 的处理器体系已经越来越多地为服务器和存储应用所采用,外围设备对 PCIe连接性的转换仍然不是非常普遍。另外,除了器件的可用性因素外,将给定的服务器或存储平台转换成 PCIe 还可能受到其他因素的限制。存储应用为这种“滞后现象”提供了很好的例子,并突显出对前向和后向桥接形式的协议转换的需求。

    图2是一个前向桥接系统的例子。在这个配置中,无论是来自北桥或交换元件的 PCI 连接,都需要转换成并行的 PCI-X 和 PCI 协议,以支持外设的连接性。在当前的许多存储应用中,系统对增加容量和减少搜索时间的要求迫使系统构架师选择最新、处理能力最强的元件。正如我们前面讨论过的,与这样的处理器相关的芯片组已经转而采用高性能 PCIe 互连。然而,由于一些经济方面的原因,主要存储系统的外围设备,如光纤通道主机总线适配器 (HBA),仍然没有转换为串行连接。在这样的系统中,高性能处理器体系和基于 PCI-X 的HBA 都是不进行本地通信的系统单元中无法替代和必须使用的。为了解决这个问题,一种从 PCIe 到 PCI-X 的桥接解决方案应运而生了。图2中PCIe 到PCI-X/PCI 桥接器可实现串行和并行域间的连接与传输。此例中桥接器正在运行向前桥接。

    虽然一些外围设备,如前面讨论过的 HBA,已经在 PCIe的应用方面滞后于业内领先的处理器,其他存储外围设备已经显现出内在的串行特性,并开始采用 PCIe 互连。串行 ATA (SATA) 磁盘控制器就是这种已经投放市场的存储系统单元之一。市场对这些高性能磁盘的需求正迫使一些处于产品生命中期的存储应用不得不进行升级,以促进在其晚期的销售。由于这些系统的 CPU 体系的软件和硬件设计的复杂性,升级周期将不可能对处理器进行升级。在许多这样的系统中,处理器到外围设备的互连采用了 PCI-X。在以上情况下,所需的处理器和外围设备需要一个桥接元件进行通信。图3是后向桥接系统的一个简化的例子。PCI-X/PCI 到 PCIe 或向后桥接可实现成熟的处理器体系,以支持新兴的,采用串行互连技术的高性能 I/O 外围设备。

    在系统架构上增加桥接器件解决了协议转换的首要问题,然而这些器件的增加产生了与交换器情况相同的基本缺点——附加的元件影响了性能、增加了系统成本,并导致了电路板空间不足的问题。关键架构的选择和优化有助于减小对系统性能和成本的影响。例如,虽然PCI-X 和 PCI 是基于总线的互连标准,但互连处理器和高性能 I/O 对高带宽的需求可限制点对点互连的使用,以防止外设由于总线冲突而堵塞并保证信号的完整性。针对高带宽需求、支持复杂的总线管理和仲裁逻辑设计而优化的PCIe 到 PCI-X/PCI 桥接器,可以改进和优化连接并行端口的单一外设的点对点应用模型。这样可以在减少芯片面积和成本的同时获得更高的性能。

    除了要将重要的系统规范要求与桥接器的设计结合起来,系统设计师还要做出重要的选择来构建一个能够支持广泛产品系列形式和功能的解决方案。同时支持前向和后向桥接的器件虽然增加了设计的复杂性,但是可以在众多应用中使用。为 PCIe 和 PCI-X/PCI 端口提供的不同性能等级的产品系列有助于最有效地利用系统资源并降低成本。由于协议转换需求将可能在多代产品或平台中出现,对系统配置的选择可能是协议桥接器设计中最重要的优化工作。

未来的采用和应用模型

    由于涉及多种技术,需要串行互连的高性能计算应用、服务器和存储应用的性能需求已成为采用 PCIe 的推动力,并推动着 PCIe 生态系统的发展。当在未来18~24个月中重新设计更长生命周期的产品时,将开始采用通信和嵌入式应用,并可利用更多可供使用的 PCIe 系统单元。
据估计,虽然基础 I/O 扩展和协议转换需求仍将存在,但预期通信和嵌入式应用将采用新的应用模型,并将需要特定优化的产品形式,以实现高性能、最佳性价比的系统。那些将自身系统知识、灵活的架构和设计实践整合在一起的、可提供优化解决方案的芯片供应商将获得成功。    三种先进串行互连标准的核心结构特性分析
2005-07-20

作者:Harpinder Matharu IDT公司 摘自:EDN China

    设计者要给某一特定应用选择一种合适的标准互连结构,必须对需要执行的数据封包、服务种类区分、拥塞管理、事件处理、结构初始化及管理需求等核心结构特性进行彻底分析。作者讨论的三种串行互连标准,在特性选择及简单与灵活性之间的折衷方面各有不同。

    随着互联网继续呈指数增长,人们正从各个层面上感觉到这种惊人的发展速度。但如果想继续保持这种增长速度,芯片、电路板及系统机架间的互连速度就变得非常关键,以顺应互联网支持系统相应地成比例增长的趋势。

    很简单,将重要的CPU周期花在数据处理及转发上不再能被接受。为有效解决此问题,人们将计算能力从中央处理器转移至卸载引擎及I/O器件上。系统架构中的这种转移已使互连技术的选择成为更重要的设计考虑事项,以便能以一种经济的方式来达到所期望的系统性能。

图1:Infiniband结构系统。

    由于每个器件引脚数越来越多、总线上偏斜余量愈发紧张以及板布局复杂性不断提高,故使互连变得更宽及更快已不再可行。因此,转移到更窄、更可靠的高速互连便成为一个自然而然的步骤。

    过去,业界开发出多种专有高速互连技术来消除内部系统瓶颈。为缓解高成本、长引脚延迟以及缺乏互操作性等问题,几个行业论坛已开发出多项新型串行高速互连标准和协议。所有这些标准与协议都拥有一个共同的问题,即:它们都基于长期确立的技术。这主要是考虑到软件再利用、易于接受以及后向兼容性等因素。Infiniband、快速结构(Rapid Fabric)以及高级交换互连(ASI)成为在该市场中拼杀的领先标准。正如过去所发生的,促使新互连标准被广泛接受的催化剂将是整体系统性能而不仅仅是技术优点。

交换结构互连—高层次目标

    交换结构互连的主要目标是:为原始连接提供高性能、保持一个比系统中所有线卡合计带宽更宽的带宽(以补偿分段与协议开销),以及在构成系统的不同实体间传输控制与数据信息等。数据传输中的相关延时与抖动是决定系统性能高低的重要指标。

    交换结构的流控制特性提供必要的QoS参数来确保每个流的预定特征。QoS参数只能通过部署拥塞管理策略与机制来得到保证,以防止该交换结构中链路与组件容量过载。使这些特性保持适当的平衡,对于既支持各种应用又不会使器件复杂性增加(以不使成本过高而阻碍其被广泛采纳)非常关键。

    提供一组平衡特性以避免增加不必要的成本与复杂性非常关键。器件寻址、数据包路由以及互连支持的数据包格式等,都是能帮助了解系统性能的重要参数。详细分析流控制与拥塞管理的核心互连特性,再加上错误检测与处理,可清晰地显示出该架构的实力。通过评估由互连提供的软件接口及结构初始化服务来分析软件复杂性也非常重要。

Infiniband架构

    Infiniband架构(IBA)正在朝集群等高端计算应用领域发展,这些应用要求有故障恢复、高可用性、可靠性及耐用性等特性。IBA支持模块至模块以及机箱至机箱互连、可以X1、X4及X12三种形式应用并采用2.5GHz时钟。所支持的吞吐量为2、8或24Gbps,占用8B10B编码开销。为提供必要的QoS,该标准还提供了16级可映射到16个服务层的虚拟通道。基于信用的流控制及注入速率控制机制,被用来提供必要的拥塞管理。其结构管理则支持简单的网管协议(SNMP)。

    它定义了用于可靠消息传送(发/收以及DMA)的硬件协议,但未定义消息内容。硬件协议允许从操作系统的内核及用户空间来传送数据。

图2:RapidIO结构系统。

    Infiniband支持诸如配置与资产管理、错误报告、性能指标收集以及拓扑管理等结构服务。它天生就使用IPv6包头来在IBA结构与互联网之间有效地交换数据。该架构具有更高的可扩展性、可用性、隔离度以及更少的CPU使用率,而且还支持互联网技术。它以单独控制与存储器接口来控制数据进出节点的存储器。

    Infiniband是一种可满足存储区域网、高端计算集群及局域网需求的全新互连标准。但以此种方式来创建这项标准以及为达其目标所带来的复杂性,却极大地限制了人们对它的采用与接受。

快速结构

    快速结构(Rapid Fabric)是串行快速IO(sRIO,Serial Rapid IO)互连的扩展。sRIO是一种瞄准处理器互连应用并已被一些DSP器件所采用的芯片至芯片串行互连。其基本规范增加了组播、流控制及数据流等特性,以将其转换成流量管理通信结构。

    快速结构以1.25/2.5/3.125GHz时钟速度支持X1及X4。在X4上,它所支持的最大带宽(占用8B10B编码开销)在3.125GHz时钟速度上为10Gbps。其架构被组织成由逻辑、传输及物理层组成的三层协议栈。逻辑层定义了被端点用来执行互连服务的协议;传输层定义了用于传输的寻址方案;广播与组播功能则通过操作传输信息来实现;物理层定义了数据包传输机制、流控制与电气特征。它总计能支持多达三路传输流及四个虚拟通道。该标准委员会目前正在努力工作以进一步支持流控制与拥塞管理等特性,以满足背板要求。

    由快速结构连接的器件使用基于器件地址的路由,这要求在交换机上保持路由表。流控制基于信用或遵循反应途径(其中接收方发送一个控制符号给发送方以便其进行数据包再发送)。拥塞管理则是基于简单的每流源XON与XOFF消息传送。

    sRIO采用分组(数据包)交换、非相干、基于存储器以及消息通过编程模型,支持分布式I/O处理。它支持从很小到很大的各种网络规模。在基于sRIO的系统中,器件ID并不取决于其位置。协议与数据包格式为拓扑不可知。协议能处理乱序数据包发送与接收。

高级交换互连(ASI)

    ASI对PCI Express进行了扩展,以提供一种旨在覆盖计算与通信互连的可扩展互连。它可从行业对PCI标准的广泛接受度上受益。ASI采用由物理、数据链路及传输层组成的三层协议栈来实现。它复用了PCI Express的物理及数据链路层,只进行了少许增强。但传输层被完全改写以满足背板互连的目标要求。

图3:高级交换互连结构系统。

    ASI是一种高度可伸缩架构,支持X1、X2、X4、X8、X12、X16及X32路,可提供高达64Gbps的吞吐量,并能在2.5Gbps时钟速度上工作。尽管可通过使用本地SARing能力来支持无限长度数据包,但最大数据包长度为2,176字节。它采用基于路径的路由以及可靠传输机制,可选择非可靠提交。这种寻址方案由于不需要在交换机上支持查找表而能简化整个解决方案。数据包封包方案只有很少的包头开销,并能在任何协议上开隧道。它通过低延时及良好的抖动控制来提供确定性行为。

    ASI标准可提供多达20条虚拟通道,分成以下三组:8条可旁路通道(用于传输载荷存储协议)、8条有序通道以及4条组播虚拟通道,可支持几乎所有应用类型。在逻辑层,它支持每虚拟通道8种流量类型,以提供QoS及流量区分。它采用基于信用的链路层流控制方案。对于拥塞管理,它支持基于状态的流控制、注入速率控制、最小带宽或由供应商定义的输出调度等。

    该规范还定义了一些基本元素来支持热插拔、冗余路径、多拥有者实体以及高效结构管理故障恢复等高可用性能力。它以一种协议诊断方式并通过集中于路由及保持几类隧道协议服务特征来支持几乎所有传输、网络或链路层协议的开隧道(tunnelling)。

    图3为一种典型的ASI结构拓扑。IO器件或CPU天生可支持ASI接口或能通过一个ASI桥接器件来与ASI结构相连。它通过采用主交换器及IO交换器并利用PCI Express分层树结构来横跨多个CPU域。图3还显示以太网数据穿过千兆以太网IO器件与DSP簇之间ASI结构的透明隧道。

    事实上,ASI 对PCI Express进行了扩展,以使其能满足各种应用的需求并能获得更广泛的接受。最重要的是,PCI Express总线的三层协议栈结构允许ASI不受阻碍地重写整个处理层,以一种最全面的方式来满足背板互连的要求。

    上面讨论的三种串行互连标准,在特性选择及简单与灵活性之间的折衷方面各有不同。要给某一特定应用选择一种合适的标准结构互连,必须对需要执行的数据封包、服务种类区分、拥塞管理、事件处理、结构初始化及管理需求等核心结构特性进行彻底分析。但这些特性均具有其各自的技术优点,很难确定谁是胜者。而像提供符合标准及具有互操作性的芯片的供应商数量、开发工具以及软件可用性等其它因素,则成为决策过程中的关键因素。此外,可最佳地利用行业规模经济的互连技术,如那些带PCI Express的互连等,则很可能会获得更广泛的采纳与使用。      新一代高速互连串行总线及其目标应用
2005-07-20

作者:Herman Eiliya ADI公司高级应用工程师 (摘自电子工程专辑)

    互连设计师正从同步并行总线转移到点对点高速串行链接(带嵌入式时钟和数据)。这种转移使很多通信系统设计人员想知道在串行和并行互连之间进行选择时如何折衷考虑。本文通过详细分析新一代高速互连串行总线和其目标应用给出了答案。

    尽管串行I/O似乎能解决高速设计面对的互连难题,但并行接口仍然有它的位置。

    尽管更高的集成度解决了器件功能和成本问题,但同时将设计瓶颈转向了互连。这时,架构设计师期望在一个能提高整个系统级性能和提供更大伸缩性的补充架构里链接多数器件。

    为实现这个目标,系统总线的效率必须提高到可进行更多的交易处理和增加带宽。很多方法已被用于达到这个目标,先是从多支路转向点到点的总线架构,使系统设计人员能实现更宽和更快的总线。此外,诸如流水线和突发处理等技术可通过从异步到同步并行总线的转变而实现。它们也使设计人员可实现更快和更宽的总线。

    不过,加宽总线、提高总线频率和使总线与外接时钟同步却会引入一些新挑战。这些技术加上物理上的限制,迫使互连设计师从同步并行总线转移到点对点高速串行链接(带嵌入式时钟和数据)。这种转移使很多通信系统设计人员想知道在串行和并行互连之间作出选择时如何折衷考虑,并想知道并行总线最终是否会过时。这些问题的答案可从详细分析新一代高速互连串行总线和其目标应用中找到。

并行方法

    一个并行总线会被多路复用或解复用,并有一个点对点或多支路式架构。尽管多路复用的总线具有对每个器件引脚和走线的要求更少的优势,但一个解复用的总线还是具有更高的性能和吞吐量。

    一个多支路并行总线是两个或两个以上器件之间共享的总线,一个例子就是PC主板或嵌入式微处理器应用中的SDRAM接口总线。PCI总线是一种用途广泛的多支路式架构(见图1)。有了这个方法,设计人员就能通过加宽总线、提高时钟频率和流水线式处理来满足对更高带宽的需求。但是,这些解决方案每个都有其缺陷。增加总线带宽限制了总线最大可用的频率,因为同一总线上的信号之间存在偏斜。总线更宽意味着器件上要有更多的引脚,电路板上有更多的走线,连接器上有更多的引脚,所有这些都转化为更高的成本。

    提高多支路式总线频率则限制了能在一个单一分段上所连接器件的数量。为解决这个问题,设计人员通常用桥路来把一个大的分段分解成多个更小的分段。尽管桥路有助于提高信号完整性,但它们迫使设计人员采用更多的电路,直接增加了成本。表1给出了一些多支路式总线及其应用的例子。

    随着多支路式并行架构中总线频率和宽度的增加,诸如扇出和电容负载的问题使点对点并行总线显得更加适用。点对点并行总线通常是一个源同步总线,由数据信号、时钟和几个控制信号组成。数据信号与源生成时钟同步。随着数据总线频率与宽度的增加,电路板上的布线变得更具挑战性,因为很小的偏斜就会引起接收器在时钟边缘上读出错误的数据。所以,设计人员必须更精确地将数据信号走线长度与源生成时钟走线匹配。不幸的是,随着总线宽度的增加,匹配所有信号的长度变得愈加困难。所有这些走线都在争夺两个芯片之间有限的空间,这样最终限制了可以实现的最大时钟频率。

    总线加宽带来的另一个问题是器件需要更多的引脚(更多的功率),在必须直接采用点到点总线进行连接的两个以上器件时,这就变成一个大问题了。这需要在其中一个电路上复制一个完整总线。一个解决方案是应用开关来互连多个器件。基本上,每个器件连接到一个开关电路,通过此开关与其它器件通信。点对点并连总线采用的开关是受焊盘限制的,因为开关需要给每个器件配备一个专用的总线。

    简言之,设计基于高速并行总线的系统的缺点是:高引脚数;导致更高的功耗;困难的电路板布线;更多的电路板层数和同一端口走线之间的偏斜失配。此外,在并行总线下大量单端信号摆动会产生噪声和EMI问题。

串行接口

    地址、数据和控制信息都是在单个链路上运载的串行接口已被提议为解决高引脚数、位偏斜和同步化问题的方案。这个信号可以同步到一个外接的时钟或可以携带内嵌时序信息的数据。串行总线像平行总线一样,可以有一个点对点或多支路式架构。

    在提到增加源同步总线中的数据率的时候有两个主要限制因素:数据和时钟偏斜、通道抖动。数据内嵌时钟的串行链路解决了时钟数据偏斜问题,使串行链路工作比源同步总线快4-10倍。但是,由于接收器必须从接收串行链路中恢复时钟和数据,时钟和数据的恢复需要应用智能电子,因而在高数据率链路上更具挑战性。

    随着两个端点之间数据率和距离在串行链路上的增加,调制和均衡占优先权。关于调制,有些设计人员选择二进制信令,其中每个脉冲对应的只有一个比特,而另一些人采用的是多层信令方法,其中每个脉冲对应的是有2个或2个以上比特的符号。

    每种信令方法各有利弊。多层信令的主要优势是能在更低频下运行一个链路,同时可运载与二进制信令同样数量的数据。主要的缺点是其复杂的时钟和数据恢复电路或造成更高功耗、更大的芯片尺寸。

串行I/O应用

    高速串行I/O用于芯片到芯片、板到板、机架到机架的连接。在芯片到芯片连接中,两个芯片都在同一块电路板上,两者之间的距离通常小于10英寸。在这种情况下,所有高速I/O单元集成在芯片内部,而这个芯片又提出新的要求,诸如I/O单元必须是低功率和小裸片尺寸。

    如果在一个设计中需要两个以上芯片来互相直接连接,开关是最受欢迎的方案。在这种情况下,每个器件由单个串行端口组成,所有器件连接到一个多端口开关器件。需着重指出的是,一个端口可以由一个或多个串行I/O链路组成。侧重于低功率、小芯片尺寸和高速串行I/O单元在设计开关中变得越来越重要,因为每个开关都是一个多端口电路,每个端口可以由几个串行I/O组成(见图2)。

    在板到板连接中,两块板是通过一个背板连接的。在这种情况下,高速串行连接在三个分段上路由。第一分段是在称为入口板的源上,第二分段是在背板上,第三分段是在目的地或出口板上。连接入口板和出口板到背板的两个背板连接器,是这个多分段走线的一部分。板与板互连的典型走线长度在20-40英寸之间,在每个入口和出口板上有5-6英寸的走线,背板走线有10-28英寸。Xaui是最流行的背板串行接口标准,而PCI Express、SPI-5和串行RapidIO是面向芯片到与芯片及板到板应用的三种前景看好的高速串行接口。

    在机架到机架连接中,在几米和几公里之间的两个或两个以上机架通过光纤或铜轴线缆系在一起。以太网和Infiniband是针对机架到机架连接的最流行标准。

    不过,一个串行标准也可同时用于几个应用中。例如,Xaui可用于企业解决方案中的芯片到芯片及板到板应用中,即使它在存储区域网络应用中受到关注。另一个例子是串行RapidIO,它主要针对内嵌和DSP应用,但也可用于芯片到芯片和板到板的应用。

互操作性

    每种标准指定了一个多层(通常为2-3层)的互连架构。第1层,一般为物理层,定义了信息包如何在两个物理点(芯片到芯片)之间移动。电气接口和流控制规范是物理层定义的一部分。第2层通常被称为传输层。传输层规范提供端点(用户到用户)之间信息包路由所需的信息。第3层一般被称为逻辑层,提供了端点能处理交易的必要信息。例如,逻辑层负责定义帧格式、寻址机制和交易类型。

    每种标准可以给每层取不同的名字,或者甚至把两层的职责并入到一层上,反过来也一样,把单层的功能分解成两层或两层以上。不管层数和名称如何,每个标准应有物理的规格来处理两个物理点之间的连接。它应说明如何在两个系统端点之间进行信息包路由,并指出有关帧格式的信息,这样所有端点都能发起和识别交易处理。对多层上的互连架构进行分割可有机会为某一层增加一些特性,而无须改变其它层的技术规格(见图3)。

并行与串行的对比

    系统工程师在串行和并行总线之间应小心选择。如上所述,高速并行总线有信道偏斜、板面积、高引脚数和更多I/O功率的缺陷。但简单地用一个高速串行总线代替高速并行总线并不象“扣篮”那样简单。因为高速串行信号在同一链路上同时承载了数据和时钟,接收器电路需要从串行信号上恢复时钟和数据,然后把进入的串行高速数据转换成低速的并行数据。这个所谓的SerPar功能导致典型芯片中的内部逻辑通常比串行数据速率慢10-20倍。

    在输出侧,内部的更低速并行总线需要串联到单个高速串行流(ParSer功能)。时钟和数据恢复(CDR)以及数据解串和串行会引入额外的时延。所以谨慎地说,对于要求低时延的应用,诸如存储器电路,并行总线是较好的选择。对于能忍受时延的应用,串行接口是个更好的选择。

接口桥接

    很多系统需要串行和并行接口。由于互连架构是个具有自身帧格式化和寻址结构的多层协议,在同一系统上使用平行和串行协议必定需要来回转换议定书的桥路,除非两种协议之间的唯一区别是物理层。在这种情况下,串行和平行互连协议在第2层和以上是一致的,两者之间的唯一区别是第1层上的物理规格。

    例如,需要一个桥路连接带有PCI接口的器件到带有串行或甚至并行RapidIO接口的器件上。这种桥路叫做PCI到RapidIO,它会把PCI交易处理转化成RapidIO交易处理,反之亦然。另一方面,不需要协议转化来把串行RapidIO交易处理转化成并行RapidIO交易处理。而且,RapidIO开关会有多个串行端口和几个并行端口,只在物理层上有区别。这就是为什么多数新的串行标准只是以往和现有并行接口的延伸,如在PCI Express和串行RapidIO情况下。串行RapidIO的第2层和第3层规范与RapidIO相同。RapidIO物理层是基于源同步、点到点并行总线,带有4个或8个数据位端口;串行RapidIO物理层是基于高速串行链路,带有1通道(或1x)和4通道(或4x)端口。

    随着数据速率和走线长度的增加,设计高速串行I/O单元变得更具挑战性。二进制信令中的高数据速率串行链路转化成更小的位周期,设计CDR电路以更短的时间恢复时钟和数据变得更加困难。同时不断增加的走线长度加剧了信号失真和衰减。输入均衡、输出预强调和输出级编程被广泛应用于提高在更高数据率和走线长度情况下的信号完整性。     基于InfiniBand方案正加快被市场接受
2005-07-20

    Mellanox科技有限公司日前宣布,已向客户提供了超过50万个InfiniBand端口,这些端口体现在多种产品形式上,包括:集群服务器、高带宽交换机、嵌入式平台和集群存储系统。InfiniBand架构的这种快速增长,主要得益于越来越多的企业级数据中心的建立部署和持续发展的高性能计算的应用。

    Mellanox公司CEO Eyal Waldman表示:“我们花了三年时间才达到销售20万端口的规模,但就在去年一年的时间里,InfiniBand端口部署的速度增长了150%,这表明基于InfiniBand的方案正在越来越快的被市场所接受”

    目前,在以追求高性能为目的的商业和科学计算领域,机架式服务器和刀片服务器通过InfiniBand网络连接在一起,来构建高性能、低成本的计算集群。而随着成熟的驱动程序、操作系统和商业计算应用对InfiniBand的倾向与支持,InfiniBand技术会得到更快的发展与成长。

    此外,业内人士认为,InfiniBand技术高带宽/低延迟的独特特性,使得InfinBand可以更容易的获得贸易优势和风险评估利益。此外,Mellanox还试着将InfiniBand技术的优势在集群存储和嵌入式系统领域推广。

    在过去的6个月时间里,InfiniBand已经取得了多项重要的进展,如:

  • 思科(Cisco)宣布收购InfiniBand交换机厂商--Topspin公司,进一步确定了InfiniBand技术的价值;
  • IBM宣布其DB2数据库集群版本支持InfiniBand技术使其规模可以达到上千个节点;
  • Infincon公司宣布其产品支持InfiniBand和Oracle 10g;
  • 在刀片服务器体系中,InfiniBand成为唯一的10Gbs互连技术;
  • 排名全球第二的集群(NASA, 52万亿次集群)采用的就是InfninBand互连技术;
  • 标准的InfninBand驱动和IpoIB协议被直接加入到Linux内核中(2.6.11版本);
  • 20Gb/s的InfninBand集群已经有了现实的展示,InfninBand联盟已经通过了120Gb/s的规格标准;
  • SBS公司宣布VME InfninBand成为嵌入式应用中的唯一标准的10Gb/s互连技术;
  • InfninBand芯片的功耗降低到2W,带RDMA和硬件传输功能 的单芯片的10Gb/s互连方案面世。

 

    InfiniBand是目前在计算集群、通信、存储和嵌入式应用中据称唯一能够量产的有着10Gb/s带宽和低延迟的互连方案。作为一种互连业界的标准技术,InfiniBand具有高可靠、高可用、适用性广和可管理的特性,能够满足数据中心和高性能计算对互连环境的要求。InfiniBand产品有着极佳的性价比,其功耗低,体积小,再加上开源软件的支持和未来120Gb/s规格的发展趋势,InfiniBand将为板级互连和主机间互连技术提供适合的选择。   高速串行通信技术的发展、设计及应用
2005-07-20

作者:王守军 Altera公司 (摘自电子工程专辑)

    随着对信息流量需求的不断增长,传统并行接口技术成为进一步提高数据传输速率的瓶颈。过去主要用于光纤通信的串行通信技术——SERDES正在取代传统并行总线而成为高速接口技术的主流。本文阐述了介绍SERDES收发机的组成和设计,并展望了这种高速串行通信技术的广阔应用前景。

    SERDES是英文SERializer(串行器)/DESerializer(解串器)的简称。它是一种时分多路复用(TDM)、点对点的通信技术,即在发送端多路低速并行信号被转换成高速串行信号,经过传输媒体(光缆或铜线),最后在接收端高速串行信号重新转换成低速并行信号。这种点对点的串行通信技术充分利用传输媒体的信道容量,减少所需的传输信道和器件引脚数目,从而大大降低通信成本。

    SERDES技术最早应用于广域网(WAN)通信。国际上存在两种广域网标准:一种是SONET,主要通行于北美;另一种是SDH,主要通行于欧洲。这两种广域网标准制订了不同层次的传输速率。目前万兆(OC-192)广域网已在欧美开始实行,中国大陆已升级到2.5千兆(OC-48)水平。SERDES技术支持的广域网构成了国际互联网络的骨干网。

    SERDES技术同样应用于局域网(LAN)通信。因为SERDES技术主要用来实现ISO模型的物理层,SERDES通常被称之为物理层(PHY)器件。以太网是世界上最流行的局域网,其数据传输速率不断演变。IEEE在2002年通过的万兆以太网标准,把局域网传输速率提高到了广域网的水平,并特意制订了提供局域网和广域网无缝联接的串行WAN PHY。与此同时,SERDES技术也广泛应用于不断升级的存储区域网(SAN),例如光纤信道。

    随着半导体技术的迅速发展,计算机的性能和应用取得了长足进步。可是,传统并行总线技术——PCI却跟不上处理器和存储器的进步而成为提高数据传输速率的瓶颈。新一代PCI标准PCI Express正是为解决计算机IO瓶颈而提出的(见表1)。PCI Express是一种基于SERDES的串行双向通信技术,数据传输速率为2.5G/通道,可多达32通道,支持芯片与芯片和背板与背板之间的通信。国际互联网络和信息技术的兴起促成了计算机和通信技术的交汇,而SERDES串行通信技术逐步取代传统并行总线正是这一交汇的具体体现。

SERDES系统的组成和设计

    基于SERDES的高速串行接口采用以下措施突破了传统并行I/O接口的数据传输瓶颈:一是采用差分信号传输代替单端信号传输,从而增强了抗噪声、抗干扰能力;二是采用时钟和数据恢复技术代替同时传输数据和时钟,从而解决了限制数据传输速率的信号时钟偏移问题。

    一个典型SERDES收发机由发送通道和接收通道组成(见图1):编码器、串行器、发送器以及时钟产生电路组成发送通道;解码器、解串器、接收器以及时钟恢复电路组成接收通道。顾名思义,编码器和解码器完成编码和解码功能,其中8B/10B、64B/66B和不规则编码(scrambling)是最常用的编码方案。串行器和解串器负责从并行到串行和从串行到并行的转换。串行器需要时钟产生电路,时钟发生电路通常由锁相环(PLL)来实现。解串器需要时钟和数据恢复电路(CDR),时钟恢复电路通常也由锁相环来实现,但有多种实现形式如相位插植、过剩抽样等。发送器和接收器完成差分信号的发送和接收,其中LVDS和CML是最常用的两种差分信号标准。另外还有一些辅助电路也是必不可少的,例如环路(loopback)测试、内置误码率测试等等。

    通信标准制订了严格的性能指标以确保系统的可靠性和互用性。SERDES芯片的主要性能指标包括抖动产生、抖动容忍、抖动转移以及系统误码率(BER)等。抖动产生取决于时钟发生电路特别是压控振荡器(VCO)的相位噪声;抖动容忍取决于时钟恢复电路容忍抖动的能力,而抖动转移是在用作中继器时必须满足的指标,同时取决于时钟发生和时钟恢复电路的性能。系统误码率(通常要求低于10-12)由时钟抖动性能、发送器信号幅度、接收器灵敏度以及链路信道特性共同决定。对于普通FR4印刷电路板而言,趋肤效应和介质损耗导致的码间(intersymbol)干扰是限制背板传输速率和距离的最主要因素。因此,信号均衡甚至自适应均衡技术正在成为SERDES芯片的核心技术。信号均衡技术可以在发送端实现,称之为预加重(pre-emphasis),也可以在接收端实现,例如判决反馈均衡。目前采用先进的均衡技术可以实现40英寸(1米)距离的10G背板传输。

    SERDES芯片的设计需要模拟和数字两方面即混合信号的设计经验。例如锁相环的设计,其中压控振荡器属于模拟电路,而检相器和分频器属于数字电路。SERDES芯片普遍采用低成本、低功耗的CMOS工艺,但CMOS工艺往往达不到高速混合信号的速度要求。因此设计人员必须采用特殊的高频宽带电路设计技术,例如螺旋电感可以用来提高电路速度和带宽。另外,模拟和数字电路共存于同一硅片上,容易产生电源同步噪声(SSN)和地反弹以及信号串扰。因此保持信号的完整性是混合信号设计人员面临的一项挑战。与此同时,芯片封装和印刷电路板的设计与仿真也是SERDES设计不可或缺的一环。当前SERDES设计逐渐IP(知识产权)化,即SERDES收发器作为商业化IP模块而嵌入到需要高速I/O接口的大规模集成电路中。

SERDES技术的应用

    最早用于光纤通信的SERDES技术会继续在信息高速公路的建设中发挥主导作用。而计算机和通信的融合为SERDES技术开辟了更为广阔的应用前景。基于SERDES技术的高速串行接口正在成为一种通用的IO接口标准。近年来世界上有多个标准组织已经或正在制订从1G到10G的高速串行接口标准(见表2)。1~6G+SERDES产品为当前高速串行接口标准的主流,其中2.5G/3.125G为第一代产品,5G/6.25G为第二代产品。这些芯片采用0.18微米的CMOS工艺就可以实现。

    信息高速公路主要由以光纤作为传输媒体的广域网(SONET)和局域网(以太网)组成。广域网和局域网分别向近距离和远距离渗透,在城域网(MAN)交汇。而且,在广域网上传输以太网数据包的协议(Ethernet over SONET)使得广域网和局域网的界限更为模糊。随着互联网络信息流量的增长,对信息存储容量的需求也大大增长。目前有三种常用的信息存储方式:直接连接存储(DAS)、网络连接存储(NAS)和专用存储区域网(SAN)。最简单的直接连接存储是通过小型计算机系统接口(SCSI)把磁盘驱动器直接连接到服务器上。网络连接存储是把存储设备连接到局域网而存储信息的传输需要通过局域网进行。SAN采用光纤信道技术,是连接服务器和存储设备的专用网络。

    SERDES技术的应用从光纤通信发展到计算机通用I/O接口,其传输媒体也由光纤发展到铜线或背板。InfiniBand是一种采用电缆或背板作为传输媒体的高速串行接口,主要用于数据中心服务器和存储设备之间的通信。RapidIO是一种面向嵌入式系统的总线结构,有并行和串行两种规范,主要用于嵌入系统的处理器总线,局部I/O总线及背板。光互联论坛(OIF)制订了多种光纤通信芯片之间的接口标准,其中公共电气接口(CEI)把背板通信速率提高到6G和11G的水平。作为计算机接口技术从并行向串行的标志性转变,PCI Express将会取代PCI和PCI-X而成为外围设备(网络、存储和视频)的通用高速接口标准。在此转变过程中,提供向下兼容的 “桥接器件”会率先推向市场,随后是完全基于PCI Express的外围设备板卡。与此同时,PCI Express的应用也向通信领域拓展,基于PCI Express架构的“先进交换”就是面向通信而提出的。PCI工业计算机制造商协会(PICMG)正在制订一系列称之为先进电信计算架构(AdvancedTCA)的规范,包括对背板、电源、散热、机械和系统管理等方面的要求,旨在为下一代电信设备提供标准化的通用平台。
     用IP媒体服务器构建下一代网络会议系统
2005-07-20

王瑞章 新太科技

    经济、省时、方便、高效,会议系统改变了我们传统的办公方式。现有的已经部署的会议系统大多是基于传统的TDM的电话会议系统,随着VoIP技术的逐步成熟,部署基于IP媒体服务器的会议系统正成为运营商和企业的首选。因为它有着传统会议系统不可替代的优势:(1)价格优势。基于IP媒体服务器的会议系统每端口的价格对比TDM的会议系统平均少大约1/2,并可大大节约系统维护的成本。(2)业务优势。基于IP媒体服务器的会议系统通过与计算机软件技术、网络技术的完美融合,可以提供给用户更多、更好的业务。(3)容量优势。基于IP媒体服务器的会议系统可以轻松地实现平滑扩容。(4)市场、技术驱动。目前,基于IP的网络在全球广泛部署,网络提供商希望能提供除数据业务外更多的业务;同时,关于NGN的各种标准(H.323,SIP,MegaCO,H.248,SigTran等)已经得到广泛认可,相关的设备和技术也发展迅猛。

一、 IP媒体服务器的会议系统应用与部署

    IP媒体服务器需要和应用服务器配合实现会议系统的功能,每一个模块独立地实现一个特定的功能,如下图1所示。Media Server(媒体服务器):根据应用服务器的要求管理呼叫,处理语音、视频、FAX以及其它各种媒体。Application Server(应用服务器)根据用户的呼叫请求,指示媒体服务器提供相应的服务,如语音、视频、网络会议等。应用服务器和媒体服务器之间可以采用标准的信令接口,如MGCP、SIP、VoiceXML等。应用服务器采用通用的计算机平台,通用的数据库、Web服务器以及开放的业务API,从而创建了一个开放的业务生成环境。业务逻辑和硬件分离,使业务开发商专著于特定的领域,使业务提供者可以自由地选择不同厂商开发的业务模块,进而降低整个系统的成本。

    在实际环境中基于IP媒体服务器的会议系统的部署如图2所示:

    SoftSwitch(软交换模块)提供呼叫路由和交换功能,是下一代网络中控制的核心。Media Gateway(媒体网关)能将PSTN网络的语音转换成IP网络的语音包进行双向转换。SoftSwitch和PSTN网络之间需要通过信令网关转换两种不同网络的信令(如SS7和Sigtran信令之间的转换)。通过媒体网关和信令网关,传统PSTN网络的用户就可以接入IP网络会议系统。

二、 IP媒体服务器的开发

    目前,电信级的媒体服务器大多采用专用的DSP芯片处理语音等媒体数据,并采用工业级的主机和总线技术以保证其符合电信级的性能、可靠性以及可扩展性的要求。例如采用符合AdvancedTCA(The Advanced Telecom Computing Architecture)标准的机框和板卡以及其它一些硬件冗余技术构建电信级的IP媒体服务器;另外一个开发思路是采用标准计算机平台的CPU处理媒体数据,采用一定的设计和部署策略保证媒体服务器达到一定的性能指标。这样的好处是平衡了VoIP技术和CPU设计技术的发展,为最终用户提供性价比更高的媒体服务器产品。一般来说,基于IP媒体服务器的系统由于开发、部署和维护成本降低,对比基于DSP的系统会节省约50%的成本。同时,采用分布式、负载分担的机制,IP媒体服务器也能达到电信级的性能指标。

    为保证媒体流数据的连续性和服务质量,IP媒体服务器必须能根据语音包的帧格式进行实时的处理,如10ms,20ms,30ms的帧。由于没有PSTN的连接可以取得精确的时钟,所以基于标准计算机平台的软媒体服务器开发必须先解决高分辨率的时钟问题。一般有两个层次的解决方案:(1)操作系统级。在Windows平台下,可以使用操作系统提供的软时钟MMtimer(Mircrosoft Windows MultiMedia Timer),它能达到2ms的精确度,但测试表明,在CPU主频高于1GHz后,并不能提供精确的帧处理;Linux由于其源码公开,我们可以修改操作系统的事件调度方式为抢占式优先的调度方式,以保证媒体数据的事件能在最快时间内得到处理。(2)芯片级。Pentium以后的计算机有一个芯片级的控制时钟APIC(Advanced Programmable Interrupt Controller),其比MMtimer有更高的精确度,但该技术与特定的硬件相关。

    IP媒体服务器的可靠性可以借助于分布式的方法解决,图3为采用IP媒体服务器池技术的一种设计方法。多个IP媒体服务器通过简单的叠加方式组成一个媒体服务器池,由负载均衡(Load Balance,简称LB)模块进行统一管理。系统作为一个黑盒子,对外仅提供LB的IP地址和相关配置接口,每一个媒体服务器的状态信息(如端口的利用率、网络流量等)都需要通过与LB的接口传送到LB模块,LB维护一张媒体服务器地址与状态数据的对照表,并根据一定的分发策略(如流量最少;端口空闲率高等),修改通过LB的RTP包的IP包头中的目标地址信息,发往指定的媒体服务器。同时,为保证系统的高可靠性,系统一般采用两个 LB模块组成交叉热备份方式,两个LB采用网络和串口线连接,一个LB的崩溃不会影响到系统的正常运行。采用这种机制有以下的优势:(1)可扩展性好。系统的扩容仅需增加一台安装IP媒体服务程序的计算机即可,媒体服务器程序会启动会自动向LB注册。(2)连续服务能力好。一台媒体服务器发生故障不影响整个系统的运作。并且通过合理地部署媒体服务器和LB的网络拓扑,可以避免由于网络流量的问题造成系统服务质量下降。(3)管理灵活。在LB侧可以根据实际的环境选用相应的负载分发策略,并且可以动态地加载分发策略,从而能更好地适应实际应用环境。


  AdvancedTCA:从规范、技术重点,到应用趋势
2005-07-20

摘自:电子工程专辑

AdvancedTCA规范

先进电信计算架构(Advanced Telecommunications Computing Architecture, 简称AdvancedTCA, ATCA)为PCI Industrial Computers Manufacturing Group(PICMG)制定的新规格,也称PICMG 3.x规范。

它是一项业界倡导的标准,旨在为运营商级电信解决方案创建一种优化的新型板卡(刀片式)和机箱(机架)外形规格。ATCA旨在通过为多种标准交换互连(包括以太网和PCI Express架构)提供支持,满足下一代通信应用的要求,并为制造商提供满足苛刻用户要求的诸多功能。ATCA提供动态空间,以实现新一代模块化、高性能且经济适用的电信解决方案。除了高达2.4TB/秒增强架构可扩展性外,ATCA还支持可扩展的多协议接口,每板卡200W的功率预算以及大型8U×280mm×1.2 板卡外形规格。

AdvancedTCA技术重点

一、背板(backplane)的弹性

背板拓扑结构(backplane topology)决定背板中刀片系统的连结模式。AdvancedTCA提供更有结构性的接口选项,让客户能运用AdvancedTCA整合各种网络元素。AdvancedTCA亦提供充裕的弹性,将Base与Fabric接口整合在背板上。这种设计让电信设备制造商能扩充其设计方案,以便容纳新的使用者与用途的需求,透过各种业界标准接口来提供传输频宽更高的连结埠。

AdvancedTCA支持各种拓扑

  1. 星状拓扑(star topology)支持简单、低成本的设计;
  2. 在电信基础建设中,网状拓扑(mesh topology)提供最高的频宽、配线灵活性、以及可靠度;
  3. 衍生型双星状拓扑(dual-star topology),内含两组星状接口,用来提供系统冗余性(redundancy),或是处理不同种类的数据流或工作负载;
  4. 两组双星拓扑,在机壳中支持4组交换机板,在机板之间提供更多的传输频宽;
  5. PICMG 亦针对光纤信道、InfiniBand、以及PCI Express/ Advanced Switching为AdvancedTCA制定许多附属规格。
二、灵活的交换机制

随着市场对无线与有线服务的需求持续成长,电信产业认识到需要跳脱专利型或部份开放性型架构的桎梏,以便获得更多的选择空间。AdvancedTCA针对新一代网络元素提供充裕的扩充性与空间,支持多种交换协议与接口。

数据传输的接口为研发业者在特殊应用方面提供各种选择,其中包括PCI Express架构的Advanced Switching (AS)。这种多点型Peer-to-Peer交换接口技术让针对专利型背板架构进行标准化,除了针对任何通讯协议进行数据封装(encapsulation)之外,亦提供多元化的QoS服务质量与高可用度。

AdvancedTCA支持各种业界标准全双工接口,其中包括

  1. 运用XAUI支持10G Ethernet;
  2. 运用1000BASE-BX支持4组1Gbps连结槽;
  3. 运用1000BASE-BX与2组 2Gbps光纤信道接口支持2组1Gbps连结槽;
  4. 4组PCI Express/Advanced Switching;
  5. 4组InfiniBand架构;
  6. 2组光纤信道。

此外,AdvancedTCA提供一套机箱层级的管理机制,采纳业界标准的智能型平台管理接口 (Intelligent Platform Management Interface),能运用智能型平台管理总线建置成放射状或总线型拓扑。更新版的连结埠互连提供一套特殊用途的接口,包括10组差分式讯号对。其信道针对各种应用提供刀片系统等应用中常见的通讯接口。这个信道提供刀片系统之间的通讯,并支持错误回复与丛集之间的应用。这套功能是其它架构上看不到的技术,能延伸AdvancedTCA的支持应用范筹。

机板之间的传输带宽是任何平台的重要核心:带宽越高,系统的性能也就越优异。AdvancedTCA在刀片系统之间提供极高的传输带宽: a)Base接口带宽每个连结埠为1Gbps,并提供充裕的升级空间,支持未来的控制面应用。 b)AdvancedTCA支持各种组态选项,其中包括系统能支持每连结端口2Gbps、4Gbps、8Gbps、以及10Gbps传输带宽的系统,满足新一代接口的带宽。

三、提高平台密度

由于密度决定冗余度,以及在固定的空间中能安装多少组件,因此密度是核心网络元素的关键因素。密度的定义是考虑散热、耗电率、以及冷却等因素后,每个机箱中安装刀片型系统的数量以及每组机架(frame)的机箱数量。AdvancedTCA在全尺吋机箱中能支持14组刀片型系统与两组交换器,提供一套较大尺吋的规格与优异的散热效率,支持大量的扩充卡,并使前置与后置I/O无须接线以避免缆线阻挡散热气流。

现今许多厂商推出的新型10U机壳,在平台密度上达到一项新的里程碑。这种配置在一个双星型背板环境中可容纳24颗处理器,并能在标准19吋rack中安装两组交换器,每个机架能安装4组机箱。这种高密度的组态配合AdvancedTCA规格,让每个机架能安装96颗处理器,每个刀片系统能支持200瓦以下的耗电率。即使应用本身并不需要机箱/机架,10U解决方案所提供的机架空间能安装1至3个机箱,机架剩余的空间可用来安装外接式储存装置或作为布线之用。10U架构的弹性受到许多服务供货商的欢迎,能有效满足许多应用的需求。

四、扩充性

电信设备制造商可轻易将刀片型系统扩充至机箱中,藉此容纳更多的传输流量与支持各种新服务,并融入AdvancedTCA支持多重通讯协议的弹性,让系统能应用在多种网络环境。例如,最初可建置一组网络元素,透过小型、低成本的4插槽AdvancedTCA机架来满足现有的需求。为了服务更多的用户,加工机壳可升级至14插槽或16插槽的组态,并重复使用原先安装在4插槽系统中的AdvancedTCA刀片型系统与机架管理模块。

五、综合型应用的处理效率

AdvancedTCA支持各种先进I/O与运算功能,让它能支持综合型计算与通信应用,这类系统采用高效能、完全可编程、内建英特尔Internet Exchange Architecture架构的英特尔网络处理器。这套架构适用于各种综合型应用,其中包括IP软件型交换器、VoIP路由器、以及第二代与第三代基地台控制器。AdvancedTCA能支持各种网络元素,因此能协助电信设备制造商降低研发的时间与成本。

六、Mezzanines

AdvancedTCA刀片型系统可安装符合业界标准的mezzanines,能轻易升级至新处理器、内存、I/O、以及管理处理器模块。支持的规格包括PCI Mezzanine Card(PMC)以及新型Advanced Mezzanine Card(AMC)模块。AMC的优点包括IPMI指令以支持先进管理功能、优于PMC的温度容许范围、以及热插拔能力。AdvancedTCA支持的mezzanine规格能容纳4组PMC插槽以及8组AMC热插拔接口。

七、管理功能

业界标准的智能型平台管理接口(IPMI v1.5)为AdvancedTCA管理功能的基础。这项规格是一套开放性标准,提供充裕的互通性,让不同厂商的各种机壳与散热风扇、刀片型系统、交换器、以及管理解决方案都能并存运作。这些解决方案不仅遵循标准规格,且经过彻底的测试与互通性检验,AdvancedTCA Interoperability Workshops (AIW)每年会进行两次这项检验。

AdvancedTCA的规格已针对电信环境的需求逐渐发展成型,并纳入许多功能,其中包括冗余性、错误返馈、以及同步管理AdvancedTCA机箱管理模块之间的关键信息。

八、可靠性

AdvancedTCA规格的一项主要目标就是降低平均故障修复时间(MTTR)以及提高平均故障间隔(MTBF)。许多专有架构要求在背板配置有源部件,因此会提高现场维修的成本。在AdvancedTCA架构中,背板并没有安装任何有源部件。此外,所有部件都能在现场进行热插拔安装,架构亦能在所有层级提供冗余性的配置模式。

为增进功率管理的效率,AdvancedTCA规格规范了机箱的输入功率、额定电压(voltage feeds)、以及其它变量,规范热插拔型可现场更换单元(Field Replaceable Unit, FRU)装置的规格,降低因背板故障导致数据毁损的可能性。AdvancedTCA规格支持冗余性的Shelf FRU,让单一装置的故障不会漫延至整个机壳。

九、服务能力

AdvancedTCA 能支持所有关键组件,例如像风扇、交换模块、管理模型、以及FRU,都能从前方面板进行控制。大多数ATCA机箱厂商皆建置可由前方安装的风扇,以配合业界普遍的应用习惯。AdvancedTCA机壳采用模块化的设计、冗余性/热插拔的风扇槽,避免机箱内组件因风扇故障而全面停摆。

AdvancedTCA 提供两种机制,避免刀片型系统、机板、与其它机箱层级组件被插入至错误的插槽,或接错连结器。第一种保护机制称为electronic keying (E-keying)。E-Keying会将储存在Chassis Data Module (CDM) shelf FRU装置中的机壳组态数据,和机板的IPMI控制器的数据进行比对。当机板被插入至shelf固定架时,IPMI控制器就会启动,并辨识机板分析是否要启动该机板。此外,AdvancedTCA会指定4种机械对准针脚,以确保机板是否正确地插入,藉此排除针脚错置的可能性。

十、中间件的弹性

管理中间件能提供各种服务,协助监视与管理系统组件,藉此提升服务的可用度。AdvancedTCA支持各种业界标准接口,其中包括SA论坛的硬件平台接口(HPI),能用来整合各种COTS中间件解决方案。电信设备制造商可运用HPI搭配自己的高可用度中间件,藉此降低研发与测试时间,加速进行硬件修改与升级。

十一、TDM支持

虽然业界已全面转移至IP型网络,但现今大多数电信基础建设设备仍是采用分时多任务(Time Division Multiplexed, TDM)、跨机壳同步频率等技术,新一代的通讯架构仍须满足这些需求。

AdvancedTCA提供充裕的弹性,能支持传统型与新一代的网络元素。TDM同步频率可透过ATCA规格完全支持,厂商可运用模块化的方案进行建置。AdvancedTCA需要3组同步频率讯号对,在所有背板上建置出冗余机制,但厂商可视实际需要选择是否采用。

促使业界采纳AdvancedTCA的趋势

服务供货商纷纷寻求低成本且高灵活性的方法来整合各种服务,其中包括一键通(Push-to-Talk)与视频占播,运用可扩充的标准化平台转移至新一代网络环境。最近兴起的新一代多重服务网络,促使电信设备制造商必须为其顾客提供更具弹性的解决方案。

下列趋势促使业者采用AdvancedTCA

  1. 业界运用电信级操作系统与标准中间件接口,转移至标准化的平台;
  2. 为了降低开发成本并缩短产品上市周期,电信设备制造商正建置各种多用型平台,用来整合计算与通讯应用;
  3. 运用AdvancedTCA平台让电信设备制造商不须分心在研发硬件上,可专心为服务供货商提供各种加值型软件与服务。

AdvancedTCA为电信设备制造商带来各项优势

1、开放性标准创造出更多的选择

为达到充裕的弹性以便支持各种新服务,电信产业需要一套真正支持整个产业的开放性解决方案架构。除了AdvancedTCA之外,电信设备厂商亦可选择市面上其它刀片型系统架构。但某些架构本身并不是以开放工业标准做为开发基础,而是以企业服务器为基础并融入专利型设计,顾客能选择的厂商与系统组件相当有限,因此它们无法实现供应链竞争以及开放性系统模式所带来的创新利益。

根据Yankee Group(2003年2月)的资料指出,精通于提供服务商等级解决方案的电信设备制造业者在采购AdvancedTCA后,可获得以下的好处:

  • 降低85%的硬件研发人事成本;
  • 降低40%的整体产品开发成本;
  • 硬件升级方案的上市周期平均缩短3至5个月;
  • 新款刀片型系统的上市周期缩短3至9个月;
  • 新款电信级系统的上市周期缩短12至18个月;
  • 简化的成本结构;
  • 产品设计方面获得更高的弹性;
  • 能事先预测产品的研发周期;
  • 完整的开发工具。
  • 开放性标准

PICMG中超过100家电信设备制造商协助开发AdvancedTCA规格。除了针对高度可扩展性与可管理性的刀片型服务器与系统层级组件制定相关规格外,AdvancedTCA亦针对模块化通讯平台推动各项多重厂商电信产业的计划,其中包括:

  • 针对AS SIG的PCI Express架构开发Advanced Switching(AS);
  • 支持IEEE 802.3ab SIG 拟定的10G Ethernet 以太网络技术;
  • 开放源码开发实验室推出的电信级操作系统;
  • Service Availability*Forum (SA Forum)论坛提供的高可用性中间件接口。

有别于某些架构,AdvancedTCA规格是公开发表且免支付权利金的技术标准。这套规格的简介已刊载于www.picmg.org。厂商在支付象征性的少许费用后即可加入成会员并获得完整的规格数据。由40多家厂商合作制定的设计指南已刊载于:http://www.intel.com/technology/atca/index.htm。这套指南协助研发业者深入了解这套架构,在充份掌握AdvancedTCA的各种架构组件、背景、以及设计方法后,规划出最佳的设计策略。

2、可重复使用的优势

PICMG组织成立一个名为Classification Working Group的工作小组。参与的厂商正汇整出一个分类表,让电信设备制造商能运用AdvancedTCA组件开发多种网络元素,并让他们能维持与提升产品的特色。图1显示AdvancedTCA组件可根据实际需求进行重新调整。

AdvancedTCA支持多重背板配置(backplane configurations),以及超过24种机壳组态,包括5至14个插槽。支持各种可重复使用的组件,其中包括刀片型与mezzanine系统,让研发业者能在各种不同的规格与组态下配置可重新调整组态的标准型机架。不论是什么厂商提供的平台,每套网络元素都适用相同规格标准的机壳。此外,每个网络元素中的刀片系统都能执行与其它网络元素相同的功能。例如,Radio Network Controller(RNC)控制器的控制与信号架(control and signal shelf)可和Serving GPRS Support Node(SGSN)使用相同的硬件。

主要电信公司采用英特尔架构模块化通信平台

英特尔公司于2004年6月美国芝加哥举行的SUPERCOMM展会上宣布,华为技术有限公司和韩国电信正在开发面向有线和无线网络基础设施的英特尔架构模块化通信解决方案。这一声明进一步扩大了正在从昂贵的专有系统移植到标准平台的电信设备制造商(TEM)和服务提供商的阵营,以通过更为经济的价格推出全新服务,同时缩短投资回报时间。这些制造商和提供商所构建的通信设备使消费者能够享有从基本电话连接到即按即聊等最新无线趋势的全面服务。据相关新闻报道,英特尔还宣布推出下一代电信级英特尔架构服务器,作为其服务通信领域的又一重要举措。

英特尔架构平台和组件作为“构建模块”,能够支持电信行业提供广泛的高性能解决方案,以满足日益增长的带宽需求。英特尔平台包括高级电信计算体系结构(AdvancedTCA)系统和电信级机架安装式服务器(RMS)。

华为技术有限公司看到了这一平台的优势,并围绕模块化通信平台和AdvancedTCA开发出长期的平台战略。华为技术有限公司副总裁兼首席技术官Wei Ai表示:“我们坚信,模块化平台技术标准是加快产品上市的关键,对于华为及我们的客户都有着重要价值。为此,我们正采用基于电信级Linux和AdvancedTCA等标准、并运行英特尔计算和网络处理器的设备来开发下一代基础设施平台,预计将于2004年下半年推出。”

韩国电信是全球领先的高速互联网服务提供商之一。在其最新的试验计划中,他们采用基于商业化AdvancedTCA的系统组件开发下一代服务平台,从而显著减少了开发时间和所需资源。这些新应用和媒体服务器平台设计用于支持一整套韩国电信服务,如多媒体呼叫方ID、彩铃和视频会议等。

韩国电信副总裁Lee Sang-hong表示:“我们的IP多媒体服务试验采用英特尔架构AdvancedTCA平台,这使我们能够将多家一流供应商提供的元件快速集成到一款电信级解决方案中。两年前,类似大小的平台和服务工作需要10个开发人员用12个多月的时间来完成。而在新项目中,通过采用基于标准的方法,我们以更少的开发人员将所需开发时间缩短了50%。此外,我们还期望通过重复使用这一平台体系结构部署多项新服务,将运营成本减少一半。”

而在9月于韩国釜山举行的亚洲电信展上,英特尔公司又宣布上海贝尔阿尔卡特公司正在为其移动应用服务平台开发基于英特尔架构的模块化通信解决方案。

上海贝尔阿尔卡特的解决方案是全球第一套在单一ATCA平台中集成的多种移动业务,充分证明了该模块化平台的出色可扩展性和集成灵活性。这些创新移动应用,如彩信、即时短消息、一键通(Push-To-Talk)和WAP网关等,都无缝集成在了采用英特尔处理器的单一ATCA平台中。这使ASB能够帮助其客户快速提供创收型服务,从而显著增强他们的竞争力。通过使用这些高度可扩展的、高性能英特尔架构标准刀片式电信服务器,运行成本得到了显著降低。