今年6月12日至22日,记者有机会再次参加了Globalpress公司组织的媒体访问团,在美国硅谷度过了紧张而愉快的10天。此次共有来自中国大陆、台湾地区、韩国、日本和菲律宾的8个记者和编辑。有趣的是,来自菲律宾EETimes Asia的Majeed是巴基斯坦人,来自日本Dempa Shimbun Daily(日本电波新闻)的DJ Kang是一位韩国人,中国台湾电子时报硅谷办事处主任郑王秀文则常驻硅谷,她不但没有遭受长途旅行的车马劳顿,而且往往在第一时间得到半导体产业的最新进展。虽然大家只能用各具本国特色的英语进行交流,紧张的行程也不免让人有些疲惫,但加州明媚的阳光、气势雄浑的金门大桥、恬静悠闲的海边小镇、旧金山郊外的山川秀色和Napa Valley的葡萄醇酒,让我们在触摸科技前沿脉动的同时,小小地过了一把旅游的瘾。
我们这次共拜访了LogicVision、Atheros、Power Integrations、Zoran、Atmel、ChipX、nVidia和Broadcom共7家公司的总部,还聆听了Verisity Design、Platform Computing、HyperTransport、SiGe Semiconductor、ON Semiconductor和Atrenta共6家公司的关于公司状况、市场业绩、产品与技术的精彩演讲。既有ON Semiconductor、Broadcom和nVidia这样的大公司,也有Atheros和ChipX等小公司,他们展示了各种各样的新产品、新技术和新理念。重要的是,这些公司在各自的领域都有自己的专长和优势,集中资源开发核心技术,避免盲目的多元化,从而在激烈的市场竞争中立于不败之地。先介绍两家公司。
Platform Computing
Platform在国内的IT业赫赫有名,不仅仅因为其在网格计算市场上独占鳌头,还因为公司的创始人和CEO周松年博士是一位中国人,他利用在攻读博士期间开发的网格计算技术在1992年创办了Platform公司,公司总部位于加拿大的多伦多,客户分布于汽车、电子、银行、保险、金融、政府部门和工业等各个领域,财富2000中的1600家公司都采用了其网格计算软件,预计今年的收入将达到6000万美元。Platform的产品包括Platform LSF、Platform Symphony、Platform IT Analytics和Platform Globus Toolkit,Microsoft、Oracle和SAS等独立软件商都将Platform的软件作为其网格策略的关键部件,在ANSYS、Cadence、Mentor等公司开发的软件中已经取得了100多个成功的应用。
网格计算是分布式计算的一种,它利用网络将大型计算机和PC连接在一起,可以让分布在世界各地的用户能够动态和虚拟地共享应用程序、数据和计算资源,有效地管理和配置计算资源,通过提高利用率来大幅提高计算能力。网格计算模式首先把要计算的数据分割成若干“小片”,而计算“小片”的软件通常是一个预先编制好的屏幕保护程序,然后不同节点的计算机可以根据自己的处理能力下载一个或多个数据片断和屏幕保护程序。当节点计算机的用户不使用计算机时,屏保程序就会工作,这样就充分调动了这台计算机的闲置计算能力。这种“蚂蚁搬山”式的计算在1999年SETI@HOME项目上显示了巨大的威力,该项目将分布于世界各地的200万台个人电脑组成计算机阵列,用于搜索射电天文望远镜信号中的外星文明迹象。在不到两年的时间里,这种计算方法已经完成了单台计算机345000年的计算量。
当然,应用软件不限于屏幕保护程序,在CRM、EDA和数据库等许多软件中都已经集成了网格技术,当一台计算机的资源不足时会自动转向网络里经过授权的的其他计算机,调用它们的计算资源,整合并优化分布于各地、不同种类的IT资源,创建出虚拟的CPU、内存和数据,提供更多可用的计算能力,降低软硬件的采购和运营成本,增强赢利能力和竞争力。
以往的网格计算多用于计算量极大的工程和科研领域,在电子设计领域,摩尔定律使得设计复杂度在飞速提高。仅仅在几年前,上百万门的设计就已经很了不起了,但现在,上千万门的设计比比皆是,设计中的计算量在急剧增加,所产生的数据量也是非常惊人的,一个1000万门的SoC或ASIC设计,可能需要一天或数天的时间进行验证和分析。尤其是SoC,在硬件上包括数字和模拟技术的集成,在软件上包括软件协议栈、实时操作系统和应用软件。从系统的高度来全面考虑并实施集成,显然不是一件容易的事,需要反复的验证和循环。此外,90nm工艺带来的设计问题远比人们想像的多,解决信号完整性、串扰、电子迁移、线路延迟和漏电流等问题所需的设计和验证计算量将增加10倍以上。今后如果采用65nm和尺度更小的工艺,所需的计算量也许会按照指数的速度增加。而且市场的快速变化要求尽可能短的上市时间,或者对设计快速进行变更,这个特点在消费电子产品上体现得尤甚,这些因素对企业的IT资源提出了苛刻的要求。现在的EDA软件都极其昂贵,为节省成本,需要大力挖掘工作站的计算潜力,提高软件的利用效率。
当前的另一个问题是设计公司在采用新工艺的速度上已经落后于代工厂,TSMC、UMC、SMC等代工厂的90nm工艺已经相当成熟,而nVidia等设计公司在设计上的难题和所花的时间要比生产上的多得多。
当然最简单的解决办法是采购足够的IT设备,但计划赶不上变化快,已有的计算资源很快又不敷使用了,而且常常是一边不堪重负,另一边是浪费和闲置,本着少花钱、多办事的原则,利用网格技术充分利用现有的计算资源当然更加划算。
为了降低成本,许多公司纷纷将设计项目转移到印度、中国等地,利用这些地区的低工资优势来降低开发成本。同时,各地的项目小组可以保持开发工作24小时连续进行,当圣何塞的工程师已经下班时,上海的工程师正在紧张地工作之中,需要两地之间实现设计数据的密切同步,并充分利用圣何塞闲置的IT资源,这为网格技术的应用提供了契机。目前的网格计算主要还停留在企业内部的资源共享阶段,将来会扩展到合作伙伴之间的协作和资源共享。负责电子产品部门的副总裁Peter Nichol打了一个形象的比喻,“我们只要插上电源,电脑、电视、微波炉就可以工作了,但谁会考虑我们所用的电能是来自哪个电厂的呢?”
Peter Nichol接着介绍,Platform于20世纪90年代初率先推出了面向半导体行业的网格计算解决方案,初期主要是用于批处理、EDA、CAE、仿真和建模等一般的工程计算,目前已经发展CRM、ERP、SCM等商业计算领域,使设计开发、财务、管理等所用的硬件设备全面共享。Platform的解决方案可以在在复杂的异构环境下,提高系统的性能、扩展性和灵活性。公司于6月7日发布了新的Platform LSF电子行业版,为中小企业和设计公司的自动化芯片设计流程提供了端到端可定制的网格计算解决方案。新版软件用整套的集成和服务使软件的功能最大化,可充分挖掘计算和许可资源的潜力,优化现有的硬件和软件资产来减少总体拥有成本,通过业界领先的“即插即用”应用集成来减少部署的成本和时间,优化IT资源的性能和可管理性。虽然额外增加了支持、系统优化和咨询服务的成本,但使商业风险减小了。最重要的是,在仿真、合成、验证、模拟设计、布线和路径选择、设计数据管理等许多方面,和Synopsys、Cadence、Mentor Graphic、Altera、Verisity、Nassda、Magma、IBM等重量级厂商的第三方软件进行了完美集成。
妨碍企业应用网格计算的问题之一是安全问题,人们担心对资源的共享失去控制,有人会恶意地非法使用和调用资源,这是任何一家视技术专利和资源为核心的高科技厂商所无法回避,也无法忽视的问题。此外,半导体厂商用于IT的设备投资不到总投资的1%,而用于EDA软件的投资则将近10%,因此这些厂商还没有很大的动力来推进网格计算。不过,最大的问题是人们在观念上无法接受,部门利益和条块分割导致的有组织的“政见不同”是网格计算技术普及的最大障碍。在一些企业中,各部门和产品线建立了庞大的IT基础设施,各个部门不愿意共享他们的资源,认为这样自己将失去对资源的控制以及使用资源的优先权,设备预算会因此而减少或者项目得不到足够的重视。
Peter Nichol指出,随着成本压力的不断增大,企业需要从总体上考虑计算资源共享,改善商业流程和运作,提高应用的性能,节约IT的资本和运营开支,提高投资回报率和快速收回投资。越来越多的公司开始将计算资源向基于Linux的PC转移,仅在一些关键应用上采用主机托管和服务器集群的模式。EDA软件则向着集中使用和共享许可的方向发展,甚至采用全球授权模式。AMD在设计Optron处理器的时候,就采用了网格计算,从而缩短了产品上市时间。经验表明,采用网格计算使每个CPU的平均利用率至少提高了5%,增加了20%的工作流量,使产品的上市时间缩短了5%。对EDA软件许可的优化消除了工作停滞、挂起和暂时无法处理的时间,提高了工程师的工作效率并减少了上市时间。两项相加,每年可节省上百万美元的采购、维护和EDA许可的费用。在投资回报率最高的几种技术中,网格计算紧跟电子商务之后,名列第二。
欲了解更多信息,请访问www.platform.com。
HyperTransport
HyperTransport是一个会员制的非营利性组织,主要成员有AMD、PMC-Sierra、Sun、Broadcom、nVidia、Cisco、Apple、IBM、TI、Altera、NEC、VIA和Agilent等公司,会员可以免费使用HyperTransport技术,有助于吸引更多的会员参加这个开放式的技术联盟。
HyperTransport是一种芯片内的高速互连总线,用于CPU和I/O、CPU和CPU之间的互连,实现低延迟、高带宽和高度优化的包处理,完全与已有标准兼容,便于平滑顺畅的产品移植,可满足未来对产品性能的要求,并可扩展到PCI、PCI-X、PCI-Express和其他总线,具有最低的部署和使用成本。
HyperTransport与PCI软件完全兼容,可以引导较早推出的操作系统,在命令和比特级上映射到PCI、PCI-X、PCI Express。HyperTransport具有强大的错误重试协议,可以用于更快的电气连接;是仅有的标准I/O与低延迟存储器之间的接口,只需极少的处理开销;大多数数据包都是8字节长,便于简化处理,当承载用户数据流时的处理开销非常小;控制包的包头只有8字节,一个完整的读请求可以很快发送;高优先级的包不会被低优先级的包所延迟;无须串并转换,并且并行接口比串行接口所用的处理时钟周期要少得多;高度可扩展、自动协商的接口具有优良的电气性能,前向时钟和抖动约束保证了高可靠性;采用点对点的路由,在HyperTransport链上的设备可以直接通信;有16个为数据流优化的虚拟通道,提交写请求采用了专用的流控制方式;端到端的流传输模式非常适用于高度通道化的应用;采用1.2V的低压差分信号方式,具有很强的抗干扰能力,可实现长距离的高可靠传输;具有低引脚数和低功耗的特点,可在200MHz~1.4GHz的时钟频率下实现双倍的数据速率,相当于400MT/s~2.8GT/s;只需一次PCB布线;简洁的规范和标准便于在部署时进行优化。现在,该组织又于2月9日发布了2.0版的标准,使传输速率达到了惊人的22.4GB/s。
Priority Request Interleaving和DirectPacket技术是实现低延迟的关键。Priority Request Interleaving的原理是,当存在多个外设的情况下,外设A向CPU发送了一个数据串,而此时外设B可以在此数据串前插入一个优先请求,将控制包插入到数据包的中间,从而加快响应,而且可以在数据串1还在传输时,数据串2开始传输。输入和输出可以同时进行,从而实现最低的延迟。
高效的DirectPacket技术用于处理数据流,在本地进行包处理,用户的数据包可以在设备之间移动,而无须经过DMA环路。负载仓库和包总线功能无缝地混合在一起,使负载仓库的操作不需要额外的处理开销。可扩展为2、4、8、16或32个数据路径,可消除延迟并适应成本变化。
HyperTransport具有很宽的应用范围,从网络设备、个人电脑、服务器、嵌入式应用到消费电子,都是其用武之地。该技术已经从规范和标准变成了实际的产品,AMD、PMC-Sierra等公司已经公布了50余个HyperTransport的产品,包括处理器、芯片组、图形引擎、I/O桥、开关、FPGA等组件,协议分析仪、参考平台、评估板等开发工具,用于测试的兼容性平台和高速测试系统,软件包括驱动程序和BIOS,由IP核、模型、仿真器和验证组成的硅IP。
采用HyperTransport的I/O设备包括Hub、桥、芯片组、图形引擎、安全处理器和IP核(包括FPGA、ASIC和PHY核)。在具体应用上,通过HyperTransport图形引擎,HyperTransport可用于处理器连接视频或多媒体子系统;通过采用HyperTransport的I/O设备连接各种外设,如USB、串行、并行和其他外设;HyperTransport的PCI桥可以连接老式PCI设备和HyperTransport的I/O设备;在服务器中,可以实现多个处理器之间的高速互连,连接另外的处理器集群和多种外设;在路由器当中,HyperTransport可以桥接其他高速总线。
PMC-Sierra不但是HyperTransport联盟的初始成员,所推出的处理器也采用了Hypertransport技术。RM9150采用了8位的HyperTransport接口,支持200、300、400、500和600MHz的DDR存储器,最高传输速度可达19.2Gb/s。在RM9000x2GL处理器中,HyperTransport总线控制器用于桥接包交换部分和外设。
Transmeta的Efficeon移动平台中采用了HyperTransport的I/O总线,采用点到点的LVDS接口,时钟速率为400MHz,带宽是PCI总线的12倍,由HyperTransport南桥连接802.11b的PCI无线设备。
Broadcom的BCM1250的PCI/HyperTransport桥可连接32位的PCI设备,采用600MHz的DDR存储器时,输入和输出的速率可同时达到9.6Gb/s,总带宽为19.2Gb/s。
AMD的8111 I/O Hub可取代传统的南桥,采用8位的HyperTransport来传输上行和下行数据流。
采用HyperTransport的桥接芯片包括AMD的8131,提供2个独立的HyperTransport与PCI-X的桥接;Alliance Semiconductor的SP1011提供两个HyperTransport与PCI 64/66的桥接,AS90L10204/10208提供双向的PCI-X桥;VIA的K8T890北桥提供HyperTransport至PCI Express的桥,具有20个带宽为250MB/s的通道;SiS的北桥芯片SiS756提供HyperTransport 2.0至PCI Express的桥接。
AMD的8151图形通道用于连接Athlon处理器、AGP3.0图像处理器和8111 I/O Hub;Ali的M1689提供了8/16个HyperTransport连接;nVidia的nForce2和nForce3的HyperTransport用于连接IGP和MCP,速度达800MHz。
在FPGA和ASIC核上,Altera的Stratix-II EP1S25 HyperTransport的IP核提供8位、500MHz的完全集成的接口;Xilinx Virtex-II提供HyperTransport IP核;GDA Technology可同时提供FPGA和ASIC格式的IP核,用于通道、主机、桥等芯片。
HyperTransport的发展当然还离不开众多的支持工具,安捷伦的Agilent 93000 SOC系列测试仪可对HyperTransport设备进行测试。FuturePlus Systems提供分析、除错和软硬件集成的方案,其HyperTransport连接分析仪提供目标系统和Agilent的逻辑分析仪之间的机械、电气和软件接口,包括物理连接、匹配阻抗、适当的端子、时钟和信号处理、用于触发的32位包,软件用于观察数据协议、过滤数据和分析仪的处理;可以调试、验证、认证和集成,直接与GDA Compliance平台和Broadcom的开发板连接,执行跨总线分析、显示等功能。GDA Technology的HT8000兼容性平台可以确认HyperTransport设备的互操作性,具有两个16位HyperTransport接口,配备了Xilinx Virtex FPGA,支持主机、通道、开关和陷阱配置,具有16位SPI-4.2和千兆位以太网连接,带有FuturePlus Systems的HyperTransport分析探针插座。O-In Design Automation开发自动和仿真软件,完整的验证IP库用于标准接口和通用设计部件,可以快速地验证模型,测试常用的RTL结构。HyperTransport Monitor可以验证端点设备、节点设备和桥。MindShare公司则负责出版有关HyperTransport的书籍,并提供培训课程。
以上这些公司在设计、工具、测试、软件和IP等方方面面,为促进HyperTransport的发展上进行着紧密的合作。值得注意的是,PMC-Sierra和Broadcom的处理器都采用了MIPS内核,而MIPS已经归属于AMD的旗下,三家的合作不仅限于HyperTransport,合作的深度和广度要将各方的利益紧密地联系在一起。
随着国内芯片设计业务的逐步发展,国内的一些企业和学校也开始引进和采用HyperTransport技术,该组织也十分有兴趣在国内举办研讨会等形式的活动来推广HyperTransport。
欲了解更多信息,请访问www.hypertransport.org。