|
|
| | -文章搜索 - 最新文章 - | |
第10937篇:数字化应用中的多核DSP |
| 发布时间:2006年10月21日 点击次数:1329 |
| 来源:无线电技术 作者: |
DSP是对数字信号进行高速实时处理的专用处理器。在当今的数字化的背景下,DSP以其高性能和软件可编程等特点,已经成为电子工业领域增长最迅速的产品之一,人们对其性能、功耗和成本也提出了越来越高的要求,迫使DSP厂商开始在单一矽片上集成更多的处理器内核。本文分析了多核DSP必须面临的挑战,介绍了一些常见的多核DSP产品。 数字信号处理器(DSP)是对数字信号进行高速实时处理的专用处理器。在当今的数字化的背景下,DSP以其高性能和软件可编程等特点,已经成为电子工业领域增长最迅速的产品之一。据市场研究公司In-Stat的最新报告,全球DSP市场今後将一直保持高速增长,其中2004年的付运量估计为15亿颗,2009年该数字可望达到28亿颗。其中,浮点DSP的应用市场可望从2004年的10亿美元增长到2009年的22亿美元。因此,全球DSP市场的前景非常广阔,DSP已成为数字通信、智慧控制、消费类电子产品等领域的基础器件,而通信市场2009年的比例可望达到61%。 Forward Concepts最近公布的DSP/无线市场报告指出,Q2/2006 DSP晶片付运量较Q1上升了3.3%,达21亿美元。报告指出,虽然无线依然主宰著DSP市场72%的份额,其Q2增长幅度仅有2.8%,而来自汽车和消费领域的增长则分别高达38.7%和37.2%。数据显示,亚太地区依然是DSP的主要应用市场,而嵌入式DSP则占据了66%以上的市场份额。 图1 DSP市场概况 随著应用领域的扩大以及终端产品性能的日益丰富,人们对DSP系统的性能、功耗和成本提出了越来越高的要求,迫使DSP厂商开始在单一矽片上集成更多的处理器内核,於是多核DSP应运而生。 1、多核DSP关键技术 晶片制造工艺技术的进步和SoC设计与验证水准的提升分别是多核DSP诞生的硬体基础和软件基础。 以下介绍多核DSP必须面对的一些关键技术∶软硬体协同设计、软硬体协同验证、IP核生成与复用、高速互连总线、低功耗设计等。 (1)低功耗 从硬体技术上来看,可以采用动态电源管理技术,设置全速、半速、休眠等工作模式,根据当前的任务强度和功耗监测信息,及时调整电压和频率,关闭暂时不使用的模块,以降低功耗。另外,根据特定的应用需求,设置专门的协处理器,同样可以减少DSP内核的运算强度。 从软件技术上来看,在编译指导下的多核DSP低功耗优化技术非常具有潜力。低功耗编译技术主要包括编译指导的动态电压调节、多线程功耗模型下的低功耗编译调度等。在操作系统的支持下,通过合理的调度,使处理器资源与演算法需求相适应,例如在DSP核+MCU的模式下,MCU就不应该处理DSP的有关程式。 (2)互连与存储系统 针对数据密集型的应用,多核DSP必须解决存储系统的效率问题。为此,必须要解决一系列关键技术,例如应该设计多大的片内存储器?数据的共用和通信在存储层次的哪一级来完成?Cache一致性在哪一级实现更合理?是通过片内共用存储器还是高速总线进行多核之间的通信?存储结构如何支持多线程的应用? (3)编译技术与操作系统 多核之间的任务调度是充分利用多处理器性能的关键。为满足实时处理的要求,均衡各处理器负载,需要研究的任务调度机制有分散式实时任务调度演算法、动态任务迁移技术等。已有的几种嵌入式操作系统,例如μcLinux、PalmOS、WinCE等,都还无法有效地支持多核处理器。嵌入式多核操作系统的研究任重而道远。 (4)应用开发环境 为此,我们可以借鉴多核通用微处理器的编程模式,即消息传递程式设计模式MPI和基於编译指导命令的程式设计模式OpenMP。但是,最终的发展趋势还将是集成化的VSP(Virtual Single Processor,虚拟单处理器模型)开发环境,在这一环境下用户能够像开发单处理器程式一样去开发多核应用系统,在同一平台上完成编程、调试、编译优化和连机测试的过程。 例如,Cradle公司在推出CT3600系列多核DSP的同时,还推出了相应的多核开发工具,包括ANSI C编译器、针对DSP进行了时序优化的Cradle C语言、eCOS实时操作系统、INSPECTORTM代码开发与调试器和RDS3600硬体开发平台等,从而为用户提供了一揽子的解决方案。 2、多核DSP的应用 (1)3G移动通信 2G数字蜂窝电话的核心处理器都是基於双处理器结构的,即包含1个DSP和1个RISC微控制器(MCU)。DSP用来实现通信协议栈中物理层协议的功能;而MCU则用来支援用户操作介面,并实现上层通信协议的各项功能。 3G数字移动通信标准增加了通信带宽,并更加强调高级数据应用,例如可视电话、GPS定位、MPEG4播放等。这就对核心处理器的性能提出了更高的要求,即能够同时支持3G移动通信和数据应用。在现代化的3G系统中,对处理速度的要求大概要超过60-130亿次每秒运算。如果用现有的DSP,需要20-80片低功耗DSP晶片才能满足要求。因此,承担这一重任的多核DSP处理器晶片必须在功耗增长不大的前提下大幅度提高性能,并且要具备强大的多任务实时处理能力。多核DSP在嵌入式操作系统的实时调度下,能够将多个任务划分到各个内核,大大提高了运算速度和实时处理性能。这些特点将使3G手机能够同时支援实时通信和用户互动式多媒体应用,支援用户下载各种应用程式。图2给出了一种3G通信多核DSP处理器的架构。
&nbs p; 图2 3G通信多核DSP处理器架构(2)数字消费类电子 由於DSP的广泛应用,数字音响设备得以飞速发展,带数码控制功能的多通道、高保真音响逐渐进入人们的生活。此外,DSP在音效处理领域也得到广泛采用,例如多媒体音效卡。在语音识别领域,DSP也大有用武之地。Motorola公司等厂商正在开发基於DSP的语音识别系统。 数字视频产品也大量采用高性能DSP。例如数码摄像机,已经能够实时地对图像进行MPEG4压缩并存储到随机的微型硬盘甚至DVD光碟上。此外,多核DSP还应用在视频监控领域。这类应用往往要求具有将高速、实时产生的多路视频数字信号进行压缩、传输、存储、重播和分析的功能,其核心的工作就是完成大数据量、大计算量的数字视频/音频的压缩编码处理。 (3)智慧控制设备 3、主流多核DSP介绍 (1)同构多核DSP A、AD公司Blackfin系列 AD公司Blackfin系列采用双Blackfin内核(每个内核性能高达756MHz/1512 MMAC,总和达到3024 MMAC),适用於要求苛刻的数字成像和消费类多媒体应用;其328KByte的大片上存储器可以用作每个内核单独的L1存储器系统,以及共用的L2存储器空间。 图3 Blackfin系列双核DSP功能图 该处理器采用类RISC的寄存器和指令模式,易於编程和编译优化,同时具有先进的跟踪、调试和性能监测方式。Blackfin内核采用动态功耗管理技术,可以改变电压和频率,从而为便携式应用提供更长的待机时间,面向应用的外设提供了与多种音频/视频转换器和通用ADC/DAC的无缝连接。 Blackfin系列的主要应用包括∶数码相机、数码摄像机、便携式媒体播放机、数字视频录像机、机顶盒、消费类多媒体、汽车可视系统、宽带无线系统。 B、TI公司TMS320VC5441
![]() 图4 TMS320VC5441功能图 C、飞思卡尔MSC8144 图5飞思卡尔MSC8144功能图 MSC8144将4个频率为1GHz的StarCore DSP内核相集成,提供业界最高的千兆赫兹级性能,相当於1个4GHz单核DSP。它在单个产品中集成业界最高的10.5MB嵌入式存储器,实际上降低了对附加外部存储器的需求,同时保持具有竞争力的成本和每通道功耗。 MSC8144 DSP基於具有更深流水线的增强型SC3400 DSP内核,该内核能够提供很高的时钟速率,并增加了新的单指令多数据(SIMD)指令,提供精确的异常和分支预测。SC3400内核还支持适用於维特比(Viterbi)和视频演算法的经过改进的专用指令,每个内核周围都有高效的16KB指令缓存、32KB数据缓存,以及用於存储和任务保护的MMU(存储管理单元),使用户能够开发强大的软件。 飞思卡尔的CodeWarrior集成开发环境(IDE)包括高级优化C/C++编译程式、整合工具、周期和指令精确模拟器、设备驱动和操作系统。该工具箱还带有一整套硬体开发平台和参考板设计。同时,OEM还可以注册购买飞思卡尔及其第三方生态系统合作夥伴的优化多媒体编解码器和软件框架。 MSC8144 DSP的主要特性包括∶2个千兆乙太网介面,支援SGMII和RGMII,另外还有16位元UTOPIA介面,支援ATM;QUICC Engine技术实施了双RISC内核,可以降低DSP内核的通信任务负荷,从而增强整体系统性能;4X/1X Serial RapidIO介面,提供高吞吐量和强大数据包传输;2048 TDM DS-0通道,处理与PSTN网络的连接;10.5M内部存储器,提供业界最大的嵌入式存储器;高级DDR-I/II控制器,提供连接高速行业标准存储器的介面;66MHz的32位元PCI总线介面,提供更多的高速连接。 在有线基础设施应用方面,MSC8144提供了运营商级中继、企业VoIP媒体网关、视频会议服务器等众多应用的DSP解决方案。另外,MSC8144提供的无线应用包括∶无线语音代码转码,IP多媒体子系统(IMS)网关,视频多点会议,3G、Super 3G和WiMax基站的基带卡以及无线网络控制器(RNC)中的第2层处理。 (2)异构多核DSP A、TI公司SMJ320C80 TI公司的OMAP处理器是这类DSP的典型代表。图6给出了最新推出的OMAP2420的组成结构。该处理器采用90nm工艺,集成了主频为330MHz的ARM1136核、TMS320C55x DSP核、2D/3D图形加速器、图像与视频加速器、共用存储控制器/DMA等,能够实现30帧每秒VGA解析度的全动态视频编解码。
B、Cradle公司CT3616 C、瑞萨半导体SuperH系列 图7 瑞萨科技SH-2A核心架构 其中,最近发布的带有片上闪存的SH7211F集成了可提供卓越实时控制能力的高性能SH-2A CPU核心,在160MHz运行条件下可以实现大约320 MIPS(每秒百万指令)的高处理性能。与SH-2 CPU核心相比,在同样的工作频率下其处理性能大约提高了1.5倍,与运行於80MHz最高工作频率的SH-2产品相比,性能大约提高了3倍。其指令集的向上相容性保证了可使用现有的程式,同时可以提高大约25%的ROM编码效率,并可减少存储程式的存储器容量。 SH-2A CPU核心在实时能力也有所改进。15个寄存器组专门用於CPU的中断,中断处理的反应周期已从SH-2的37个周期减少到SH-2A的6个周期。由於更高的工作频率和更短的反应周期,在160MHz工作条件下运行的SH-2A的程式开始反应时间的中断信号已减少到在80 MHz条件下运行的SH-2反应时间的大约1/12。这样,就可以在中断事件发生时,实现快速的程式切换,从而提供高质量的实时控制。 SH7211F还包括了适用於诸如AC伺服系统和变频器等强调实时控制能力的高档工业设备的各种外设功能。这些功能是具有3相PWM(脉冲宽度调制)输出能力的、8个12个位A/D转换器通道,以及2个8位D/A转换器通道变频设备使用的MTU2和MTU2S电机控制应用的 理想选择。其通信功能包括有助於外围设备通信的I2C总线介面通道和具有16级FIFO的4通道串列通信介面。外部数据总线能够支持闪存ROM、SRAM、SDRAM、突发ROM、多工I/O,这些都可以通过总线状态控制器进行设置,使各种存储器能够进行直接连接而无须使用外部元件。D、picoChip公司picoArray多重核心处理器 图8 picoArray多重核心处理器阵列元件原理 其中,PC202与205亦内建一个性能强悍的ARM9处理器。所有新产品均采用标准C语言或组译语言撰写程式码,让客户能利用其开发完整的软体无线电系统,此外并针对WiMAX(16d与16e)以及WCDMA(包括HSDPA,并能升级至HSUPA)提供完整的参考设计方案。 PC202内建198个数位讯号处理器,以及一个负责控制与MAC功能的ARM 926EJ-S处理器,以锁定各种追求低成本的应用,例如WiMAX客户端系统与存取设备、以及WCDMA毫微微蜂巢式(家用基地台)设备。 PC203内含248个处理器,系专为基地台(BS)应用所设计,能协助业者开发出支援各种热门无线通讯协定的产品,例如WiMAX与HSDPA/HSUPA,包括支援如MIMO与波束成型等先进演算法,C203尚能搭配外部控制处理器或网路处理器,开发出大型基地台产品。 此三款晶片均内建加密引擎,针对高速傅立叶转换/反向高速傅立叶转换、Viterbi、以及涡轮高速解码器(包括符合16e规格的CTC),此功能完全整合至picoChip的互连架构与开发环境,让业者能轻易进行编程、整合、以及验证。 另外,每个处理器均为功能完备的DSP,内含16x16乘数器与40位元累加器、内部指令与资料记忆体,采用一套改良式三路超长指令字元(LIW)架构,此意味著处理器可执行乘数-累加(MAC)指令,每个周期最多可处理三个其他指令。PC203与PC205内含的248个处理器,运作时脉达160MHz,即使在针对如Turbo与Viterbi解码与加密作业时,亦能达到约160 GIPS的无线通讯加速效能。 (3)DSP核+协处理器 这类DSP一般针对某一类应用集成专用的协处理器,从而对DSP实现演算法加速。TI的研究表明,对於像MPEG4编解码这样的任务,使用协处理器可以降低50%的DSP负荷,从而平衡系统功耗。 A、TI公司的高性能数字信号处理器TMS320C6416 B、飞思卡尔MSC8126   ; 图9飞思卡尔MSC8126内部功能该DSP在最先进的90nm工艺下生产,在400MHz主频下,其4个扩展内核可以达到最高每秒6400MMAC(百万次乘加操作)的性能。除了每个DSP核内包含228KB的M1存储器之外,片内还集成了476KB的共用M2存储器。支援可变长指令是该DSP的另外一个特点。 4、DSP展望 Forward Concepts的Will Strauss表示∶DSP技术的演绎趋势是多重核心处理器。未来10年,全球DSP产品将向著高性能、低功耗、加强融合和拓展多种应用发展,DSP晶片将越来越多地渗透到各种电子产品当中,成为各种电子产品尤其是通信类电子产品的技术核心,将会越来越受到业界的青睐。 据TI预测,到2010年,DSP晶片的集成度将会增加11倍,在单个晶片内将能集成5亿苹晶体管。目前DSP的生产工艺已开始从0.35mm转向0.25mm、0.18mm,预计到2005年,DSP晶片的工艺将达到0.075mm的更高水准,届时,将能够在一块仅有拇指大小的单个晶片上集成8个DSP内核。
|
|
|
|
|
[DSP数字信号处理] 相关文章: X-Digital采用Blackfin处理器为MDU客户传送多达384个数字音频通道简介: 美国模拟器件公司发布X-Digital 系统公司——一家广播传输系统制造商——在其带有FM调制器的集成卫星接收器中采用了ADI公司的Blackfin®处理器。X-Digital系统公司采用Blackfin处理器,提供了这样一种产品,允许卫星运营商将数字音频传送到远远还没有打开的市场——多住户单元(MDU),例如酒店和公寓大楼。X-Digital公司的卫星接收器将数字卫星信号转换成可被标准的消费类音频接收器识别的...... 中国下一代龙芯有望年底流片 用Xtensa可配置处理器实现高性能低功耗系统 用FPGA动态探头与数字VSA对DSP设计实时分析 芯原发布符合业界标准ZSP处理器的ZView开发环境 |
|
|
|