老古开发网首页
导航:老古开发网首页文章索引索引第2119页文章分类综合电子第360页→[基于OMAP平台的AVS解码实现]
| -文章搜索 - 最新文章 - |

第4511篇:基于OMAP平台的AVS解码实现

发布时间:2006年5月31日 点击次数:787
来源:   作者:杨阳 彭玉华 刘兆广
 

摘    要:本文提出了一种基于OMAP1510和AVS-M标准的实时解码方案。在充分考虑了OMAP1510硬件结构特点的基础上对解码程序进行了优化。
关键词:OMAP1510;AVS;解码器;优化

       H.264,等,具有更高的编码效率和更小的复杂度,同时不需要交纳高昂的专利费用,具有重要的经济价值。在多媒体通信终端设备方面,公司的开放式多媒体应用平台综合了的控制能力与的运算能力,可以实现单一无法完成的更多、更复杂的服务,如实时视频交互等。本文在的开发板上实现了部分,即移动视频的解码,基本满足了实时性和质量要求。

 

 

 

AVS组织为适应数字存储媒体、网络流媒体、多媒体通信等应用中对运动图像压缩技术的需要而制定的,其核心技术包括:×整数变换、量化、帧内预测、精度像素插值、特殊的帧间预测运动补偿、熵编码、去块效应环内滤波等。

16×的亮度样值块和对应的色度样值块。 宏块可进一步划分成最小为×的样本块来进行预测,共有种用于运动补偿的宏块划分方法。

在预测方面,只采用帧和帧,帧最多可有两帧参考图像。定义了种亮度块帧内预测模式和种色度块帧内预测模式。在帧间预测的运动矢量方面,都采用像素精度的运动补偿技术,但相对于采用的抽头滤波器,采用水平抽头和垂直抽头滤波器进行半像素插值和像素插值,增大了插值精度。亮度解码时,首先进行样本和样本的插值,然后根据运动矢量得到相应的参考样本。色度样本插值使用对应亮度块的运动矢量,利用被插值样本周围的个整数样本值进行线性插值。

AVS-M嫡编码过程中,所有的语法元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流。标准对于帧内编码块亮度系数、帧间编码块亮度系数和色度系数分别定义了多个变长码表。根据解析所得语法元素的值,通过查变长码表可以得到量化系数值和量化系数游程。解码得到一个系数值和游程后,下一个解码量化系数所参考的码表将根据前一个解码量化系数值进行选择。

 

DSP 核与控制性能强的微处理器结合起来是一种开放式、可编程的基于的体系结构如图所示。


图1  OMAP1510结构框图

ARM核、核以及流量控制器组成。

ARM925 核,工作主频为。它包括存储器管理单元、的高速指令缓冲存储器、的数据高速缓冲存储器和个字的写缓冲器。片内有的内部为液晶显示等应用提供大量的数据和代码存储空间。它有个内部中断和个外部中断采用两级中断管理。此外,核内还有协处理器和保护模块。内核采用阶管道化流水线、处理器架构的体系结构。系统中的控制寄存器可通过对协处理器的读写来对和读写缓存控制器进行存取操作。具有项的转换旁路缓存器用于指令和数据流每项均可映射存储器的段、大页和小页。

200MHz。它具有高度的并行能力,位读写和功能强大的, 双流水线的独立操作以及双的运算能力,它采用了三项关键技术增大的空闲省电区域、变长指令和扩大的并行机制。其结构对于多媒体应用高度优化适合低功耗的实时语音图像处理。

1/ 2 像素插值的硬件加速器降低了视频处理的功耗,其结构对于多媒体应用高度优化,适合低功耗的实时语音图像处理。核内部有的双存取的单存取的高速指令缓存。此外核内还包含存储器管  理单元、两级中断管理器和直接存储器访问单元。


 图2  基于OMAP的AVS-M程序流程框图

OMAP 可以建立两个操作系统一是基于的操作系统等,二是基于。连接两个操作系统所使用的核心技术是桥。支持多种实时多任务操作系统在微处理器上工作用来对进行实时多任务调度管理进行控制和通信。桥包含管理器、管理服务器、和外围接口链接驱动器。桥提供运行在上的应用程序和运行在上的算法之间的通信管理服务。开发者可以利用桥中的应用编程接口,控制在中实时任务的执行,并同交换任务运行结果和状态消息。在这个环境下,开发者可以调用局部网关组件来完成诸如视频、音频和语音等功能。

    耗时(指令周期)
  SDRAM 到 DARAM 1041
DMA DARAM 到 SDRAM 620
  SDRAM 到 SDRAM 1621
  SDRAM 到 DARAM 1893
Memcpy() DARAM 到 SDRAM 2168
  SDRAM 到 SDRAM 3282

表1 DMA与非DMA方式传输耗时比

OMAP上的软件实现

OMAP1510上的程序结构

上开发程序通常分为两部分,一部分是端,负责控制、显示等,另一端是端,主要负责数据处理,本文采用提供的在这两端分别开发,程序流程如图所示。    

OMAP1510芯片,包括等的时钟设置,的开启关闭以及复位,、定时器等各个外设的初始化。在启动完成后,就一直查询共享内存中的某一标志位,当查询到一帧解码结束时,就启动专用,在上显示。

AVS-M码流的解码。本文将码流放置在中。与基于的解码程序的主要区别在于,由于的片内内存有限,所以不可能将当前帧以及参考帧都放在片内,所以,以宏块为单位在与片内内存之间进行数据传递。另外,由于在液晶屏上显示需要转换成图像,所以,在每一帧结束后,要通过来实现实时显示。

程序优化的主要过程

本文采用标准语言,一方面是出于可移植性的考虑,另一方面是由于编译器效率不断提高。但是,仅仅依靠编译器的优化是远远不够的,还可以采用以下手段进行优化:

DMA将片外数据导入片内。如前文所述,广泛采用了,用于与片内内存之间以及内部的数据交换。不占用时间,相当于并行操作。表列出了命令与等待状态下的耗时,移动的数据为数。   

由表可以看出,采用方式只需要直接传输时间的,所以,即使在传输过程中完全处于等待状态,也比对内存的直接操作要高效得多。

DSP的通信机制问题。提供了两种通信方式,一是采用中断方式,另外一种是采用共享内存查询方式。方式的优点是实时性强,缺点是数据量小,查询方式可以一次性传递大量数据,但是要通过查询某一位共享内存来实现,实时性较差,所以,一般是采用两种方法结合的措施,兼顾效率和速度。

DSP时钟。在系统上电复位时,的时钟等于晶振的固有频率,由于采用了数字倍频以及数字锁相环,所以,可以通过设置频率控制寄存器来更改的时钟。具体的原则是在满足系统实时要求的情况下,尽可能低地设置时钟,这是显而易见的,因为高的时钟频率必然带来大的系统能耗。

DMA。采用系统的专用,可以使系统独立出来,可以执行操作系统的任务,同时,采用也比直接移动指令更为有效。

C55x内部固定的指令。 这些指令由优化的汇编代码写成,可以显著提高代码执行的效率,包括乘法,取最大最小值等,使用一般可以提速左右。

DSP采用大端模式,端采用小端模式组织数据,所以,在采用共享内存时,存在模式转换的问题,通过的大小端转换模式,寄存器自动转换。另外,端能够处理位、位、位、位的数据,端能够处理位、位、位、位数据。型变量在端是位,在端是位,要注意数据格式的比较。

(16位,采用位的数据总线,所以采用位的数据宽度是最高效的。也支持位数据,这样,数据得到了一倍的压缩,但每次取操作数都要进行高低位选择。以宏块为单位进行操作时,实际上用到的空间并不大,而速度是更关键的问题,所以将原始的码流统一以位置零的格式进行存放与计算。

restrict关键词进行编译,得到更为高效的循环解决方案,以下面一段代码为例,功能是相同的:

loop((int*)0x2600,(int *)0x2700,0x100);

void loop(int * restrict i,int * restrict j,int counter)

 

*(j++)=*(i++)+*(j++);

 

 耗时个时钟周期

 

{

*((int *)(j++))=*((int *)(i))+*((int *)(j++));

}

耗时个时钟周期

两者相差倍,因此,尽量采用对循环的优化策略成为系统加速的关键。

C55x采用了位的数据,所以寄存器也是位的,经常会出现边界的问题,例如开辟一个数组,当数组元素到达时,下一个并不是到达,而是回到,即便采用型定义数组元素个数也是如此。所以,本文采用型指针,采用绝对地址间接寻址的方式来解决这个问题。

DARAM中,同时,使能指令可以有效加速执行速度。

TI 公司提出的体系结构开放性好在这种体系结构下编写的程序移植方便,适合于多媒体平台的应用。的结合,在移动通信与多媒体信号处理方面将有良好的应用前景。■


欢迎进入老古论坛进行讨论
[综合电子] 相关文章:
ThinkPad被指设计缺陷 联想否认有质量问题
简介:
  新浪科技讯 4月27日晚间,联想公司就Thinkpad T60以及X60两款笔记本被指存在设计缺陷而采用“飞线”作出回应,声明在整个业界,这是新品上市时的正常现象,不会影响客户的正常使用。该公司新闻发言人称,由于不存在质量问题,目前不会对此进行召回或其他类似处理。   这是联想自2004年联想收购IBM PC业务后,ThinkPad笔记本首次遭遇类似指责,此前,ThinkPad一直以品质优秀、设计精良成为业界典范。   这两款被怀疑存在设计缺陷的笔记本,缘于采用了板卡处理......

Silicon Image公司为东芝提供HDMI发送器
三菱电机多款新品抢眼IAC,TME+SENSOR2006
浙大中控5月12日于沪上成功举行WebField ECS-100X控制系统新产品发布会
X20,APC620——贝加莱新品发布
 
下一个:[芯片介绍]频谱分析带通滤波器
简介:
摘 要: 本文介绍了BA3826S芯片的结构和性能特点,给出了一个在音响中的应用实例,阐述了软件设计思路并提供了程序流程图。 关键词:BA3826S;PT6311; VFD 图1 硬件电路图 的结构和性能特点 具有用于频谱分析的 个带通滤波器,所有滤波电容都内部集成,以使外围附件最小化。另外,还具有低电流损耗 典型 。 50k , 控制逻辑设定在 典型 ,可以通过单片机对 、 引脚的置位来选择......

上一个:[EDA/IC设计]Mentor软件在高速ADC板设计中的应用

老古开发网版权所有 2006年9月 asp.Net V2.0 设计:老古
页面缓存:30分钟 执行时间:78毫秒