老古开发网首页
导航:老古开发网首页文章索引文章分类消费类电子→[电视机智能声控选合系统设计与实现]
| -文章搜索 - 最新文章 - |

电视机智能声控选合系统设计与实现

发布时间:2006年6月13日 点击次数:424
来源:电子技术应用   作者:长沙国防科技大学电子科学与工程学院(410073)胡延平 陈 强 谷鸿林
 

    摘要:介绍了一种基于专用语音识别芯片TSG410的彩电智能声控选台系统,可以在不对彩电做任何改动的基础上,实现语音遥控电视机。

    关键词:语音识别  彩电遥控  智能声控选台

随着电视频道数目的日益增多,传统的电视遥控方法弊端越来越明显。它需要观念记忆大量电视台对音识别芯片TSG410设计了一个彩电智能声控选台系统,可以较好地解决记忆频道这个难题。尤其对列疾朋友来讲,更具有特殊的意义。

该系统不对彩电做任何改动。在保留原有遥控功能的基础上,实现语音控制选台,主要功能有:

·开关电视:电视接通电源处于待命状态,操作者发出“开机”命令,则打开电视机;操作者发出“关机”命令,则关掉电视机;

·选台功能:操作者想看XX电视台的节目,只要发出“XX台”的命令,电视机自动跳转到该台。

·识别主人功能:日防止识操作,该系统只能事先录入命令样本的操作者语音敏感,其他人发出的命令包括电视伴音均无效。

·其它功能:具有电视音量、画面亮度调节等适合语音控制的功能。

1 系统设计方案

我们最初考虑了两种设计方案(见图1和图2),它们各有优缺点。第一种电路不足之处是:电路稍复杂一点,而且要对电视机的选台控制电路做必要的改动(当然这对电视机生产厂家是不成问题的);其优点是:只需一个无线话筒便可声控选台,且不必对准电视机,甚至在另一个房间也可实现遥控。第二种电路的优点是:不必对电视机的选台控制电路做任何的改动;缺点是:所有电路只能靠电池供电,芯片选择要考虑耗电和工作电压问题。由于采用红外遥控发射来控制电视,该系统须对准电视机才能正常工作。综合考虑各方面因素,我们认日第二种设计方案切实可行。

2 各个功能模块简介

2.1 语音命令提取单元

语音命令提供该单元(如图2)在电视话音和其它噪音背景下,完成提取出操作者语音命令功能,其示意图如图3所示。

MIC选用驻极体送话器,它具有结构简单、重量轻、体积小、频率响应宽、保真度好等优点,但灵敏度较低,必须再加放大器才行。由于输出阻抗可高达10 8Ω数量级,所在必须进行阻抗变换后才能与放大器配合使用。放大器采用差分放大电路,一个驻极体送话器面对送话者,其输出接送放大器正向输入端;另一个驻极体送话器背对送话者,其输出接放大器负向输入端。由于两个送话器相对于电视机和其它噪声源的位置基本一样远,可以近似认日通过二者输入的干扰是一样的。但考虑到送话器具有方向性,前者送入的操作者语音命令远远大于后者,适当选择各电阻值可以抵消掉各种干扰。放大器采用运放(OPAmps)MAX495(单电源供电+2.7~+6V)。

2.2 语音识别单元

语音识别单元主要由TSG410和非易失性SRAM组成,大体构成如下图4所示。

语音识别功能由专用语音芯片TSG410完成,TSG410是一种新颖功能齐全的语音识别集成电路。它采用CMOS大规模集成电路制作工艺制造,内含除SRAM以外语音识别所需的全部电路,如CPU、A/D转换器、ROM、语音放大器、压缩器、滤波器、振荡器及接口电路等。TSG410具有双列直插和贴片两种封装方式,可工作在CPU控制和人工控制两种模式下。语音识别的响应时间典型值日300ms,最长不超过600ms。

识别容量大,最多可识别40个字段,且分段方式灵活。为了CPU管理方便,将40个字段分成四组,编号为1~4,每组10个段。这样,第一个字段编号为10,第二个为11,第三个为12…依次类推,第40个字段编号为49。在操作显示时,十位数显示组号,个位数显示序号。因此,建立语音样本时,应注意显示数字和电视机选择频率之间的换算关系,以免语音命令和控制结果对应不起来。各段功能分配如表1所示。

表1

字段号 功能分配 40字段 打开电视 41字段 关掉电视
10~19 对应电视机0~9频道 42字段 上一个台 43字段 下一个台
20~29 对应电视机10~19频道 44字段 声音调高 45字段 声音降低
30~39 对应电视机20~29频道 46字段 亮度调高 47字段 亮度调低
40~49 留作特殊功能键 48字段 关掉声音 49字段 打开声音

TSG410的每个字段时间长度可以在0.9s和1.92s之间选择。按正常人的讲话速度,每秒吐字2~4个,如选择0.9s,则每个命令字段以1~3个字为宜,选择1.92s则最大容量为8个汉字,但可识别的字段数减少为20个。我们选择胶一种分段方式,语音命令以3个字以下为宜。因此,电视选台命令采用“地方”命名原则,如:山东、上海等,中央台可直接叫“一台”、“二台”,依次类推。语音命令差别越大越不容易出现错误识别。系统要正常工作,必须首先建立语音样本,为防止语音样本因为掉电丢失,SRAM选用内带掉电保护电池的非易失性SRAM,即NVSRAM(non-volatile SRAM),如HK1125,掉电后其数据可保存10年以上,用法同普通RAM。

一般情况下,留有30个预选频道是足够用的。实际上,既可以采用多片TSG410进行频道数和允许操作者人数扩展方式满足各种需要,也可以采用让TSG410工作在CPU控制方式的办法。此时识别容量不受40字段限制,但需增加单片机(如8031)作控制用。

2.3 控制面板

为了能输入字段号,以便建立语音样本,RSG410配置了外接键盘扫描电路。行、列信号的输入、输出口由芯片的S1~S3、K1~K3担当。这样一个三列、四行的键盘共有12个按键,其中十个定义为:0~9数字键,一个定义为:语音样本建立键(TRN),一个定义为:语音样本清除键(CLR)。由于控制面板只在建立语音样本时使用,为防止误操作,应将12个按键用塑料外亮封起来。

2.4 操作指示电路

采用两片数码管和译码驱动电路CC4558组成操作指示电路。在本系统中,操作指示电路作用是:建立语音命令样本时,用于显示存入的字段号;语音命令识别时用于显示识别结果及芯片识别结果的处理报告。

2.5 逻辑控制电路

整个逻辑控制电路如图5所示。TSG410通过D0~D7输出识别结果,必须进行必要的译碱码后,才能用来控制后面的红外发射装置。在电视机的遥控系统中,遥控发射器通过按键,以红外线方式发出各种不同的脉冲编码信息。尤其需要注意其发射编码必须与原来一致,以便兼容。采用电子开关电路模拟手工按键时,必须考虑开关接通时间和两个按键之间的时间间隔问题,以防止信号丢失和“串键”、“并键”现象的发生。通常情况下,全部键位扫描一次的时间小于10~20ms,而入手触及按键的时间最短也在100ms以上,因此在任一按键被按下后,会有多次扫描信号通过,不存在信号丢失问题。所谓“串键”是指在一个键按下之后,又接着按下另一键;而“并键”则是同时按下两键。这两种错误操作发生的根本原因是:每个按键的遥控指令编码需要一定时间才能发射完毕(一般在100ms左右),所以应设法消除。这是我们设计逻辑控制电路时的一个难点,采用脉冲展宽(>40ms)和脉冲延迟电路(>120ms)解决。

2.6 遥控发射电路

红外遥控发射器主要由三大部分组成:一是键盘矩阵,二是发射专用集成电路,三是放大驱动和红外线发射部分。该电路与电视机的特定型号有关,可以根据电视机品牌选用适当的专用红外发射电路。

需要说明的是:由于不同品牌电视机的红外发射、接收电路各不相同,因此它只对兼容电视有效。


欢迎进入老古论坛进行讨论
[消费类电子] 相关文章:
TMS320C542在脱机视频编/解码系统中的应用
简介:
摘要: 介绍利用高速微处理器TMS320C542实现脱机视频编/解码系统的控制核心的方法。这个设计方法利用和扩展了TMS320C542芯片的接口资源,结构清晰、性能高效,成功地满足了视频系统实时处理大量图象数据的性能需要。 关键词: DSP 微处理器 可编程逻辑器件 视频编/解码 ......

利用STR-F6656设计34"彩色电视机开关电源
一个简易型115VAC供电的彩色电视机开关电源
DVB_C机顶盒中的视频信号处理
Coyote数码相机设计
可嵌入心电震发生器的电击系统方案
数字化模糊控制空调系统
内置微处理器的USB音频接口芯片TUSB3200
移动电话设计中的新技术
数字音频放大器改变便携音频的现状
 
下一个:[新闻热点]Intel下月发动价格战 奔腾降幅达60%
简介:
6月9日消息,据外电报道,据英特尔客户透露,为了收复失地,英特尔将于下个月发动一场大规模的价格战,其中奔腾处理器的降价幅度将高达60%。   据彭博社报道,英特尔台湾地区的两大客户技嘉和微星公司高层透露,英特尔已经通知他们,将于7月23日发动一场价格战。   微星公司产品营销经理Alex Lin称,英特尔双内核处理器的降幅将达到15%,而奔腾处理器的降幅居然高达60%。而华旗分析师Glen Yeung此前也表示,英特尔奔腾处理器的降幅将达到61%。   而技嘉产品经理Max Tsai称:“为了夺回失去的市场份额,英特尔此次是不惜一切代价。当英特尔客户经理告诉我们降价时,我们......
 

上一个:[新闻热点]TI首款集成式 1394b OHCI 链路层/PHY推出

老古开发网版权所有 2006年9月 asp.Net V2.0 设计:老古
页面缓存:否 执行时间:16毫秒