登录 免费注册 首页 | 行业黑名单 | 帮助
维库电子市场网
技术交流 | 电路欣赏 | 工控天地 | 数字广电 | 通信技术 | 电源技术 | 测控之家 | EMC技术 | ARM技术 | EDA技术 | PCB技术 | 嵌入式系统
驱动编程 | 集成电路 | 器件替换 | 模拟技术 | 新手园地 | 单 片 机 | DSP技术 | MCU技术 | IC 设计 | IC 产业 | CAN-bus/DeviceNe

新型ISD语音组合电路设计与应用

作者:peixifeng 栏目:IC产业
新型ISD语音组合电路设计与应用
    现代电子、电器产品及设备的智能化水平不断提高,在人机界面设计上不但有了文字标识、发光管指示、显像屏显示等视觉表达,而且还有各种听觉表达,如最简单的“滴滴、嘟嘟”讯响声、稍丰富些的音乐声、甚至用人的语言直接对用户“说话”等。用简单的数码语音集成电路可以实现一句或多句语言的播放,如掩模芯片中的“欢迎光临”、“有电危险,请勿靠近”等,还有如ISD系列、APR9600(IVS1560)等芯片可由开发人员或用户任意录制、播放需要的一段或几段语音等。在听觉表达中最复杂的就是语音的组合,它是将用户预存的多段语音选择顺序连续播放,将字或词素组合成一句话、甚至一段话播放出来,从而实现最准确、定量的语义表达,例如“嘟,现在温度37.5度,温度偏高”、“现在时间五点二十五分三十三秒”等。
   传统语音组合电路的设计十分复杂,开发工具十分昂贵,语音录制及软件编制工作量巨大,而且组合出来的语音效果也不甚理想,尤其在投资不大的产品、系统中最为突出,从而制约了这一技术的应用和发展。只是在近一、两年来,模拟存储语音技术的ISD芯片及其廉价的开发编辑工具问世后,情况才大为改观。现在已有专业公司开发出通用ISD语音组合模块,用户只需要在ISD语音芯片中分段录入要求的词素,即可方便地用单片机控制输出这些词素的任意组合成句、成段,词素的语音容量从20秒至480秒,甚至更长,以至可以容纳所有的中文汉字发音。下面介绍一种用途最广泛的通用语音组合模板的设计与应用。
工作原理
  ISD1420是采用模拟存取技术集成的可反复录放的20秒语音芯片,掉电语音不丢失,最大可分160段,最小每段语音长度为125ms,每段语音都可由地址线控制输出,每125ms为一个地址,由A0~A7八根地址线控制,地址语音控制表如附表所示。用户录制的语音每一段结束后芯片自动设有段结束标志(EOM),芯片录满后设有溢出标志(OVF),一片分段录好音的ISD1420芯片语音地址结构如图1所示。如果用单片机等控制电路按某一段的起始地址进行放音操作,遇到段结束标志(EOM)即自动停止放音,单片机收到段结束标志(EOM)就开始触发下一段语音的起始地址,如此控制,即可以将很多、不同段的语音组合在一起成一句话放音出来,实现语音的自动组合。
 用户可以先通过专用的ISD1425语音编程拷贝机将需要的语音分段编程、连续录制到芯片中,每段语音的长度不限,制成语音源片后,将源片的录音端封住,不让其再做录音操作,再由单片机电路控制放音。首先,单片机将ISD1420语音芯片完整搜索一遍,自动找出每一段的起始地址,按分段顺序编号存入外置的串行存储器中;然后用户通过单片机串口发出指令,单片机即将这些段的编号、地址一一调出,依次向语音芯片发出首地址、放音该段、该段结束,单片机收到EOM标志。单片机发出下一段语音的首地址,如此循环,直到要求的一句话合成完毕。
   这种控制方式有较强的通用性和方便性,不需要事先规定每段语音的时间长度、总段数,甚至不需要知道每段语音在芯片上的具体地址,只要用户记住录入语音的段顺序即可控制各段语音的自由组合。
电路结构
   图2电路可以很好地实现语音组合。由于其中包含了大量最新的器件和技术成果,如可更换、反复使用的先进数字语音录放芯片(ISD1420),控制灵活功能强大的片内可擦写程序存储器的微型单片机(AT89C2051),非易失大容量I2C串行存储器24C16,低压差微功耗的三端稳压器(HT7251)使输入电源电压范围扩至5~12V,平衡输入单端输出的LM386功放可提供0.5W的喇叭输出,等等。因此,它的功能十分强大,但电路却十分简单,制作出来也仅火柴盒大小,应用十分方便。
首先,跳线开关置于“1-2”学习功能位上,用户按动按键AN,单片机AT89C2051即控制ISD1420语音芯片从头至尾放音一遍,它会将语音芯片中的每一段语音的起始地址都记录到串行存储器24C16中,即完成了芯片搜索操作。然后,跳线开关置于“2-3”组合功能位上,用户可按照RS232标准串口协议向单片机的RX端发送合成指令,单片机即将合成命令翻译成对应的语音芯片中各段语音的起始地址,并控制语音芯片发出需要的语音,一段结束后立刻又播发下一段,如此将一句话合成“说”完。在单片机的TX端将作为忙信号端使用,当有语音输出时该端将保持低电平,空闲时为高电平。
   单片机遵循标准5V的RS232串口协议方式(TX、RX双线,串口方式一、无校验)。协议如下:串口速率为4800bit/s;引导码为AAAA;静音延迟0.5秒为DD(在一句话中停顿一会,起逗号作用);句结束放音存储码为FF(立刻语音合成放音);TX端放音忙信号为低电平有效(空闲为高电平,语音合成放音期间变为低电平输出);数据码为码址与语音段位序号对应,如00为第一段,01为第二段,02为第三段,……每句话最多48段。
   整个电路的电源电压为5~12V,静态电流为13mA,工作电流为150mA,接口电平为5V,外接喇叭为4~8Ω,输出音频功率为0.5W,还可以外接功放机或有源音箱扩音使用。
应用实例
   下面举例说明该语音组合电路的应用。如产品系统中需要一个能实时播报时间和温度的语音单元,经过对所有语句的拆字分析,有以下31段字、词素、提示音需要组合使用:幺(00)、零(01)、壹(02)、贰(03)、叁(04)、肆(05)、伍(06)、六(07)、柒(08)、捌(09)、玖(0A)、十(0B)、百(0C)、千(0D)、万(0E)、温度(0F)、度(10)、正(11)、负(12)、现在(13)、正常(14)、偏高(15)、偏低(16)、上升(17)、下降(18)、号(19)、小时(1A)、分(1B)、秒(1C)、点(1D),嘟(1E)。我们先找专业播音员将这些字词录到磁带上,再转录到多媒体电脑中,其中的“嘟嘟”提示音可从电脑的音效文件中找到,然后通过ISD1425语音编程拷贝机及其电脑软件,将这些语音都按上述顺序分段录入到ISD1420芯片中。如果语音效果不满意可反复重新录制,直到满意后将ISD1420芯片插到本语音组合电路板上,内部语音及分段信息在断电后也能保持100年。
   插上新的语音片后,语音组合电路还需要搜索并存储一次该语音芯片的各段地址,即将语音组合电路板上的跳针置于1-2位置,按一下AN按钮,语音芯片即将内部的语音从头到尾完整播放一遍,放音完毕后即将跳针置回2-3,即可开始组合放音了。
   这样,当我们需要语音单元说“嘟,现在温度126.5度,偏高”时,就可以按照语音芯片中语音段的段位序号和命令格式对本电路单片机的RX端发码:AAAA1EDD130F020C030B071D0610DD15FF。其中“AAAA”表示“下面开始输入放音的段号了”,“1E”是用十六进制表示的语音芯片第31段(十进制),这一段是“嘟”提示音,“DD”是表示此时要暂停放音0.5秒,相当于一个逗号,“13”是用十六进制表示的语音芯片第20段(十进制),这一段是语音“现在”,如此类推都是要播放的各段语音,最后“FF”表示“现在即将上述各段语音顺序播放出来”。代码发完后要合成的语句也就随之播放出来了。
   本语音组合电路设计已广泛应用到工业测量控制、长江水利监测、公安报警系统、智能电话系统、空调机、计价器、银行报号系统、公路收费系统、铁路指挥系统等各种产品系统中。使用该语音组合原理,还可对ISD2500、33000、4003等系列芯片进行控制,实现更长时间的组合。
注:作者简介 周湘峻:现任中青世纪董事长,毕业于湖北大学物理系,1993年只身于北京创立中青世纪公司(www.atvoc.com)多年来一直秉承为客户提供产品服务与技术支持的理念,致力于语音技术的开发与发展  曾发表多篇技术文章,分别刊登在《电子报》《北京电子报》《电子技术应用》《电子技术》《国外电子元器件》等报刊杂志上。现收录部分文章以飨读者。
欢迎来电话垂寻:01062106945-807联系人:裴先生  Email:peixifeng06@sian.com
MSN:peixifeng06@sina.com QQ:609244119   转载请保留原文章否则后果自负。


参与讨论
昵称:
讨论内容:
 
 
相关帖子
电子产品生产对厂房的要求\\求助
请教Hspice中关于calculator的使用
日本人嘲笑:“汉芯一号”造假骗局与中国芯片业“大跃进”的教训
关于一个842贴片IC的问题
有人搞过电子产品的CE,UL认证的吗?
免费注册为维库电子开发网会员,参与电子工程师社区讨论,点此进入


Copyright © 1998-2006 www.dzsc.com 浙ICP证030469号