论文网首页|会计论文|管理论文|计算机论文|医药学|经济学论文|法学论文|社会学论文|文学论文|教育论文|理学论文|工学论文|艺术论文|哲学论文|文化论文|外语论文|论文格式
中国论文网

用户注册

设为首页

您现在的位置: 中国论文网 >> 艺术论文 >> 声学论文 >> 正文 会员中心
 艺术理论论文   影视论文   音乐论文   美术论文   声学论文
声控点歌mp3技术说明

声控点歌mp3技术说明

   mp3播放器由于其方便携带、价格适中、时尚前卫等原因备受青年音乐爱好者的推崇,市场上的mp3播放器的销售一直保持非常旺盛的态势。使用者除了对mp3的品质、价格、外观等方面有各种各样的要求之外,还都希望自己所拥有的mp3具有更大的容量以便存储更多数量的音乐。当前市场上主流的mp3存储量是512m,很多品牌包括ipod等大容量的音乐播放器(硬盘mp3)其存储量是以多少个g的单位来计算的。以每首mp3音乐文件大小大约5m来计算,主流mp3可以存储100首以上的音乐,硬盘mp3更是可以存储上千首歌曲。在这些音乐中选择自己喜欢的曲目来播放,对于体积小巧的设备来说,需要很麻烦的操作。
  为了解决这个问题,我们设计了具有声控点歌功能的mp3播放器。该播放器和用户之间存在一个语音接口,用户只要说出自己需要的歌名、歌手或音乐风格等,播放器就可以“听懂”使用者的要求进行点歌。这个功能大大的方便了mp3选歌的操作,也使得在某些场合(比如开车的时候)使用mp3或操作不熟练的老人使用mp3等情况提供了另一个便捷、友好的操作方案。本文就对具有声控点歌的mp3进行一些介绍。
  
  一、核心技术说明
  
  声控点歌mp3和普通mp3播放器的区别主要就在于包含了一个具有高语音识别性能的人机语音接口。这个语音接口是基于语本文由论文联盟http://收集整理音处理专用芯片设计的语音识别模块。
  声控点歌mp3播放器中语音识别模块的核心部件是清华大学和德国infineon公司共同设计的语音处理专用芯片unispeech,unispeech芯片可以完成语音识别和语音编解码等语音处理领域的一系列操作。WWW.11665.COmunispeech系列语音处理芯片采用infineon公司0.18微米工艺生产,其中集成了两个核,一个是16bit定点 dsp (oak)。另一个是8bit微控制器(m8051)。双核之间的通信通过芯片内部的双向fifo实现。此外,unispeech芯片中还集成了2路12bit的adc和2路11bit的dac。芯片结构如图1。
  由于芯片内部集成了adc、dac和片上ram等大部分的功能单元,因此只需要很少的片外器件就可一实现最终的语音识别模块,这样的模块方案体积小、成本低,适宜在mp3播放器中实现。
  声控模块的语音识别采用的是基于音素的声学模型,在识别过程汇中使用连续马尔科夫模型(hidden markov model, hmm)方法。基于音素模型的语音识别系统主要的优点包括:识别性能高、模型参数的规模不随识别任务的变化而变化,可以通过拼接的方式得到识别词表中各词条的识别模板,特别适合中文普通话的识别任务,为当前语音识别的主流技术。目前的硬件处理能力已经可以达到识别一千词条语音命令,识别性能基本达到实用要求。图2是一个基于音素的语音识别算法流程。
  在硬件上实现的时候,我们对算法进行了优化使得其识别率不下降的前提下,具有较快的响应时间。算法在安静环境下测得对不同规模词表的识别性能如表1。
  可以看出,采用两级识别结构的基本算法搭建的基于音素的语音拨号系统在识别600词时达到了97.5%的较高的识别率,而平均使用的识别时间仅为0.105倍实时,在语音长度为1.6秒时,响应时间0.24秒。
  
  二、样机菜单功能说明
  
  我们联合深圳eston公司已经开发了具有声控功能的mp3播放器样机,该样机菜单共有8项功能选择:
   1. 音乐模式:用于歌曲名表、播放两种状态切换。
   2. 均衡:分为正常、摇滚、爵士、古典、流行模式等5类风格,用户可根据个人喜好设置音乐风格。
   3. 循环模式:分为单曲循环、所有循环、单次循环;
   ● 单曲循环的功能是只循环播放一首歌曲;
   ● 所有循环的功能是循环播放所有的歌曲;
   ● 单次循环的功能是所有的歌曲只循环播放一次随即停止。
   4. 文件删除:在不与电脑连接时,用此功能可以在mp3上进行删除歌曲文件。
   5. mic精度设置:设置mic的灵敏度,共分5级。1级灵敏度最低,适合嘈杂环境;5级最高,适合安静环境。
   6. 语音提示开关:此功能开启后,点歌后会语音提示是否

转贴于论文联盟 http://www.ybask.com

正确,供用户选择;关闭此功能,点歌后直接播放,通过“备选”键来选择备选歌曲。
   7. 省电模式:开启后将不显示歌词,操作后延时10秒关闭oled背光灯,直到用户重新按键操作,可以延长电池使用时间。
   8. 更新名表:当用户重新更换mp3歌曲内容后,须通过此项操作来重新更新歌曲表,使歌曲表与mp3中歌曲内容相一致,以保证点歌的正确。
  
  三、声控点歌操作设置
  
  作为声控点歌mp3播放器的特点,其声控点歌的操作非常的简便,易学,易操作。
  
   1. 设置好声控选项
   ● 麦克风灵敏度:如果在比较嘈杂的环境,请将灵敏度设置为1或2,但点歌时须比较接近麦克风孔;如果环境相对安静,则将灵敏度设置为3、4或5,此时点歌时不需要离麦克风孔很近,但抗干扰的能力相对较弱。该项功能使得mp3播放器的声控点歌功能不光可以在安静环境中实现,也可以在公共汽车、餐厅、开车时等嘈杂环境中实现。
   ● 语音提示开关:开启语音提示开关,选歌过程较长,但互动性较强,在选出歌曲后,首先会播报歌曲名称,并询问正确与否,回答正确则立即播放该歌曲,回答错误,mp3则选择下一首备选歌曲并播报歌曲名称……;关闭此开关,点歌后,mp3会直接播放歌曲,如果不正确,可按备选键选择下一首备选歌曲。
  
   2. 选择点歌的方式
   ● 使用普通耳机(3.5”插头)或家庭音响欣赏,应使用机身右侧的“点歌”和“备选”键来完成点歌。按“点歌”键后不到1秒会听到“嘟”的一声,表示系统已经准备好了,此时可以说出想听歌曲的名称,系统将会在不到1秒的时间内选出歌曲。“备选”键用于在4首备选歌曲中选择歌曲,每按一下进入下一首。
   ● 使用线控耳机(2.5”插头)欣赏,可使用线控耳机上的“快捷点歌”键完成点歌,长按此键可以完成“备选”操作。
   3. 备选(根据语音提示开关的设置,进行不同的操作)
   ● 互动问答方式(语音提示开):
  播放歌曲名,询问“正确还是错误”,用户直接按“播放”键或听到“嘟”声后回答“正确”,进入歌曲播放;如果不是想听的歌曲,可直接按“备选”键或听到“嘟”声后回答“错误”,选择下一首备选歌曲直到正确。如没有正确备选,可再按“点歌键”进行新一轮的点歌。
   ● 简洁方式(语音提示关):
  直接播放歌曲,如果不是想听的歌曲,直接按“备选”键,会自动播放下一首备选歌曲。转贴于论文联盟 http://www.ybask.com
  • 上一篇艺术论文:
  • 下一篇艺术论文:
  •  作者:佚名 [标签: 声控 声控 声控 声控 声控 技术 声控 ]
    姓 名: *
    E-mail:
    评 分: 1分 2分 3分 4分 5分
    评论内容:
    发表评论请遵守中国各项有关法律法规,评论内容只代表网友个人观点,与本网站立场无关。
    声控技术给你带来意想不到的方便
    且谈建筑节能与建筑噪声控制
    基于建筑节能与噪声控制基础上的建筑设计探…
    居住建筑设计中的噪声控制分析
    无锡新区金融服务区大厨房燃气噪声控制措施
    试论建筑设计中综合考虑建筑节能与建筑噪声…
    建筑设计中综合考虑建筑节能与建筑噪声控制…
    基于噪声传递原理对齿轮箱噪声控制方法研究
    首个声控U盘 声音加密你的文件
    生产“光声控音乐蜡烛”创富无限
    声控闪烁灯的制作
    基于AT89C51单片机的声控LED彩灯的设计
    | 设为首页 | 加入收藏 | 联系我们 | 网站地图 | 手机版 | 论文发表

    Copyright 2006-2013 © 毕业论文网 All rights reserved 

     [中国免费论文网]  版权所有