维普资讯
发表评论我要收藏点击“我要推荐”按钮复制地址,将本页推荐给别人看,自己就可以获得积分奖励!点击“我要推荐”按钮复制地址,推荐文章给别人看,自己就可以获得积分奖励。

基于EMD拟合特征的耳语音端点检测

下载全文 在线阅读
[全文大小:257 K]
[在线阅读,第一页免费]

潘欣裕 赵鹤鸣 陈雪勤 徐敏

苏州大学电子信息学院,苏州215021

电子与信息学报
订阅本刊
国际标准刊号:ISSN 1009-5896
国内统一刊号:CN 11-4494

摘  要:

耳语音作为人类发音的一种特殊形式,与正常语音相比具有信噪比低、元音的周期特征不明显等特性,因而耳语音处理比正常语音更为困难。耳语音处理研究的第1个关键步骤就是语音的端点检测,该文利用希尔伯特-黄变换(Hilbert—Huang Transform,HHT)中的经验模态分解(Empirical Mode Decomposition,EMD),首次提出了一种基于EMD拟合特征的耳语音端点检测新方法。利用EMD得到的内禀模态函数(Intrinsic Mode Function,IMF)能量,以其归一化拟合参数为耳语音端点检测的特征,可以准确地划分出耳语音端点。实验表明,该方法在耳语音端点检测中取得了很好的效果,在1200个信噪比为2-10dB的测试样本中,检测准确率为98.25%。[著者文摘]

Journal of Electronics & Information Technology

栏目信息:

论文

分 类 号:

TN912.3

文献标识码:

A

文章编号:

1009-5896(2007)02-0362-05

相关文章:

参考文献(16篇) 耦合文献(73篇)  主题相关

[参考文献]

Endpoint Detection of Whispers Based on the Fitting Characteristic of EMD

Pan Xin-yu, Zhao He-ming ,Chen Xue-qin, Xu Min (School of Electronics and Information Engineering, Soochow University, Suzhou 215021, China)

Abstract:

Whispered speech is the especial form of people's pronunciation. There is lower Signal-to-Noise Ratio (SNR) in whispers and unobvious pitch waveform compared with the normal speech, so it is more difficult to process the whispered speech. The endpoint detection of whispers is the first pivotal step of whispered speech signal processing. This paper uses the Empirical Mode Decomposition (EMD) of Hilbert-Huang Transform (HHT) to solve the problem, and firstly proposes a novel algorithm of endpoint detection of whispered speech based on the fitting characteristic of EMD. Normalize the energy of Intrinsic Mode Function (IMF) obtained by EMD, and use the fitting parameters of the energy as the characteristic and then the endpoint of whispers can be easily divided. The results of experiments show that it is very useful in endpoint detection of whispers, and the accurate rate is 98.25% in 1200 samples (SNR=2-10dB)[著者文摘]

Key words:

Hilbert-Huang Transform (HHT); Empirical Mode Decomposition (EMD); Intrinsic Mode ;nction (IMF); Fitting characteristic of normalized energy

收稿日期: 2006-07-10
修订日期: 2007-01-12

基金资助:

国家自然科学基金(60572076)资助课题.感谢南京大学声学所提供的耳语音数据测试样本.

作者简介:

潘欣裕:男,1981年生,硕士生,研究方向为语音信号处理. 赵鹤鸣:男,1957年生,苏州大学电信学院院长,教授,博士生导师,研究领域为语音信号处理、多媒体处理、神经计算. 陈雪勤:女,1974年生,讲师,博士生,研究方向为语音信号处理. 徐敏:女,1982年生,硕士生,研究方向为语音信号处理.

更多评论>>文章评论
你是匿名用户 登录 | 注册 验证码 刷新
中国业务群个人门户,免费下载!
更多>>相关文章
天元数据 维普资讯 版权所有 Copyright © 2001-2008 cqvip.com Inc. All rights reserved.
渝ICP证 B2-20050021  违法和不良信息举报中心
建议使用:1024x768分辨率,16位以上颜色