专利名称 ---【 一种噪声功率谱估计与语音活动性检测方法 】

基本信息
申请号
CN201110141137.5
申请日
20110527
公开(公告)号
CN102800322B
公开(公告)日
20121128
申请(专利权)人
中国科学院声学研究所;北京中科信利技术有限公司
申请人地址
100190 北京市海淀区北四环西路21号
发明人
应冬文;颜永红;付强;潘接林;李军锋; 专利类型 发明专利
摘要
本发明涉及一种噪声功率谱估计与语音活动性检测方法,该方法基于一阶回归的序贯隐马尔可夫模型SHMM描述语音在每一频率分量上的时序相关性,最终推演出语音的在这个频率子带上的出现概率和噪声的功率谱信息,1)对于语音信号在每一个频率分量上提取对数幅度谱包络,并建立一个对应的二元隐马尔可夫模型,每一个状态均由高斯分布表示;2)对于一段语音数据,设定M帧缓存,把前M帧输入信号存入缓存中,提取缓存中M帧的对数幅度谱,采用极大似然估计算法建立一个初始化的模型;3)在得到初始化的模型λM之后,从第M+1帧开始,采用增量学习的方法,逐帧更新每一频带的HMM模型,依次递推得到噪声值和语音信号的出现概率。
主权项
1.一种噪声功率谱估计与语音活动性检测方法,该方法基于一阶回归的序贯隐马尔可夫模型SHMM描述语音在每一频率分量上的时序相关性,并采用增量学习的方式来逐步更新SHMM,最终,推演出语音的在这个频率子带上的出现概率和噪声的功率谱信息,以准确反映语音的时序统计特征,该方法包括下列步骤:1)对于语音信号在每一个频率分量上提取对数幅度谱包络,并建立一个对应的二元隐马尔可夫模型,其中,一个分量表示语音能量的分布,另一个分量是噪声能量的分布,每一个状态均由高斯分布表示;2)对于一段语音数据,设定M帧缓存,把前M帧输入信号存入缓存中,提取缓存中M帧的对数幅度谱,采用极大似然估计算法建立一个初始化的模型;3)在得到初始化的模型λM之后,从第M+1帧开始,采用增量学习的方法,逐帧更新每一频带的HMM模型,依次递推得到噪声值和语音信号的出现概率;所述的步骤3)中的HMM的序贯更新是在建立初始化的模型λM之后,从第M+1帧开始,采用增量学习的方法,逐帧更新HMM模型,其迭代过程可以表述为:在每一个频点上,已知λl和当前的观察值xl,推断λl+1;对于第l+1帧进行傅立叶变换,得到Yl+1,k,其中,0≤k<N;在每一个频点上,计算幅度值对于每一个频点,在l+1帧的参数更新步骤如下:步骤301):计算前向因子,z∈{0,1};步骤302):计算语音和噪声出现概率,步骤303):计算条件转移概率,步骤304):计算平均噪声语音出现概率,步骤305):计算时间依赖平滑因子,步骤306):计算状态均值,步骤307):对新的状态均值进行约束:步骤308):计算新的状态方差,步骤309):对新状态方差进行约束,κ1,l+1=max{κ0,l+1,κ1,l+1},l≥M;步骤310):计算平均转移概率,步骤311):计算状态概率,步骤312):对新的转移概率进行约束,a01,l=max{a01,l,η},a00,l=1-a01,l,a10,l=max{a10,l,η},a11,l=1-a10,l,l≥M;从以上子步骤中,获得了λl+1中所有的参数,从而得到了相应的语音出现概率γl+1|λl(1)和噪声信号的功率谱估值μ0,l+1。

 

IPC信息
IPC主分类号
G10L21/0232

 

法律状态信息
法律状态公告日
20121128
法律状态
公开 法律状态信息
CN201110141137 20121128 公开 公开
法律状态公告日
20130123
法律状态
实质审查的生效 法律状态信息
CN201110141137 20130123 实质审查的生效 实质审查的生效IPC(主分类):G10L 21/02申请日:20110527
法律状态公告日
20140326
法律状态
授权 法律状态信息
CN201110141137 20140326 授权 授权

 

代理信息
代理机构名称
北京法思腾知识产权代理有限公司 11318
代理人姓名
杨小蓉;高宇


| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器