专利名称 ---【 基于语音分析与合成的高品质实时变声方法 】

基本信息
申请号
CN200410062337.1
申请日
20040706
公开(公告)号
CN100440314C
公开(公告)日
20060111
申请(专利权)人
中国科学院自动化研究所
申请人地址
100080北京市海淀区中关村东路95号
发明人
孟猛;张树武; 专利类型 发明专利
摘要
本发明涉及语音变换技术领域的一种基于语音分析与合成的高品质实时变声方法。在时域上按照时间长度改变的要求对信号进行插值或抽剪,然后变换到频域,对幅度谱和相位谱分别进行处理,分离基频和共振峰,并对其进行独立调节,调节时补偿时间长度调整对此二者的影响,最后恢复时域信号。通过快速傅立叶变换将时域信号转化到频域上,将话音的基频和共振峰位置进行分离,并分别调整,然后重新合成语音,从而调节音长、音高和音色,改变音强,实现嗓音变换。本发明可以实时对语音进行处理,可直接应用于网络电话、语音聊天室等休闲领域,也可用于配音、音乐合成等实用领域。同时,该方法也可以应用语音合成方面,起到改善合成语音整体音质的作用。
主权项
1.一种基于语音分析与合成的实时变声方法,基于傅立叶分析与 合成技术,其特征在于,包括如下步骤:在时域上按照时间长度改变 的要求对信号进行插值或抽剪,然后变换到频域,对幅度谱和相位谱 分别进行处理,分离基频和共振峰,并对其进行独立调节,调节时补 偿时间长度调整对此二者的影响,最后恢复时域信号;其中所述基频、 共振峰位置的调整步骤如下: 步骤S1-1,在时域上按照调整因子t对某一帧进行数据点的插 值或抽剪; 步骤S1-2,变换到频域,并由直角坐标转换到极坐标上,得到 相位谱I和幅度谱II; 步骤S1-3,对幅度谱II提取包络,得到包络谱III,对III在频率 轴上按调整因子t×f进行缩放,得到调整过共振峰位置的包络谱IV, f表示基频调整因子; 步骤S1-4,对幅度谱II点对点除以包络谱III,得到V,将谱V 的横坐标在频率轴上按照调整因子t×p进行缩放,然后点对点乘以 调整后的包络谱IV,得到调整后的幅度谱VII,p表示共振峰位置调整 因子; 步骤S1-5,对相位谱I,与相邻帧的相位差进行展开,得到两 帧之间各频率上相位改变的实际值,该值乘以调整因子t×p,然后 对频率轴按照调整因子t×p进行缩放,将调整后的相位差重新累加, 得到当前帧调整后的相位谱VIII; 步骤S1-6,将调整后的幅度谱VII和相位谱VIII变换到直角坐标, 重新变换到时域。

 

IPC信息
IPC主分类号
G10L13/02

 

法律状态信息
法律状态公告日
20081203
法律状态
授权 法律状态信息
CN200410062337 20081203 授权 授权
法律状态公告日
20060308
法律状态
实质审查的生效 法律状态信息
CN200410062337 20060308 实质审查的生效
法律状态公告日
20060111
法律状态
公开 法律状态信息
CN200410062337 20060111 公开 公开

 

代理信息
代理机构名称
中科专利商标代理有限责任公司 11021
代理人姓名
周国城

 

被引专利信息
引用阶段 被引时间 专利号 申请人 公开时间

 

被引非专利信息
引用阶段 被引时间 被引文档类型 被引文档信息


| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器