CN201811086181.9 一种基于声源定位的自适应语音分离方法

发布者:张永姣发布时间:2026-06-04浏览次数:12

专利号:CN201811086181.9

专利名称:一种基于声源定位的自适应语音分离方法

申请日:2018-09-18

专利类型:授权发明

支付方式:面议

支付标准:面议

所属分类:人工智能

  

项目详情:本发明提供一种基于声源定位的自适应语音分离方法,涉及信息处理技术领域。包括:采集被观测环境音频信号,确认声音源个数和每个声音源的波达方向;生成降维矩阵P;生成语音传递矩阵和延迟叠加波束系数;判定频率点处的活跃声源并分离语音成分;获取得到的语音成分并将未激活声源成分置零;得到各个声源的时域语音信号。本方法通过声源定位技术获得当前环境下的声源数目与方位,配合PCA白化技术对语音信号的各个频段进行降维获得初始分离矩阵,通过频率点激活声源数目自适应的使用波束形成技术与FDICA技术分离各个声源通道的频率成分还原各个语音成分,获得的信噪比提升特性更高,具有更好的噪声抑制性能,适用于真实语音环境下的任意声源情形。

  

联系人:孙聪

电话:83671445

邮箱:dbdxzscq@mail.neu.edu.cn