专利号:CN201811086181.9
专利名称:一种基于声源定位的自适应语音分离方法
申请日:2018-09-18
专利类型:授权发明
支付方式:面议
支付标准:面议
所属分类:人工智能
项目详情:本发明提供一种基于声源定位的自适应语音分离方法,涉及信息处理技术领域。包括:采集被观测环境音频信号,确认声音源个数和每个声音源的波达方向;生成降维矩阵P;生成语音传递矩阵和延迟叠加波束系数;判定频率点处的活跃声源并分离语音成分;获取得到的语音成分并将未激活声源成分置零;得到各个声源的时域语音信号。本方法通过声源定位技术获得当前环境下的声源数目与方位,配合PCA白化技术对语音信号的各个频段进行降维获得初始分离矩阵,通过频率点激活声源数目自适应的使用波束形成技术与FDICA技术分离各个声源通道的频率成分还原各个语音成分,获得的信噪比提升特性更高,具有更好的噪声抑制性能,适用于真实语音环境下的任意声源情形。
联系人:孙聪
电话:83671445
