CN201811086181.9 一种基于声源定位的自适应语音分离方法

发布者：张永姣发布时间：2026-06-04浏览次数：12

专利号：CN201811086181.9

专利名称：一种基于声源定位的自适应语音分离方法

申请日：2018-09-18

专利类型：授权发明

支付方式：面议

支付标准：面议

所属分类：人工智能

项目详情：本发明提供一种基于声源定位的自适应语音分离方法，涉及信息处理技术领域。包括：采集被观测环境音频信号，确认声音源个数和每个声音源的波达方向；生成降维矩阵P；生成语音传递矩阵和延迟叠加波束系数；判定频率点处的活跃声源并分离语音成分；获取得到的语音成分并将未激活声源成分置零；得到各个声源的时域语音信号。本方法通过声源定位技术获得当前环境下的声源数目与方位，配合PCA白化技术对语音信号的各个频段进行降维获得初始分离矩阵，通过频率点激活声源数目自适应的使用波束形成技术与FDICA技术分离各个声源通道的频率成分还原各个语音成分，获得的信噪比提升特性更高，具有更好的噪声抑制性能，适用于真实语音环境下的任意声源情形。

联系人：孙聪

电话：83671445

邮箱：dbdxzscq@mail.neu.edu.cn

CN201811086181.9 一种基于声源定位的自适应语音分离方法

友情链接