基于波束形成的声源定位方法研究开题报告

 2023-11-30 09:03:52

1. 研究目的与意义

声源定位技术是阵列信号处理领域的研究热点,其利用麦克风阵列来采集声源目标信号,解决了单个麦克风采集声音信号容易受到噪声和混响干扰的问题,接着对采集到的声音信号进行处理,包括信号放大、模数转换和数字滤波,并使用声源定位算法对滤波后的数字信号进行处理得到声源目标的方位。

在声呐、噪声检测、故障诊断、智能产品等领域具有广泛和潜在应用前景。

基于波束形成的声源定位是声源定位领域常用的算法,其基本思想为采用波束形成技术,调节麦克风阵列的接收方向,在整个接收空间内扫描,能量最大的方位为声源的方位。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

课题的关键问题实现基于波束形成的声源定位仿真实验,难点有三方面:

首先为算法的合理选取。常见的基于波束形成的声源方位角估计算法有延迟相加算法,最小方差无失真响应算法,可控响应功率相位变换法等,上述算法具有差异性,在不同场景下的性能有所区别,需要根据实际应用场景选取合理算法,这就要求对上述算法原理和性能有较为充分的了解。

其次为声源定位任务的实现。声源定位任务包含到达方向估计和距离估计,其中方向估计主要包括方位角与俯仰角,这要求需要较强的编程能力,使用MATLAB仿真算法模型。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

三、文献综述(或调研报告)

声源定位是人耳的主要功能之一,人类可以听到频率范围从20Hz到20Khz的声波,人类听觉系统不仅可以检测声音信号,还可以消除噪声和混响,并从多个声音信号中提取有用的信息。人工人类听觉系统主要用来模拟人耳功能,人耳的三大功能为:声音事件检测(SED)、声音类型分类和声源定位(SSL)。声音事件检测系统通过有效消除噪声和回声来检测相关的声音事件。声音类型分类系统主要用于分类不同种类的声音,例如分辨汽车鸣笛声和汽车马达声的区别。声源定位系统通过分析在每个音频传感器(麦克风)处接收的声音信号分量(振幅、频率、相位)的变化来检测声源的方向。

波达方向定位(DOA)是声源定位系统(SSL)中的一个重要方向,准确确定音频源的DOA是许多应用中的关键要素。现有声源定位技术主要分为三大类方案:

方案一:基于可控波束形成技术。该方法对麦克风阵列接收到的语音信号进行滤波、加权求和,然后直接控制麦克风指向,使波束有最大输出功率的方向;基于可控波束形成的定位算法,是早期的一种定位方法。该算法的基本思想是,采用波束形成技术,调节麦克风阵列的接收方向,在整个接收空间内扫描,能量最大的方位为声源的方位。采用不同的波束形成器可得到不同的算法。

方案二:基于到达时间差(TDOA)技术。该算法可以分成两步,首先确定参考阵元,并且根据其余麦克风接收到的声音信号与其进行比较,接着利用声源信号到达不同阵元的时间差做出时延估计,然后根据时延估计的结果进行方位估计。

方案三:基于子空间技术的定向技术。该方法利用求解麦克信号间的相关矩阵来定出方向角,从而进一步定出声源位置。基于子空间技术的声源定位算法,来源于现代高分辨谱估计技术。该方法己经成功地应用到通信、雷达等许多民用和军事领域。以MUSIC算法为代表的噪声子空间类算法,是基于子空间技术的定向技术中最为常用的算法之一,利用子空间的正交特性,具有较强的分辨力。

基于子空间技术的定向技术己经广泛应用于基于麦克风阵列的语音拾取领域,已经发展出了最大熵算法、自回归模型算法、特征值分解算法等。但是这些算法复杂度比较高、计算量大,当声源信号不平稳时的定位效果也不好,而实际中声源信号到达麦克风阵列的各个阵元时大多是不平稳的,最终导致相关矩阵的运算结果产生误差。对于基于到达时间差(TDOA)技术而言,基于时延估计的算法在所有算法中计算最为简单,实现起来比较容易,对麦克风阵列的要求也不高,在一定角度范围内对单个声源的定位效果好,所以被频繁运用于日常科研使用过程中。但是该算法分为两步进行,这就导致第一步时延估计的误差会累积到第二步的角度计算上,使得时延估计的精度受到影响。

综上分析,基于子空间技术的定向技术和基于到达时间差(TDOA)技术都存在一定的局限性,基于子空间技术的定向技术的局限性为对初始搜索值较敏感、需要较大运算量;基于到达时间差(TDOA)技术的局限性为适合于单个声源的定位系统,而对于多声源定位性能较差。而可控波束形成技术可以提高声源定位的精度和可靠性,且可以有效地避免多普勒效应对定位结果的影响,并具有较强的抗干扰性和鲁棒性。

基于可控波束形成算法数学描述如下:

若麦克风阵列有M个阵元,声源信号s(t)=ej2pft

A(θ,φ,f)=1,e-j2πfτ2,e-j2πfτ3,…,e-j2πfτmT

由于波束形成通常处理的数字信号是离散的,所以第1个阵元接收到声源信号可以表示为s(i),其中i表示离散信号的序数,若存在噪声N(i)干扰,各个阵元输出的离散信号序列为:

X(i)=A(θ,φ,f)s(i) N(i)

下图为窄带CBF算法的波束形成器的结构示意图。

图 1 波束形成器

因此窄带常规波束形成算法(CBF)的输出功率为:

PCBF(θ,φ,f)=E|y(i)|2=WH(θ,φ,f)R(i)W(θ,φ,f)

其中,E()表示数学期望,R(i)为空间信号协方差矩阵。

参考文献

[1] 杨秀庭,孙贵青,陈新华等,矢量水听器阵列MVDR波束形成器的性能研究[J]。应用声学,2007。

[2] 褚志刚,周亚男,王光健等,基于声压球谐函数分解的球面波束形成噪声源识别。[J] 农业工程学报,2012,28(S1)

[3] 郑思明,黎远松,陈新华等,改进的最小方差无畸变响应波束形成的方法[J] 。上海交通大学学报,2016,50(2).

[4] MORIOT J,MAXIT L,GUYADER J L,et a1.Use of beamforming fordetecting an accoustic source inside a cylindrical shell filled with a beavyfluid[J].Mechanical Systemsamp;Signal Processing,2015,52-53.

[5] PORTEOUS R,PRIME Z,DOOLAN C J,et a1,Three-dimensionalbeamforming of dipolar aeroaccoustic-source[J],Journal of Sound andVibration,2015,355

[6] 刘哲, 陈日林, 滕鹏晓,等. 基于平面传声器阵列的声源定位系统[J]. 声学技术, 2011, 30(2):6.

[7] 刘红宁, 李志尊. 基于移动机器人的声源定位系统[J]. 四川兵工学报, 2009, 30(004):77-79.

[8] 陶巍, 刘建平, 张一闻. 基于麦克风阵列的声源定位系统[J]. 计算机应用, 2012, 32(5):3.

[9] 邢超, 陈克安, 张成. 一种适用于低信噪比条件的DOA估计方法[J]. 声学技术, 2010(4):5.

[10] Dong A ,Shoujue W , 安冬,et al. A DOA Estimation Method Based on Biomimetic Pattern Recognition基于仿生模式识别的DOA估计方法[J]. 电子与信息学报, 2004,26(9):1468-1473.

[11]金梁, 殷勤业, 汪仪林. 广义谱相关子空间拟合DOA估计原理[J]. 电子学报, 2000, 28(001):60-63.

[12]张志良, 孙棣华, 张星霞. TDOA定位中到达时间及时间差误差的统计模型[J]. 重庆大学学报:自然科学版, 2006, 29(1):4.

4. 研究方案

首先对延迟相加算法,最小方差无失真响应算法,可控响应功率相位变换法做理论分析,从泛用性和算法性能角度阐明可控响应功率相位变换法相对最优的原因。随后使用matlab仿真实现可控响应功率相位变换法,并实现声源的到达方向估计和距离估计。最终分析算法参数和声源条件的关系,研究不同声源条件下的算法表现,并探究不同算法参数对算法性能的影响。

延迟相加算法,最小方差无失真响应算法,可控响应功率相位变换法理论成熟,具有许多学者做过广泛研究。MATLAB强大易用,在仿真声源系统方面具有明显优势,可以较好的实现可控响应功率相位变换法仿真。可控响应功率相位变换法适用声源条件较为广泛,且对算法参数较为敏感,在不同声源条件和不同算法参数下差异较为明显,具有研究价值。

5. 工作计划

第15-16周完成选题,根据毕业设计任务书要求查找基于波束形成的声源定位方法相关文献和资料,理解毕设内容,明确基于波束形成的声源定位方法基本原理。

第17-18周与导师沟通进行课题总体规划,导师下发毕业设计(论文)任务书,学生根据导师的要求进行外文翻译,列出开题报告大纲。

第19 学习MATLAB基础知识,搭建MATLAB开发环境,撰写开题报告。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。