简易说话人识别系统的研究及基于Matlab的主要算法实现开题报告

 2022-12-10 10:41:45

1. 研究目的与意义

说话人识别也可以被叫做声纹识别,其任务是研究如何从人的语音中获取说话人的个人信息,进而利用这些获取的个人信息采用建模等方式对说话人的身份做出判断。它是生物特征认证技术中的一种。与传统认证方式相比较,人体生物特征天然能够克服传统认证方式所具有的容易丢失(身份证)或遗忘(密码)所导致的认证失败,更重要的是能克服传统认证方式无法区分持有标志物的冒认者与真正的标志物拥有者而造成的重大安全隐患,而且其具有与生俱来,无需考虑携带等特点。

说话人识别技术以其独特的优点,必然拥有广阔的应用前景。在身份鉴别领域,即使用说话人发出的语音信号进行说话人身份的鉴别,可以用于声控门禁系统,声控智能汽车启动,公司签到,公司权限控制等。在互联网安全领域,考虑到电子商务的蓬勃发展,其对我们的财产安全、人生安全、隐私保护等影响越来越大,而目前电子商务所依赖的互联网上口令密码认证的缺陷也越来越明显,将说话人识别技术应用于登陆或者交易时的身份认证,无疑可以解决这一问题。在司法领域,可以应用声纹识别技术区分嫌疑犯,如持有录音的前提下对大范围的嫌疑人进行声纹识别,从而筛选出该录音的说话者,这在嫌疑人数目较多的情况下尤其有用。此外,在金融领域中,将说话人识别与传统口令认证相结合来对服务使用者进行身份认证,这可以更大程度上保护用户的金融财产安全。除了上述领域外说话人识别技术也可以用于军事等领域。

说话人识别技术起源于上个世纪30年代,当时的研究主要基于人耳对语音的实际识别实验以验证说话人识别技术的可行性或者说讨论语音信号中是否包含个性特征。上个世纪60年代,Bell实验室的L.G.Kesta从视觉观察的角度研究语音信号提出了“语谱图”概念,并进而提出“声纹 '' voice print 这一概念[1]。因此,说话人识别又被称为声纹识别。紧接着VQ、人工神经元网络模型(Artificial Neural Network ANN)与隐马尔科夫模型(Hidden Markov Model HMM)[2]等建模技术被引入说话人识别领域。其中 HMM模型以其在文本相关的说话人识别领域中优秀的识别效果得到了肯定。1995年 Reynolds将高斯混合模型(Gaussian Mixture Model GMM)引入说话人识别并指出其与HMM有着一脉相承的关系[3]。由于高斯混合模型在文本无关的说话人识别领域中具有极其优秀的识别性能,并有着简单,易懂,具备一定的鲁棒性等特点,成为了文本无关的说话认识系统中最主流的技术之一[4]。与此同时,特征领域的改进也在不断进行。1979年Atal指出了倒谱域对声学特征的研究优势[5]。而语音信号的线性预测系数-----线性预测倒谱系数Mel频率倒谱系数等经典特征参数的突出,使得实验室环境下的说话人识别开始走向成熟。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容与预期目标

研究内容:

本课题主要研究说话人识别技术,说话人识别技术主要包含以下四个模块:

1. 语音信号预处理模块:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究方法与步骤

本课题将使用的两种重要研究方法:

1.本课题将使用梅尔频率倒谱系数(MFCC)作为特征参数进行特征提取工作:梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)是语音信号处理中最常用的语音信号特征之一。实验观测发现人耳就像一个滤波器组一样,它只关注频谱上某些特定的频率。人耳的声音频率感知范围在频谱上的不遵循线性关系,而是在Mel频域上遵循近似线性关系。梅尔频率倒谱系数考虑到了人类的听觉特征,先将线性频谱映射到基于听觉感知的Mel非线性频谱中,然后转换到倒谱上。

2.本课题将利用矢量量化对提取的语音MFCC特征进行压缩:VectorQuantization (VQ)是一种基于块编码规则的有损数据压缩方法。事实上,在 JPEG 和 MPEG-4 等多媒体压缩格式里都有 VQ 这一步。它的基本思想是:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] 郑方,李蓝天,张慧。等.声纹识别技术及其应用现状[J].信息安全研究,2016

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

3.2-3.20 理解课题任务,查阅资料,完成开题报告;

3.23-4.10 深入研究课题要求,研究说话人识别技术的最新进展;

4.13-4.30 按照课题要求选择合适的特征提取和识别技术,并初步实现;

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。