基于能量语音端点检测的说话人识别开题报告

 2023-08-03 08:55:41

1. 研究目的与意义

一、选题背景与意义(300字左右)随着云计算,大数据时代的到来,移动环境下的多模态自然人机交互,包括面向服务机器人的语音交互需求,对话系统及安全验证系统,都对当前的说话人识别技术提出更大的挑战。

互联网时代对数据分析提出了更高的要求,分析的颗粒度越来越小,对用户行为数据的分析也越来越关键。

得益于丰富多样的终端存储与处理,语音作为人类获取信息最有效、最自然的方式,其采集保存与应用变得越来越方便,智能语音交互和安全验证受到更为广泛的关注。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

本设计将实现基于能量语音端点检测的说话人识别关键问题:1.在端点检测中短时能量作为唯一的语音特征,是最简单的一种方法,我们只需要确定一个能量阈值,任一帧的短时能量只要小于这个被确定的阈值就认为是静音。

然而如何确定一个好的阈值并不简单,最好的方法是用已标识端点的语音信号数据作为训练数据集去计算出最好的阈值。

实现了基于短时能量的语音信号端点检测,它通过选择合适的短时能量阈值来进行端点检测。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

根据实际应用的不同,语音识别系统可分为:特定人识别和非特定人识别、独立识别单词和连续单词,小词汇量和大词汇量,词汇量无限。

但无论哪种语音识别系统的基本原理和处理方法一般相似。

查阅了一种新的鲁棒语音端点检测方法在护理环境中[1] ,准确的端点检测是提高语音识别精度的关键。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

该方案通过以下步骤实现:语音激活检测(VAD)的作用是检测当前输入信号中是否有语音,它的输入是输入信号本身和AMR编码器计算出来的参数集,VAD用这个信息来决定每20ms语音帧中是否包括语音。

在VAD没有检测到语音的情况下,AMR采用8种速率之外的低速率噪声编码模式,以节省移动台的功率,降低整个网络的干扰和负载。

此外,当语音帧由于传输错误而丢失时,为了使接听者感觉不到丢帧,应完成丢帧和错帧的消除,并用预测的参数集进行语音合成。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

2022-2022-1学期:第15-16周:完成选题,查阅相关中英文资料。

第17周:与导师沟通进行课题总体规划。

第18-19周:导师下发的毕业设计(论文)任务书,学生根据导师的要求进行外文翻译,列出开题报告大纲,进行开题报告的撰写。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。