赣州市科技成果转化中心稀土新材料及应用分中心

赣州市科技成果转化中心钨新材料及应用分中心

成果案例 详情页
基于 5G 移动通信中 EVS 编码器的语音频带扩展技术
型:应用
业:其它
度:初创成果
方: 信息工程学院
地:江西/赣州
绍:请登录后查看
式:请登录后查看
成果摘要
成果介绍

【成果简介】

为节省带宽资源,在第五代移动通信(5G)中,使用增强型语音服 务(Enhanced Voice Services, EVS)编解码器对语音进行编解码,其编码 效率可以达到 6.6kbps 。但是,以低比特率对宽带语音进行编码时,会出 现较大的失真,从而导致通话质量下降。为了解决该问题,设计一种可 以部署在移动端、并结合深度学习的语音频带扩展方法。该方法通过批 次注意力机制和空间注意力机制来学习语音的上下文信息,修复 EVS 编 码器在低比特率条件下,对窄带语音编码产生的失真,同时恢复语音缺 失的高频部分。以达到节省带宽资源,提升通话质量的效果。

【技术指标】

该方法包含了两种自主设计的注意力机制:批次注意力机制和空间 注意力机制。两种注意力机制有效解决了卷积神经网络无法利用语音上 下文信息的问题。通过和目前语音频带扩展方向主流神经网络模型性能 比较,在对数谱距离(Log Spectral Distance, LSD)、信噪比(Signal to Noise Ratio, SNR)、客观语音质量评估(Perceptual Evaluation of Speech Quality, PESQ)和平均意见得分(Mean Opinion Score, MOS)四项技术指标上均 达到了最优的水平。经过频带扩展后的宽带语音与直接经过编码器编码 的宽带语音相比,在四项技术指标上均有较大的幅度的提升。

【技术成熟度】

该技术目前处于正在研发阶段。 

【应用情况】

考虑到软硬件的适配程度,以及应用场景,该方法目前还处于落地 阶段。伴随着人工智能的快速发展,未来的语音通话中,只需以低比特 率对语音进行编码,就能在接收端获得高质量的语音。不仅能够节省带宽资源,还能降低通话所需的成本。

登录后查看更多信息
登录查看