全球最实用的IT互联网信息网站!

AI人工智能P2P分享&下载搜索网页发布信息网站地图

当前位置:诺佳网 > 电子/半导体 > 音视频/家电 >

一对一语音聊天场景的技术难点是什么

时间:2019-10-16 10:07

人气:

作者:admin

标签: 语音技术 

导读:一对一语音聊天场景的技术难点是什么-视频聊天时候,因为可以看到彼此,对声音也不那么在意。而纯语音聊天时,人注意力都放在声音上,对音质的要求更高。...

(文章来源:布谷鸟网络科技

视频聊天时候,因为可以看到彼此,对声音也不那么在意。而纯语音聊天时,人注意力都放在声音上,对音质的要求更高。

1)整体稳定的技术,1 对 1 语聊的技术门槛相对较低,多人语聊和特定场景相对复杂,技术实现难度比较大。以pia戏为例,如果经常出现卡顿、延迟和听不清的情况,会将营造的剧情气氛破坏殆尽,主播时不时要退出重新登录,无法全身心投入,用户听到的是断断续续的声音,不能沉浸到剧情中。

自研的音视频引擎,通过抖动缓冲技术、前向纠错技术、丢帧补偿技术减少网络抖动和弱网环境下的延迟,保障语音通话低延时且清晰。让用户在复杂网络环境和多类型手机的情况下,也能实现畅通优质的语音通话。

2)多人聊天的语音前处理,以KTV语聊房为例,在房间当中,有人说话声音、歌声、伴奏都在房间呈现,每个人所处的地方,所用的设备也不一样,这就有很大可能出现回声、噪音,或是某个人设备不是很好,发出的声音很小。

成熟的语音前处理3A技术:回声消除(AEC)、噪音抑制(ANS)、音量增益(AGC),杜绝回声和啸叫,降噪而无损音质。这样歌者能展示甜美歌声,听众也有良好的听觉享受。

3)媒体次要信息同步,而在KTV类的场景中,AB两人轮麦合唱,如果轮到B唱歌时发现歌词没同步,就很难唱下去。这当中技术难点就在于歌词等媒体次要信息是否能做到同步。支持将非媒体信息注入媒体流中,歌词等媒体次要信息和音视频信息放在同一个媒体通道传输的,做到歌词与歌声同步展示果。

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信