(CWW)语音业务是无线通信网络的基本业务,在5G网络建设初期,5G基站覆盖和终端渗透率均不高,语音业务通常由LTE网络承载。
在NSA组网下,语音业务直接建立在LTE网络,采用LTE语音解决方案VoLTE,如图1所示。在SA组网下,语音业务通过EPS(Evolved Packet System) Fallback解决方案从NR网络回落到LTE网络,如图2所示。
图1NSA组网下的语音解决方案
(相关资料图)
图2SA组网下的语音解决方案
其中,在SA组网下的EPS Fallback解决方案中,NR用户的语音业务和数据业务会同时回落到LTE网络,一方面造成语音呼叫建立时延变长,另一方面基于LTE网络的数据业务速率相对于NR网络会降低。
因此,随着5G网络的规模部署,可支持采用VoNR语音解决方案,如图3所示。NR用户可以基于NR网络直接进行语音通话,无需回落到LTE网络,从而获得更高质量的语音业务体验和更高速率的数据业务体验。
图3VoNR语音解决方案
VoNR介绍
VoNR支持NR用户基于NR网络直接进行语音通话,即在NR网络内的UE和IMS间建立基于IP传输网络的语音专用承载。具体流程如下:(1)主被叫UE与gNodeB之间建立RRC连接;(2)5GC建立主被叫UE用于承载SIP(Session Initiation Protocol,会话发起协议)信令的QoS Flow(5QI5),GNodeB建立主被叫UE的DRB承载;(3)UE和IMS进行语音业务的SIP会话协商,如编码方式、IP地址、端口号和主被叫相关信息等;(4)5GC建立主被叫UE用于承载RTP(Real-Time Transport Protocol,实时传输协议)和RTCP(Real-Time Transport Control Protocol,实时传输控制协议)数据流的QoS Flow(5QI1),GNodeB建立主被叫UE的DRB承载;(5)主被叫UE释放QoS Flow(5QI1),gNodeB释放主被叫UE的DRB承载。
4种语音报文介绍
流媒体服务器进行音视频媒体传输主要就两件事:媒体回话协商、媒体数据传输。下面这几种协议就围绕这两个需求而产生。
在一个完整的音视频媒体传输中,SIP用于初始化一个Session,并负责传输SDP包;而SDP包中描述了一个Session中包含哪些媒体数据,如邀请的人等;当被邀请的人通过各自的终端设备收到通知后,就可以使用RTSP(RealTimeStreamingProtocol,实时流协议)来控制特定媒体的通信,比如RTSP控制信息要求开始Video的播放,那么就开始使用RTP(或者TCP)实时传输数据,在传输过程中,RTCP要负责QoS等。
SIP/SDP报文
SIP是由IETF提出的IP电话信令协议,主要目的是为了解决IP网中的信令控制。SIP会话使用多达4个主要组件:SIP用户代理、SIP注册服务器、SIP代理服务器和SIP重定向服务器。这些系统通过传输包括SDP协议(用于定义消息的内容和特点)的消息来完成SIP会话。
SI用户代理(UA)是终端用户设备,用于创建和管理SIP会话的移动电话、多媒体手持设备、PC、PDA等。用户代理客户机发出消息,用户代理服务器对消息进行响应。
SIP注册服务器是包含域中所有用户代理的位置的数据库。在SIP通信中,这些服务器会检索参与方的IP地址和其他相关信息,并将其发送到SIP代理服务器。
SIP代理服务器接受SIPUA的会话请求并查询SIP注册服务器,获取收件方UA的地址信息。然后,它将会话邀请信息直接转发给收件方UA(位于同一域中)或代理服务器(位于另一域中)。
SIP重定向服务器允许SIP代理服务器将SIP会话邀请信息定向到外部域。SIP重定向服务器可以与SIP注册服务器和SIP代理服务器同在一个硬件上。
SDP完全是一种会话描述格式,不属于传输协议,只使用不同的适当的传输协议,包括会话通知协议(SAP)、会话初始协议(SIP)、实时流协议(RTSP)、MIME扩展协议的电子邮件以及超文本传输协议(HTTP)。SDP协议也是基于文本的协议,能保证协议的可扩展性比较强,这样就使其具有广泛的应用范围。
SDP用于描述多媒体通信会话,包括会话建立、会话请求和参数协商。SDP不用于传输媒体数据,只能用于两个通信终端的参数协商,包括媒体类型、格式以及所有其他与会话相关的属性。SDP以字符串的形式描述上述初始化参数。
RTP/RTCP报文
RTP是用于Internet上针对多媒体数据流的一种传输层协议。RTP协议详细说明了在互联网上传递音频和视频的标准数据包格式。RTP协议常用于流媒体系统(配合RTCP协议),视频会议和一键通系统(配合H.323或SIP)使其成为IP电话产业的技术基础。
RTP实行有序传输,RTP中的序列号允许接收方重组发送方的包序列,同时序列号也能用于决定适当的包位置,例如:在视频解码中,就不需要顺序解码。
实时传输控制协议RTCP是实时传输协议(RTP)的一个姐妹协议。RTCP为RTP媒体流提供信道外(out-of-band)控制。RTCP本身并不传输数据,但能与RTP一起协作将多媒体数据打包和发送。RTCP定期在多媒体会话参加者之间传输控制数据。RTCP的主要功能是为RTP的服务质量提供反馈。
RTCP收集相关媒体连接的统计信息,例如:传输字节数、传输分组数、丢失分组数、单向和双向网络延迟等。网络应用程序可以利用RTCP所提供的信息提高服务质量,比如限制信息流量或改用压缩比较小的编解码器。RTCP本身不提供数据加密或身份认证,但SRTCP可以用于此类用途。
SRTP/SRTCP报文
SRTP(SecureReal-timeTransportProtocol,安全实时传输协议)是在RTP(Real-timeTransportProtocol,实时传输协议)基础上所定义的一个协议,旨在为单播和多播应用程序中的实时传输协议的数据提供加密、消息认证、完整性保证和重放保护。它是由DavidOran和RolfBlom开发的,并最早由IETF于2004年3月作为RFC3711发布。
实时传输协议和实时传输控制协议用于控制实时传输协议有着紧密的联系,而安全实时传输协议同样也有一个伴生协议,被称为安全实时传输控制协议。安全实时传输控制协议为实时传输控制协议提供类似的与安全有关的特性。
在使用实时传输协议或实时传输控制协议时,是否使用安全实时传输协议或安全实时传输控制协议是可选的。即使使用了安全实时传输协议或安全实时传输控制协议,它们提供的所有特性(如加密和认证)也可以被独立地使用或禁用。唯一的例外是在使用安全实时传输控制协议时,必须要用到其消息认证特性。
RTSP报文
RTSP是用来控制声音或影像的多媒体串流协议,允许同时多个串流需求控制。传输时所用的网络通信协定并不在其定义的范围内,服务器端可以自行选择使用TCP或UDP来传送串流内容。它的语法和运作与HTTP1.1类似,但并不特别强调时间同步,因此比较能容忍网络延迟。
优化方案EVS
编码速率
编码速率为主被叫终端之间协商的结果,IMS核心网不会主动干预协商。基站侧不感知协商的编码速率。基站侧支持解析VQI的EVS编码类型有EVS Primary WB(通常所说的EVS-WB 16kHz采样)、EVS Primary SWB(通常所说的EVS-SWB 32kHz采样)、EVS IO(为向下兼容AMR-WB,16kHz采样)。EVS是一种全新的编解码业务,在质量上和覆盖上都要强于AMR-NB和AMR-WB,采用EVS编码方式可以获得更高的MOS分。如两台终端中一台仅支持AMR,另一台仅支持EVS,则可以按照EVS IO的编码协商。具体EVS编码速率如表1所示。
按照使用频带的宽窄,语音信号通常被分为以下4类。
窄带语音(narrow band,简写为NB)信号频带为300Hz~3400Hz。用于各类电话通信。数字化时采样频率常用8000Hz,即8kHz。
宽带语音(wide band,简写为WB)信号频带为50Hz~7000Hz。用于电话会议、视频会议等,数字化时采样频率常用16kHz。
超宽带语音(superwideband,简写为SWB)信号频带为20Hz~15000Hz。用于数字音频广播等,数字化时采样频率常用32kHz。
全带语音(fullband,简写为FB)信号频带为20Hz~20000Hz。用于VCD、DVD、CD唱片、HDTV伴音等,数字化时采样频率常用48kHz。
表1 EVS 编码速率
鲁棒性头压缩(robust header compression,ROHC)通过减少语音包头部负荷来降低无线链路误码率和时延、减少无线资源消耗,ROHC支持IPv4和IPv6包头的压缩,包头由IPV4/IPV6(20字节), 用户数据报协议(User Datagram Protocol,UDP,8字节)和RTP(12字节)。ROHC可压缩成1~5字节包头。如图4所示。
图4 ROHC编码方案
ROHC头解压失败恢复
远点处存在空口丢包时,若出现通话期和静默期转换,有关键压缩包丢失(TS_Scaled的更新,或者TS_Stride的更新等), ROHC解压更容易出错,从而导致ROHC解压失败。ROHC头解压失败恢复功能主要针对timestamp进行恢复,适用于RTP协议(RTCP没有timestamp字段)。
使ROHC解压失败的包,能够减少丢包,同时避免在远点时退出ROHC引起语音中断丢包,进一步发挥ROHC提升覆盖的价值。
上行RB资源预留
语音用户优先使用预留的RB资源,预留的RB资源被占满后可以继续使用非预留的RB资源,非预留的RB资源按照正常的调度流程分配。非语音用户不能使用该功能预留的RB资源。预留RB中可能有部分RB被PRACH、PUCCH或上行数据业务占用,如图5所示。
图5 上行RB资源预留
VoNR上行RLC分段优化
当信道质量较低时,UE发射功率受限,上行动态调度分配的TBS(transport block size)会随之调小,使得RLC分段变多。RLC分段变多会导致VoNR语音包时延增大、丢包率上升以及上行开销增多的语音质量问题。上行RLC分段优化功能通过限制上行动态调度分配的TBS来控制上行RLC分段数,以提高信道质量较低时的语音质量。
VoNR具有语音通话质量好、接续时延低、可边通话边进行5G高速上网等优势。另外,VoNR可以加快传统老旧、低效的2G/3G CS语音向4G和5G转移,从而能提升网络效率、降低网络运维成本,以及重耕优质的低频资源。VoNR利于支持新的5G应用。AR/VR、全息等5G应用都离不开实时、高清的音视频通话,而有了VoNR后,可提供增强的媒体面以更好支撑这些新应用。