您现在的位置 : 首页 > 服务网络

一定发APP官网

服务网络

移动互联网业务对EPC网络信令面的挑战

时间:2018-11-26 05:45:04  来源:本站  作者:

 

  从21世纪第二个十年开始,移动互联网的发展进入到4G时代,移动互联网的发展以高速无线接入、智能终端和移动应用这“三驾马车”为驱动。根据全球移动设备供应商协会(GSA)最近更新的《EvolutiontoLTEreport》[1]数据显示,截至目前,全球130个国家/地区的443家运营商正在投资LTE。目前全球共有194张商用LTE网络,分布在75个国家和地区,预计到2013年,LTE商用网络将达到260张。过去五年多的时间里,智能手机在全球呈现高速发展,据Gartner统计[2],2012年全球智能手机出货量超过7.1亿部,复合增长率超过40%;在国内市场2012年的智能手机出货量已达1.8亿部,相比2011年增长率超过200%。移动互联网用户规模也在快速扩张,据CNNIC的统计数据[3],2013年上半年,国内移动互联网用户数达4.64亿,超过桌面互联网用户的4.1亿。移动应用的发展势头也前所未有,苹果公司的App Store已有77.5万个应用,累计下载超过500亿次;谷歌应用商店的应用数达70万个,累计下载达486亿次。

  移动互联网的发展不仅带来了移动宽带网络的用户和流量爆发性增长,信令风暴的问题也不期而至。本文将针对LTE核心网(EPC)中出现的信令过载等问题,分析移动互联网时代EPC核心网络信令风暴的现象和成因。进而从移动互联网业务、网络体系结构以及终端和用户行为,即“云、管、端”三个维度分析移动互联网端到端的不同部分对EPC网络信令面的影响及相关解决方案。针对信令面网元设备的部署和信令管控策略方案提出建议。

  移动互联网应用的普及和发展促使网络流量爆炸式增长。来自贝尔实验室的流量分析预测表明[4],2011~2016年间,网络流量将会提高25倍。在美国,有些运营商如Verizon、AT&T在网智能手机月均流量达到900MB,部分手机月均流量突破2GB。在国内,移动互联网接入总流量36918.3万GB,目前仍在以数百PB每月的速度增长。今年第一季度,国内人均移动互联网流量已达121MB,同比增长37.1%。

  根据爱立信等研究机构有关移动数据流量的数据[5],随着智能终端软硬件能力的不断提升,加上视频和基于云的业务与应用的普及的推动,预计移动数据流量将以50%的复合年增长率增长(2012-2018),到2018年底,移动数据流量将增长大约12倍。其中,智能手机的流量增长尤为迅速。到2012年底,平均每部智能手机每月产生450MB的数据流量,而到2018年,这一数据将达到2GB/月,平均每部智能手机的流量将达到增长14倍。

  除了爆炸式的增长,移动网络的流量分布同时呈现突发特性,而且从地理分布上也突显“热点效应”,如50%的移动数据流量是由10%的基站产生的,而70%的流量发生在室内。由于用户的移动,流量的“潮汐效应”也更加明显。视频流量逐渐占据主导也正改变着流量的结构。据贝尔实验室的流量指数显示,2011年视频流媒体占到整个移动流量的25%,预计在2016年这一数字将达到50%;这种快速增长和动态分布的流量对网络覆盖、资源配置、网络管理提出了更高的要求。

  首先,随着移动宽带网络用户数量不断增加,数据业务忙时也不再局限在1-2个时间段而是持续10个忙时以上,导致网络信令的绝对数量大幅增加;其次,传统的信令系统已经不能满足移动互联网时代信息服务模式的需求,移动APP的频繁心跳和信息推送,都会导致终端和网络之间频繁的交互,产生大量接入和状态迁移的信令,对网络的稳定性产生冲击,加上开发者对移动网络不甚了解,APP潜在的信令风险很难事先察觉,一旦发作,往往导致严重全网的信令风暴;第三,诸如物联网等新型的业务的开展意味着使用海量的传感器等终端,这些终端虽然流量较小,但海量终端设备产生的周期性的连接请求仍会对信令网络造成很多大的冲击。最后,网络架构的扁平化演进趋势使得LTE核心网(EPC)信令过载问题更加严重。

  为应对移动宽带网络的用户和流量爆发性的增长,移动运营商纷纷对网络吞吐量进行扩容升级以满足移动宽带网络需求。然而,不期而至的信令风暴,却让广大移动网络运营商和设备商措手不及。经测算,终端的一次状态转换需要和网络进行20至30条的信令交互,考虑到用户数量增长,使用频度增加等因素,网络信令面设备过载的风险不容忽视。根据对国内外多个客户的移动网络的监测统计发现,个别单用户平均信令指标已经超过运营商预计指标的20倍以上,全网信令流量增长速度甚至超过了用户数据流量的增长速度,导致网络和设备容量严重下降,无法达到规划要求。不仅如此,严重的信令风暴不仅影响LTE/3G等网络的数据接入业务,甚至可能蔓延到电路域网络,导致移动网络最基本语音服务不可用。

  相比于流量增长,信令过载往往难以预测,突发性和破坏性更强。在移动互联网时代,移动应用开发者对运营商网络信令控制过程知之甚少,网络运营商对移动应用开发也不可控,即使出现了APP对网络功能的误用或滥用,网络运营商很难在事先或在信令拥塞的早期进行预防,然而一旦形成信令风暴,则必然造成严重后果,轻则让单一网元设备服务中断,如果没有有效的信令流量管理,危机会迅速蔓延,最终将导致全网的灾难性后果,以下是两个较为典型的案例:

  2009年9月,由于苹果iPhone手机特有的快速休眠功能没有考虑对网络造成的冲击。导致短期内信令增加了好几倍,造成网络瘫痪。AT&T纽约地区的iPhone用户掉线%,收发一条Twitter消息延迟15分钟。

  2012年1月,NTTDoCoMo在东京地区的网络发生故障,在持续的四个多小时中,252万用户受到了影响。事后调查发现,激增的数据流量是导致网络故障的主因,而产生大量数据流量的来源则是一款免费语音通信的Android应用,会每隔3至5分钟发送控制信令。

  容易造成EPC网络信令面过载的移动互联网业务主要包括:间歇性小包业务、在线交互和同步类业务、新型M2M业务等。

  这类业务主要包括SNS类业务和即时通信类业务,产生的间歇性小包主要有以下两种类型:

  —周期性的Keepalive消息,比如用于保持用户和服务器网络连接的心跳消息等

  这些消息往往总流量少(2KBytes),IP包数量少(20packets),数据传输持续时间短(短于3秒),但交互次数较频繁(周期30秒~4分钟不等)。导致无线连接状态频繁迁移,网络连接频繁建立和释放,对网络信令面设备设备(MME)造成巨大的信令冲击。

  另外由于这些应用通常都具有通知功能,服务器会维护一条和客户端的网络连接,产生新的信息内容后,服务器会主动给接收端推送通知信息,此时在网络侧和空口会产生寻呼消息。当出现定时推送事件或者突发事件时,服务器会向一个网络下的大量终端同时发送消息,这时将会给网络造成严重的寻呼冲击。

  随着计算内容的上传过程越来越方便快速。利用云端的强大计算能力来代替本地计算这一新型计算模式越发变得普及。在云计算模式下,应用程序会将用户数据保存到云端的数据中心。当用户访问内容时,应用程序会自动从数据中心取回最新数据,此时用户并不感受数据是在本地还是云端储存。这样一来,原本在本地存储模式下,用户的每次离线操作(如查看、编辑、修改等),都会成为一次与云端数据中心的备份和同步交互,这对网络而言意味着更加频繁无线连接状态迁移和更多的连接建立与释放过程。

  物联网的开展意味着部署海量的传感器类型终端,这些传感器与网络间交互流量较小,与网络间的连接建立请求有比较明显的周期性。考虑到物联网业务的行为,往往是海量传感器终端同时工作,因此在数据上传或配置更新等时刻很可能会形成信令面流量的峰值,如果再与其他信令流量叠加,将对网络信令面设备产生极大的冲击。

  以上列举的几种业务类型,对EPC信令面网元有比较突出的影响。与此同时,移动互联网的其他业务也会使用类似心跳消息的方法来保持应用对终端连接的感知,因此也存在造成信令风暴的可能,具体分析参见下表:

  网络架构的扁平化演进趋势使得LTE核心网(EPC)信令过载问题更加严重。与3G网络相比,由于LTE网络中没有RNC设备对信令进行汇聚收敛,信令消息直接从分散的基站(eNB)汇聚到集中部署的核心网信令控制平面网元(MME)进行处理,使得MME完全暴露在终端信令流量冲击之下,成为网络信令面的瓶颈,而且MME比SGSN更易受到永远在线类业务的影响。

  MME的主要信令负荷是寻呼消息(在3G网络中由RNC处理);连接建立和释放信令则是第二大信令流量。寻呼消息的大幅度增长是由智能手机“快速休眠”模式和推送类业务造成的。智能手机的快速“休眠”模式可以节约终端电量消耗,但在下行数据的送达时,需要由MME频繁地寻呼唤醒终端以接收数据,从而增加了MME的信令负荷。随着智能手机和推送类业务的普及,寻呼消息会越来越多,对网络的压力也越来越大。

  智能手机上大多数APP都采用了心跳机制,这些心跳消息用于维持和服务器的连接,以及状态更新等。但是不少APP为了实现近似实时的状态更新(特别是一些IM应用),采用了非常小的心跳间隔。这些频繁的心跳加上智能手机的快速休眠特性,导致大量的网络连接建立与释放信令。

  目前的智能终端在软硬件性能方面都非常接近一般的计算机,其操作系统、协议栈软件以及通信功能模块的控制策略都会对核心网网络信令面产生重要的影响。相同的业务,相同的网络环境,因为终端系统优化的差别,会导致对网络信令资源的占用情况和用户体验的截然不同。

  以“永久在线类”业务的推送服务为例,在iOS终端和Android终端上的实现方式有很大不同。对iOS平台,放置在后台的应用程序不会产生蜂窝数据流量,后台业务的心跳统一归并到苹果推送服务器心跳,可以认为业务是非激活状态的。Android平台后台多数业务存在单独心跳。iOS的心跳统一机制在很大程度上减少了用户在手机黑屏时产生的频繁的网络连接请求和断开信令。下表对Android终端和iOS设备的黑屏后台行为做了如下比较:

  按上表数据计算,1小时内iOS和Android系统后台业务分别产生的网络连接请求次数,Android平台为30,而Apple仅为2。在用户并没有多少推送消息而仅维持业务的连接状态,Android终端1小时内产生的连接数为iOS的15倍。对网络而言,Android终端频繁接入请求更易使管道不堪重负,产生信令拥塞。

  另外,为了延长电池使用时间,智能终端设计了快速休眠节电功能,每次消息发送完毕后,智能终端强制将其状态修改为“IDLE”,这一设计对EPC网络带来巨大副作用,即:idle态的终端因业务请求频繁发起接入请求,会制造大量不必要的信令开销,导致呼损率增加。

  EPC核心网信令风暴是移动互联网端到端共同作用的结果,因此解决方案也需要从全局入手,分段实施。根据解决方案是否涉及对终端和应用的要求,可以分为端到端方案和EPC网络侧优化方案两个大类。

  面对信令风暴这一问题,应用程序、终端和网络可以共同采用一些措施进行优化,以减少终端和网络业务请求信令次数,降低网络过载风险。

  终端APP开发者或开发厂商应该充分考虑无线网络的特点,减少过于频繁的心跳,降低对网络的影响;同时也能降低终端的耗电。

  另外,移动网络运营商应尽可能参与终端制造和应用开发过程,例如为操作系统或APP开发平台提供一组用于根据网络当前状态动态优化接入请求尝试和心跳消息周期的接口,使得终端和应用行为能与网络状态协调一致,从源头上抑制信令风暴的生成。

  对于无线网络无法控制驻留在URA/PCH_CELL状态的智能终端,无线网络可以对终端信令进行控制,以减少信令冲击;核心网和无线接入网侧可以联合起来实现对信令的控制。比如由核心网识别具有信令冲击的终端后,由无线接入网侧来执行对终端信令的控制,从源头控制或减少对无线、网络侧信令优化方案

  首先,扩大信令面网元设备容量是预防信令过载的基本手段。EPC核心网元应能支持千万级规模用户同时附着,为所有板卡提供有效的冗余备份机制,从容面对信令的激增,满足当前网络建设的需求。同时还要不断创新,例如将现有EPC核心网向云平台架构和虚拟化技术演进,实现无级扩容,进一步满足未来增长的需求。

  除了提高网元本身的容量,EPC核心网还需要有抵御突发性信令风暴的能力。这一能力体现在两方面:自我防御与周边保护。一方面,网元需要有专门的处理机制来保护自己。如若不然,网元在接受超过其设计能力1倍以上的信令冲击后就会过载而停止服务。但在现实情况下,信令风暴往往会造成超过其设计能力10倍甚至以上的信令冲击。为此,信令风暴解决方案的保护机制需要保证网元在这一场景下依然运行正常。

  另一方面,网络中各个节点性能千差万别,EPC核心网需要特定的解决方案来保护MME周边网元,比如HSS、MSC等等,从而提高整个网络的抵御能力。MME通过检测邻近节点的信令处理能力和状态,动态调整发送至邻近网元的信令门限,防止信令超过对端能力而导致对端网元过载宕机,从而保证整网的可靠性。

  针对寻呼量不断增加的挑战,通过引入智能寻呼,缩小寻呼范围,减小网络的寻呼负荷。结合应用场景和网络架构特点,LTE网络的智能寻呼由PS和LTE无线接入网配合实现。LTE智能寻呼方案中,可根据终端移动性的高低不同,进行不同范围的寻呼控制。比如对于低移动性的终端,可进行单一eNB的寻呼;对于高移动性的终端,可进行基于TA或TAList的寻呼。从而实现LTE无线寻呼负荷和寻呼命中率之间的平衡。网络能够提供灵活的寻呼颗粒度,针对不同的业务,分别设置寻呼范围并支持寻呼间隔时长的设置。

  随着智能终端在线时间变长,特别是频繁小包业务访问的终端,如果移动频繁,会导致终端切换频率变高,导致另外一个信令冲击点。如果用户的频繁切换,是由于用户真正在频繁使用业务导致,则这些切换是无法避免的;而实际使用中,很多终端在线是由于用户打开了频繁小包业务,即使用户没有使用终端,也会保持终端长时间在线,此时,终端和网络之间的交互主要是应用客户端和应用服务器之间的心跳、或消息的实时PUSH、或状态信息的通知等,这些消息的交互都是存在一定的周期的,一般都在60s以上;在这些周期,发送的数据量很小,持续的时间很短,所以,对于处于这种状态的终端,如果移动性高,会导致移动性产生的信令冲击大于永远在线节省的信令。针对这些终端,尽快控制终端进入空闲态,避免高移动性带来的信令冲击。可通过LTE网络控制,对访问不同业务的终端进行差异化控制,从而减少终端频繁的释放和连接和位置更新次数。

  在部署LTE网络时,移动网络运营商必须综合运用上述提到的解决方案,以确保其EPC核心网控制平面可以支持未来信令流量的增加。具体而言,LTE网络中信令处理的瓶颈转移到了MME,因此移动网络运营商需要在MME平台上部署高效用、智能化、可扩展的智能信令流量管理机制,来实现对信令过载问题的有效管理。

  从EPC控制面组网的角度,采用MME集中部署方案可以减少信令消息的数量,如集中部署MME可以有效地降低基于S1/S10接口的跨MME切换(需要12~14条消息,而基于X2接口的切换只需要4条消息)引起的信令。同时,还可以通过MME所有板卡一比一冗余备份、以及MMEPool等机制来对抗信令风暴对EPC网络关键网元MME的冲击。

  从EPC控制面运维优化的角度,寻呼消息是EPC网络中主要的信令负载,优化寻呼策略将大大降低寻呼信令负荷。运营商应采取灵活的寻呼策略,在终端用户的体验和网络资源的消耗上取得良好的平衡,防止寻呼产生信令风暴。可以通过业务分类、优先等级、TAU信令优化和防止多重寻呼等方法,来降低信令风暴的影响。

  总之,信令风暴的形成主要是由于网络对终端和业务感知不足,终端和业务行为与网络能力失调等因素综合形成,因此既需要综合“云、管、端”的端到端统一解决方案,也需要EPC核心网控制面进行有针对性的优化。目前,LTE建设和部署已经具备相当规模,国际上大型LTE网络建设基础以及解决信令过载问题的实践经验,对我国的LTE网络建设和运维保障工作有着重要的借鉴和参考价值。

  辛伟,工业和信息化部电信研究院通信标准所无线与移动研究部副主任,高级工程师。长期从事移动核心网技术发展和网络演进等方面的技术研究。

  朱浩,工业和信息化部电信研究院通信标准所无线与移动研究部工程师。主要从事移动核心网标准化和新技术研究。目前专注于基于演进的移动分组核心网EPC的研究工作

返回首页返回首页