作者:郑晓敏
1 引言
分组域网关GGSN (gateway GPRS support node,GPRS网关支持节点)/SAE GW (system architecture evolutiongateway,系统架构演进网关)是2C/3G/4G分组域核心网的关键网元,随着流量经营战略的转型,该网元的主要作用从初期的用户地址分配、业务路由疏导扩展到了内容计费、PCC(policy control and charging,策略控制和计费)管控策略执行、APN(access pomt name,接人点)融合、白名单判别、在线计费、网络扁平化的隧道直连等八大重要功能。该设备内部逻辑处理愈来愈复杂,设备运行压力越来越大,设备处理能力下降明显。
通过对内部处理逻辑的全面梳理优化,从内容计费的URL(uniform resource locator,统一资源定位符)识别、PCC管控、OCS(online charging system,在线计费系统)、APN融合、白名单判别、虚拟APN、自有业务填写手机号、APN别名判定等方面,执行APN归一化处理、内容计费处理逻辑重构、局数据聚合三大优化措施,有效地降低了设备处理负载,提升了处理能力,实现了挖潜增效。
2分组域网关面临的问题
2.1 业务处理逻辑复杂性增加
GGSN的功能演进如图1所示,在初期的地址分配、路由疏导基础上,增加了内容计费、PCC管控策略执行、APN融合、白名单判别、在线计费等重要功能,内部的处理逻辑复杂度大大增加。
内容计费主要满足区分业务类型的计费,近期还通过内容计费为淘宝等热门网站进行了流量统付的开通;PCC架构是构建智能管道的重要手段,同时GGSN/SAE GW是PCEF(policy and charging enforcement function,策略和计费执行功能)策略执行点;为降低终端上网设置的门槛,APN融合后无论终端如何设置,CMNet和CMWAP访问业务均趋同,同时为满足自有业务获取手机号的需要,增加了白名单识别;在线计费主要是进行流量的欠费风险控制,减少恶意欠费风险。
2.2会话管理压力增加
随着大带宽、高流量无线技术的演进,为减少时延,核心网网络组网架构逐步扁平化,在3GPP R7的3G网络中,无线网络控制器(radio network controller.RNC)直连GCSN.在LTE网络中众多基站直连SAE GW,组网出现了较大的变化,SAE GW需要维护和面对终端的无线基站路由和数据传送,会话管理的压力较大。组网架构的演进趋势如图2所示。
随着流量统付类业务量的增多、单用户流量模型的增大、智能管道的构建和在线计费的全面实施,分组域网关GGSN/SAE GW各功能模块的内部逻辑处理愈来愈复杂,设备运行压力越来越大,如某厂商标称支持1 000万户在线用户的网关设备,在现网压力测试后只能承诺满足大约300万户的峰值用户,标称处理能力下降70%。再如,某厂商GGSN日常负荷正常,但用户面U卡负荷在晚忙
时只有60%左右;2014年“十一”期间,用户数增长30%,但用户流量翻倍,导致GGSN负荷突增,数据显示,晚忙时GGSN U卡负荷峰值达到95%,但用户数尚未达到标称的40 %,可见设备的性能远不能满足业务发展的需要。
3 系统优化思路和措施
为提高设备性能、降低设备运行压力,本着对系统负荷进行瘦身减压、实现挖潜增效的思路,对分组域网关GGSN/SAE GW的内部处理逻辑进行了梳理优化,从内容计费的URL识别、PCC管控、OCS计费、APN融合、白名单判别、虚拟APN、自有业务填写手机号、APN别名判定等方面,执行APN归一化处理、内容计费处理逻辑重构、局数据聚合三大优化措施,提升系统性能。
3.1 APN归一化处理
APN归一化实施原理如图3所示。中国移动通信集团公司拟定的APN融合方案中,GGSN配置单独的CMNet和CMWAP两个APN,并为两个APN分别配置内容计费数据和白名单数据,通过在GGSN上配置业务APN和内容APN,应用DPI(deep packet inspection,深度分组检测)技术和重定向技术重构用户业务请求,将CMNet和CMWAP两个APN合并为一个APN.内容计费、代理地址判断和白名单都只执行一次,不再对APN进行判别,优化了设备处理逻辑。
3.2 内容计费处理逻辑重构
CGSN/SAE GW的内容计费功能主要通过对用户的业务报文进行3/4层解析获得五元组,利用DPI技术对终端用户的业务报文进行7层解析获得目的URL、客户端类型等有价值的信息,从而实现区别性、差异化的计费,目前配置为每个业务流的建立都要根据数据配置优先级遍历所有局数据直至得以匹配,无任何匹配时使用默认流量。GGSN/SAE GW的缺省内容计费处理流程如图4所示。
现有的内容计费处理逻辑对设备的性能消耗较大,主要通过图5所示的6种措施进行优化:修改NDPI(normaldeep packet inspection,标准深度分组检测)机制,由串行改为并行合并service-set、header-rule,精简配置减少NDPI条目;统计访问频次高的网站Topl0,定义到NPI (networkperformance improvement,网络性能改善),配置在http-wsp-rule最前面,优先匹配;分离HTTP和WSP,使用start-with语句,节省系统资源;微调优先匹配大流量的term;内容计费数据聚合,合并URI (uniform resourceidentifier,统一资源标识符)数据。本文主要研究通过前5种方式优化GGSN性能,提升用户感知。
3.2.1修改NDPI机制
在内容计费三层header-rule中.NDPI处理机制lP地址、URI数据流是采用串行处理,将其修改为并行处理机制,修改后的数据流处理流程如图6、图7所示。并行处理机制在数据流条目少时效果不明显,但在现网对数以万计的数据进行处理时,效率提升明显。
将串行处理改为并行处理的方法如下:将header-rule-set中的3层内容计费header-rule合并为一条,将之前header-rule内容计费变为新header-rule cmnet-ip-hr中的term。优化后,GGSN header-rule-set配置包含的header-rule只有如下6个:
优化后,GGSN header-rule cmnet-ip-hr中的term配置如下:
优化前,每个term是一个header-rule配置,数据流串行处理;优化后,仅有一个header-rule cmnet-ip-hr,业务流变为每个term,数据流并行处理,提高了GGSN处理效率。
统计优化配置后,term由原来的4654条减少到3 637条。
3.2.2减少NDPI条目
CGSN内容计费配置的NDPI的顺序以及数量对GGSN的处理有决定性作用。NDPI的条目和GGSN的U卡剩余空间存在一定的比例关系,若NDPI数目过多,必定影响GGSN性能:具体算法流程如下。
(1)计算NDPI条目
show services epg pgw inspection“show config c,lassifv”lsave ndpi.conf?
cat ndpi.conf l wc—l
(2)计算所有U卡的剩余空间
show services epg pgw inspection“show ndpi memory”lmatch“Free space”
(3)比较方法
(NRx700 +(2xl 024xl 024》x1.2<“smallest free space” GGSN内容计费优化前,NDPI条目数为18 584条,已经超出了U卡剩余空间。采用的具体优化方法如下。
(1)将APN调用CMNet和CMWAP的header-rule合并为一个,payload通过access-control-rule将service-ID重新map回原来的值,能减少数千行NDPI。
(2)精简配置,如将CMWAP和CMNet的service-set合并一起,如图8所示。
7层中部分配置也可以合并,例如下面的配置可以仅保留第一条:
starts-with http://dm.monternet.com;
starts-with http://dm.montemet.com/;
3.2.3优先匹配统计访问频次高的网站
根据GN信令检测系统及GI抓取分组结果,统计访问频次Topl0网站,GN信令监测系统统计的访问频次Topl0的网站见表1。
把表1中访问频率最高的URI定义到NPI中,放置到http-wsp-rule最前面,使这些访问频率最高的URI率先被命中,可有效降低GGSN的负荷。优化后,NPI中主要添加包含QQ、微信、百度、新浪等18条数据。
3.2.4分离HITP和WSP
明确分离HTTP和WSP,每一个http-wsp-rule在默认情况下均会使用3条NDPI rule、100条http-wsp-rule或者term将会在U卡上增加300条NDPI的消耗。
将HTI'P和WSP分离后,每一个HTTP的http-wsp-rule将会消耗一条NDPI rule;
每一个WSP的http-wsp-rule将会消耗两条NDPI rule;
若HTTP、WSP写在一起,GGSN在匹配时都会默认消耗3条NDPI,若分开写,GGSN在匹配7层http-wsp-rule之前会判断是HTTP或者WSP,这样能有效减少2/3或者1/3的NDPI条目,提升GGSN性能:根据内容计费程序匹配原则.contains的消耗要远大于start-with的,优化配置,将可以使用starc-with开头匹配URI的更换为start-with。如内容计费信息*.fetion.com.cn/*,配置为contains .fetion.com.cn/,不能修改为staIts-with;内容计费信息wapnews.i139.cn/*,配置为contains wapnews.i139.cn/,可以修改为starts-with http://wapnews.i139.cn/。在优化部署拆分HTTP、WSP合并部分7层配置、删除垃圾数据后,NDPI条目下降比例约减少200%。
3.2.5优先匹配大流量的term
根据GGSN统计的service-id的使用情况,不断微调7层http-wsp-rule中term的顺序,使大流量的term优先被匹配中,降低GGSN负荷。
根据现网业务流量的使用情况(如图9所示,这里隐去单位),调整这些流量对应term的顺序,将大流量业务的term放在对应http-wsp-rule的前面,将小流量业务的term放在大业务流量term的后面,使大业务流量优先被匹配,降低GGSN低U卡负荷。
3.3局数据聚合
根据内容计费各类业务URI内容进行局数据的聚合,合并没有歧义的URI数据,减少内容计费条数。对于同类内容计费业务的多个7层URI数据,可以根据如下原则进行合并:
·IP地址最后8位组的十进制是3位数,可以聚合为IP*;
·IP地址最后8位组的十进制是2位数,但是大于或等于26可以聚合为IP*;
·对于顶级域名如.cn的业务地址聚合为XXX XXX cn*。3种情况的合并示例如图10所示。
4方案主要创新点
本文所提方案的主要创新点如下。
·通过梳理、优化分组域网关的内部处理逻辑,实施了APN归一化处理、内容计费处理流程的优化,减少了设备繁杂的内部处理流程,实现了瘦身减压。
·根据局数据IP地址及互联网域名架构体系的特点,实现了内容计费数据的聚合,减少了局数据制作量和设备处理的压力。
·瘦身减压措施实现了对分组域网关的挖潜增效,设备处理性能提升40%。
·现网90%以上的流量为非内容计费流量,优先疏导默认的非内容计费流量的方法大大缓解了设备处理压力,减少了URL匹配检索的时间,降低了对设备性能的损耗。
5实施效果
GGSN系统优化的相关措施在现网实施后效果明显。内容计费的识别term由原来的4 654条缩减到3 637条,减少了22%:NDPI由原来的20 930条缩减到了4 725条,减少了77%:优先疏导QQ、微信、百度和新浪等默认流量,一共增加了18条配置:设备配置脚本从11.1万条减少到4.55万条,减少了59%。上述措施的实施有效地降低了设备负载,在近期的业务测试中发现,承载等量用户的GGSN/SAEGW设备负载降低了40%。
爱立信GGSN06优化后的测试结果如图11所示。优化后比优化前的负载用户数约多2万户、流量增大的情况下GGSN U卡负荷峰值为65%,优化后GGSN U卡负荷下降超过40010,系统优化效果非常突出。
6结束语
对分组域网关GGSN/SAE GW的内部处理逻辑进行梳理优化,并对非DPI内容计费Top流量进行优先疏导,爱立信GGSN06优化后的测试结果表明,本文所提方案能有效地降低设备负载,提升网关的运行能力。
7摘要:
随着业务量的增多,分组域网关GGSN/SAE GW的内部逻辑处理愈来愈复杂,设备运行压力越来越大,网关实际运行能力离标称值相距甚远。为此,对分组域网关GGSN/SAE GW的内部处理逻辑进行梳理优化,使得内容计费识别逻辑和配置脚本大量减少,并对非DPI内容计费Top流量进行优先疏导,有效地降低了设备负载,提升了网关的运行能力。
关键词:分组域网关;网络优化;降低负载
下一篇:返回列表