听云重保服务方案为“双十一”保驾护航

  又是一年光棍节!每年的订单量都冲出新高,双十一呈现给更多人的是一个光鲜的数字,但对于工程师们来说,双十一是紧张而忙碌的一天。

  “当客户有重要需求的时候,听云都会提供驻场服务。为了保障这一天服务的顺畅运行,像京东、聚美这样的大型电商都会专门成立一个项目组,云厂商、CDN厂商以及听云的技术团队,都要悉数到场。”听云华北互联网技术支持总监谷岳静,首先向我们展示了听云的小伙伴在“双十一”当天的实战场景图。

  听云华北互联网技术支持总监谷岳静

  为了打造“没有最快,只有更快”的购物体验,这几年,淘宝、京东、苏宁、国美等电商大鳄纷纷加大了对技术力量的投入。尽管如此,一些电商企业的后台系统依然存在问题。从“双十一”电商系统的表现看来,越是交易量大的企业,越容易出现网站瘫痪的现象。所以,加大后台系统管理力度,采取有效的系统防护措施,做到有备无患,是每一个电商平台紧锣密鼓在做的一件事。

  那么,针对双十一这种大促活动,如何保障后台系统运行正常?如何确保其业务系统在任何环节、任何状态下都能表现优异?听云重保服务方案勾勒了一幅企业高速增长背后的IT运维保障“全景图”。

  电商面临双十一重大活动有哪些挑战?

  双十一带来的挑战来自各个方面,首先是流量挑战。 “双十一”是购物狂欢节,也是电商流量“大比拼”。这一天的流量峰值到底有多高,普通用户可能无法想象。为了保障双十一的平稳运行,技术人员每年都要提前做好各种预案,预估这一天有多少流量,提前做多少带宽、服务器的冗余,。

  除了流量挑战,这几年还有一个新变化,就是终端设备和网络接入越来越复杂,大多数用户由PC走向移动端。比如京东,60%~70%的用户在移动端;聚美更夸张,几乎90%的用户都转向移动端。随着智能终端的发展,除了苹果,还有很多安卓系统的智能机。据了解,安卓在全球的独立机型就有五万多,对于技术人员来说,要了解每一个用户的使用习惯,是一个非常大的挑战。由于移动终端多,接入方式也不只是移动、电信、联通的区别,还要考虑3G、4G的体验,这对于后端技术来说,不可控的层面也就越来越多,大大增加了运维的复杂难度,。

  最重要的是,交易额太高,意味着要承担更大的风向,用户体验对GMV影响巨大。以京东为例,京东在双十一或者618当天的销售额相当于他们平常一个月甚至两个月的销售额。另外,用户体验对于销售额的影响非常大,如果网站断了一秒,会造成几百万甚至上千万的损失。所以,活动当天,一定要确保用户拥有最佳购物体验。

  不止如此,数字化转换营销成功率的压力也非常大。我们经常看到电商网站在各种App或者各种媒体渠道上打广告,那么这些广告能不能成功获客?存在很多疑问。

  所以,针对上述各个层面的挑战,技术部门会有很多诉求。第一,在大促前进行现网环境的压力测试,了解系统瓶颈,提前预估流量,做好服务器、带宽扩容准备。一般情况下,我们会做一些内网环境下的压测,但这种测试只是模拟请求;现网环境要求必须是真实用户的测试,通过真实测试来预估服务器的扩容。第二,需要一套终端用户的时时监控系统,时时关注真实用户业务体验,出问题时快速报警,提前预知。有些技术部门只是针对服务器进行监控,这远远不够,因为在性能问题中有70%来自于用户端,服务器端的问题只占大约30%。第三,需要一套工具,当出现问题时能快速告诉我问题出在哪里,由谁来解决,并准确界定影响范围。另外,说到大促,就不得不提CDN。因为,在大促过程中,每一家电商机房的带宽都不够用,一定要通过CDN来做带宽上的补充。

  重保服务方案如何防出事?

  对于每家电商企业的技术部门来说,“双十一”这一天可以没有惊喜,但绝对不能出事。那么,如何做到不出事?应用性能管理服务提供商听云,会给客户提供一套以用户为中心的保障方案,即听云“双十一”重保服务方案。

  之前,电商企业的监控考虑的都是数据中心部分。可是后来发现,数据中心内部的安全性即使达到4个9,用户还是在投诉。所以,现在越来越多的电商企业开始关注用户端的数据。

  听云把整个方案分成用户端、网络层和后端。针对于APP用户端方面,让客户在APP中集成一条SDK,从而获取所有的真实用户访问体验数据,比如:访问卡顿,点击时转圈,或是闪退等等,App端的数据全部都要采集。针对于浏览器端,是在客户的页面中插入JS,来获取最近一段时间用户访问页面的次数,哪个页面首屏的白屏时间很长等等,针对于这些数据来进行针对性优化。网络层方面,听云在全国有30万个真实网民,让这些网民模拟用户进行访问,从而获得访问的性能数据。到了数据中心内部,也就是后端,听云通过在应用服务器上部署探针的方式来获取每一行代码的执行效率,以及其服务器硬件的数据。

  总结来看,听云提供的是一套以用户为中心的解决方案,将用户的数据按业务维度全部建立起来。当出问题的时候,在一个平台上就可以实现端到端的溯源。比如,前端有个接口很慢,可以通过系统进行前瞻分析,听云有上百种指标来供客户详细分析错误原因以及责任界定。

  另外, “双十一”重保服务方案能够防出事,是因为听云基于真实用户的端到端的压测方案,能够帮助电商企业做现网环境的压测。具体是怎么做到的呢?

  “我们在全国有30万的真实网民,调用这些网民用户实时对服务器发起并发访问,在后端部署探针,当大流量过来的时候,可以看到其后端代码执行效率的变化,看瓶颈点在哪里,再进行针对性的优化。”

  谷岳静举了个例子,一个人的购物流程是:打开页面,搜索,跳到商品页,然后出现很多商品列表,加入购物车,登录,订单支付。听云能针对这类的业务流程进行监测,假如刚开始是100个用户访问, 5分钟过后,又增加100个用户,随着时间的推移,用户量会越来越大,从而看出瓶颈点是在哪里。基于真实用户压测的好处是,可以保证在大促的当天不会出现很多性能问题,帮助电商企业在大促前做好准备。

  针对很多企业关注的移动端,听云提前两周左右帮客户梳理他们现在的APP到底哪里有不足,哪一个指标还落后于行业指标,差距有多大等等。听云现在移动端每天可以采集到8亿多终端的设备,这些数据被划分为20多个行业,每个行业里都有听云的评分。同时,听云还会对客户的APP做一个实时的评分,力争在大促前的评分达到95分以上。同时由于研发部门和运维部门的性质不同,导致他们的关注点不太一样,所以听云会针对最慢借口、体积最大域名、出错率最高主机等等关键点,给客户提供不同的优化方案。

  大促当天要做哪些事情?

  像在战场上打仗一样,双十一当天,听云会构建一个“后台指挥中心”,将客户的业务数据实时展现在大屏中,大量的结算、数据验证以及秒杀,还有非常多的业务接口,都会投放到大屏中。技术人员可以在全国地图中实时看到哪个区域状态良好,哪个区域有问题,从而有针对性地解决问题。听云在客户的现场就相当于一双眼睛,通过监控系统可以看到所有真实用户端的数据,然后来做切片和分析,最后决定把这个问题发送给谁。

  除了关注大屏以外,听云还会帮助客户梳理上百种的业务指标,来做精细化的管理。这些指标包括浏览器端、网络端、移动端以及服务器端等。这种能力来自于听云在客户现场的实战经验。每天,听云都会收集到非常多的数据,把这些数据进行分析并绘制成行业数据,给更多用户带来参考价值。

  所以说,“双十一”不只是商家和买家“嗨翻天”的日子,火热的“买买买”背后,考验的是电商平台强大的技术支撑能力,而听云重保服务方案,可以为“双十一”保驾护航。

第 1 /  10 页
点击查看余下全文