一秒钟一百万赔付 数字时代不能掉线的运维保障

  互联与数字化时代,从各类消费端App的高交易量,到在线网站的高并发运行,互联网企业对于其系统运行和运维的要求提出了更高要求,以确保可以7*24小时不间断地为网络用户提供服务。另外,传统行业的“互联网+”转型让IT系统运维更加复杂化, IT系统从原有封闭走向开放,整个IT应用架构被颠覆。现阶段IT运维从设备和企业内部开始,已经在与前端业务和用户的关联逐渐加大。因此,最近业界也有“一秒钟宕机需要系统供应商赔付一百万元”的对赌协议发出。这在侧面反映出现在诸多企业对于系统稳定化的迫切需求。

  一百万元也许可以买回错失的那一秒流量变现费用,但却无法买回前端用户的操作体验,特别是企业级业务因为运维系统出问题所产生的乌龙或重大失误,也许不是百万元可以弥补的。运维管理不再只是面对内部,更多时候要面对外部开放环境,面对未知的各种终端设备。依靠单一的产品、技术,或是单纯依赖人的经验,都不可能解决这种复杂化带来的运维难题。应用性能管理APM通过监控和管理应用软件性能和可用性,监测和诊断复杂应用程序的性能问题,来保证软件应用程序的良好运行(预期的服务)。所以,如何打造企业自身的数字化体验能力和稳定的系统,成为现阶段企业信息部门人员所应该关注的。

  作为Gartner第三方分析机构发布的APM魔力象限领头羊厂商,Dynatrace早前即在关注企业投入诸多数据中心稳定技术之后,如何来提升数字化体验这一能力。“在整个数字化体验和企业APM过程中,我们已经运营了四代产品。从主动化的拨测工作,到网络流量分析,再到探针技术和智能化运维,随着企业数据的复杂性、交易链路的长度,用智能化来帮助人工化运维手段的完善,已经成为大势所趋。” Dynatrace大中华区总经理琚伟谈到。

  在大多数企业进入互联网化、云端化的“下半场”中,更看重的是企业的数字化体验能力。企业从传统架构转到云架构,获取资源方式变得灵活,也同样意味着获取资源的方式更复杂。尤其是金融、运营商、跨国企业这些体量大、要求高的企业级客户中,他们敢于不断尝试新技术和新型应用。比如,他们在很多环节上采用大规模云化或混合云的方式,以前层次分明的传统IT架构被不断云化,原来的网络、带宽、硬件、设备都没了,玩法全部改变。基于这个变化趋势,Dynatrace重新定义了现在环境下对于各类企业应用的性能监控,进而落地在人工智能驱动下的全栈自动化的监控。琚伟说:“所谓全栈式,即把网络、系统、IaaS、PaaS、SaaS等云化系统下的各个层级监控全拉到这个平台里面来,帮助企业完成在现代环境下的一个全新的开发、测试、生产生命周期。”

  谈及智能化的监控,Dynatrace提供的APM产品是全交易过程的监测,便于回溯、分析,能够精准定位是哪一行代码出现问题,并能够根据数据经验将问题自我修正。“也就是人工智能积累的经验值在运维的环境里面改代码,将整个发现问题到解决问题的过程实现了人工智能。” 琚伟介绍,人工智能的这个工作过程是全代码级别的,会给运维人员提供工作提醒或建议,提示是否同意进行修改,如果同意,AI就会对代码问题进行自动修正。目前正在试用一款被称作UFO的自动语音运维产品,来实现DevOps敏捷开发。

  琚伟同时也说道,面向智能化和云化的企业IT发展“新常态”,当前Dynatrace拥有的是较好的起点,包括世界500强及国内一些中大型企业客户均在使用其产品并保持的高口碑度。可以看到,在APM应用服务市场,资本方在过去几年投资了超过1亿美元,行业内的几家企业均获得几千万美元的资金,促成了这个市场的崛起。APM的未来将是一个风口,各家都将聚集自己的力量做研发、适应变化的环境,找到很好的方案给到客户。因此,琚伟认为应该在大数据大智能时代,建设更为前沿的运维解决方案能力,Dynatrace也早已开始为应对挑战做好了研发准备。“例如,针对如何帮助一些企业在系统上应对互联网端短期内的峰值压力,如何保障、支撑和为系统提供生产能力等,Dynatrace正在借助技术手段帮助客户企业进行一些预判。未来我们要重新定义监控,使其更加符合现阶段企业的业务形态,在每一个用户、每一笔交易、任何地方都做到全栈式和人工智能驱动的自动化运维,这是我们在未来的发展方向。”

  大数智云的背景下,不仅行业变化快、客户需求变化也在改变,Dynatrace正在密切关注这些变化,聚焦云时代的数据运维,探索利用自动化工具、智能产品、云技术等服务用户的新方法新工具,这也许又将为企业级业务运维开辟出新的蓝海。

第 1 /  10 页
点击查看余下全文