金山云陈海彪自述:2020互联网流量大迁移背后的故事-风君雪科技博客

  2020 互联网流量大迁移背后的故事

  密集的互联网应用宕机,接连发生在了这个意外的超长假期。1 月 25 日开始,《和平精英》、钉钉、企业微信、猿辅导、小红书、B站等先后宕机。

  超十亿人被动的“关门闭户”,拿起手机,十亿设备同时在线,超 2 亿人同期在线办公,超 1 亿学生集体在线听课。历史罕见的在线用户量、再创新高的在线用户时长背后,一场“互联网流量界的春运” 正在无声展开。

  这场流量大迁徙背后还有哪些故事?我们也和一些相关的公司聊了聊。

  金山云作为一家云服务商,也在这次“超长假期”感受到了产业链上下游合作商的需求。以下是从金山云 CDN 及视频云产品中心副总经理陈海彪视角看到的一些行业故事与信息。

金山云陈海彪自述:2020互联网流量大迁移背后的故事-风君雪科技博客

  在抗击疫情期间,线下很多行业均受到了影响,但相应地,用户对直播、短视频、在线办公、在线教育等线上应用的需求量急剧增加。从往年经验看,在正常情况下,春节期间互联网流量会有大概 20% 左右的下滑,节后经过半个月的时间,会逐步恢复到正常水平。今年春节期间的流量也如预期出现减少,但是受疫情影响,全国各地的复工时间均出现推迟,这就导致在节后出现流量剧增的情况,这在游戏、短视频和直播平台上体现得尤其明显。不少主流视频内容平台一周内的业务量,相比于节前增长超过 40%。 

  在线教育作为传统教育的补充,一般业务模型是在早7-8 点以及晚上 18-21 点之间出现;受疫情影响,传统的授课大量迁移到线上,由网课替代。学生受众群体更多,由此出现的一个现象就是在整个工作日的白天时段,会持续出现在线教育流量的高峰,而且量级规模远超平常在线教育的早晚高峰。 

  视频会议通常作为多地区协同办公工具,受疫情影响,视频会议从次要工具变成了最重要的工作交流方式,流量也呈现出几何级增长,这就导致了几大视频会议的 PaaS 平台在复工初期或多或少资源不足,导致部分不可用的情况。视频、直播等应用也如上述应用,虽然出现了流量的大幅增长,但也呈现出晚间流量明显高于日间流量的特点。

  从云计算服务的角度来看,视频服务平台在假期期间流量的大幅增长,势必带来基础设施用量和成本支出的显著增加,具体会和流量的增加呈正比。对于大平台而言,增加的幅度会超过正常水平的 20% 甚至更多。近期视频会议平台均推出了免费使用的公益举措,这对其成本的影响很大,因为他们的基础设施的采购成本会因此提升好几倍。大公司和小公司的流量从数据上看都在增长,其中以头部和一些垂直领域的特色平台的增量最为明显。

  由于以上原因和趋势,我们意识到开春的业务模式会有明显的变化,节前安排的保障部署不足以支撑实际需要。因此从大年初一开始,金山云自上而下开始频繁和客户沟通,了解他们的业务变化情况,同时按照春晚、国庆阅兵等大事件业务保障中积累和总结出来的保障预案,进行人员、资源、后勤等诸多方面的安排,保障整个疫情和假期期间公司业务的正常开展,为客户的业务提供高标准服务。虽然和节前的部署出现了较大的出入,但是我们克服了各种困难,确保各项工作如期顺利开展,也积累了很多经验。

  在可预知的流量高峰来临前,我们会尽可能地准备充足的带宽冗余和节点资源,保障系统的稳定性和高并发处理能力,以及自身资源和服务能力的建设,从而为所有的客户提供无差别的云服务,确保客户业务正常开展。例如,针对远程办公的需求,今年春节期间,北京各机房面临疫情封网,人员进出受控,金山云连夜紧急安排线上存量资源调度,整合北京、上海、广州各地的 BGP 带宽资源。同时,金山云迁移整合线上计算资源,很好地解决了以满足远程办公的业务突发和弹性扩容需求,支持海量文件存储和分发。

  为保证疫情期间的在线教学需求,金山云提供了包括直播、点播、下载、小文件等完整的 CDN 产品矩阵,以及包括边缘计算、集智高清、AV1、P2P、QUIC 双边加速等一系列技术体系在内的全方位服务,很好地解决了课程直播时高清度与流畅度无法兼顾的难题,保障师生实时在线教学、互动。同时,金山云提供7*24 小时的免费 IT 服务保障机制,让学生足不出户享受高质量的教学课程。

  此外,近期由于疫情原因,医疗行业和其它线下行业产生了大量的诸如防疫、在线办公、在线教育需求。针对不同行业客户近期的需求和疫情防控过程中存在的棘手难题,金山云发挥自身的技术和资源优势,基于云计算、大数据、AI 技术,推出了一系列的产品和方案,涉及应急物资管理、疫情防控、协同办公、远程教育、远程医疗等各领域,并在各省市、社区、医院、学校等地方使用,持续通过科技助力“抗疫”。