拳头游戏即将完成全球基础设施全面迁移至亚马逊云科技
在亚马逊云科技2023 re:Invent全球大会上,拳头游戏(Riot Games)全球基础设施和运营负责人Brent Rich宣布,公司实施多年的全球数据中心关闭项目已进入到最后阶段,并将于2024年初全部完成。通过这一计划,拳头游戏将使其服务器更接近旗下游戏的玩家,这些广受欢迎的游戏包括《英雄联盟》(League of Legends)、《无畏契约》(VALORANT)、《英雄联盟:激斗峡谷》(League of Legends: Wild Rift)、《云顶之弈》(Teamfight Tactics)和《符文之地传说》(Legends of Runeterra)。
自2017年开始,拳头游戏决定关停物理数据中心,并向亚马逊云科技全面迁移。此后,已有14个数据中心相继关闭,包括上个月刚刚关闭的位于拉斯维加斯和智利的数据中心。拳头游戏计划在未来几个月内继续关闭其在巴西和土耳其的剩余数据中心。
除了作为拳头游戏的官方云服务提供商,亚马逊云科技还是该公司的官方云端人工智能(Cloud Artificial Intelligence)、云端机器学习(Cloud Machine Learning)和云端深度学习(Cloud Deep Learning)服务提供商。
拳头游戏在规划公司未来的发展道路并继续探索为玩家提供电视节目、音乐和电竞广播等创新服务的过程中,鼓励团队采用"云优先"的思维方式。Brent Rich表示,"过去,在面临极限或挑战时,我们的第一反应是‘我可以做得更好';而现在我们会‘先跟亚马逊云科技交流一下',看看他们能为我们提供哪些帮助。"
故事开始的地方
"时间回到2015年左右,拳头游戏仿佛一艘永不减速的火箭。"Brent Rich回忆道,"《英雄联盟》取得了爆炸性成功。拳头游戏所有的精力都集中在性能和玩家体验上。"
2015年至2018年间,拳头游戏专注于将《英雄联盟》打造成一款能够持续吸引玩家的游戏,每两周更新一次游戏内容。拳头游戏的数据中心采用的技术已经有近十年的历史,尽管公司进行了生命周期升级,并通过亚马逊云科技实现了对旧软件服务技术堆栈的虚拟化,但它仍然依赖本地基础设施。
时间进入2019年,拳头游戏的关注点转向独立移动游戏《云顶之弈》,并计划在2020年发布下一个重量级游戏。针对《无畏契约》,公司最初计划在全球设立40个数据中心来为玩家提供服务。低延迟的解决方案对《无畏契约》的成功至关重要。在游戏开发的早期阶段,拳头游戏就意识到消除"探头优势"(peeker's advantage,指玩家可能因为延迟差异和服务器记录玩家的行动而获得的微小优势),这一举措将为玩家带来关键价值。
"那时,我们认为使用物理服务器是维持高性能的正确方式,但建立和运营数据中心非常复杂,更别提引入自动化功能。因此,我们希望了解如何在云端获得与物理服务器同等的性能水平。"Brent Rich表示。
拳头游戏技术负责人、《英雄联盟》高级首席软件工程师David Press表示:"我们需要更大的灵活性来调整容量。如果是利用本地的基础设施,我们通常需要花几个月的时间来计划,这迫使项目沿用瀑布模式。但我们希望能够更加敏捷。"
于是,拳头游戏开始探索将云作为数据中心的延伸,希望可以简化运营并提高效率,从而实现更快速地迭代并以自动化的方式负载测试。为了实现这一目标,Brent Rich和团队开始与亚马逊云科技合作并制定了一项行动计划。
"无论是过去还是现在,亚马逊云科技都是云计算领域的领导者,而且我们已经有了多年的合作经验,亲身体验了他们以客户至尚的准则,因此我们相信他们将会是卓越的战略合作伙伴。" Brent Rich表示。
为了实现《无畏契约》极致的低延迟目标,拳头游戏与Amazon Elastic Kubernetes Service(Amazon EKS)团队合作制定了一个工作路线图,为拳头游戏及其玩家提供他们所需的功能、支持和体验。
持续进化的方法
2019年6月,《云顶之弈》成为拳头游戏将游戏开发方式转移到云端的开始。在Brent Rich看来,《云顶之弈》"诞生在亚马逊云科技"。而《无畏契约》则是一次重大的考验。拳头游戏团队决定为《无畏契约》的发布进行18个全球部署,其中14个在亚马逊云科技上,另外4个在拳头游戏的数据中心上。2020年初,公司进行了一项几乎达到全面发布规模的封闭测试,在4月至5月期间每天吸引近300万玩家参与。
"从3月开始,我们的一切都依靠云计算。"Brent Rich说道,"我们对于云端的超大规模扩展抱以极高的期望。"
《无畏契约》从正式发布之初便在云上,并迅速成为公司又一款价值数十亿美元的系列游戏。此后,拳头游戏还在云上推出了多款小型游戏。随着它们的成功发布,公司决定开始将剩余服务器都迁移至亚马逊云科技。
获得内部支持
Brent Rich认为,采取逐步验证的方法是赢得最初持怀疑态度的高层管理人员信任的关键。"我们必须证明我们可以让新的事物在云端运行。最大的依据就是UDP协议(用户数据报协议)延迟和丢包率处于可接受的水平。一旦玩游戏时出现丢失数据包,会让角色看起来像是在瞬间移动位置,从而影响游戏体验。"
在项目初期,Brent Rich让团队列出认为云计算无法成功的所有可能原因,然后他开始逐一确认或反驳每一个观点。"他们对此有一些担忧是可以理解的,但我们进行了调查并证明了我们可以克服每一个障碍。当我们直接在云端运行《云顶之弈》时,并未出现任何计算问题。云的质量与我们在数据中心获得的质量并无不同。"
Brent Rich逐步验证的方法得到了拳头游戏首席技术官Derek DeFields的支持,同时他也让那些建议公司继续建立新数据中心的人改变了观点。"并非所有人都支持我们的决定,有些人还想购买备用设备。当我们将《云顶之弈》甚至《无畏契约》都部署在亚马逊云科技上时,我们并没有做‘全面上云'的宣言。但我们与亚马逊云科技之间的关系以及我们的合作确实向前推进了一大步。"Brent Rich继续表示。
David Press表示:"通常情况下,在本地出现硬件故障时需要停机90分钟。在迁移到亚马逊云科技并使用了Amazon RDS后,硬件故障虽然也可能发生,但停机时间只有30秒。"
Brent Rich表示,当负责将系列游戏迁移至亚马逊云科技的主要工程团队要求接管项目时,他就知道这个项目已经成功了。"我们花了两年的时间才让他们接管这个项目。至此,我们完成了列表上的每一项任务。"
全新的思维方式
当被问及迁移上云为拳头游戏带来了什么时,Brent Rich提及到,"更多的是它关闭了什么。"他表示,"这是一个全新的篇章。我们几乎抛弃了关于数据中心的一切。我们已经印证了云计算可以实现我们的目标,对于数据中心的观念已经完全改变了。"
拳头游戏与Amazon EKS团队定期进行项目规划会议,继续开发工具和新功能以支持公司的更多项目。Brent Rich认为:"有些事情如果没有一个战略合作伙伴是很难实现的。例如,通过与亚马逊云科技和我们的集成合作伙伴Slalom的合作,我们为《英雄联盟》提供了一个非常详细的共享自动化操作手册。如今,我们只需花几周的时间就可以在新的地区启动新的项目。这样的合作伙伴关系对我们来说非常宝贵。"
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本文禁止转载,侵权必究。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。
评论
评论
推荐评论
暂无评论哦,快来评论一下吧!
全部评论(0条)