腾讯云的一个“小项目”,如何扛起数亿用户需求?

云计算1年前 (2023)发布 aixure
48 0 0
导读:21世纪经济报道记者白杨 北京报道 三年前,腾讯通过一场大刀阔斧的改革,完成了公司整体战略的升级。当时,外界的目光都聚焦于腾讯的ToB转型,鲜有人关注腾讯新成立的技术委员会,以及其提出的开源协同和自研上云两大技术战略。 所谓自研上云,就是要将腾讯…

21世纪经济报道记者白杨 北京报道

三年前,腾讯通过一场大刀阔斧的改革,完成了公司整体战略的升级。当时,外界的目光都聚焦于腾讯的ToB转型,鲜有人关注腾讯新成立的技术委员会,以及其提出的“开源协同”和“自研上云”两大技术战略。

所谓“自研上云”,就是要将腾讯内部的自研业务搬上云端。这个看似简单的搬迁动作,对于一直追求小团队作战的腾讯而言,却是一个要伤筋动骨的巨大挑战。

历经3年的时间,腾讯近日对外宣布,自研业务已实现全面上云。这也意味着,腾讯过去分散在不同事业群的割裂的技术栈,在云端实现了大一统。

这个过程中,腾讯部分新业务也成为了云端的原住民。它们生于云、长于云,成为了腾讯内部检验云技术的试炼场,同时也是外部观察腾讯云服务性能的重要窗口。

腾讯会议是生于云的业务之一,2020年初,为了应对剧增的云会议需求,腾讯会议在8天的时间内实现了100万核资源的扩容。而完成这项不可思议的工作背后,依靠的正是云的能力。

但这仅仅是个开始,在上线245天后,腾讯会议用户数突破了1亿,如今用户数已超过了3亿。伴随着用户规模的快速扩张,腾讯会议对于云的能力需求也在发生变化,除了底层资源上云,对上层应用乃至技术栈进行云原生升级需求也变得十分迫切。

一个“小项目”

在互联网公司,每个新项目能获得多少资源,要由项目的权重所决定。如果只是一个小项目,它能匹配的资源也不会多。

而腾讯会议在立项时,就是这样一个小项目。起初腾讯会议就是CSIG的一个创业项目,只有不到几十人,预期在上线一两年内能达到5万DAU的规模。

这么一个小团队,在做技术选型时,优先考虑的是相对先进且大家都更熟悉的技术栈,这样开发效率也会更高。

但作为一个新生儿,挑战也随之而来。2020年初,腾讯会议的用户量激增,项目的初创团队已难以支撑,腾讯便从公司层面派了十几个团队前来帮助。

这个时候问题出现了,来帮忙的兄弟团队使用的技术语言以及熟悉的技术栈都各不相同,为了临时应急,腾讯会议只能提供统一接口,让这些团队各自接入。

这导致,整个腾讯会议变成了一个非常大的异构系统。后来,当其他团队散去,如何将复杂的技术栈进行合并统一,成为了腾讯会议团队面临的一大挑战。

腾讯云副总裁、腾讯会议技术负责人陈健生表示,“云原生的优势在于它具备非常好的横向伸缩能力,同时能够释放人力提高研发效率,所以当业务到了一定规模,升级迭代是必须要做的事情”。

真正的云原生

2020年4月,腾讯会议开始着手推进云原生升级。

这个过程大致可以分为三个阶段:容器化和组件化的替换、架构的微服务化和DevOps研效、以及持续的精细化运营。

第一个阶段的容器化和组件化,这个过程持续了两三个月。彼时,腾讯会议的整个底层资源具备了云的能力,但是,要想真正做到云原生升级,服务更大规模的用户,需要通过第二阶段和第三阶段来实现。

腾讯云专家工程师薛笛告诉记者,第二阶段要解决的是效率问题,腾讯会议当时是从devops的改造入手。2020年,腾讯会议的发布系统还比较传统,需要先编包,面对一个几万台机器的模块,发布一次需要点击几百下,效率非常低。

“腾讯会议每天要发布上百个模块,如果用原先的研发流程,则需要几个研发人员每天什么都不做,只在那点击发布按钮”,薛笛说。所以在整个研发体系上,腾讯会议投入了较大的精力,通过对研发效率的提升,把研发人员解放了出来,让他们去做更多的研发工作。

另外,像是直播、RTC等在内的流媒体系统,特性流量虽然很大,但是又是以小包存在,这就涉及到很关键的一个指标叫做PPS,每调用一层就会占用整个系统的进程,媒体的服务就会遇到瓶颈。

所以在第三阶段,腾讯会议要让流媒体系统和云原生体系不断弥合,比如在使用云原生能力的同时,也要让云原生适配腾讯会议在流媒体领域的需求。

如今,腾讯会议已走完这三个阶段,实现了真正的云原生,这也使腾讯会议团队在应对突发状况时,变得更加从容。

薛笛表示,2020年时,研发团队经常彻夜不睡,甚至几个星期都在公司吃住,需要天天盯着才能把系统做好。今年,面对不亚于2020年的用户需求,整个团队却更加轻松。

同时,云原生也帮助腾讯会议优化了运营成本。比如devops体系的建设,解放了大量研发人员,使得研发人效大大提升;另外,借助云原生的自动扩缩容能力,也节省了大量储备机器的成本。

陈健生则告诉记者,在和2020年部署的核心数规模差不多的情况下,腾讯会议现在能够支撑的容量翻了一倍,相当于性能提升了一倍。此外,腾讯会议目前的自动化测试覆盖率超过了97%,研效的流水线耗时也下降了近85%。

在腾讯会议身上,云原生降本增效的价值得到了充分的体现,作为腾讯最大规模的云实践,“自研上云”项目在推进过程中也面临着重重阻力,而腾讯会议作为近两年成长起来的腾讯明星业务,成为了整个公司云原生的标杆产品。

对腾讯而言,腾讯会议这场面对数亿级用户规模产品的云原生实践,不仅检验了腾讯云产品的技术能力,也为更多自研产品出了一条可行的云原生路径。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...