支付宝,集自己的“五福” - 网络动向论坛 - 吾爱微网

支付宝,集自己的“五福”

支付宝,集自己的“五福”

良渚文化村,临近除夕,孟章倚在阳台上看今年集五福的信息,旁边是刚晾好的酱鸭。

回想起来,这样的场面已经有4、5年。2020年家里的老人换了新的智能手机,从她这里扫走了这台新手机生涯中第一张敬业福。

那已经不是最火爆的那张敬业福了。2016年1月28日(农历腊月十九),集五福的活动首次正式推出——“富强福”、“和谐福”、“友善福”、“爱国福”和“敬业福”——五张集齐者可平分人民币2.15亿元。最后只有一共不到80万人集齐了五福,人均拿到的红包金额为271.66元。在当年,你在支付宝上加满10个支付宝好友,就可以拿到三张福卡,多少人拿着一沓子四缺一的福卡走街串巷。

支付宝,集自己的“五福”

“敬业福”是那一年珍惜的年货,让支付宝一时风头无两。之后直到现在,敬业福变多了,“集五福”这个动作已经成了年味的一部分。现在集五福已经成了中国人过年新的四大年俗之一。

孟章倚在阳台上研究五福的时候。几公里外的支付宝大楼,一群技术人员正在一次次重复着关于这场年俗的压力测试。

俊义,这次“集五福”的技术总指挥,在除夕前10天带领团队左右完成了今年集五福的上线,然后从杭州启程去北京,他会在当天回到杭州,一切准备工作都还没结束。

俊义从PC时代跨进移动互联网,到现在已经在蚂蚁待了16年。他在去年重新找到了那种移动互联网时代初期的兴奋感。不只是俊义自己,2022年末ChatGPT问世之后,2023年整个支付宝的技术团队都非常兴奋。

2024年春节的集五福,是俊义和支付宝在AI上的一次尝试机会,他不想错过。

练兵场

12月28日晚上8点开始,支付宝的整个8楼挤满了人,最后一次测试开始了。12点整,2024年支付宝春节集五福活动正式上线。

俊义和他的技术团队,把这次集五福变成了五福节。

“五福节”将横跨整个春节,从一个短周期的活动升级成为一场“数字庙会”。全周期包括三个阶段,第一阶段为“五福年货节”,已于1月10日启动,上万商家在直播间开播为消费者提供爆款年货;第二阶段为大家最熟悉的“集五福”,在1月29日正式开启;第三阶段是从大年初一开始的“过年天天乐”。

这也是集五福这件事第一次有了AI元素。

支付宝,集自己的“五福”

“大家来找福”是今年集福卡的新玩法,所有图片由AI生成,通过像素级可控生成技术,生成10万多张藏福图,用户可以和家人拼眼力,边找福字边得福卡。除了找福卡,“飙戏小剧场”“会说话红包”“时空照相馆”这些新的 AI玩法也是第一次登场。

没有人能在仅仅一年之后说清楚,2022年底ChatGPT的诞生到底意味着什么。但它让所有人的目光都吸引到AI上。当然也包括俊义。他将这场大模型的浪潮比喻成从经典力学向量子力学转变的时刻,也好像是另一次移动互联网之初。

对于随着移动互联网而繁荣起来的支付宝来说,这个“五福节”则是一次难得的机会。

如果AI会成为一个新的时代的基础设施,那它势必会有大规模应用落地的一天,对于9亿用户的支付宝来说,这样的新技术需要一次极限的压力测试。一项新技术在扛住国民级项目后,开始运用到支付宝日常的技术支持,再又通过开源和对外商业化,服务外部合作伙伴和更多普通人。这是蚂蚁内部技术的生长过程。

这不是第一次。

从2007年加入支付宝后,俊义一直在技术一线。从组建蚂蚁集团SRE团队,到负责研发效能、AI Infra、数据库这些基础设施建设,这位现任支付宝CTO在支付宝的头10年,一直围绕着双11。双11从一种新玩法变成国民性的消费心智的10年,也是支付宝迅速增长的10年。

“2009年,我记得淘宝给当时CTO发了个邮件——应该是逍遥子发的——他们要搞个活动,从第二年开始做了‘双11’。”

2009年支付宝有2亿用户,现在是10亿。没有人比完整经历了双11十余年的支付压测与技术保障的俊义更了解,支付宝是从什么时候成为支付宝的。

“支付宝整个分布式技术的沉淀,是从那时开始的。”双11成为了支付宝内部第一次技术迭代的契机。

2010开始,蚂蚁集团自研的原生分布式数据库OceanBase开始投入研发,尝试去掉IOE中那个“O”——Oracle。一定程度上,OceanBase是被双11倒逼出来的数据库,它需要闯过最为严苛的极限场景的考验。研发3年后,支付宝在2013年5月下线了最后一台IBM小型机,2014年双11的零时之后,出现了285万笔/分钟的交易峰值,这一年双11时10%的流量切到了OceanBase上,OceanBase 0.5版本第一次成功应用于支付宝核心交易系统。

在2015年的双11,OceanBase真正挑起了大梁。蚂蚁交易创建100%切流到OB上,核心线的会员、充值、支付上的切流比例达到了50%。现在OceanBase已经连续十余年稳定支撑双11,并且在金融领域成为市场占有率第一的分布式数据库。

到了2021年“双十一”期间,OceanBase成熟,蚂蚁集团的绿色计算技术也迎来了第一次规模化应用。绿色计算主要分为两个方面。在物理层面,降低数据中心PUE(核心能耗指标,即数据中心总能耗/IT设备能耗);在算力层面,合理分配计算资源。支付宝从软件技术入手,找到分时调度技术、AI弹性容量,再叠加已经成熟的离线混合部署技术作为技术解决方案。

在使用绿色计算技术之前,全局的算力利用率跟行业平均水平一样,8%。而从2019年投入研发,经过4年时间,现在翻了好几倍,达到了近40%。

主导了支付宝分布式技术和绿色计算的俊义,身上的一个大标签就是“双11技术总指挥”,他也同时主导了支付宝小程序云的技术和产品上线。大模型火了之后,他带着团队第一时间进入了这场新的围绕大模型的技术迭代里。

如果说十几年前的第一次技术迭代给支付宝扎了根,那现在的第二次,则是为了向上探。

底牌

大年夜22时18分,来自河南的张江准点打开自己此前集齐的5张福卡,领到了五福红包。这是支付宝第9年给全网用户发奖金,今年依然是5亿。支付宝发布的数据显示,今年,近6亿人次通过AI科技体验新年味,共有近30亿个AI生成的福字被用户找到,贾玲新电影《热辣滚烫》换脸片段上线五福“飙戏小剧场”后,一天吸引近百万网友AI“参演”。

支付宝,集自己的“五福”

集五福的AI化是一场AI时代大规模应用落地的测试,它到底在测试什么?

“两件事:算力的上限和成本控制。”俊义说。这是支付宝第二次技术迭代的核心。

过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍。这个增长曲线远超摩尔定律。而如果AI应用的生态在未来出现,算力需求会进一步提高。

支付宝在五福节里推出了业内首个多人AI人像——时空照相馆最多可同时支持6人同框——这还不能满足一个大家庭对一张全家福的需求,但6人已经是目前俊义团队测试过后能够达到的效果上限。

6人的合影上线意味着包括单人照、双人照、全家福等近千个关系对。而每个类型下面有5-6个风格模版,每个风格模版有最多10种姿势可选,这就意味着支付宝的后台模版多达近三万张。

这是第一款亿级用户产品敢这么玩,背后的算力基础是蚂蚁基础大模型平台具备万卡异构集群。

眼下蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练MFU可达到40%,集群有效训练时长占比达到90%以上;数据层面,除了全网通用语料与金融领域的优质语料,蚂蚁还注入了优质的研判分析数据,以及大规模知识工程所带来的超过270亿Token的知识量;模型层面,蚂蚁认为金融专属指令更能够代表大模型,解决特定金融任务的能力,其从真实场景中萃取了超过60万条以上的专属指令。

算力顶得住背后是对算力成本的控制。

算力成本的控制在大模型应用常态化中将会扮演着至关重要的角色,也直接影响到技术创新的速度。随着算力成本的降低,可以为研究者和开发者提供更多的实验空间,促进新算法、新模型和新应用的创新。而如果算力成本一直居高不下,不断增长的大模型训练和推理需求也将会变成更多的能源消耗和更大的碳足迹。通过优化计算效率、探索节能技术和新计算范式,对算力成本的精细控制成为推动大模型技术发展和广泛应用的关键因素。

俊义透露,目前蚂蚁万卡异构集群的硬件算力效率(HFU)超过了60%,集群有效训练时长占比90%以上。RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平。此外,蚂蚁的CPU利用率从2017年的不到10%,提升到了2022年的33%。

孟章也试了试时空照相馆,从支付宝点进去,找到“集五福”入口,点了3次终于找到。这个过程仍然有点繁琐。给外公介绍这个功能的时候,她直接搜索了“时空照相馆”这几个字。

支付宝,集自己的“五福”

双11的第15年,集五福的第9年,支付宝变成一个庞大而复杂的产品,而这正是俊义在谈到大模型时最兴奋的地方。对于俊义来说,大模型给这个世界的变化首先是交互方式上的。他对于支付宝未来的想象,是它或许可以从繁杂的图形界面挣脱出来,从GUI走向一个LUI的产品。这会带来支付宝在界面甚至整个产品形态上新的变化。

“我们希望技术上把支付宝改成LUI的支付宝,不仅仅在手机上能用全功能,也希望大家开车时也能用支付宝,让它出现在钮扣上,在音响里,这是我作为CTO依靠技术趋势要干的事情——让支付宝装到很多地方去,同时能用绝大部分功能。”

这意味着支付宝在推动技术迭代的自身逻辑上也要发生变化。虽然AI大规模落地应用的眼下仍然依赖人机合作,但从Copilot到Agent的这条道路已经开始。支付宝已经建立了一套完整的AI Copilot的解决方案。

去年9月,蚂蚁集团首次开源了代码大模型CodeFuse,CodeFuse 基于蚂蚁基础大模型研发,在近期代码补全的 HumanEval 评测中,CodeFuse 得分 74.4%,超过 GPT-4(67%)的成绩,也超过了 WizardCoder-34B 73.2% 的得分。而CodeFuse最独特的地方在于, 其微调语料完全来自蚂蚁内部的代码库,这让它天然地契合蚂蚁内部的产品开发。俊义表示,目前约50%的蚂蚁程序员在写代码时用上了Codefuse,AI生成代码占比超过10%,大大提高了代码开发效率。

CodeFuse背后,基于万亿级Token语料进行训练的百灵大模型在2023年11月完成了备案,而百灵多模态大模型也已经进入内测阶段。一整套从AI Infra到基础模型,再到行业大模型和应用产品的技术链路已经成型。

这场热闹的集五福也是支付宝迎接下一场变革必需集到的“五福”。一个崭新的支付宝,从这个新年里开始生长。

(文中孟章为化名)

请登录后发表评论

    请登录后查看回复内容