短短一年,大模型的赛制已经从资格赛进阶至淘汰赛——刚刚迈过资金准入门槛的大模型厂商,火急火燎地卷进了价格战的漩涡。
这场价格鏖战始于私募巨头幻方量化旗下的AI公司DeepSeek。5月6日,DeepSeek宣布开源第二代MoE大模型DeepSeek-V2,标价为GPT-4-Turbo的近1%,百万tokens只需1元。
智谱紧随其后,于5月11日称个人版GLM-3Turbo调用价格从5元/百万tokens降低至1元/百万tokens。
4天后,字节跳动也加入了价格屠夫的阵营,打着低于行业平均价99.3%的旗号,宣布豆包Pro 32k模型0.8厘/千tokens,用户花1元可获取与5本《新华字典》相当的数据量。
接下来的一周内,阿里、百度和腾讯等互联网大厂和垂直赛道头部玩家科大讯飞相继释放了降价信号。阿里云宣布通义千问9款模型一起降价,其中主力模型Qwen-Long直降97%;百度智能云则直接宣布文心大模型两大主力模型ERNIE Speed和ERNIE Lite免费;腾讯云则称,其主力模型之一混元-lite模型的价格从0.008元/千tokens调整为全面免费,其他模型降幅最高达87.5%;而科大讯飞则表示轻量级模型API永久免费。
实际上,OpenAI也是降价阵营的主力军,其最新模型GPT-4o价格较GPT-4-Turbo再次减半,这是自2023年初以来OpenAI进行的第4次降价。按照OpenAI的预期,其大模型将以每年50%-75%的幅度继续下调。
回溯出行、本地生活、新能源车等领域,每个赛道的决胜局都少不了价格战。然而当前大模型盈利前景尚不明朗,价格战却早早脱胎于无形,竞争的激烈程度可见一斑。
“价格战一般存在于行业中后期,即技术成熟、市场完善、竞争格局清晰之时,各占山头的企业通过压低价格来抢夺对手的蛋糕。”AI投资人刘柯(化名)向时代周报记者称,大模型厂商间的比拼比新能源车领域还要猛烈,他们前期烧掉的资金还没有收回来,急于投身价格战无疑要承担巨大的资金风险。
价格战的早产,将本就金鼓连天的大模型赛道推向白热化。
近日,估值10亿美元的Stability AI资金链断裂,正在寻求被收购;融资近5亿美元的Adept,正在与互联网大厂洽谈出售事宜;清华系大模型公司衔远科技传出了人事变动。据悉,公司创始人周伯文已不再主持公司事物,多位业务负责人也在今年春节前后离职。每日经济新闻报道称,出现该变动的原因是公司“产品迟迟无法落地,商业化进展缓慢”。
另时代周报记者从一位AI投资人处获悉,另一家清华系大模型明星企业深言科技也正经历发展瓶颈。该投资人称,深言科技创始成员大额套现,产品研发进展缓慢,部分团队核心成员已将主要精力放回学业。时代周报记者就该问题尝试联系深言科技创始人岂凡超进行核实,截至发稿未得到回复。
大模型价格下调已成趋势,厂商该如何平衡成本与支出?谁会是这场战役的受益方?腰部大模型企业又该怎样迎战?
价格下跌一大截,技术前进一小步
大模型厂商的降价手段与互联网企业有所不同。无论是网约车,还是电商和外卖行业,所谓价格战往往通过巨额补贴来实现。而大模型的降价逻辑是通过技术手段的驱动,重构生产函数,提升研发效率来压低成本。
随着模型工程化、架构、系统手段不断优化,推理成本的减少有效带动了模型降价。DeepSeek-V2的一篇论文中称,研发团队利用MLA(Multi-head Latent Attention,多头潜在注意力)结合 MoE(Mixture-of-Experts 专家混合模型),实现了模型性能跨级别提升,同时减少了计算量、推理现存及成本。
但推理成本的降低,只能算模型厂商们向前迈的一小步。零一万物CEO李开复此前表示,整个行业每年降低10倍推理成本是可以期待的,而且必然也应该发生。“降低模型推理成本并不难,难的是探索模型综合能力的上限,模型能力提升,才能带来API商业模式的持续增长。”Minimax创始人闫俊杰也表达了相同观点。
无奈在模型能力相近的情况下,国内厂商只能先简后繁。
目前,大模型价格战仅限于推理所用的token降价层面。token是自然语言模型处理文本的最小单位。大模型厂商在训练出闭源大模型后,会将其 API(应用程序编程接口)出售给开发者并收取费用。这种主流商业模式的计费法则一般依靠token所对应的汉字、字母的使用量来计算。
token并非大模型的全部。下游企业在获取大模型API后还需通过投喂数据、微调等方式进行模型优化和部署,而这些成本依旧昂贵。比如阿里的Qwen-Turbo大模型,进行百万个tokens推理只需要2元,若继续进行训练,则需要花费30元,具体部署时,每月则需要2万元。
而百度云的千帆大模型平台虽然有两款大模型可以免费调用,但是模型部署、精调、评估、数据管理、插件调用等环节都需要按量付费。以最基础的模型部署为例,客户租赁5天私有资源池至少需要7000元。
时代周报记者还注意到,大模型厂商的降价并没有覆盖全线产品。如阿里、百度降价幅度最高的产品都是其轻量模型,主要适用于使用频次不高、推理量不太大、任务处理量不太复杂的中小企业、开发者在短期内使用。
显然,大模型企业见缝插针卷价格,很大程度上还是为了制造噱头吸引用户,以缓解API这一模式的增长焦虑。
为了提高大模型的API调用量,大模型厂商始终不遗余力地探索降低AI应用门槛的方法,让更多的人先用起来。百度云在2023年曾推出了模型开发工具Model Builder 和AI应用开发工具AppBuilder。今年4月,其又联合有渠道、场景的供应商一起合作服务客户,希望进一步拉升文心大模型标准化的API 调用量。
百度公布的最新数据显示,文心大模型日处理文本2500亿 token,另一大厂字节跳动日均处理 1200亿token。这其中很大一部分是公司内部业务在调用做AI 应用和业务探索。可见,标准化的模型 API 并没有迎来确定性的增长。
2023年年底,The information称OpenAI的年度经常性收入已经达到了16亿美元,只不过,如此体量的营收相比其百亿美金级别的研发成本而言也还是杯水车薪。
羊毛出在猪身上,价格战喂饱云厂商
官方辞令背后,这场价格战更像是云厂商在另一赛道布下的战局——用低价的大模型引流,带动背后公有云服务的销售。IDC数据显示,2023上半年中国大陆公有云市场同比增速放缓至15.9%,这一增速在2023下半年进一步放缓至9.5%。
官宣降价后,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,公有云的技术红利和规模效应,带来巨大的成本和性能优势,能大幅压缩模型推理成本、加快推理速度。
随后,在百川智能新一代基座大模型Baichuan 4的发布会上,创始人王小川表示,价格战核心要看背后的商业模式是什么,如果是做to B服务的,降价的根本目标不是为了卖大模型本身,而是带动整套云服务的销售。这推动云厂商从偏传统的服务模式,进入到一个新战场。
猎豹移动董事长兼 CEO傅盛也在朋友圈发文称,这次价格战,降得最凶的都是有云服务的大公司,通过大模型来获取云客户,羊毛出在猪身上,降得起。
此前,大模型为公有云带来的增量很小。拿百度举例,2024年一季度百度云收入为47亿元,同比增长12%,其中6.9%的云收入来自外部客户使用大模型及生成式AI相关服务。以此测算,当季生成式AI给百度云带来的收入约为3.24亿元。
阿里云在大模型降价后的第二天就推出了上云优惠。包括首次推出5亿元算力补贴,以及为200余款云产品制定折扣价,这些产品包括覆盖GPU、云服务器、大模型训练与推理服务等产品。
图源:Unsplash
“‘公有云+API’被认为是企业使用大模型更具性价比的模式,哪怕AI利润暂时比较薄,只要有足够多的客户上公有云,云厂商便能吸引用户购买计算、存储、网络和安全等基础产品。”科技分析师李笑霖告诉时代周报记者。
李笑霖还表示,低价策略主要利好to B的大模型厂商。“随着越来越多的开发者被吸引进来,更多新的落地场景将随之被激活。而随着公有云和算力规模效应的逐渐显现,会进一步反向压缩模型厂商的成本。等待行业整体丰富起来,模型厂商还将获取源源不断的应用产品生态捆绑以及垂直模型的优化方案。”
“应用产品与通用模型适配得越牢靠,意味着模型厂商与客户绑定越紧密,下游企业将持续为模型厂商支付运营费用,而转换平台要面临昂贵的转换成本。”李笑霖补充道。
价格战早产,是大模型创企之殇?
大厂气势汹汹打价格,大模型创企却应声者寥寥。
原因在于,大模型创业公司如今都认可“双轮驱动”战略,认为只有既做通用模型,又做产品才有未来。但显然,模型所需的资金、人才和GPU集群都是稀缺资源,产品所需的营销、渠道也意味着大额消耗。创业公司们明显不舍得丢掉手中为数不多的筹码投身价格战。
李开复表示,ofo(共享单车)式的疯狂降价是双输的打法,大模型公司不会这么不理智,因为技术还是最重要的,如果是技术不行,就纯粹靠贴钱赔钱去做生意,“我们绝对不会跟这样的一个定价来做对标”。官网显示,零一万物最新发布的闭源大模型Yi-Large,每百万tokens价格20元。
王小川则说,这次B端降价,不是生产关系改变,而是直接做生产力供给,将AI直接供给生产力,“这件事情对我们而言,就是别掺和进去”。
“目前大模型赛道是错位与同质化竞争并存的状态。各家技术差距不大,但也具备相对差异化的产品。好在市场还不成熟,蛋糕尚且未被瓜分,明星创企依然有出头的机会,但需要找到万无一失的应对策略。”刘柯向时代周报记者称,资本是逐利的,此前历经数轮融资的创业公司也到了向投资者递交成绩单的时刻,但技术大山连绵起伏,商业化前景也不够明朗,下半年行业或将面临洗牌,一些企业很可能在此节点就与赛道无缘了。
傅盛认为,这次大降价基本宣告了大模型创业公司必须寻找新的商业模式。
刘柯称:“创业公司资金实力不如可以依靠云业务造血的大厂,因此一味拼低价显然是没有生存空间的,如果要向应用层延伸,或者打造AI原生,也不能忽略大厂的围追堵截。AI搜索、AI Agent等热门应用都有大厂在布局,况且现有的大模型能力还不足以支撑一个超级APP的诞生。”
假如深入B端交付业务,也意味着大模型创企或将为了迎合国内市场,面临为纷繁的客户做精细化定制的处境,最终要舍弃掉与AGI相匹配的估值。
刘柯表示,明星创企不妨与专注于某一领域的大模型开发和服务平台,与大厂合作,作为其ISV服务商,来为大厂提供某些专项场景所需的软件服务系统,“剩者为王,是大混战时期的生存哲学。