图源:天眼查
在中国计算机大会论坛上, AI独角兽企业智谱AI正式发布全新自研的 第三代基座大模型 ChatGLM3系列。
智谱AI官方指出,ChatGLM3在多模态理解、代码模块、网络搜索等能力上有所提升,相较于最佳开源模型推理速度提升2-3倍。同时,因采用自研的Agent Tuning技术,在智能规划和执行上比ChatGLM-2提升10倍,并通过利用华为昇腾生态,其算力推理速度提升3倍以上。
公开信息显示,成立于2019年的智谱AI为清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司。其中,CEO张鹏毕业清华大学计算机系,总裁王绍兰为清华创新领军博士。
名校光环+爆火的AI,双层buff加持下,智谱AI可谓说是资本眼中的宠儿。今年7月至9月,智谱AI直接拿下5轮融资,企业估值高达100亿元,是国内 AI 领域独角兽企业,其背后的投资方包括美团、阿里、蚂蚁集团、高瓴资本等多家投资机构。
图源:天眼查
智谱AI CEO张鹏指出,智谱 AI GLM大模型已被应用到政务、金融、能源等多个领域,合作伙伴包括阿里、腾讯云、火山引擎、华为、美团、微软、OPPO、海天瑞声等数十家公司。
华信永道近日发布公告称,已和智谱AI签订《人工智能大模型共建战略合作协议》,后续双方战略合作场景包括政策知识梳理与构建,客户服务咨询、风险识别等。
图源:华信永道
除智谱AI外,此前腾讯、商汤、华为等多家大模型公司在公开场合均表示,目前所发布的行业大模型已超过数十个,甚至上百个大模型解决方案。但时至今日,市场仍未看到大模型对其背后企业业绩有明显带动。
商汤今年半年报显示,报告期内商汤集团的生成式AI同比增长670.4%,对集团业务贡献从2022年的10.4%提升至20.3%,但今年上半年商汤营收仅同比增长1.3%至14.33亿元。
科大讯飞今年上半年营收和净利润分别为78.4亿元和7357.2万元,分别同比下滑2.26%和73.54%,营收和利润双双暴跌。360公司所提到为中小客户提供AI服务收入2000万元,实则是软件会员费用和企业安全云的SaaS服务。
和国内市场不同的是,大模型正在带动海外企业营收增长。The Information报道称,Chat GPT预计在未来12个月内,通过销售人工智能软件及其计算能力,将获得超过10亿美元的收入。英伟达今年第二财季,数据中心GPU芯片相关业务收入同比增长171%至103亿美元,公司总净利润同比增长843%至61.88亿美元。
张鹏曾指出,对标Open AI是智谱AI成立以来的目标。但未来智谱AI又能否达到Chat GPT这一收入,真正成为中国版的“Open AI”呢?
01.智谱AI能力仍需持续完善
虽说在中国计算机大会张鹏提到,ChatGLM3在44个中英文公开数据集测试中国内同尺寸模型排名首位。但我们在智谱AI官网测试后却发现,智谱AI大模型未来仍需持续完善。
图源:中国计算机大会
在智能客服场景中,我们针对“你们家的牛肉酱怎么没有牛肉”这一问题,向智谱AI多次询问,但三次答案却不同,且均存在问题。首次回答中,智谱AI指出这是因产品名称误导、配料表不明确、宣传推广不清晰、产品分类问题所导致。
图源:智谱AI官网
二次回答中,智谱AI指出这是一款以大豆、玉米等为主要原料的调味酱。三次回答中,智谱AI指出这款牛肉酱主要成分是豆酱、辣椒、花生、植物油等。换言之,第二、第三次回答前后矛盾。
图源:智谱AI官网
针对智谱AI的上述回答,国内某生产牛肉酱企业的电商经理胡强(化名)告诉DoNews,按照相关法规要求,食品企业名称为牛肉酱时,需在食品标签中清晰注明配料包含牛肉。若告知客户我们食品标签不清晰,通过多种原料进行勾兑,这不但无法安抚客户情绪,甚至可能还会因虚假宣传给企业带来经济损失。
图源:京东
客户质疑牛肉酱没有牛肉时,客服可以给到客户配料表,并告知客户只是我们家牛肉颗粒较小,您这边可能没有吃出来。客服实际工作中,要学会有理有据地“辩解”,而非将所有问题全部揽到企业身上,全部顺着客户说。
在测试逻辑的推理上,我们给出了一道数学题:我们公司去年有员工 315人,其中90后占全公司人数的1/5。今年又招进了一批90后,让90后人数占到了全公司人数的 30%。所以今年招了多少90后?
智谱AI首次回答中,直接告诉我们具体数值取决于公司今年总人数X的大小,这一回答相当于没有回答。紧跟着我们又问X是多少?但智谱AI给出210人和正确答案45人相比,明显错误。
图源:智谱AI官网
第二次的回答中,智谱AI先是给出了一个11300人的错误答案,这一答案甚至题干中315人的总人数还要多。意识到错误后,修正出的314人不仅答案错误,甚至几乎不符合题干要求。
图源:智谱AI官网
我们将难度升级,在作业帮中选取一道高中常见数学函数题,并要求智谱AI只回答前两问。但在这两问中,智谱AI给出的答案均错误。两道数学逻辑题的接连出错,和智谱AI所宣传的ChatGLM系列模型能够解决复杂推理问题明显矛盾。
图源:作业帮
图源:智谱AI官网
02.商业化仍需持续探索
现阶段,大模型的盈利方式主要包括大模型、大模型+算力、大模型+应用。其中,大模型和大模型+算力为主要盈利方式。
图源:爱分析
智谱AI盈利方式和行业盈利方式基本一致,一是根据客户需求,提供大模型定制化开发服务。云端私有化本地私有化最高价格分别为120万元/年和3690万元/年。
图源:智谱AI官网
二是标准版大模型,提供API接入方式,按照tokens使用收费。ChatGLM-Turbo、CharacterGLM、Text-Embedding收费标准分别为0.005元/千tokens、0.015元 / 千tokens、0.005元/千tokens。
这里的tokens可简单理解为“字”或“词”,目前市场上针对tokens尚缺乏一个完整的标准。通义千问、Chat GPT、文心一言的1token相当于1个汉字,星火大模型和Baichuan53B相当于1.5个汉字,混元大模型则为1.8个汉字,英文上几家大模型企业定义更是千差万别。
图源:公开信息整理
收费标准上,除Chat GPT接近1元/1k token,其他大模型企业费用相对便宜,这虽能提高大模型在TOC端的渗透率,但也意味着大模型厂商需完成海量用户积累才能给企业带来更多营收。
图源:公开信息整理
据七麦数据显示,文心一言iOS端、讯飞星火iOS端近一个月日均下载量均在2万以下。同时考虑到APP下载到次日留存、七日留存会存在较大的漏斗模型。显然,当前文心一言和讯飞星火iOS端真实用户数量明显不足。
图源:七麦数据
文心一言虽效仿微软Colpilot推出包月会员服务,但一方面ToC端用户被移动互联网免费教育多年,会员付费意识不强。如腾讯音乐今年二季度会员付费率为16.7%,这一数字和Spotify40%以上的付费率相比,整体偏低。
图源:文心一言
另一方面,ToC端对大模型尝鲜感较强,大模型现有能力对用户留存有限。厂商对ToC端收费后续将陷入用户流失,增加广告投放费用获取新用户,用户持续流失的恶性循环中。
在ToB端,因我国企业净利润率和欧美企业相比尚存在差距,国内企业软件付费意识普遍不强,这点从中美软件收入占GDP比重也能看出。而且在当前中小企业、民营企业普遍追求降本增效活下去的背景下,其自然优先考虑投产比问题。
图源:wind
但ToB端定制大模型成本极高,企业除需支付大模型厂商百万千万的定制费用外,也需同时承担数据准备和预处理的成本、模型训练和调优的成本、部署和运维的成本、模型更新和迭代的成本,以及法规合规成本,内部人员调动成本等等。
以科大讯飞T20学习机为例,因其搭载星火大模型,其价格比T10高出2000元。有知情人士透露,增加的2000元仍未能覆盖大模型成本。但目前市面普通学习机,其硬件版权购买的总成本也仅在1000-1500元左右,这就更加凸显了大模型在商业应用中的高昂成本。
高成本投入下,却是何时盈利的不确定。以搭载大模型实物产品为例,在消费者逐渐被全网最低价教育下,过高的产品售价很容易劝退消费者。仍以科大讯飞T20学习机为例,其8000多元的售价让其在京东平台上评论较少,抖音前端显示销量4000+。但考虑兴趣电商退款率问题,真实销量自然可想而知。降低产品售价,虽能带动销量,但无法覆盖大模型成本。矛盾之下,企业又会如何抉择呢?
图源:京东、抖音
大模型“虚拟产品”,也面临上述问题。文本创作虽为当前大模型的通用能力,但国内某家自媒体公司负责人刘伟告诉我们,目前包括头条号、百度号、抖音等多家平台对由AI生产的视频、图文基本都是限流,点赞量、评论量等数据极其惨淡。
图源:抖音
另按照头条号、百家号10元1万阅读量的流量收益计算,百万成本投入阅读量至少需在千万级。但在信息爆炸,用户追求信息差异化下,很难实现。而且大模型说是降低人力成本,但百万级的投入,远比人力成本还要高。
除投产比外,从事ToB端销售多年的张东(化名)告诉我们,自己和不少企业主沟通后发现,不知道大模型、大模型对企业日常经营有何帮助的企业主占比极高。作为对比,当自己提到金蝶、用友等厂商的ERP软件时,他们却极其清楚,甚至不少企业使用ERP多年。
即便有部分企业主知道大模型,但也存在着场景不匹配、企业数据安全风险、对大模型能力质疑等问题。尤其是智谱AI的客服场景完全顺着客户说,很多企业主更是不敢使用。综合来看,愿意为大模型买单的可能只有具备资金实力的大型企业。
爱分析相关报告也指出,目前大模型商业化提速较快的行业为能源和金融,其原因在于这两个行业密集分布的央国企。央国企数据基础设施建设完备、算力投入高、AI应用场景多且基础强,这些原因促进央国企与大模型的快速融合。
图源:爱分析
03.大模型价格战将至今,智谱AI如何应对?
针对本次发布的ChatGLM3模型,张鹏提到,ChatGLM3模型价格达到国内最低,甚至在全世界范围内大模型API售价最低的水平线。但因训练和推理阶段算力成本的下降,后续将带动大模型价格的持续下探。
以英伟达的两款GPU产品H100和A100为例,根据公开数据,H100的算力相较于A100提升了6倍左右,但价格仅提升了3倍左右,单位算力的成本显著下降。换言之,ChatGLM3后续的售价不可能达到最低。
而且随着大模型供给和开源企业增加,其在2024年国内市场规模仅有120亿元,短期内买方仍以国企、央企等具备资金实力和需求场景明确的企业为主。僧多粥少下,未来大模型将和云产业、SaaS产业那样深陷价格战的泥潭中。
图源:爱分析
也就是说,后续大模型企业除需比拼技术能力外,也需比拼企业综合销售能力,以在买方的招投标中获取更多订单。但销售能力,对智谱AI这种技术型企业而言,可能是一大短板,尤其是和华为、阿里等厂商相比,其在客户积累上本就不足。
以华为为例,做ToB服务起家的华为,手中已积累大量国企、央企等客户,而且内部有专人跟进这些客户需求。一旦这些客户有大模型需求时,华为则会迅速介入。而且针对ToB销售,华为可通过交叉销售的方式分摊成本。换言之,华为盘古大模型哪怕给客户的报价再低,后续也可借助其他方式盈利。
因此,后续智谱AI可能需从技术型思维逐渐转变为销售型思维。但其内部技术人员又是否会愿意接受这一改变呢?
更现实的问题是,虽说多轮资本介入下,为智谱AI的研发提供了充足的资金保障,但这也让当下智谱AI的股权极其分散。
未来这很有可能会出现各股东之间利益诉求不一致,包括长期布局,短期、产业诉求和资本诉求等;股东与公司之间的矛盾错综复杂,各种矛盾会频繁发生;对市场相应速度下降,决策流程变长等等问题。因此,平衡好各大股东利益,这极其考验张鹏个人的综合能力。
图源:天眼查
同时在大模型价格战下,智谱AI营收、利润必然会受到影响。随着越来越多的资本对大模型从火热到冷静,此时又是否会出现资本套现撤离呢?
围绕ToB端的大模型商业化,这条路注定坎坷,毕竟SaaS产业、云产业已经有了前车之鉴。因此,如何在大模型商业化真正爆发前,穿越黎明前的寒冬,这是包括智普AI在内的每家大模型企业都必须思考的问题。