01
智谱AI,站在聚光灯下
超25亿元人民币,这是北京智谱华章科技有限公司(下称:智谱AI)今年已累计获得的融资额度,也让其一举成为国内公开融资最高的大模型创业企业之一。
ChatGPT发布之后,大模型掀起的技术热潮,很快转化为投资热潮。但与以往不同的是,大家公认,这是一个马太效应更强的赛道,对投资人和创业企业皆是如此。
一方面,现阶段大模型创业严重依赖重资源和强资金,有能力入局的创业企业数量本就少,投资人可投标的少了很多;另一方面,大部分人相信,大模型是堪比甚至超过互联网的机会,企业的估值水涨船高,知名投资人和机构也得“团购”。
据36氪了解,智谱AI官方公布的融资额尚且属于保守测算,目前还有在谈的融资。从2019年到2023年,智谱AI四年三轮融资总额超30亿人民币。而今年以来,不论是融资频次还是融资额度,都远超从前。
2019年,智谱AI正式成立,Pre-A轮投资者包括中科创星、清华控股等,A轮投资设包括达晨财智、华控基金等,B轮投资者包括君联资本、启明创投等。
根据本次智谱AI公布的信息显示,其投资参与方主要包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构及包括君联资本在内的部分老股东跟投。
图源:IT桔子
作为一家明星大模型创企,智谱AI有着令人艳羡的投资者名单,智谱AI并不缺少资金来源,资方皆有头有脸,有不少投资人表示,“现在肯定是智谱挑选投资方,而不是反过来。”
目前行业已有多家大模型创企获得高额融资,市场并不缺少投向大模型的钱,但是拿不拿,怎么拿,是大模型创企更应该考虑的事。分析智谱AI的投资者名单可以看出,资金不是唯一考量,资金背后代表的价值,能够赋予大模型创业企业不同的资源。
例如,社保基金中关村自主创新基金。今年5月底举行的2023中关村论坛重大科技成果专场发布会上,社保基金会宣布,将设立“社保基金中关村自主创新专项基金”,具有“国家队”身份属性,首期规模50亿元,基金期限超过10年,显示出长期资金特征。
再如美团、蚂蚁、阿里和腾讯等互联网大厂,不仅能带来丰厚的资金,也意味着潜在的产业合作,互联网许多业务都有基于大模型改造的潜质,智谱AI的基础大模型能够接触到庞大的数据、业务场景等,这是许多初创企业缺少的部分。
在大模型如今的叙事背景下,智谱AI得学着习惯站在聚光灯下,这与智谱AI一直以来低调的风格并不太相符。
02
大模型的硝烟,早已燃起
ChatGPT出圈是AIGC的奇点时刻,以此为分界点能清晰划分出两个阶段,部分大公司或创业企业早在大模型露出苗头时,已经做了技术上的预研或者成立新公司专注大模型,相当比例的公司则是明确看到ChatGPT之后,才下定决心要做大模型。
由此带来了认知上的差异,也会导致不同的结果。行业普遍认为,2023年是大模型的元年,而在智谱AI CEO张鹏眼里,“AI大语言模型元年”应该是2020年,也就是智谱AI成立的第二年。
智谱AI CEO 张鹏
2017年Transformer诞生,陆续产生了像GPT-1、GPT-2等一系列的大规模Transformer模型,这些模型具备大规模的参数,拥有了很强的通用化能力,解决了很多之前我们无法解决的问题。一直到2020年,GPT-3的出世把生成式AI带入了全新的时代。
2020年,也是智谱AI决定全力进行大模型研发的节点。在那时,由于高昂的训练成本以及复杂的研发门槛,大模型并不被业界看好,智谱的发展并不像现在一样备受瞩目。然而在ChatGPT发布之后,张鹏直言他的感受是“既兴奋又感到一些压力”,兴奋的是方向更加确定,压力来源于追赶新技术的紧迫性。
与此同时,越来越多的投资者辗转找到智谱AI,大模型的硝烟早已燃起,投资者希望找到能先一步关注到花火的人。
一番调研之后,稳定的创始团队、足够的技术沉淀以及商业化方面的探索等因素,使得智谱AI从崭露头角到声名大噪。
创始团队方面,智谱AI由清华KEG(知识工程实验室)孵化而来,这支团队走出实验室,进军市场,智谱AI正式成立。CEO张鹏本科毕业于清华大学计算机系,博士在清华大学计算机系的研究方向为知识图谱。
董事长刘德兵师从高文院士,是曾任清华数据科学研究院科技大数据研究中心副主任,总裁王绍兰为清华创新领军博士,清华色彩不言而喻。
在硅谷乃至全球学术圈,智谱AI早就名声在外,在投资者看来,智谱AI在清华期间就“有人、有技术、有客户”,相当于一个小而美的创业公司,并且各位主要人员都经过了一段时间的合作,比较稳定,按照投人、投赛道的逻辑,智谱AI自然备受青睐。
技术方面也是智谱AI的强项,追溯到智谱的早期研究,从2006年的“科研情报挖掘”AMiner,到2019年公司成立,再到2020年专注大模型算法研究,2021年发布GLM-10B,2022年发布GLM-130B,2023年3月发布对话模型ChatGLM-6B及千亿对话模型ChatGLM。
据悉,智谱AI还将于10月27日发布全新一代基座大模型。在这个大模型行业战火纷飞的十月,智谱是否能够占据一席之地,还要再看新一代的模型性能。
智谱AI的研究要早于国内绝大多数大模型参与者,并且智谱的确将先发优势转化为胜势。在Stanford发布的世界主流大模型评测中,GLM-130B是亚洲唯一入选模型,准确性、恶意性与GPT-3持平,鲁棒性和校准误差在所有模型中表现颇佳。
ChatGLM-6B在2023年3月14日开源,数月时间在GitHub上获得48000+ star、6800+ fork,在Hugging Face上8,000,000+下载,四周趋势排行第一;数百个项目基于ChatGLM-6B研发,如LoRA、P-Tuning、langchain等;在第三方测评的中文自然语言、中文对话、中文问答及推理任务上获得第一。
03
没有终点的长跑
人工智能作为一种通用革命技术,大模型不仅是决定个人与个人、企业与企业的竞争,也关乎大国竞争,智谱的出身决定了其不仅是一家企业,也是带有技术主义理想的学者型团队。
与大部分公司和机构都不尽相同,智谱AI正在走自己的路。
36氪了解到,国内许多大厂的大模型研究都基于GPT、BERT和T5,作为商业公司无可厚非,但从国家视角来看,中国一定且必须有自己的预训练框架,不是跟随,而是走出自己的路线,GLM(通用语言模型)便是智谱的答案。
自研大模型并不容易,且风险极高。“GPT-3对我们的影响是坚定了要自研一个稠密的、千亿的、双语的模型。因为当年我们研究完之后也知道,做这样一件事情投入是非常大的,尤其是算力、人才、团队、数据。”张鹏此前对36氪表示。
图源:IC photo
“中国没有自己的预训练模型框架。无论是GPT、BERT,还是T5,都是西方的科学家提出的底层技术,路径是被西方垄断的状态。我们希望打破垄断,所以没有完全复刻OpenAI的路径。”他说。
当然,智谱AI主动与西方技术体系做一定切割,也代表着潜在的风险,如果后续发展遭遇了新的瓶颈,可能会有额外的困难。目前,智谱是少数全内资/国产自研的大模型企业,并且有明确的国产芯片适配计划,更适合中国企业,在某种程度上能弥补路线分歧。
在工信部部科技司最新发布的《2023年产业技术基础公共服务平台-面向人工智能大模型工程化技术及应用的产业公共服务平台项目》招标结果中,智谱AI参与的联合体中标。据介绍,该项目为国家工信部首个大模型重大专项项目和今年唯一一个大模型公共服务平台重大专项,将给予中标主体以支持,推动面向重点行业应用的大模型工程化关键技术研究和智能生成应用落地。
开源开放也是智谱AI的一大特色,很多企业都选择了闭源路线,智谱却希望营造繁荣的社区和生态,为了更进一步促进大模型开源社区的发展,智谱AI发布ChatGLM2,千亿基座对话模型全系升级并开源,包括6B、12B、32B、66B、130B不同尺寸,满足不同层级的客户需求。
“我们在学术技术上的交流以及产品上的合作都比较开放,大模型不是靠一家独大就能做好的,还是需要开放的生态。我觉得做开源也好、免费也好,这些事情都不是为了商业利益。”张鹏说。
在商业化方面,智谱AI显得更不疾不徐,以如今热炒的行业大模型为例,智谱AI并没有为了迎合客户就做行业大模型,智谱AI选择在通向AGI的路上“沿途下蛋”,而不是把行业大模型当做目标。
“行业模型本质上是用大模型的壳,重复造了一遍传统算法的轮子。”张鹏指出行业大模型的局限性,“我们认为只有一定规模的(通用)大模型,才能实现类人的认知能力涌现。”
人工智能是一场没有终点的长跑,大模型是其中的一座丰碑,所有人都希望在上面刻下自己的名字,资本是智谱AI通向技术理想的手段,当智谱被裹挟着不得不被站到台前,将更考验智谱的定力、自信与耐心。