11月中国AI大模型平台排行榜

来源: AI大模型工场 更新时间2024-12-10 14:25:50 点击数:

一、国内大模型发展趋势|11月份解读

从预训练向推理转向,Scaling law撞墙?

有研究预计,如果 LLM 保持现在的发展势头,预计在 2028 年左右,已有的数据储量将被全部利用完。届时,基于大数据的大模型的发展将可能放缓甚至陷入停滞。

实际上,OpenAI O1模型的推出将预训练Scaling Law范式带向了推理层的Scaling Law,国内企业也开始纷纷上线推理模型。

国内,10月初,就有消息传出,“AI六小虎”中已经有两家公司已经决定逐步放弃预训练模型,近期又有消息指出,仍在继续预训练的公司只剩下智谱AI和MiniMAX,其他包括月之暗面、百川只能在内的公司都已经放弃预训练。

然而,OpenAI高级研究副总裁Mark Chen却在在炉边谈话中,正式否认「Scaling Law撞墙论」。他表示,并没有看到Scaling Law撞墙,甚至OpenAI还有两个范例——o系列和GPT系列,来保持这种Scaling。

此外,扎克伯格、奥特曼和其他 AI 开发商的首席执行官也公开表示,他们尚未达到传统 scaling laws 的极限。因此,OpenAI 等公司仍在开发昂贵的、价值数十亿美元的数据中心,以尽可能多地提升预训练模型的性能。

企业软件公司 Databricks 的联合创始人兼主席联合开发者 Ion Stoica 表示,大模型的表现可能在某些方面已经停滞,但在其他方面仍在进步。

Stoica 表示,尽管大模型在代码和解决复杂、多步骤问题等任务方面不断改进,但其在执行通用任务(如分析一段文本的情感或描述医疗问题的症状)方面似乎进展缓慢。“对于常识性问题,你可以说,目前我们看到 LLM 的表现停滞不前。我们需要 [更多] 事实数据,而合成数据没有太大帮助”他说道。

但其实“Scaling Law”撞墙与否,在AI领域,虽然短期内可能会遇到技术瓶颈或成本效益比下降的问题,但从长远来看,AI的软硬件能力仍然会持续增长。 

大模型巨头重点发力,AI Agent大爆发

最近,大厂扎推上线AI Agent产品。从去年就大火的概念,今年终于迎来应用落地的集中爆发。

Gartner已将代理式AI列为2025年十大技术趋势之一,并预测到2028年,至少有15%的日常工作决策将由代理式Al自主完成。

11月29日,在智谱Agent OpenDay上,智谱AI CEO张鹏宣布旗下自主任务完成智能体AutoGLM再次升级,支持自主执行超过54步的长步骤操作,也可以跨App执行任务。

张鹏认为,发展至今,大模型已经初步具备了人类与现实物理世界互动的部分能力。Agent将极大地提升L3使用工具能力,同时开启对L4自我学习能力的探索。未来,GLM团队将继续加速Agent模型产品的研发,期待着一句话操作电脑和手机的范式尽快到来。

目前,微软、苹果、华为、小米等国内外头部厂商也正争先推出AI助手相关产品。加上OpenAI即将推出的全新AI Agent产品“Operator”,2025年将成为AI Agent商用爆发年。

此外,华鑫证券在其研报中预测,AI Agent的中国市场规模有望从2023年的554亿元增长至2028年的8520亿元,年均复合增长率高达72.7%。中信建投则在研报中表示,预计在不久的将来会进入大模型时代的2.0时代:AI Agent。

随着人工智能技术的持续突破,AI Agent正迅速成为全球科技领域的关键发展方向,预计未来几年内,AI Agent将广泛渗透至多个行业应用,涵盖智能家居、医疗、金融等领域,成为推动行业升级和自动化的核心技术之一。 

大厂扎推入场,AI眼镜正在崛起

11月12日,“百度世界2024”大会上,百度发布了全新AI硬件产品——小度AI眼镜,号称全球首款搭载中文大模型的原生AI硬件产品。据悉,小度 AI 眼镜将于明年上半年正式上市。

据透露,小米也正在布局新一代AI眼镜,届时将与歌尔股份合作,全面对标Meta Ray-ban。该眼镜搭载 AI 功能、音频耳机模块、摄像头模块,并将以小米自有品牌形式发布。消息称雷军对这款AI眼镜的销售预期设定在“三十万台以上”。而此前小米已经在2021年发布了小米智能眼镜探索版。

11月18日,Rokid的发布会上推出的一款与BOLON眼镜联名的新一代 AI + AR 眼镜—— Rokid Glasses。通过整合阿里巴巴通义千问多模态大模型,Rokid Glasses 支持接打电话、AI 问答搜索、AI 识别物体、AI 拍照答题、AI 多语种翻译、AI 导航、AI 转译、AI 健康提醒等。

华为、小度、小米、荣耀等互联网巨头依托自身强大的生态体系和用户基础,纷纷布局AI眼镜。根据IDC的数据,2024年第一季度全球智能眼镜出货量同比增长了200%以上,显示出AI眼镜市场的强劲增长势头。预计到2029年,全球智能眼镜全球年销量有望达到5500万副,市场规模将达到1067.78亿元。这一市场趋势进一步证实了大厂们纷纷布局AI眼镜,希望通过硬件化落地AI大模型技术,以抓住市场机遇。 

二、国内主要大模型最新进展

百度

11月21日消息,百度发布截至2024年9月30日的第三季度业绩。 财报显示,百度总营收336亿元,百度核心营收265亿元,归属百度核心的净利润75.4亿元,同比增长17%,超出市场预期。 

李彦宏在业绩会上透露,百度将于2025年初发布文心大模型的新版本。目前,文心大模型日均调用量已达15亿次,一年内增长30倍。

同时在业绩会上披露的,还有百度文库和百度App的最新数据——当前,百度文库AI功能月活用户已经突破5000万,同比增长超300%;百度App AI功能已覆盖近70%月活用户。

近日,百度文库推出的“AI全网搜”功能,利用先进的AI技术提升信息检索的效率和准确性,帮助用户在信息泛滥的时代快速获取核心要点。该功能整合了丰富的文档资源,特别是在学术领域表现突出,能够通过自然语言处理技术提供结构化答案,并通过图示化功能提升信息的可读性。 

 

字节跳动

11月15日消息,字节跳动视频生成模型 PixelDance和Seaweed在即梦AI正式上线,面向公众免费开放使用。用户进入即梦AI的“视频生成”界面,在视频模型里选择“视频P2.0 Pro”或“视频S2.0 Pro”,即可分别体验这两款模型,目前网页版和手机端APP均已支持。 

字节跳动两款视频生成模型于9月底首次发布,并通过即梦AI、火山引擎分别面向创作者和企业客户小范围邀测。

11月14日消息,扣子上线了全新的智能语音 OpenAPI,首次将“理解”的能力注入语音交互链路,同时具备强大的 AI Agent 能力、精准识别、稳健的实时通信能力、自然的语音效果等优势。

扣子团队表示,邀测期间暂不收取语音功能费用,仅根据智能体调用次数和 Token 消耗收取专业版的基础费用。而内测用户的福利是每日 1 小时、每月 20 小时的实时通话体验时长,足以满足基础测试和常规使用。如有更高时长需求,用户可根据实际情况提出额外申请,以满足不同场景的深度测试需要。 

科大讯飞

近日,科大讯飞对其星火低代码智能体平台进行了全面升级,旨在通过快速搭建和灵活定制,显著缩短开发周期并拓展应用场景。新平台允许用户免费创建AI Agent,接入微调平台实现定制优化,升级RAG方案扩充专业知识,并上线创建模板降低开发门槛。

星火低代码智能体平台提供可视化操作界面,允许用户将大型语言模型、插件、代码等功能模块灵活组合,高效编排复杂且稳定的业务流程。

平台涵盖了大语言模型(LLM)、自定义代码执行以及复杂的判断逻辑等高级功能,满足用户对各种复杂任务处理的需求。开发者可以基于大小模型混合架构搭建应用,一键发布API,并跨平台云+端大模型SDK进行灵活集成与定制化。 

阿里云

11月12日消息,阿里在海外推出对话式 AI 搜索引擎 Accio,面向全球商家开放,这是全球第一个 B2B 领域的 AI 搜索引擎。 

11月13日消息,阿里云通义大模型团队正式开源通义千问代码模型全系列,共6款Qwen2.5-Coder模型。其中32B尺寸的旗舰代码模型在十余项基准评测中均取得开源最佳成绩,成为全球最强开源代码模型,在多项关键能力上超越闭源模型GPT-4o。

11月17日消息,阿里最近宣布开源了其最新的图像生成模型——Qwen2vl-Flux。该模型不仅具备编辑、合并和混合等多种功能,还能够根据用户输入的图片或文字生成高度相似的新图片。

近日,阿里巴巴国际AI团队推出的Marco-o1模型,专注于解决开放型问题,超越了传统的标准答案领域。该模型通过创新的self-play和MCTS技术,构建了具备反思能力的超长CoT数据,展现了在机器翻译和其他领域的强大能力。 

中国电信人工智能研究院(TeleAI)

近日,权威大模型评测基准 SuperCLUE 发布最新《中文大模型基准测评2024年10月报告》中,由中国电信人工智能研究院(TeleAI)原创打造的星辰语义大模型 TeleChat2,作为央企大模型代表,综合能力位列大模型第一梯队。 

其中TeleChat2 在理科“工具调用”维度排名前二,在 Agent 智能体总榜排名并列第二。

TeleChat2-35B 以更小参数量和更佳效果获得开源模型排行榜铜牌,综合效果超过 Llama-3.1-70B-Instruct 和 Llama-3.2-90B-Instruct 等较大参数模型。

据了解,中国电信是最早布局并首先开源大模型的央企机构,在中国电信CTO、首席科学家、TeleAI院长李学龙教授带领下,坚持全链路自主研发创新,构建了语义、语音、视觉及多模态等全模态完备的大模型基础框架。并在今年7月完成了星辰大模型系列的语义、语音、多模态大模型均已完成算法及服务的“双备案”。

且在今年前半年,TeleAI 就陆续开源了 1B、7B、12B和52B 参数的第一代 TeleChat 系列模型。最近,TeleChat2 系列也已完成 3B、7B、35B 和 115B 模型开源,逐步构建了全尺寸开源布局。

在应用落地层面,目前,星辰语义大模型系列已在政务服务、智慧教育、经营分析、公文写作等领域广泛应用落地。 

腾讯

11月15日消息,腾讯宣布旗下AI智能工作台ima现已正式上线,其除了能完成其余大模型AI问答产品的功能(包括问答、创作文字、生成图片等)以外,还打通了微信公众号文章的生态,整个公众号世界里的知识都可为用户所用。 

11月28日消息,腾讯公司官方人士对外宣布,腾讯混元大模型12月3日正式上线视频生成能力,用户可以在腾讯元宝App中提交申请试用。企业客户通过腾讯云提供服务接入,目前 API 同步开放内测申请。同时,腾讯也将开源该视频生成大模型。

本月中旬,腾讯大模型 App元宝发布了 2.0 版本,界面方面的升级包括更新对话列表,支持历史使用资产沉淀,用户可更轻松地查找历史对话和用过的智能体。

2.0版本新增 AI 应用专属板块,提供了 AI 搜索、AI 阅读、创意绘画、灵感图库、AI 美照五大应用,以及“应用广场”的多种智能体,其中AI 搜索功能除微信公众号外,还升级整合微信视频号、QQ 音乐等信息资源,提供更加智能和便捷的搜索体验。

此外,元宝2.0基于新一代大模型“混元Turbo”,在性能上实现了大幅提升,训练和推理效率提高一倍,支持任意长宽比及最高7K分辨率图片的理解分析。在文生图方面,语义理解、画面质感和真实性也得到了全面优化。 

360

11月27日消息,360集团研发的全新生成式 AI 搜索产品“纳米搜索” App日前已上架到苹果App Store和应用宝等安卓应用商店,直接对标百度、阿里夸克、秘塔AI、Perplexity AI等多个 AI 搜索类产品。 

据介绍,基于大模型的360 AI搜索产品“纳米搜索”,slogan是“解锁每一个疑问,看见每一个细节”,主打集搜、读、写、创于一体,称要“重新定义AI搜索”、更轻更快更强,并且要开创全新问答方式,让搜索变得简单直观。

周鸿祎在视频中指出,传统搜索引擎存在“关键字不匹配导致结果偏差大”和“搜索信息质量参差不齐”两大问题;同时大模型的使用对普通用户而言仍有较高门槛,需要掌握复杂的提示词与对话技巧。而360AI搜索以大模型驱动搜索引擎的智能化升级,在用户体验上取得显著突破,具有门槛低、易操作的优势,是AI改造的最佳场景之一。 

智谱

11月29日消息,在上午北京智谱GLM OpenDay上,智谱AI发布AutoGLM 及 GLM-PC两款AI智能体产品。 

其中,AutoGLM,基于智谱自研的“基础智能体解耦合中间界面”和“自进化在线课程强化学习框架”,是智谱第一个产品化的智能体 Agent,通过文字/语音指令模拟人类操作手机,实现大模型从“言”到“行”的范式转变,目前已经“百万内测”开放申请;GLM-PC则是基于CogAgent模型的视觉理解和任务规划能力,操作计算机的桌面应用,用户通过简单的一句话即可实现复杂任务的快速执行,同时具有任务规划、屏幕界面信息理解的能力,能够根据页面信息进行计划更改和自我纠错,根据用户的指令完成任务。

智谱 AI CEO张鹏表示,Al Agent今天非常火,从苹果的 Apple Intelligence、谷歌的 Jarvis,到 OpenAI 即将发布的 Operator,全球科技巨头纷纷布局。而国内智谱率先开放AutoGLM内测,已受到很多关注,过去一个月申请页面已经有超过100万的用户访问。 

昆仑万维

11月27日消息,昆仑万维正式推出具有复杂思考推理能力的系列模型——「天工大模型4.0」 o1版(Skywork o1)。此次发布的Skywork o1包括三款模型:Skywork o1 Open、Skywork o1 Lite、Skywork o1 Preview。 

据了解,Skywork o1是由昆仑万维集团发布的具有慢思考推理能力的系列模型。这是国内第一款中文逻辑推理能力的o1模型。不同于现有的复现OpenAI o1模型的工作,Skywork o1不仅在模型输出上内生了思考、计划、反思等能力,同时,该开源模型在标准评测集上,对比普通模型推理能力大幅上升,真正让模型拥有了思考和反思带来的推理能力的提升。团队复现o1的技术路线,使得初始推理能力较差的基座模型在基准测试集上成为生态位SOTA。

11月20日,昆仑万维正式推出「天工大模型4.0」4o版(Skywork 4o),以及新产品「实时语音对话助手Skyo」。据了解,Skyo作为一个智能语音互动产品,具备快速响应、多语言对话能力,它能够主动发起对话、实时打断。同时,Skyo具备情感化反应和个性化声音定制功能,为用户带来温暖贴心的陪伴体验。

外此,基于天工AI的大模型技术能力和AI搜索功能,Skyo能克服大模型幻觉问题,在对话中回复真实内容。

月之暗面

11月16日消息,月之暗面宣布:发布数学大模型k0-math。这是该公司首次推出推理能力强化模型产品,发布时间就在o1-preview推出的2个多月后。

11月27日消息,该数学推理模型已经上线网页版,用户可以拿数学难题去考验AI的解题能力。Kimi相关负责人表示,该模型在做了大量的数学思维训练之后,不仅会做数学题,还具备了极强的综合逻辑思维能力,面对非数学问题,也可以给出自己的思考。

最近两天,月之暗面的仲裁纠纷持续发酵。金沙江创投主管合伙人朱啸虎公开“炮轰”前金沙江创投主管合伙人张予彤,认为其隐瞒在月之暗面的股权激励,并指出月之暗面在拿到循环智能几个投资方的同意豁免书之前开始融资,次程序过程存在问题,对月之暗面的豁免协议也可以被认为无效。

对此,杨植麟出面回应,感谢投资人,并确认张予彤作为联创加入月之暗面,并透露,迄今为止张予彤在业务、战略以及多场融资战役中对公司做出了重要贡献,月之暗面授予张予彤股份的本质是其作为月之暗面联合创始人对公司后续多年持续工作的对价。

朱啸虎在杨植麟回应后马上表态,认为杨植麟回避了关键问题:

1、书面沟通是不够的,需要严格的按照公司章程,股东决议(每一轮股东多数的签字);董事决议有利益冲突的董事必须明示并申请回避,不能隐瞒欺骗。

2、利益冲突必须第一天就披露,900万股是第一天就给的,并不是后面陆续给的,而且不是简单的没有披露,而是设计了很多方式(代持,投很少的钱来欲盖弥彰)来隐瞒欺骗。虽然是月之暗面,但希望所有的行为都能在太阳底下,堂堂正正。

围绕月之暗面的风波还未结束,无论后续事件会如何发展,都将是AI创投圈一个标志性事件。 

快手

11月11日消息,快手可灵AI正式推出独立App,已在苹果App Store及多个安卓商店陆续上架。可灵AI App的核心功能为AI视频生成和编辑,支持文生视频和图生视频,目前有可灵1.0和1.5两个版本模型可供选择,其中1.0模型拥有更强大的可控生成能力,而1.5模型可直出1080p高清视频、提高画面美感。同时,针对已生成的视频提供续写功能,最长可续写生成约3分钟视频。 

11月20日消息,在快手三季度业绩电话会上,快手科技创始人兼首席执行官程一笑表示,可灵 AI 自问世以来,服务用户已超 500 万,累计生成 5100 万个视频,超 1.5 亿张图片, 9 月实现了月活超 150 万,商业化单月流水超千万人民币

11月25日消息,快手可灵AI在全球上线业内首个视频模型定制功能,创新性解决了AI视频生成中人物IP稳定性难题。目前,用户可在可灵AI web端使用该功能训练定制人脸模型,并参照该模型继续生成视频内容,满足用户创作多个包含同一人物镜头的诉求。此外,可灵1.5模型也迎来再次升级,支持在图生视频高品质模式下,使用多达六种运镜控制方式和运动笔刷功能。 

猎户星空

11月27日消息,猎户星空联合聚云科技举办了题为《Data Ready for Al,MoE大模型发布暨商业闭环分享》媒体见面会。猎户星空正式发布了自主研发的Orion-MoE8×7B大模型,并携手聚云科技推出了基于该大模型的数据服务产品——AI数据宝AirDS(AI-Ready Data Service)。 

这两项重要成果的发布,不仅标志着猎户星空在AI技术领域的又一重大突破,更为AI行业商业化进程注入新动能。 


首页 AI对话 资讯 我的