微软宣布,其Phi系列生成式AI模型迎来了新成员——Phi-4。与之前的版本相比,Phi-4在多个方面有所改进,尤其在数学问题的解决能力上表现突出,这得益于训练数据质量的提升。
截至周四晚上,Phi-4的访问权限相对有限,仅在微软最新推出的Azure AI Foundry开发平台上可用,且仅限于微软研究许可协议下的研究用途。
图源备注:图片由AI生成,图片授权服务商Midjourney
Phi-4是微软推出的最新小型语言模型,拥有140亿个参数。与其他小型模型如GPT-4o mini、Gemini2.0Flash和Claude3.5Haiku相当,这些小型模型通常具有更快的运行速度和更低的成本,而在过去几年中,小型语言模型的性能也在持续提升。
微软将Phi-4的性能提升归因于使用了“高质量合成数据集”以及来自人类生成内容的高质量数据集,并进行了未公开的训练后改进。
如今,许多人工智能实验室正在密切关注合成数据和后训练在提升模型性能方面的潜力。Scale AI的首席执行官Alexandr Wang在周四的推文中提到:“我们已经到达了训练前数据瓶颈。”这一说法也证实了近期关于该话题的一些报告。
此外,值得注意的是,Phi-4是微软AI副总裁Sébastien Bubeck离职后推出的首款Phi系列模型。Bubeck在微软AI领域扮演了重要角色,并且是Phi模型开发的关键人物。Bubeck于10月离开微软,加入了OpenAI。