近日,亚马逊宣布了一项重大投资,计划投入1.1亿美元用于人工智能(AI)研究,旨在减少对英伟达的依赖,并推动其自家芯片的开发。这笔资金将用于支持大学的生成式 AI 研究,项目名称为 “Build on Trainium”。
该项目将为研究人员提供使用 Trainium 芯片的机会,以便他们开发新的 AI 架构、机器学习库以及针对大规模分布式 AWS Trainium UltraClusters 的性能提升。
图源备注:图片由AI生成,图片授权服务商Midjourney
AWS Trainium 是一种专门为深度学习训练和推理任务设计的定制机器学习芯片。亚马逊表示,这一项目涵盖了从算法创新到 AI 加速器性能提升的广泛研究方向,还包括大规模分布式系统的研究。作为 “Build on Trainium” 计划的一部分,亚马逊已经建立了一个包含多达40,000个 Trainium 芯片的研究 UltraCluster,这些芯片专为 AI 的独特工作负载和计算结构进行优化。
亚马逊进一步表示,项目中创造的任何 AI 进展都将以开源方式发布,允许研究人员和开发者继续推动他们的创新。此外,亚马逊在8月份宣布了对 Claude 开发者和 OpenAI 竞争者 Anthropic 的40亿美元投资。
“Build on Trainium” 项目还将提供资金支持新的研究和学生教育,亚马逊计划进行多轮研究奖项的评选,选中的提案将获得 AWS 培训积分,并能够访问大型 Trainium UltraClusters 进行研究。卡内基梅隆大学的 Catalyst 研究小组已参与该项目。
该校计算机科学教授托德・C・莫里(Todd C. Mowry)表示:“AWS 的 Build on Trainium 计划让我们的教师和学生能够大规模地访问现代加速器,如 AWS Trainium,配备开放的编程模型。这使我们能够大幅拓展在张量程序编译、机器学习并行化和语言模型服务与调优方面的研究。”