亚马逊近日宣布将向 AI 研究领域注入1.1亿美元的资金,以支持开发其自主设计的 Trainium 芯片。这一举措旨在降低亚马逊对 Nvidia 的依赖,并推动自家云计算平台 AWS 的技术进步。
图源备注:图片由AI生成,图片授权服务商Midjourney
Trainium 是一款为深度学习训练和推理任务量身定制的机器学习芯片,亚马逊希望通过这一投资,鼓励学术界利用 Trainium 芯片进行新型 AI 架构、机器学习库和性能提升的研究。
这一计划名为 “Build on Trainium”,将为大学研究人员提供利用 Trainium 进行大规模分布式计算的机会。亚马逊表示,他们已建立了一个包含多达40,000个 Trainium 芯片的研究超集群,这些芯片针对 AI 的独特工作负载和计算结构进行了优化。通过这一计划,亚马逊希望吸引各类 AI 研究,包括算法改进和大型分布式系统的研究。
亚马逊还承诺,所有通过该计划取得的 AI 成果都将以开源方式共享,这样研究人员和开发者能够进一步推动技术的进步。此外,该计划还将为新的研究和学生教育提供资金支持,并计划进行多轮研究奖项的评选,获选项目将获得 AWS 培训积分,以及对大型 Trainium 超集群的访问权限。
卡内基梅隆大学的 Catalyst 研究小组参与了这一计划,计算机科学教授 Todd C. Mowry 表示,AWS 的 Build on Trainium 计划为他们的师生提供了对现代加速器的大规模访问机会,有助于扩展在张量程序编译、机器学习并行化及语言模型服务和调优等方面的研究。
亚马逊的这一投资不仅显示出其在 AI 领域的雄心,也进一步推动了与学术界的合作,力求在 AI 技术的前沿保持竞争优势。