怎么理解人工智能算力?1000P的算力到底有多强?

来源:石河子市政数局 更新时间2024-04-26 15:42:19 点击数:

人工智能的本质是多源大数据模型训练,使计算机具备部分或超出人类的已有能力的技术集成。

在计算机世界,一切信息可以通过数据来表示,包括语音数据、文本数据、图像数据、压力数据、温度数据等等,人工智能就是通过海量数据对计算机进行驯化,来实现计算机模仿,具备或超出人的能力。

因此,海量数据的采集、清洗、存储、标注、处理、传播成为关键,人工智能的发展需要高水平算法和算力作为支撑,反映在对高端人才、芯片和数据传输网络的强依赖性。

算法、算力、数据是人工智能的三要求:

  • 基础层提供算力支持,即硬件部分;
  • 技术层提供通用技术平台做算法开发,驯化海量数据,即软件部分;
  • 应用层体现不同场景下大数据驯化所体现的价值。

在数据、算力和算法的共同推动下,全球人工智能产业相关技术实现快速发展,下游应用不断丰富。

其中,算力代表了对数据的处理能力,是数字化技术持续发展的衡量标准,也是数字经济时代的核心生产力。

接下来以人工智能计算中心建设 1000P 的算力为例,深度了解人工智能的算力。

怎么理解 1000P ?

P 是一个数量级,10 的 15 次方,1000P 就是 100亿亿,1000PFlops 算力就意味着每秒有 100 亿亿次的浮点运算能力。

AI 算力单位:量级单位+每秒运算次数+数据类型


用来描述参与运算的数据类型,同时也表达了数据精度:

  • INT8 8位 整数型数据 常适用于深度学习模型的推理运算
  • FP16 16位 浮点型数据 常适用于深度学习模型的训练运算
  • FP32 32位 浮点型数据 主要应用于高性能计算(比如科学计算)

一个 Atlas 800 组成的 AI 算力集群,以 1000P 算力为例,一个时钟周期可以进行“100亿亿”次计算。

那 1000P 的算力到底有多强?

  • 相当于 50 万台 PC 电脑
  • 以对 20 万颗星体的数据探索为例,传统方式需要一个有经验的科学家用 169 天才能完成,现在只需要 10.02 秒
  • 在 26.9 秒时间内,学习 1200 万张照片,形成一个模型,用于图像识别

通用计算和 AI 计算,“分工”不同,共建多样性计算

通用计算

以 CPU 提供算力。适合复杂逻辑运算,比如大多数通用软件。70% 以上晶体管用于构建 Cache 和控制单元,计算核心从几个到几十个。

通用应用:办公、数据库、数值计算(气象预测、流体仿真、电磁仿真)等

| AI 计算

以 GPU 或 NPU 提供算力。适合逻辑简单,计算密集型高的并发任务。70% 以上晶体管用于构建计算单元,计算核心几千或上万个。

特定应用:图像识别(人脸识别、车牌识别、动作识别、物品检测、周界检测等、自然语言处理(机器翻译、语音识别、文本生成、情感分析等)、搜索推荐、辅助驾驶、趋势预测等。

GPU:Graphics Processing Unit,图像处理单元,主要用于图像加速和渲染

NPU:Neural Network Processing Unit,神经网络处理单元

人工智能 1000P 并非超算意义上的 “1000P”

以高性能计算为例,TOP500 榜单,入围的超级计算机都要进行一项名为 LINPACK 的测试,以考察平台的双精度浮点计算能力。

以人工智能为例,人工智能运行的测试程序叫做 Resnet-50,而其成绩则是基于半精度浮点环境获得的,只考察平台的半精度能力。

总结:人工智能计算,只是高性能计算的一个分支,是针对神经网络,深度学习等,针对特定领域、特定场景产生的应用需求。高性能计算都是科研应用的基础,它能“算天算地算人”,几乎所有的应用都可以通过高性能计算来实现。双精度和半精度的区别,双精度是 64 位,单精度是 32 位,半精度是 16 位。


Tag: AI算力 人工智能
首页 AI对话 资讯 我的