1、AI驱动下,英伟达数据中心业务蓬勃发展
英伟达是GPU的发明创造者。1999年,英伟达在纳斯达克挂牌上市,并于同年提出了GPU概念,发布了GeForce 256。这被业界视为现代计算机图形技术的开端。
最初,GPU主要应用于PC游戏和主机游戏(如Sega、Xbox和PS3),能够通过硬件支持T&L(多边形转换与光源处理)。T&L在3D图像渲染中扮演重要角色,计算多边形的3D位置和处理动态光线效果,提供细致的3D物体和高级的光线特效。由于3D图像渲染中的任务是并行计算的,各区域之间没有联系或依赖关系,因此可以轻松拆分成独立的并行任务,提高计算速度。
这种并行计算能力让GPU意外成为AI计算的硬件基础设施。在AI计算中,深度学习是最常见的任务。深度学习模型需要进行大量的矩阵计算,而GPU擅长同时执行大量的矩阵运算,加速了深度学习模型的训练和推理过程。
英伟达作为全球GPU市场的巨头,目前占据主导地位,并在AI时代迎来新的发展机遇。由于芯片产业的赢家通吃效应,英伟达在数据中心领域的GPU应用获得广泛认可,并在各行业的AI项目中广泛采用。随着人工智能应用的兴起和需求的增加,英伟达的数据中心业务有望持续高增长。
2、算力领域的架构创新
英伟达不断改进芯片架构以满足高算力需求。每1到2年推出新的架构,适应计算需求的升级。历年来的架构创新包括:
Kepler架构(2012年)引入了GPUDirect技术,实现了本机和其他机器GPU之间的直接数据交换。
Pascal架构(2016年)除了支持深度学习和DP unit外,还引入了NVLink来实现单机内多GPU的点到点通信,带宽达到160GB/s。
Volta架构(2017年)以Deep Learning为核心,引入了Tensor Core。
Ampere架构(2020年)提高了FP32着色器操作数量、RT Cores的光线/三角形相交测试吞吐量,并加速稀疏神经网络处理速度。
Hopper架构(2022年)引入了新一代流式多处理器的FP8 Tensor Core,加速AI训练和推理,并提供高速的Transformer引擎,在大型NLP模型上提供高达9倍的AI训练速度和30倍的AI推理速度。