英伟达GPU型号与架构介绍

本文介绍: 随着人工智能应用的兴起和需求的增加，英伟达的数据中心业务有望持续高增长。显存: 显存即显卡内存，显存主要用于存放数据模型，决定了我们一次读入显卡进行运算的数据多少(batch size)和我们能够搭建的模型大小(网络层数、单元数)，是对深度学习研究人员来说很重要的指标，简述来讲，显存越大越好。CUDA核心数量：CUDA是NVIDIA推出的统一计算架构，NVIDIA几乎每款GPU都有CUDA核心，CUDA核心是每一个GPU始终执行一次值乘法运算，一般来说，同等计算架构下，CUDA核心数越高，计算能力会递增。

英伟达是GPU的发明创造者。1999年，英伟达在纳斯达克挂牌上市，并于同年提出了GPU概念，发布了GeFo r ce 256。这被业界视为现代计算机图形技术的开端。

英伟达作为全球GPU市场的巨头，目前占据主导地位，并在AI时代迎来新的发展机遇。由于芯片产业的赢家通吃效应，英伟达在数据中心领域的GPU应用获得广泛认可，并在各行业的AI项目中广泛采用。随着人工智能应用的兴起和需求的增加，英伟达的数据中心业务有望持续高增长。

英伟达不断改进芯片架构以满足高算力需求。每1到2年推出新的架构，适应计算需求的升级。历年来的架构创新包括：

Ke pler架构（2012年）引入了GPUDi rect 技术，实现了本机和其他机器GPU之间的直接数据交换。
Pa sc al架构（2016年）除了支持深度学习和DP unit外，还引入了NVLin k来实现单机内多GPU的点到点通信，带宽达到160GB/s。
Vol t a架构（2017年）以Dee p Learnin g为核心，引入了Tensor Co re。
Am pere架构（2020年）提高了FP32着色器操作数量、RT Cores的光线/三角形相交测试吞吐量，并加速稀疏神经网络处理速度。
Hop per架构（2022年）引入了新一代流式多处理器的FP8 Tensor Core，加速AI训练和推理，并提供高速的Tr ans former 引擎，在大型NLP模型上提供高达9倍的AI训练速度和30倍的AI推理速度。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。