• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
从Tesla到Blackwell,英伟达如何改写HPC规则

从 Tesla 到 Blackwell,英伟达如何改写 HPC 规则

2025 年 3 月 19 日

工业母机 ETF(159667) 近 5 日净流入超 1.6 亿元,机构:今年以来机床行业呈现复苏态势

2025 年 9 月 9 日

科创板收盘播报:科创 50 指数调整跌 2.38% 半导体类个股跌幅居前

2025 年 9 月 9 日
突发!菊乐股份实控人童恩文去世,部分退休员工前往悼念,公司官网已变黑白

突发!菊乐股份实控人童恩文去世,部分退休员工前往悼念,公司官网已变黑白

2025 年 9 月 9 日
广告
大厂化身「金主」!京东具身智能领域「六连投」 阿里、美团也入局

大厂化身 「金主」!京东具身智能领域 「六连投」 阿里、美团也入局

2025 年 9 月 9 日
金价再创历史新高 与今天A股的下跌有关系吗?

金价再创历史新高 与今天 A 股的下跌有关系吗?

2025 年 9 月 9 日
「牛市买股不如买ETF」?A股「游戏规则」遭重塑

「牛市买股不如买 ETF」?A 股 「游戏规则」 遭重塑

2025 年 9 月 9 日
日本政治风险发酵!高盛与美银罕见同步:瑞郎成新宠,日元前景堪忧

日本政治风险发酵!高盛与美银罕见同步:瑞郎成新宠,日元前景堪忧

2025 年 9 月 9 日
苹果上半年在全球高端智能手机市场份额超过60% 但在国内份额有下滑

苹果上半年在全球高端智能手机市场份额超过 60% 但在国内份额有下滑

2025 年 9 月 9 日
世界黄金协会:全球投资者8月重新涌入黄金ETF,资金流入环比增加一倍以上

世界黄金协会:全球投资者 8 月重新涌入黄金 ETF,资金流入环比增加一倍以上

2025 年 9 月 9 日
TechWeb微晚报:iPhone 17 Pro机身退回铝合金材质,中国铁路下月推行电子发票

TechWeb 微晚报:iPhone 17 Pro 机身退回铝合金材质,中国铁路下月推行电子发票

2025 年 9 月 9 日
TechWeb微晚报:iPhone 17 Pro机身退回铝合金材质,中国铁路下月推行电子发票

TechWeb 微晚报:iPhone 17 Pro 机身退回铝合金材质,中国铁路下月推行电子发票

2025 年 9 月 9 日
又一只主动权益基金一日售罄 基金新发市场见暖意

又一只主动权益基金一日售罄 基金新发市场见暖意

2025 年 9 月 9 日
金桂财经
广告
2025 年 9 月 9 日 星期二
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

从 Tesla 到 Blackwell,英伟达如何改写 HPC 规则

来自 金桂财经
2025 年 3 月 19 日
在 外汇
0

YOU MAY ALSO LIKE

跑赢 45 年通胀!黄金 「真历史新高」 出现了

美国就业数据下修近百万人?今日重磅报告或将引爆市场


文 | 半导体产业纵横

明日,英伟达创始人 CEO 黄仁勋将迎来重振该公司股价的重要契机。在英伟达年度技术峰会 GTC 上,黄仁勋将阐述他如何带领英伟达探索 AI 下一个前沿的方向。

据摩根大通此前预计,英伟达将在大会上推出 Blackwell Ultra 芯片 (GB300),并可能披露 Rubin 平台的部分细节。此次大会还将聚焦 AI 硬件的全面升级,包括更高性能的 GPU、HBM 内存、更强的散热和电源管理,以及 CPO(共封装光学) 技术路线图。

在黄仁勋的演讲到来前,我们来看看这些年中英伟达推出的系列架构,和他们背后的故事。

1999 年底,英伟达推出了第一款 GPU(Graphic Process Unit,图形处理单元)Geforce 256,将完整的渲染管线集成进硬件,提供了不错的加速效果。但这款产品还很难称之为处理器,因为它尚不具备任何可编程能力。2001 年随着 DX8 引入可编程顶点着色器的概念,英伟达才在 Geforce 3 中添加了 Vertex Processor,使 GPU 可以编程了。随后,越来越多的可编程着色器被 DX 和 OpenGL 引入,以满足渲染开发者的算法需求。

在 GPU 设计之初,并非针对深度学习,而是图形加速,在英伟达推出 CUDA 架构之前,GPU 并无太强对深度学习运算能力的支持。真正用来作为人工智能算力支持的 GPU,不是普通的显卡,而是 GPGPU(General-Purpose Computing on Graphics Processing Units) 即通用计算图形处理器,这是一种用于处理非特定需求 (通用类型) 计算目的的算力单元 (芯片)。

革命的开始,CUDA 架构的诞生

随着 GPU 具备了可编程能力,其用于并行计算的天赋被发掘出来。当时,很多大学和研究机构都在尝试用 GPU 做一些科学计算。

2003 年的 SIGGRAPH 大会上,许多业界泰斗级人物发表了关于利用 GPU 进行各种运算的设想和实验模型。SIGGRAPH 会议还特地安排了时间进行 GPGPU 的研讨交流。但当时的开发者只能利用着色器编程语言开发程序,必须将计算资源映射为渲染概念才能使用,非常麻烦。因此亟需一种针对 GPU 并行计算的编程语言。此时,正在斯坦福读博的 Ian Bark 看到这一需求,投身到 Brook(一套用于并行计算的编程语言,后被 AMD 收购) 的研发中,成为 GPU 并行计算软件栈的先行者。2004 年,他以实习生的身份加入英伟达,并于两年后开发出 CUDA。

渲染需求变得越来越多样化,并行计算业务正含苞待放,Tesla G80 架构正是在这样的历史背景下被设计出来,成为英伟达改变自身命运的重要转折点。

2006 年,英伟达推出了 Tesla 架构的第一代 (G80),开启了 GPU 通用计算探索。Tesla 架构之前的显卡也经历了几代的发展,但基本上是图形显卡。而它采用全新的 CUDA 架构,支持使用 C 语言进行 GPU 编程,可以用于通用数据并行计算。这成为英伟达改变自身命运的重要转折点。Tesla G80 是第一款实现 CUDA 架构的 GPGPU,开启了一个并行加速的时代。G80 是有史以来最伟大的 GPU 变革产物之一,首批产品 GeForce 8800 GTX/GTS 于 2006 年 11 月发布。之后,英伟达又在第一代基础上推出了 Tesla 架构的第二代 (GT200),其双精度的 FMA 运算速度 30FMA ops/ clock,提升了 8 倍多。

就在 G80-G200 这两代产品上,英伟达花了大约三年时间积累了大量的用户体验反馈,招募了 Bill Dally 作为首席科学家,最终推出了 Fermi 这个划时代的产品,这是第一款带有 L1 Cache、ECC 纠错,面向超级计算机的架构,从这一代开始,英伟达涉足超级计算机的野心开始暴露无遗,在发布的时候拉来了多位超级计算机行业的重要人物站台。

2010 年,英伟达公司正式推出了 Fermi 全新架构。这款架构不仅仅是一个简单的硬件更新,而是被英伟达定义为首款专门为计算任务而设计的 GPU。换句话说,英伟达通过 Fermi 架构重新定义了 GPU 的概念,旨在加速并行计算的性能。与此同时,这款架构还具备了强大的图形渲染能力,使其在图形处理方面同样表现出色。而 GF100 是第一款基于 Fermi 架构的 GPU,集成 32 亿个晶体管,专为下一代游戏与通用计算应用程序而优化的全新架构,实现了所有 DirectX 11 硬件功能,包括曲面细分和计算着色器等。

G80 是对统一图形与计算处理器应有面貌的最初愿景。随后的 GT200 扩展了 G80 的性能与功能。而 GF100,这是一个专为下一代游戏与通用计算应用程序而优化的全新架构的 GPU。Fermi 这一代架构展现了英伟达全力押注通用并行计算的决心。倘若说 Tesla G80 仅仅是小试身手,那么 Fermi 则正式吹响了全面进军计算产业的号角。

英伟达布局高性能计算

之后,英伟达大致保持了两年更新一次架构的频率,不断推陈出新。

2012 年,英伟达推出 Kepler 架构。这是首个支持超级计算和双精度计算的 GPU 架构。得益于 28nm 的先进制程技术,Kepler 在性能和功耗方面实现了质的提升。Kepler GK110 具有 2880 个流处理器和高达 288GB/s 的带宽,计算能力比 Fermi 架构提高 3-4 倍。Kepler 架构的出现使 GPU 开始成为高性能计算的关注点。

2014 年,英伟达发布的 Maxwell 架构是先前 Kepler 架构的升级版,采用台积电 28nm 工艺制程。彼时移动设备兴起,对低功耗、高性能 GPU 需求大增,同时需要优化 GPU 在不同应用场景的适应性,Maxwell 架构应运而生。首款基于 Maxwell 架构的 GPU 为 GM107,专为笔记本和小型 (SFF)PC 等功率受限的使用场合而设计,采用台积电 28nm 工艺制程,芯片尺寸 148 平方毫米,集成 18.7 亿个晶体管。针对流式多处理器采用全新设计称为 SMM,GM107 核心的每核心效能提升了 35%,每瓦功耗比提升了一倍,支持 DirectX 12。首款基于 GM107GPU 的显卡是 GeForce GTX750Ti。

2016 年,Pascal 架构推出,用于接替上一代的 Maxwell 架构。基于 Pascal 架构的 GPU 使用 16nm FinFET 工艺、HBM2、NVLink 等新技术。这是首个为了深度学习而设计的 GPU,支持所有主流的深度学习计算框架。Pascal 架构核心阵容强大,包括 GP100(3840 个 CUDA Core 和 60 组 SM 单元) 和 GP102(3584 个 CUDA Core 和 28 组 SM 单元) 两大核心。Pascal GP100 具有 3840 个 CUDA 核心和 732GB/s 的显存带宽,但功耗只有 300W,比 Maxwell 架构提高 50% 以上。

Pascal 架构刚刚推出之际,深度学习正发展的如火如荼。业界出现了很多针对神经网络的专用加速器,无论在能效和面效上都碾压 GPU,这让英伟达倍感压力。为了应对竞争,英伟达一反之前两年一代架构的迭代节奏,次年就推出了专门针对神经网络加速的 GPU 架构 Volta。Volta 架构引入了 Tensor Core(张量核心) 专门加速矩阵运算,提升深度学习计算效率;支持 NVlink 2.0,提高了数据传输速度,增强了多 GPU 协作能力,提升系统整体性能。Volta GV100 具有 5120 个 CUDA 核心和 900GB/s 的带宽,加上 640 个张量核心,AI 计算能力达到 112 TFLOPS,比 Pascal 架构提高了近 3 倍。Volta 的出现标志着 AI 成为 GPU 发展的新方向。

紧随其后,在一年后的 2018 年,英伟达发布了 Turing 架构,进一步增强了 Tensor Core 的功能。Turing 架构不仅延续了对浮点运算的优化,还新增了对 INT8、INT4、甚至是 Binary(INT1) 等整数格式的支持。这一举措不仅使大范围混合精度训练成为可能,更将 GPU 的性能吞吐量推向了新的高度,较 Pascal GPU 提升了惊人的 32 倍。此外,Turing 架构还引入了先进的光线追踪技术,新增了 Ray Tracing 核心(RT Core)。Turing TU102 具有 4608 个 CUDA 核心、576 个张量核心和 72 个 RT 核心,支持 GPU 光线追踪,代表了图形技术的新突破。

2020 年,Ampere 架构的推出再次刷新了人们对 Tensor Core 的认知。Ampere 架构新增了对 TF32 和 BF16 两种数据格式的支持,进一步提高了深度学习训练和推理的效率。同时,Ampere 架构引入了对稀疏矩阵计算的支持,在处理深度学习等现代计算任务时,稀疏矩阵是一种常见的数据类型,其特点是矩阵中包含大量零值元素。传统的计算方法在处理这类数据时往往效率低下,而 Ampere 架构通过专门的稀疏矩阵计算优化,实现了对这类数据的高效处理,从而大幅提升了计算效率并降低了能耗。Ampere GA100 GPU 具有 6912 个 CUDA 核心、108 个张量核心和 hr 个 RT 核心, 比 Turing 架构提高约 50%。Ampere 架构在人工智能、光线追踪和图形渲染等方面性能大幅跃升。

英伟达全面引领 AI 时代

2016 年,黄仁勋亲手将第一台 DGX-1 超级计算机送给了 OpenAI。而在 2022 年年底,OpenAI 发布了 ChatGPT 生成式大语言模型,其惊艳的自然语言处理能力成为深度学习发展历程中划时代的里程碑。而在这波 AI 革命中,英伟达作为 「卖铲人」,发布了 H100 GPU,凭借着最新的 Hopper 架构,H100 成为地表最强并行处理器。

H100 是英伟达第九代数据中心 GPU,集成了 800 亿个晶体管,专为大规模 AI 和 HPC 计算而生。Hopper 架构标志性的变化是新一代流式多处理器的 FP8 张量核心 (Tensor Core),这一创新进一步加速了 AI 训练和推理过程。值得注意的是,Hopper 架构去除了 RT Core,以便为深度学习计算腾出更多空间。此外,Hopper 架构还引入了 Transformer 引擎,这使得它在处理如今广泛应用的 Transformer 模型时表现出色,进一步巩固了英伟达在深度学习硬件领域的领导地位。

同时,NVIDIA Grace Hopper 超级芯片将 NVIDIA Hopper GPU 的突破性性能与 NVIDIA Grace CPU 的多功能性结合在一起,在单个超级芯片中与高带宽和内存一致的 NVIDIA NVLink Chip-2-Chip(C2C) 互连,并且支持新的 NVIDIA NVLink 切换系统,CPU 和 GPU、GPU 和 GPU 之间通过 NVLink 进行连接,数据的传输速率高达 900 GB/s,解决了 CPU 和 GPU 之间数据的时延问题,跨机之间通过 PCIe 5.0 进行连接。NVIDIA Grace Hopper 超级芯片架构是高性能计算 (HPC) 和 AI 工作负载的第一个真正的异构加速平台。

2024 年,英伟达推出的 Blackwell 架构为生成式 AI 带来了显著的飞跃。相较于 H100 GPU,GB200 超级芯片在处理 LLM 推理任务时,性能实现了高达 30 倍的惊人提升,同时在能耗方面也实现了高达 25 倍的优化。其中 GB200 超级芯片能够组合两个 Blackwell GPU,并与英伟达的 Grace 中央处理单元配对,支持 NVLink-C2C 互联。Blackwell 还引入了第二代 Transformer 引擎,增强了对 FP4 和 FP6 精度的兼容性,显著降低了模型运行时的内存占用和带宽需求。此外,还引入了第五代 NVLink 技术,使每个 GPU 的带宽从 900 GB/s 增加到 1800 GB/s。

英伟达的 GPU 架构经历了一系列针对深度学习优化的重大创新和升级,每一次进步都在推动深度学习技术的边界。这些架构的发展不仅体现了英伟达在硬件设计方面的前瞻性,也为深度学习的研究和应用提供了强大的计算支持,促进了 AI 技术的快速发展。

值得注意的是,去年英伟达 CEO 黄仁勋在接受采访时表示,英伟达工程师正在开发接下来的两代产品,「将按照一年一代的节奏完成」。此前,英伟达按照平均两年一次的更新频率升级 GPU 架构,对产品性能进行大幅提升。

明日,英伟达会如何刷新人们的想象,令人期待。

Search

没有结果
查看所有结果

一周热门

工业母机 ETF(159667) 近 5 日净流入超 1.6 亿元,机构:今年以来机床行业呈现复苏态势

2025 年 9 月 9 日

科创板收盘播报:科创 50 指数调整跌 2.38% 半导体类个股跌幅居前

2025 年 9 月 9 日
突发!菊乐股份实控人童恩文去世,部分退休员工前往悼念,公司官网已变黑白

突发!菊乐股份实控人童恩文去世,部分退休员工前往悼念,公司官网已变黑白

2025 年 9 月 9 日
大厂化身「金主」!京东具身智能领域「六连投」 阿里、美团也入局

大厂化身 「金主」!京东具身智能领域 「六连投」 阿里、美团也入局

2025 年 9 月 9 日
金价再创历史新高 与今天A股的下跌有关系吗?

金价再创历史新高 与今天 A 股的下跌有关系吗?

2025 年 9 月 9 日
「牛市买股不如买ETF」?A股「游戏规则」遭重塑

「牛市买股不如买 ETF」?A 股 「游戏规则」 遭重塑

2025 年 9 月 9 日
日本政治风险发酵!高盛与美银罕见同步:瑞郎成新宠,日元前景堪忧

日本政治风险发酵!高盛与美银罕见同步:瑞郎成新宠,日元前景堪忧

2025 年 9 月 9 日
苹果上半年在全球高端智能手机市场份额超过60% 但在国内份额有下滑

苹果上半年在全球高端智能手机市场份额超过 60% 但在国内份额有下滑

2025 年 9 月 9 日
世界黄金协会:全球投资者8月重新涌入黄金ETF,资金流入环比增加一倍以上

世界黄金协会:全球投资者 8 月重新涌入黄金 ETF,资金流入环比增加一倍以上

2025 年 9 月 9 日
TechWeb微晚报:iPhone 17 Pro机身退回铝合金材质,中国铁路下月推行电子发票

TechWeb 微晚报:iPhone 17 Pro 机身退回铝合金材质,中国铁路下月推行电子发票

2025 年 9 月 9 日
金桂财经

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

近期动态

  • 工业母机 ETF(159667) 近 5 日净流入超 1.6 亿元,机构:今年以来机床行业呈现复苏态势
  • 科创板收盘播报:科创 50 指数调整跌 2.38% 半导体类个股跌幅居前
  • 突发!菊乐股份实控人童恩文去世,部分退休员工前往悼念,公司官网已变黑白
  • 大厂化身 「金主」!京东具身智能领域 「六连投」 阿里、美团也入局
  • 金价再创历史新高 与今天 A 股的下跌有关系吗?
  • 「牛市买股不如买 ETF」?A 股 「游戏规则」 遭重塑
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }