英伟达召开九月全球开发者大会。英伟达CEO黄仁勋在大会上发布了40 系显卡、全新 GPU 架构 Ada Lovelace、自动驾驶芯片“雷神”Drive Thor、Omniverse Cloud 服务、Nemo LLM 系列等诸多产品。

  首先,备受关注的40系显卡如期而至。本次发布的40系显卡包括:24GB显存的RTX 4090,以及16GB和12GB显存的RTX 4080。

  定价方面,40系显卡迎来了一波涨价,相较于RTX 3090的首发价11999元和RTX 3080的5499元,40系上涨1000元不止。

  Ada新架构,DLSS 3技术

  RTX 40系列显卡是英伟达依托于新架构 Ada Lovelace 的第一款显卡,新架构 Ada Lovelace也随着显卡同时发布。黄仁勋表示,在相同的功率下,Ada架构的性能是Ampere的两倍以上。Ampere架构是英伟达于GTC 2020发布的GPU架构,由540亿晶体管组成,是7nm芯片。

  RTX 4090则包含760亿个晶体管、16384个CUDA核心和24 GB GDDR6X显存,最大boost频率2.52GHz,采用台积电4nm先进制程工艺和美光科技的G6X存储芯片。

  据英伟达官方新闻稿,40系显卡参数为:

英伟达RTX 40系显卡逆天!台积电4nm性能涨4倍

  为了直观展现40系显卡的性能,英伟达在发布会现场展示了对性能要求极高的3A大作《赛博朋克2077》的实测效果。

英伟达RTX 40系显卡逆天!台积电4nm性能涨4倍

英伟达RTX 40系显卡逆天!台积电4nm性能涨4倍

  可以看见,在运行《赛博朋克2077》时,40系显卡实现了近4倍性能提升。在另一款优化较差的游戏《微软模拟飞行》中,性能也达到了30系旗舰3090ti的2倍。

  在优秀的性能的背后,英伟达也强调了依托于新架构的DLSS 3技术的重要性。官方表示,DLSS 3是一款由 AI 驱动的性能倍增器,拥有开创性光学多帧生成功能。

  光学多帧生成技术,可生成全新帧,而不仅仅是像素,能够带来惊人的性能提升。此前的两代DLSS技术通过AI算法提高渲染速度,而DLSS 3能够渲染插帧,并利用“光流场”技术,在无需GPU或CPU运算的就能提高渲染速度,这能够极大减少AI在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。

  自动驾驶芯片DRIVE Thor

  除了40系显卡以外,英伟达的自动驾驶芯片DRIVE Thor是本次发布会另一个“重磅核弹”。

英伟达RTX 40系显卡逆天!台积电4nm性能涨4倍

  雷神Thor搭载了770亿晶体管,在算力上达到了2000 TOPS和2000 TFLOPs.据了解,Thor的算力是特斯拉FSD芯片的14倍。

  除了算力的提升以外,Thor的定位是一台超级计算机,只靠单机架构,就能够运行自动驾驶、数字仪表盘/车机、车载信息娱乐一整套系统。

  同时,Drive Thor也是英伟达第一个具有Transformer引擎的自动驾驶汽车计算平台。Transformer 引擎在“雷神” GPU 单元的 H100 Tensor Core 中运行,能够极大提升车载算力的性能,降低了对云端服务器和连通性的要求。

  此外,黄仁勋在发布会上强调,Thor超强性能的支撑来源于:Grace、Hopper、Ada Lovelace。

  Grace是英伟达的AI专用服务器CPU,Hopper是英伟达最新的GPU架构之一,Ada Lovelace即上文提到的40系显卡新架构。因此,Drive Thor可以说是英伟达三项技术的集大成之作。

  值得注意的是,DRIVE Thor 宣布的第一个客户是中国车企吉利旗下的 ZEEKR极氪。极氪CEO安聪慧表示,将在2025年生产的下一代智能电动汽车当中采用Drive Thor.黄仁勋在发布会上也确认了Thor将于2025年上车量产。此外,小鹏、轻舟等车企也相继与英伟达达成合作关系,对“雷神”进行早期测试。

  除了40系显卡和Drive Thor以外,英伟达也推出了依托于新架构的Omniverse Cloud 服务、超大规模神经网络开发工具Nemo LLM 系列、游戏 mod 开发工具RTX Remix等等。