在当天的Hot Chips 2024大会上,英伟达公布了下一代GPU架构Blackwell的更多细节信息丝袜 英语,以及将来的产物阶梯图。
会议时间,英伟达架构总监Ajay Tirumala和Raymond Wong对Blackwell平台进行了初步先容,并阐发了这些本事怎么协同责任,在提高动力效果的同期为AI和加速狡计性能提供新的模范。
为Blackwell作念好准备
英伟达Blackwell是通用狡计全栈矩阵的终极握住决策,由多个英伟达芯片构成,包括Blackwell GPU、Grace CPU、BlueField数据处理单位、ConnectX网罗接口卡、NVLink交换机、Spectrum以太网交换机和Quantum InfiniBand交换机。
它涵盖了从CPU和GPU狡计,到用于互连的不同类型的网罗。这是芯片到机架和互连,而不单是是GPU。它是有史以来单个GPU所领有的最强AI狡计、内存带宽和互连带宽。通过使用高带宽接口(NV-HBI),可在两个GPU芯片之间提供10TB/s的带宽。
此外,英伟达还引入了新的FP4和FP6精度。裁汰狡计精度是提高性能的一种家喻户晓的顺序。通过英伟达的Quasar量化系统,不错找出哪些方面不错使用较低的精度,从而减少狡计和存储。英伟达默示,用于推理的FP4在某些情况下不错接近BF16性能。
NVLink交换机芯片和NVLink交换机托盘(tray)旨在以更低的功耗推送广博数据。英伟达演示了GB200 NVL72和NVL36。其中,NVL72包含36个Grace GPU和72个Blackwell GPU,专为万亿参数AI而联想。GB200 NVL 72动作一个融合系统,对大言语模子(LLM)推感性能擢升高达30倍,开释了及时运行数万亿个参数模子的才智。
英伟达默示,跟着AI模子尺寸的增多,在多个GPU上拆单干作负载大势所趋。而Blackwell饱胀建壮,不错在一个GPU中处理大家模子。
临了,英伟达还展示了2024年至2028年的产物阶梯图。2026年的1.6T ConnectX-9似乎标明了英伟达对PCIe Gen7的需求,因为PCIe Gen6 x16无法处理1.6T的网罗勾搭。
Blackwell的本事打破
本年3月,英伟达在GTC 2024开发者大会上发布了新的GPU架构Blackwell。Blackwell得名于好意思国数学家David Blackwell,是英伟达最新一代的AI芯片与超等狡计平台。与Grace数据中心CPU、新一代网罗芯片等产物一说念,面向生成式AI共同构成完满握住决策。
英伟达称,Blackwell领有6项立异性本事,可补助多达10万亿参数的模子进行AI检会和及时大言语模子(LLM)推理。
1.民众最建壮的芯片:Blackwell架构GPU领有2080亿个晶体管,确保了芯片具有极高的狡计才智和复杂性;接纳台积电4纳米工艺制造,提高了芯片的集成度,裁汰了功耗和发烧量;配备192GB的HBM3E显存,极大擢升了芯片的数据处理才智和效果。
2.第二代Transformer引擎:勾搭Blackwell Tensor Core本事和TensorRT-LLM和NeMo Megatron框架中的英伟达先进动态范围握住算法丝袜 英语,Blackwell将通过新的4位浮点AI补助双倍的狡计和模子大小推理才智。
3.第五代NVLink:为提高数万亿参数和搀杂大家AI模子的性能,最新一代英伟达NVLink为每个GPU提供了打破性的1.8TB/s的双向微辞量,确保最复杂LLM之间多达576个GPU之间的无缝高速通讯。
4.RAS引擎:Blackwell补助的GPU包含一个专用引擎,结束可靠性、可用性和职业性。此外,Blackwell架构还增多了芯片级功能,应用基于AI的贯注性抠门进行会诊和预测可靠性问题。这不错最大狂放地延长系统正常运行时候,并提高大范畴部署AI的弹性。
5.安全东说念主工智能:先进的玄机狡计功能可在不影响性能的情况下保护AI模子和客户数据,并补助新的本机接口加密契约,进一步增强了芯片的安全性。
6.解压缩引擎:专用解压缩引擎补助最新风光,加速数据库查询,提供数据分析和数据科学的最高性能。
英伟达CEO黄仁勋称,Blackwell不单是芯片,而是一个全新的平台。它将是英伟达历史上、乃至扫数狡计机历史上最告捷的产物。
Blackwell的商场影响
中文字幕Blackwell架构的推出受到了民众各大云提供商、职业器制造商以及头部AI企业的敬爱,如亚马逊、谷歌和微软等。英伟达默示,Blackwell正在被民众各大云职业提供商接纳。同期,AI公司、电信提供商和一系列其他本事企业也有着强盛的需求。
Blackwell的发布预示着AI的又一个打破时刻的到来,如故发布便获得了微软CEO萨蒂亚·纳德拉(Satya Nadella)、Alphabet CEO桑达尔·皮查伊(Sundar Pichai)、亚马逊CEO安迪·贾西(Andy Jassy)、OpenAI CEO萨姆·奥特曼(Sam Altman),以过甚他有名科技魁首和名东说念主的补助。
至关要紧的是,Blackwell是一个更大的生态系统政策的一部分。黄仁勋称:“Blackwell不仅是系统的中枢芯片,它本体上如故一个平台。它基本上便是一个狡计机系统。”
Nvidia还将使用Blackwell来擢升其在软件界限的地位和宏愿。跳动的AI开发商已经依赖Nvidia的CUDA软件来创建由该公司处理器驱动的应用风光,而高性能Blackwell处理器的蛊卦力应有助于确保客户连续使用其软件。
该政策甚而蔓延得更远。黄仁勋在GTC的一次会议上称:“你不错制造芯片让软件运行得更好,但莫得软件你就无法创造一个新的商场。咱们的独有之处在于,我信服咱们是独逐个家大要创造我方商场的芯片公司。”
跟着基于Blackwell架构的GPU GB200的发布,英伟达似乎正在为创建新类别的AI软件应用风光掀开大门。反过来,此类软件的推出、扩张和合手续发展可能会对其超高端GPU产生更大的需求。
Blackwell的延迟
本月初有报说念称,英伟达的下一代Blackwell系列AI芯片因联想纰谬问题被动推迟发布,这一决定可能对包括Meta、谷歌和微软在内的大客户变成影响。
据悉,Blackwell芯片的大范畴分娩原打算于本年第三季度开动,并于第四季度开动请托。但说念,在准备大范畴分娩时,台积电的工程师发现了联想问题,导致分娩受阻。
报说念称,由于台积电封装本事CoWoS的复杂性,英伟达将推迟Blackwell GPU的出货时候至2025年第一季度。
瑞银(UBS)分析师觉得,英伟达首批Blackwell芯片最多延迟4~6周出货,即推迟到2025年1月底。为此,许多客户会改而采购交货时候短的H200芯片。
而摩根士丹利的分析师相对乐不雅,觉得Blackwell芯片的分娩仅会暂停约两周,并可在2024年第四季度通过台积电的致力于赶上过程。
合座而言,分析师觉得相关Blackwell芯片推迟上市的担忧可能被夸大了,预测这不会对英伟达的营收或需求产生枢纽影响。
英伟达CEO黄仁勋默示,Blackwell GPU的研发预算约为100 亿好意思元,上市后单价会在3~4万好意思元。鉴于现时检会和部署AI的强盛需求,该价钱也并未超出商场预期。
“反英伟达”定约
包括Alphabet、高通和英特尔在内的公司正在联手创建一个组织“UXL基金会”,旨在报复英伟达在AI界限斥地无可争议的主导地位。
UXL基金会旨在创建一个软件套件,匡助在更平时的处理器上运行AI应用风光,并减少对英伟达平台的依赖。
据报说念,UXL基金会当今正在招募微软、亚马逊和其他有影响力的科技公司。因此,尽管许多科技界的有名东说念主士对Blackwell的才智感到喜跃,但不错露出的是,东说念主们对更平时的AI界限过度依赖英伟达的生态系统合手左右气魄。
在某种程度上,UXL基金会的建立阐发了英伟达当今的竞争地位有多强。该公司在用于AI和其他加速狡计应用的GPU商场上占据了大要90%的份额,而Blackwell的推出可能有助于它连续保合手甚而扩大其主导地位。
与持续扩大的专用软件器具相勾搭,英伟达正在重塑AI界限,而其竞争敌手和潜在竞争敌手还有好多责任要作念。
海量资讯、精确解读,尽在新浪财经APP牵扯裁剪:刘亮堂 丝袜 英语