丝袜 英语 英伟达公布Blackwell架构更多细节:引颈AI与超等狡计的新纪元

Ady影院
你的位置:Ady影院 > 羽田爱qvod > 丝袜 英语 英伟达公布Blackwell架构更多细节:引颈AI与超等狡计的新纪元
丝袜 英语 英伟达公布Blackwell架构更多细节:引颈AI与超等狡计的新纪元
发布日期:2024-08-27 17:16    点击次数:178

丝袜 英语 英伟达公布Blackwell架构更多细节:引颈AI与超等狡计的新纪元

  在当天的Hot Chips 2024大会上,英伟达公布了下一代GPU架构Blackwell的更多细节信息丝袜 英语,以及将来的产物阶梯图。

  会议时间,英伟达架构总监Ajay Tirumala和Raymond Wong对Blackwell平台进行了初步先容,并阐发了这些本事怎么协同责任,在提高动力效果的同期为AI和加速狡计性能提供新的模范。

  为Blackwell作念好准备

  英伟达Blackwell是通用狡计全栈矩阵的终极握住决策,由多个英伟达芯片构成,包括Blackwell GPU、Grace CPU、BlueField数据处理单位、ConnectX网罗接口卡、NVLink交换机、Spectrum以太网交换机和Quantum InfiniBand交换机。

  它涵盖了从CPU和GPU狡计,到用于互连的不同类型的网罗。这是芯片到机架和互连,而不单是是GPU。它是有史以来单个GPU所领有的最强AI狡计、内存带宽和互连带宽。通过使用高带宽接口(NV-HBI),可在两个GPU芯片之间提供10TB/s的带宽。

  此外,英伟达还引入了新的FP4和FP6精度。裁汰狡计精度是提高性能的一种家喻户晓的顺序。通过英伟达的Quasar量化系统,不错找出哪些方面不错使用较低的精度,从而减少狡计和存储。英伟达默示,用于推理的FP4在某些情况下不错接近BF16性能。

  NVLink交换机芯片和NVLink交换机托盘(tray)旨在以更低的功耗推送广博数据。英伟达演示了GB200 NVL72和NVL36。其中,NVL72包含36个Grace GPU和72个Blackwell GPU,专为万亿参数AI而联想。GB200 NVL 72动作一个融合系统,对大言语模子(LLM)推感性能擢升高达30倍,开释了及时运行数万亿个参数模子的才智。

  英伟达默示,跟着AI模子尺寸的增多,在多个GPU上拆单干作负载大势所趋。而Blackwell饱胀建壮,不错在一个GPU中处理大家模子。

  临了,英伟达还展示了2024年至2028年的产物阶梯图。2026年的1.6T ConnectX-9似乎标明了英伟达对PCIe Gen7的需求,因为PCIe Gen6 x16无法处理1.6T的网罗勾搭。

  Blackwell的本事打破

  本年3月,英伟达在GTC 2024开发者大会上发布了新的GPU架构Blackwell。Blackwell得名于好意思国数学家David Blackwell,是英伟达最新一代的AI芯片与超等狡计平台。与Grace数据中心CPU、新一代网罗芯片等产物一说念,面向生成式AI共同构成完满握住决策。

  英伟达称,Blackwell领有6项立异性本事,可补助多达10万亿参数的模子进行AI检会和及时大言语模子(LLM)推理。

  1.民众最建壮的芯片:Blackwell架构GPU领有2080亿个晶体管,确保了芯片具有极高的狡计才智和复杂性;接纳台积电4纳米工艺制造,提高了芯片的集成度,裁汰了功耗和发烧量;配备192GB的HBM3E显存,极大擢升了芯片的数据处理才智和效果。

  2.第二代Transformer引擎:勾搭Blackwell Tensor Core本事和TensorRT-LLM和NeMo Megatron框架中的英伟达先进动态范围握住算法丝袜 英语,Blackwell将通过新的4位浮点AI补助双倍的狡计和模子大小推理才智。

  3.第五代NVLink:为提高数万亿参数和搀杂大家AI模子的性能,最新一代英伟达NVLink为每个GPU提供了打破性的1.8TB/s的双向微辞量,确保最复杂LLM之间多达576个GPU之间的无缝高速通讯。

  4.RAS引擎:Blackwell补助的GPU包含一个专用引擎,结束可靠性、可用性和职业性。此外,Blackwell架构还增多了芯片级功能,应用基于AI的贯注性抠门进行会诊和预测可靠性问题。这不错最大狂放地延长系统正常运行时候,并提高大范畴部署AI的弹性。

  5.安全东说念主工智能:先进的玄机狡计功能可在不影响性能的情况下保护AI模子和客户数据,并补助新的本机接口加密契约,进一步增强了芯片的安全性。

  6.解压缩引擎:专用解压缩引擎补助最新风光,加速数据库查询,提供数据分析和数据科学的最高性能。

  英伟达CEO黄仁勋称,Blackwell不单是芯片,而是一个全新的平台。它将是英伟达历史上、乃至扫数狡计机历史上最告捷的产物。

  Blackwell的商场影响

中文字幕

  Blackwell架构的推出受到了民众各大云提供商、职业器制造商以及头部AI企业的敬爱,如亚马逊、谷歌和微软等。英伟达默示,Blackwell正在被民众各大云职业提供商接纳。同期,AI公司、电信提供商和一系列其他本事企业也有着强盛的需求。

  Blackwell的发布预示着AI的又一个打破时刻的到来,如故发布便获得了微软CEO萨蒂亚·纳德拉(Satya Nadella)、Alphabet CEO桑达尔·皮查伊(Sundar Pichai)、亚马逊CEO安迪·贾西(Andy Jassy)、OpenAI CEO萨姆·奥特曼(Sam Altman),以过甚他有名科技魁首和名东说念主的补助。

  至关要紧的是,Blackwell是一个更大的生态系统政策的一部分。黄仁勋称:“Blackwell不仅是系统的中枢芯片,它本体上如故一个平台。它基本上便是一个狡计机系统。”

  Nvidia还将使用Blackwell来擢升其在软件界限的地位和宏愿。跳动的AI开发商已经依赖Nvidia的CUDA软件来创建由该公司处理器驱动的应用风光,而高性能Blackwell处理器的蛊卦力应有助于确保客户连续使用其软件。

  该政策甚而蔓延得更远。黄仁勋在GTC的一次会议上称:“你不错制造芯片让软件运行得更好,但莫得软件你就无法创造一个新的商场。咱们的独有之处在于,我信服咱们是独逐个家大要创造我方商场的芯片公司。”

  跟着基于Blackwell架构的GPU GB200的发布,英伟达似乎正在为创建新类别的AI软件应用风光掀开大门。反过来,此类软件的推出、扩张和合手续发展可能会对其超高端GPU产生更大的需求。

  Blackwell的延迟

  本月初有报说念称,英伟达的下一代Blackwell系列AI芯片因联想纰谬问题被动推迟发布,这一决定可能对包括Meta、谷歌和微软在内的大客户变成影响。

  据悉,Blackwell芯片的大范畴分娩原打算于本年第三季度开动,并于第四季度开动请托。但说念,在准备大范畴分娩时,台积电的工程师发现了联想问题,导致分娩受阻。

  报说念称,由于台积电封装本事CoWoS的复杂性,英伟达将推迟Blackwell GPU的出货时候至2025年第一季度。

  瑞银(UBS)分析师觉得,英伟达首批Blackwell芯片最多延迟4~6周出货,即推迟到2025年1月底。为此,许多客户会改而采购交货时候短的H200芯片。

  而摩根士丹利的分析师相对乐不雅,觉得Blackwell芯片的分娩仅会暂停约两周,并可在2024年第四季度通过台积电的致力于赶上过程。

  合座而言,分析师觉得相关Blackwell芯片推迟上市的担忧可能被夸大了,预测这不会对英伟达的营收或需求产生枢纽影响。

  英伟达CEO黄仁勋默示,Blackwell GPU的研发预算约为100 亿好意思元,上市后单价会在3~4万好意思元。鉴于现时检会和部署AI的强盛需求,该价钱也并未超出商场预期。

  “反英伟达”定约

  包括Alphabet、高通和英特尔在内的公司正在联手创建一个组织“UXL基金会”,旨在报复英伟达在AI界限斥地无可争议的主导地位。

  UXL基金会旨在创建一个软件套件,匡助在更平时的处理器上运行AI应用风光,并减少对英伟达平台的依赖。

  据报说念,UXL基金会当今正在招募微软、亚马逊和其他有影响力的科技公司。因此,尽管许多科技界的有名东说念主士对Blackwell的才智感到喜跃,但不错露出的是,东说念主们对更平时的AI界限过度依赖英伟达的生态系统合手左右气魄。

  在某种程度上,UXL基金会的建立阐发了英伟达当今的竞争地位有多强。该公司在用于AI和其他加速狡计应用的GPU商场上占据了大要90%的份额,而Blackwell的推出可能有助于它连续保合手甚而扩大其主导地位。

  与持续扩大的专用软件器具相勾搭,英伟达正在重塑AI界限,而其竞争敌手和潜在竞争敌手还有好多责任要作念。

海量资讯、精确解读,尽在新浪财经APP

牵扯裁剪:刘亮堂 丝袜 英语



Powered by Ady影院 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024 版权所有