找回密码
 立即注册
★★★教你玩转月半叔茶坊★★★
→长春LY会所修车大队总部←
广告位招租中
广告位招租中
查看: 9890|回复: 5

黄仁勋最新采访:谈CUDA、TPU、华为和其他

[复制链接]
发表于 13 小时前 | 显示全部楼层 |阅读模式

朋友,既然来了,加入我们的大家庭呗~

您需要 登录 才可以下载或查看,没有账号?立即注册

×
在昨日一个采访中,Vlogger Dwarkesh Patel向英伟达CEO Jensen Huang 扣问了关于 TPU 竞争、英伟达怎样掌控日益告急的先辈芯片供应链、我们是否应该向中国出售 AI 芯片、英伟达为什么不转型为超大规模数据中央、其投资计谋等等题目。5 c, g4 T& q+ c, e& Q
以下是我们总结的的三十个紧张观点:
4 R9 p% @( u0 w1、全部产能题目都可以在两三年内轻松办理
6 c4 K0 C4 Y1 a% O: N9 C) x2、CPU有点像凯迪拉克,它是一款舒服的巡航车,速率不会太快,每个人都能轻松驾御;它配备了巡航控制,统统都很简朴。但在许多方面,英伟达的GPU和加快器就像F1赛车/ z! D, c9 ]7 c' c
3、跟Elon Musk吃过饭,但Musk没有恳求黄仁勋优先供货GPU6 A- ?8 y/ A4 j* j
4、GPU订单遵照先来后到原则
) D- Q, v+ {' y) R5、不喜好“价高者得”的谋划方式" N! S+ @% k- K
6、悔恨错过Anthropic
( @' z$ w, F' o$ V- X* S7、不喜好挑选赢家举行支持,而是雨露均沾,让他们自由发展
0 F/ Y3 z( F" g8 q3 T1 O' b0 N8、依然不看好ASIC,没有任何一个ASIC公司有英伟达可靠( O5 r! T* n8 _7 Y! |
9、和台积电没有法律条约, [/ p# Q. U+ o. _  \* I
10、本年的Vera Rubin将会非常精彩;来岁Vera Rubin Ultra将问世;后年,Feynman将横空出世
' d# Q/ a9 Z, q7 [11、中国生产了环球60%的主流芯片,乃至更多
: c2 @: \% Z8 ^5 u12、中国拥有一些天下上最顶尖的盘算机科学家
8 U" a# a! J, r, ^13、中国拥有环球50%的人工智能研究职员
. L' x  j. q3 r14、中国不是仇人,他们只是对手/ s1 _9 d# E0 m6 X; }
15、中国的盘算本领非常巨大,中国是环球第二大盘算市场。假如他们想整合盘算资源,完全可以满意需求。" u' u$ i) g3 V2 S
16、中国拥有的能源量惊人,富足的能源是中国的上风  q  g! _! z  f; Z4 K' t/ o; `
17、假如中国乐意,他们完全可以把更多的芯片会合起来
5 p2 C: }% B; P! @" R1 M, Y( Q, k18、以为中国无法制造人工智能芯片的说法完满是无稽之谈( ^3 f# z  V' Z/ |0 w0 a% f- _4 s
19、中国是环球最大的开源软件贡献国3 |( h  E0 F6 G4 e) H+ m! L9 {  ]
20、中国也是环球最大的开放模子贡献国
( K  G) l* S0 A21、7nm芯片已经充足好了5 Q2 R+ S1 u) K4 `% G  @
22、创建两个生态体系——一个只能运行在外国技能栈上的开源生态体系,另一个是运行在美国技能栈上的封闭生态体系——的做法是极其愚笨的" I* N& {1 b. I, o4 A3 c
23、人工智能本质上就是一个并行盘算题目% V' m* s' ^% B% P/ r4 l
24、MoE 是一项巨大的发明" t# S) g  V! z/ c) b, B  k+ T
25、DeepSeek 绝非无关紧急的进步,假如 DeepSeek 先在华为平台上发布,那对美国来说将是劫难性的* e* H. x% a& r9 p
26、x86架构的存在是有缘故原由的。ARM架构云云根深蒂固也是有缘故原由的。这些生态体系难以替换。这必要泯灭大量的时间和精神,而且大多数人都不肯意如许做
6 {; f3 Q/ Q* t) L/ i27、英伟达在中国份额大幅降落
. Q$ D" z7 w7 d. L4 S28、架构至关紧张,盘算机科学至关紧张。半导体物理固然紧张,但盘算机科学才是重中之重
1 i0 \8 O$ r) E( C3 y! ?+ j: G29、纵然人工智能本日尚未出现,英伟达的规模也会非常巨大; a4 Q! Z' E. a$ |
30、假如没有人工智能,我会非常惆怅
% ~; j" P3 J* E' p* c英伟达最大的护城河是其对稀缺供应链的控制吗?
" s7 S9 `0 ]4 @3 i, y% QQ:我们已经看到很多软件公司的估值暴跌,由于人们预期人工智能会使软件商品化。有一种大概过于灵活的想法是:你看,英伟达把GDS2文件发给台积电。台积电制造逻辑芯片,制造互换机芯片,然后将它们与SK海力士、美光和三星生产的HBM内存封装在一起。之后,台积电将封装好的芯片发给台湾的ODM厂商,由他们组装成机架。从本质上讲,英伟达制造的是其他人制造的软件,假如软件商品化了,英伟达也会商品化吗?
4 s% i' ?8 w7 t& I/ i' N. Z) `6 G2 g黄仁勋:终极,总得有某种机制将电子转化为tokens。将电子转化为tokens,并随着时间的推移提拔这些tokens的代价,这很难完全商品化。从电子到tokens的转化是一个不可思议的路程。制造tokens就像让一个分子比另一个分子更有代价,让一个tokens比另一个更有代价。显然,我们正在及时见证着tokens代价的提拔,此中蕴含着大量的艺术、工程、科学和发明创造。这种转化、制造以及全部相干的科学原理,我们远未被完全明白,这段路程也远未竣事。我猜疑它终极可否实现。5 c* b. n4 {9 S# i( v
我们固然会进步服从。你提出的题目正是我对我们公司的明白。输入是电子,输出是tokens。英伟达位于中心。我们的工作是在须要范围内尽大概少地干预,从而以惊人的本领实现这种转型。我所说的“尽大概少地干预”,是指任何我不必要亲身完成的事变,我都会与其他互助同伴一起,将其纳入我的生态体系。
! f& K  w& M/ G. K9 M( p4 Z假如你看看本日的英伟达,我们大概拥有规模最大的互助同伴生态体系,涵盖供应链的上卑鄙,包罗全部盘算机公司、应用开辟商和模子构建者。人工智能就像一个五层蛋糕,我们的生态体系遍布全部五个层面。我们只管少做,但究竟证实,我们必须做的那部门工作极其困难。我以为这部门工作无法商品化。(We try to do as little as possible, but the part that we have to do, as it turns out, is insanely hard)
$ M: }. p( O2 P3 [5 J8 Z究竟上,我也不以为企业软件公司、工具制造商……现在大多数软件公司都是工具制造商。固然,也有一些公司不是,它们开辟的是工作流程编码体系。但对许多公司来说,它们确实是工具制造商。比方,Excel 是工具,PowerPoint 是工具,Cadence开辟工具,Synopsys也开辟工具。现实上,我看到的恰好与人们的见解相反。我以为署理的数目和工具用户的数目都将呈指数级增长。全部这些工具的实例数目很大概会激增。3 y8 U+ i) K$ N7 U0 s
Synopsys Design Compiler的实例数目很大概会激增,利用平面规划器、结构工具和计划规则查抄器的署理数目也会随之大幅增长。现在,我们受限于工程师的数目。将来,这些工程师将得到大量agent的支持。我们将以亘古未有的方式探索计划空间,并继承利用我们本日利用的工具。
- j" B- J; b9 a6 B' V# p我以为工具的利用将推动软件公司发达发展。之以是现在还没有出现这种环境,是由于agents还不善于利用这些工具。要么这些公司会自行开辟署理商,要么agents会变得充足纯熟,可以或许利用这些工具。我以为终极会是两者的联合。
$ \" c8 m1 ]: g: O4 ~" e& uQ:在你们最新的文件中,你们与代工厂、内存和封装厂商签署了近1000亿美元的采购答应。SemiAnalysis报道称,你们这类采购答应的总额将到达2500亿美元。一种解读是,英伟达的护城河现实上在于你们锁定了将来几年这些稀缺组件的供应。其他厂商大概拥有加快器,但他们真的能得到所需的内存吗?他们真的能得到所需的逻辑芯片吗?这真的是英伟达将来几年最大的护城河吗?1 D3 h! }* B9 Z/ {3 ?( G, w3 d/ ^
黄仁勋:这是我们能做到而别人很难做到的事变之一。我们在上游投入了大量资源。有些是明白的,好比你提到的这些答应。有些则是隐性的。比方,我们供应链上的很多上游投资都是由他们举行的,由于我曾对各位CEO说:“让我告诉你们这个行业将会发展到多大的规模,让我表明一下缘故原由,让我和你们一起分析,让我向你们展示我所看到的。”
  ?% @% M" [  C; t. J3 K通过与上游各行各业的CEO们沟通、开导和和谐,他们才乐意举行投资。为什么他们乐意为我而不是为其他人投资呢?缘故原由在于,他们知道我有本领购买他们的产物,并通过我的卑鄙渠道贩卖。究竟上,英伟达的卑鄙供应链和我们的卑鄙需求都非常巨大,因此他们乐意举行上游投资。(As a result of that process of informing, inspiring, and aligning with CEOs of all different industries upstream, they’re willing to make the investments. Why are they willing to make the investments for me and not someone else? The reason for that is because they know that I have the capacity to buy their supply and sell it through my downstream. The fact is that Nvidia’s downstream supply chain and our downstream demand is so large, they’re willing to make the investment upstream.)
2 G6 Y( {, n! l3 V$ X" x/ N2 l. g( ]假如你看看GTC大会,人们都会赞叹于它的规模和参会职员之多。它涵盖了人工智能范畴的方方面面,可谓应有尽有。他们齐聚一堂,是由于相互必要交换。我把他们聚集在一起,是为了让卑鄙企业相识上游,上游企业相识卑鄙,让全部人都能相识人工智能的最新希望。更紧张的是,他们还能与人工智能范畴的专家、正在发达发展的人工智能初创公司以及全部令人赞叹的结果晤面,亲眼见证我所报告的统统。我耗费大量时间,直接或间接地向我们的供应链、互助同伴和生态体系转达我们眼前的机会。) I# k  R% [4 h- N, F3 \$ D3 T& T
有些人总是说:“Jensen,大多数主题演讲都是一个接一个的公告。”但我们的主题演讲总会有一部门内容让人感觉有点“折磨”,由于它险些像是在举行教诲。究竟上,这正是我所关注的。我必要确保整个供应链,从上到下,整个生态体系,都相识即将发生的事变,它为什么会发生,何时发生,规模有多大,而且可以或许像我一样体系地思索和分析它。3 o3 C9 d0 G6 i$ o0 W
关于您所形貌的护城河,我们有本领为将来做好预备。假如将来几年我们的规模到达万亿美元,我们拥有相应的供应链。假如没有我们的影响力,我们业务的发展速率……就像现金流、供应链和客户流失一样,假如业务流失率很低,没有人会为一个架构构建供应链。我们之以是可以或许维持云云巨大的规模,完满是由于卑鄙需求巨大。他们看到了这一点,听到了相干信息,预见到了这统统。这使我们可以或许以云云大的规模去做我们可以或许做的事变。: x1 `7 k* K+ G5 i6 ^  ]
Q:我确实想更详细地相识上游可否跟上步调。多年来,你们的收入每年都翻一番。你们提供给环球的flops数每年都增长三倍以上。. B8 F" I9 C5 y" y
黄仁勋:如今以这种规模翻倍真的太不可思议了。; R( v4 g; M( w- h. E  J4 j) n
Q:没错。但你再看看逻辑。你是台积电N3工艺节点的最大客户,也是N2工艺节点的最大客户之一。本年人工智能团体将占N3工艺节点的60%,根据SemiAnalysis的猜测,来岁将到达86%。假如你已经占据了大部门市场份额,怎样才气实现翻番?又该怎样逐年实现这一目的?我们如今是否正处于一个由于上游工艺的限定,人工智能盘算增长速率不得不放缓的阶段?你以为有什么办法可以办理这个题目?终极,我们怎样才气实现每年两倍的晶圆厂建立量?; Z6 m8 A4 M) F: A0 F# v
黄仁勋:在某种水平上,瞬时需求大于环球上卑鄙的供应。在任何时候,我们都大概面对plumbers数目不敷的限定,而这种环境现实上也时有发生。
* m: ]( p* ]. }: S% PQ:plumbers受邀到场来岁的GTC大会。4 X* v; X5 e6 f# `
黄仁勋:趁便说一句,这主意不错。但这只是个好条件。你想要的是一个瞬时需求大于行业总供给的行业。反之则显然欠好。假如我们之间的间隔太远,假如某个特定组件的供应量太少,整个行业就会蜂拥而至。比方,你会发现如今人们很少再评论CoWoS了。3 j1 _" d% ~2 K& ?
缘故原由在于,已往两年我们尽力以赴,实现了超负荷的产能扩张。我们一连数次更加,每次都翻倍。如今我以为我们形势相称不错。台积电如今也意识到,CoWoS的供应必须跟上逻辑电路和存储器的需求。他们正以与逻辑电路雷同的速率扩展CoWoS和将来的封装技能。这非常棒,由于恒久以来,CoWoS和HBM存储器都属于小众技能。但如今它们不再是小众技能了。人们如今意识到它们已经成为主流的盘算技能。" T! B5 O9 l& {2 P5 }- U1 O
固然,我们如今更有本领影响供应链的更大范围。在人工智能革命之初,我五年前就说过如今我说的这些话。有些人信赖它并举行了投资,比方Sanjay和美光团队。我仍旧清晰地记得那次集会,会上我清晰地论述了将会发生什么、为什么会发生以及本日的猜测。他们确实更加投入。我们在LPDDR和HBM内存范畴与他们睁开了互助,他们也确实投入了大量资金。这显然对公司产生了巨大的影响。有些人参加得晚一些,但如今他们都在这里了。. ~+ L. z7 t: U  P; a6 f. r
这些瓶颈题目都受到了高度器重。如今,我们正在提前数年预先办理这些瓶颈题目。比方,已往几年我们对Lumentum 、Coherent以及硅光子生态体系的投资,真正重塑了供应链。我们围绕台积电构建了一条完备的供应链。我们与他们互助开辟了COUPE 项目,发明白大量技能,并将这些专利授权给供应链,以保持其开放性和高效性。0 }: z* a1 y0 S; r( a
我们正在通过发明新技能、新工作流程、新型测试装备(比方双面探针测试)来构建供应链,同时投资于相干企业并资助它们扩大产能。可以看出,我们正积极塑造整个生态体系,使供应链可以或许支持规模化发展。
  |4 B; K% c9 b* e( U3 kQ:好像有些瓶颈比其他瓶颈更轻易办理。比方,扩展 CoWoS 与其他扩展方式相比。8 a& h- v$ P! v) r
黄仁勋:趁便说一句,我遇到的是难度最高的那一个。# _/ ~7 D+ @* v; J
Q:哪个?/ t2 H3 i1 R8 w9 D2 H' ?" ^
黄仁勋:水管工和电工。这就是我对那些形貌工作闭幕和职业灭亡的末日论者感到担心的缘故原由之一。假如我们劝阻人们成为软件工程师,我们就碰面临软件工程师短缺的题目。十年前也出现过同样的猜测。一些末日论者告诫人们:“无论怎样,万万别当放射科大夫。”你大概还会在网上看到一些如许的视频,说放射科大夫将是第一个消散的职业,天下将不再必要更多的放射科大夫。猜猜我们如今缺什么?放射科大夫。& n1 B/ W9 V% P. Z
Q:回到之前关于有些东西可以规模化生产,而有些东西却不可这一点……你毕竟怎样才气每年生产两倍的逻辑电路?归根结底,存储器和逻辑电路的瓶颈都在于极紫外光刻(EUV)。你怎样才气逐年得到两倍的极紫外光刻装备?
; f3 s/ N6 `8 m4 d9 J黄仁勋:这些都不是无法快速扩展的。全部这些都可以在两三年内轻松实现。你只必要一个需求信号。一旦你能造出一个,你就能造出十个;一旦你能造出十个,你就能造出一百万个。这些都不难复制。9 ^; @) ~% {8 x
Q:你会追溯到供应链的哪个环节?你会去找ASML说:“嘿,假如我预测三年后,英伟达的年收入到达两万亿美元,我们必要更多的EUV光刻机”吗?  R" M; G5 x4 c3 g
黄仁勋:有些我必须直接说服,有些必要间接,另有一些……假如我能说服台积电,ASML也会被说服。我们必须思量关键的瓶颈。但假如台积电被说服了,几年后你们就会有许多EUV光刻机可用了。
, f. _9 c2 F8 M5 j0 f) Z我的意思是,全部瓶颈都不会连续凌驾两三年,一个都不会。与此同时,我们的盘算服从进步了10倍、20倍,以Hopper到Blackwell为例,乃至进步了30倍到50倍。由于CUDA的机动性,我们不停开辟新的算法。我们正在开辟各种新技能,以进步服从,同时提拔产能。这些我都不担心。真正让我担心的是卑鄙的题目。那些拦阻能源发展的能源政策……没有能源,就无法创建任何财产。没有能源,就无法创建一个全新的制造业。
4 D' p$ g: Z1 X- o/ E3 c我们盼望重振美国工业。我们盼望规复芯片制造、盘算机制造和封装财产。我们盼望研发电动汽车和呆板人等新产物。我们盼望建立人工智能工厂。全部这些都离不开能源,而且这些项目都必要很长时间。增长芯片产能,这必要两到三年的时间。增长CoWoS产能,也必要两到三年的时间。  d) n. D+ S) N" u7 L9 L
Q:故意思。我感觉有时间客人会跟我说完全相反的话。这种环境下,我确实缺乏相干的专业知识来判定。
7 s: K- l2 `5 H6 }- E( H黄仁勋:最妙的是,你是在和专家对话。4 p! i' `/ @" i5 b3 }! k
TPU 可否冲破英伟达在 AI 盘算范畴的把持职位?
/ B6 [9 L& U2 L/ W$ l) CQ:我想问问你们的竞争对手。假如你看看TPU ,可以说环球排名前三的模子中,有两款——Claude和Gemini——都是用TPU练习的。这对英伟达将来的发展意味着什么?
7 g; q* G8 w- W+ C黄仁勋:我们打造的是截然差别的东西。英伟达打造的是加快盘算,而不是张量处置惩罚单位。加快盘算的应用范围非常广泛:分子动力学、量子色动力学、数据处置惩罚、数据帧、布局化数据和非布局化数据。它也用于流体动力学和粒子物理学。别的,我们还将其应用于人工智能范畴。
6 x6 t3 a% [& \1 X  C: L  k. C& \加快盘算的范畴远比这广泛得多。固然人工智能是当今的热门话题,而且显然非常紧张且影响深远,但盘算的范畴远不止于此。英伟达彻底革新了盘算方式,从通用盘算转向加快盘算。我们的市场覆盖范围远远凌驾任何TPU或ASIC芯片所能企及的范围。从我们的市园地位来看,我们是唯逐一家可以或许加快全部范例应用步伐的公司。我们拥有巨大的生态体系。因此,各种框架和算法都可以在英伟达平台上运行。9 f- h. g$ |0 v$ a! a" Y8 Y
由于我们的盘算机计划之初就思量到了由他人操纵,以是任何具备操纵本领的人都可以购买我们的体系。而大多数自建体系则必要用户自行操纵,由于它们的计划初志并非为了方便他人操纵。由于任何人都可以操纵我们的体系,因此我们的产物已摆设在包罗 Google、Amazon、Azure 和 OCI 在内的全部云平台上。
* M3 C) O' h& T' d假如您想以租赁方式运营,最好拥有一个涵盖多个行业的巨大客户生态体系,以便他们成为承购方。假如您想自行运营,我们固然有本领资助您,就像我们之前为埃隆·马斯克提供的 xAI 服务一样。而且,由于我们可以或许赋能任何公司和任何行业的运营者,您可以使用这项技能为礼来公司构建一台用于科学研究和药物研发的超等盘算机。我们可以资助他们运营本身的超等盘算机,并将其用于我们所加快的各个药物研发和生物科学范畴。
4 ?7 D" C" |" p; p我们可以或许办理许多TPU无法办理的应用题目。英伟达打造CUDA的目标不但在于使其成为一个精彩的张量处置惩罚单位,它还能处置惩罚数据处置惩罚、盘算、人工智能等各个生命周期。我们的市场时机更大,覆盖范围也更广。由于我们如今支持环球全部应用,以是无论你在那里构建英伟达体系,都无需担心找不到客户。这完满是两码事。0 k+ p- c5 L, K+ Q
Q:这将是一个很长的题目。你们的营收非常惊人,但你们每季度600亿美元的收入并非来自制药和量子盘算范畴。你们之以是能做到这一点,是由于人工智能是一项亘古未有的技能,而且它正以亘古未有的速率发展。
8 d' q& {) Y2 N: h; Q8 @那么题目就酿成了:哪种方案最得当人工智能?我不太相识细节,但我跟我的人工智能研究朋侪聊过,他们说:“你看,我用TPU的时间,它是一个大型的脉动阵列,非常得当做矩阵乘法,而GPU则非常机动。当你必要处置惩罚大量分支或不规则的内存访问时,它就非常棒。”2 A' }1 {" g& L/ ~
但人工智能毕竟是什么?它不外是不停重复举行这些非常可猜测的矩阵乘法运算。你无需为线程束调理器或线程与内存库之间的切换而捐躯任何芯单方面积。而且,TPU 针对当前盘算范畴收入增长和应用场景的大量需求举行了优化。我想知道你对此有何见解。
% ]. p( x' q% A8 `2 L( h7 b黄仁勋:矩阵乘法是人工智能的紧张构成部门,但并非全部。假如你想提出新的留意力机制、以差别的方式举行分解,大概发明一种全新的架构——比方混淆SSM——你必要一个通用的可编程架构。假如你想创建一个融合扩散和自回归技能的模子,你同样必要一个通用的可编程架构。我们险些可以运行你所能想象的统统。这就是它的上风地点。由于它是一个可编程体系,因此可以更轻松地发明新的算法。) u8 G2 j8 C- n7 W; _1 ^
人工智能之以是能云云快速发展,真正的缘故原由在于其不停发明新算法的本领。与其他任何事物一样,TPU(技能处置惩罚单位)也受到摩尔定律的影响,而摩尔定律的年增长率约为25%。要想真正实现10倍乃至100倍的飞跃,唯一的办法就是每年从根本上改变算法及其盘算方式。  ?& k. ^+ l9 G& s8 x- L
这就是英伟达的根本上风。我们之以是能让 Blackwell 的能效比 Hopper 高出50倍,唯一的缘故原由是……当初我公布 Blackwell 的能效将比 Hopper 高出35倍时,没人信赖。厥后Dylan写了篇文章说我故意遮盖,但现实上能效是 Hopper 的50倍。单凭摩尔定律是无法实现这一点的。我们办理这个题目的方法是接纳新的模子,比方MoE(模块化实行单位),这些模子可以并行化、解耦并分布在整个盘算体系中。假如没有本领真正深入研究并使用 CUDA 开辟新的内核,这统统都很难做到。
) v( L) j1 P8 t/ n( V) C8 B这得益于我们架构的可编程性,以及英伟达作为一家极致的协同计划公司的上风。我们乃至可以将部门盘算使命卸载到架构自己(比方NVLink )或网络(比方Spectrum-X)中。我们可以同时对处置惩罚器、体系、架构、库和算法举行更改。假如没有 CUDA,我真不知道该从何入手。
9 o& |: \2 G% s$ R# s8 jQ:这引出了一个关于英伟达客户群的风趣题目。你们60%的收入都来自五大超大规模数据中央运营商。假如换个期间,面临差别的客户群体——好比说举行实行的传授——他们必要CUDA。他们无法利用其他加快器。他们只必要用CUDA运行PyTorch ,而且全部功能都得到优化。
* |% i0 v+ Q0 L: f$ ^+ Z4 f但这些超大规模数据中央运营商拥有编写自有内核的资源。究竟上,为了得到其特定架构所需的末了5% 的性能提拔,他们必须如许做。Anthropic 和 Google 大多运行着本身的加快器,大概利用 TPU 和Trainium 。纵然是利用 GPU 的 OpenAI,也利用Triton ,由于他们必要本身的内核。乃至在 CUDA C++ 方面,他们也没有利用cuBLAS和NCCL ,而是拥有本身的技能栈,该技能栈还可以编译到其他加快器上。假如你的大多数客户可以或许而且确实找到了 CUDA 的替换方案,那么 CUDA 在多大水平上真的可以或许推动 Nvidia 平台上的前沿 AI 应用?
- y' z8 {6 ?! g- z# n黄仁勋:CUDA 拥有丰富的生态体系。假如您想先在任何盘算机上举行构建,那么起首基于 CUDA 举行构建黑白常明智的选择。正由于其生态体系云云丰富,我们才气支持全部框架。假如您想创建自界说内核……比方,我们为 Triton 做出了巨大贡献。因此,Triton 的后端利用了大量的 Nvidia 技能。
/ y5 _( J$ R  Y我们很高兴可以或许资助每个框架发挥其最大潜力。框架种类繁多,比方 Triton、vLLM 、SGLang等等。如今又涌现出很多新的强化学习框架,比方verl和NeMo RL 。随着练习后处置惩罚和强化学习的不停发展,整个范畴正履历着爆炸式增长。因此,假如您想基于某个架构举行开辟,那么基于 CUDA 无疑是最佳选择,由于 CUDA 的生态体系非常美满。
4 q' z4 G: [. Z+ Q你知道,假如出了题目,更有大概出在你的代码里,而不是底层那堆积如山的代码里。构建这些体系时,别忘了你要处置惩罚的代码量有多大。假如出了题目,是你的题目照旧电脑的题目?你肯定盼望题目总是出在你身上,而且可以或许信托电脑。固然,我们本身也存在许多 bug,但我们的体系已颠末充实测试,至少你可以在这个底子上继承开辟。这就是第一点:生态体系的丰富性、可编程性和强盛功能。- p8 R" E0 w+ ?
第二点是,假如你是一名开辟者,无论开辟什么软件,你最看重的就是用户基数。你盼望你编写的软件可以或许在大量的其他盘算机上运行。你开辟软件并非仅仅为了本身,而是为了你的服务器群,大概其他全部人的服务器群,由于你是一名框架构建者。英伟达的 CUDA 生态体系终极是其最大的财产。
; X7 E9 ^$ M# a+ k& m# f如今市面上已经有数亿个GPU。每个云平台都配备了GPU。从A10 、A100 、H100 、H200 ,到L系列、P系列等等,种类繁多,尺寸和外形也各不雷同。假如你是一家呆板人公司,你肯定盼望CUDA协议栈可以或许直接在呆板人上运行。我们的产物险些无处不在。巨大的用户群意味着,一旦你开辟出软件或模子,它就能在任何地方利用。这简直太有代价了。
" x8 q& m( x- O: a5 F! q末了,我们可以或许覆盖全部云平台,这使我们真正独树一帜。假如您是一家人工智能公司或开辟者,您大概并不确定应该与哪家云服务提供商互助,大概在那里运行。我们险些可以在任何地方运行,假如您乐意,我们也可以为您提供当地摆设服务。丰富的生态体系、巨大的用户群以及我们机动的摆设方式,共同作育了 CUDA 的无可相比的代价。
2 ~+ j6 p7 c( l! N) K+ s. k* JQ:这很有原理。我好奇的是,这些上风对你的重要客户来说是否紧张。对许多人来说,这些上风大概很紧张。可以或许构建本身软件栈的那类人贡献了你的大部门收入。尤其是在人工智能越来越善于那些具有严酷验证循环、可以举行强化学习的范畴……怎样编写一个内核,使其在规模化应用中可以或许最高效地处置惩罚留意力机制或多层感知器(MLP)?这是一个非常轻易验证的反馈循环。; b9 ^& r; H* U
全部超大规模数据中央运营商都能自行编写这些定制内核吗?英伟达的性价比依然很高,以是他们大概仍旧更倾向于利用英伟达的产物。但题目在于,终极会不会演酿成谁能以最低的代价提供最佳的规格、浮点运算本领和内存带宽?汗青上,英伟达依附CUDA的护城河,在人工智能范畴(包罗硬件和软件)不停保持着最高的利润率,高达70%。而题目是,假如大多数客户可以或许负担得起自行构建,而不是依靠CUDA的护城河,英伟达还能维持如许的利润率吗?
4 H5 v& K; x: x/ m0 C黄仁勋:我们为这些人工智能实行室配备了数目惊人的工程师,他们与这些实行室互助,优化他们的技能栈。缘故原由在于,没有人比我们更相识我们的架构。这些架构不像CPU那样通用。CPU有点像凯迪拉克,它是一款舒服的巡航车,速率不会太快,每个人都能轻松驾御。它配备了巡航控制,统统都很简朴。但在许多方面,英伟达的GPU和加快器就像F1赛车。我估计每个人都能以每小时一百英里的速率驾驶它,但要将其性能发挥到极致,则必要相称丰富的专业知识。我们运用了大量的人工智能技能来创建我们的内核。
+ w: t% O5 ~1 @6 e' n' K我非常肯定,在相称长的一段时间内,我们仍旧会被必要。我们的专业知识通常能资助我们的人工智能实行室互助同伴轻松地将他们的技能栈性能提拔两倍。我们完成技能栈优化或特定内核优化后,他们的模子速率提拔三倍、两倍乃至五成的环境并不少见。这是一个巨大的数字,尤其思量到他们巨大的装备基数,包罗他们全部的 Hopper 和 Blackwell 等盘算单位。性能提拔一倍,收入也会翻倍。这直接转化为现实收益。
8 v5 H1 v% `9 N- p/ C2 q英伟达的盘算堆栈是环球性价比最高的,没有之一。现在天下上没有任何一个平台能证实它的性能/总拥有本钱比更高。没有一家公司能做到。究竟上,现有的基准测试,好比Dylan的InferenceMAX ,大家都能用,但没有任何一家公司能做到……TPU不会推出,Trainium也不会推出。" ?6 q& u7 V7 Y, l
我鼓励他们利用 InferenceMAX 来展示他们惊人的推理本钱。这真的很难。没人乐意来。MLPerf 。我倒是很想听听 Trainium 展示一下他们不停声称的40% 的本钱上风。我很想听听他们怎样证实 TPU 的本钱上风。在我看来,这完全说不通。一点原理都没有。从根本上来说,这根本说不通。
/ a, ]$ ~! K$ n以是我以为我们云云乐成的缘故原由很简朴,就是我们的总体拥有本钱 (TCO) 非常低。其次,您提到我们60% 的客户是前五大企业,但此中大部门业务都是外部业务。比方,AWS 上的英伟达产物大部门是为外部客户而非内部用户提供的。Azure 上的全部客户也都是外部客户。OCI 上的全部客户也都是外部客户,而非内部用户。他们之以是青睐我们,是由于我们的覆盖范围非常广。我们可以为他们带来环球全部良好的客户。这些客户都基于英伟达的产物。而全部这些公司之以是都基于英伟达的产物,正是由于我们覆盖范围广、功能多样。4 c5 v$ d4 Z6 T1 R, H& n! _3 e
以是我以为真正的飞轮效应在于用户基数、我们架构的可编程性、我们生态体系的丰富性,以及环球人工智能公司数目浩繁这一究竟。如今有成千上万家人工智能公司。假如你是此中一家人工智能初创公司,你会选择哪种架构?你会选择最遍及的架构。而我们的架构是环球最遍及的。你会选择用户基数最大的架构。而我们的用户基数最大。你还会选择拥有丰富生态体系的架构。
/ ]( E; b) l3 z: L" r0 S& W) z$ X" u这就是飞轮效应。缘故原由在于:起首,我们的每美元性能云云之高,以至于他们的tokens本钱最低。其次,我们的每瓦性能是环球最高的。因此,假如我们的互助同伴制作了一个1吉瓦的数据中央,那么这个1吉瓦的数据中央必须可以或许产生最大的收益和tokens数目,这直接转化为收入。您盼望它产生尽大概多的代币,从而最大化数据中央的收益。我们拥有环球最高的每瓦代币产量架构。末了,假如您的目的是租用底子办法,我们拥有环球最多的客户。这就是飞轮效应发挥作用的缘故原由。
0 {1 @. v: a: [/ ^* g' gQ:故意思。我想题目的关键在于,现实的市场布局毕竟怎样?由于即便另有其他公司……本来大概存在成千上万家人工智能公司,它们大抵中分盘算资源。但即便通过这五家超大规模数据中央,真正利用亚马逊盘算资源的仍旧是 Anthropologie、OpenAI 以及那些有本领且可以或许自行摆设差别加快器的大型基金会实行室。8 K0 F( k8 h& h' ]
黄仁勋:不,我以为你的条件是错误的。# _! U; F: @' S, s" _
Q:大概吧。不外,我想问你一个轻微差别的题目。假如代价、性能、每瓦性能等等这些说法都是真的,那么你以为为什么像 Anthropic 如许的公司会在几天前公布他们与 Broadcom 和 Google 告竣了一项数吉瓦的 TPU 协议,用于他们的大部门盘算呢?# C5 m* x- Y; X
显然,对谷歌来说,TPU 占据了大部门盘算资源。以是,假如我观察这些大型人工智能公司,会发现它们的许多盘算资源……曾经有一段时间它们都依靠英伟达的加快器,但如今环境并非云云。因此,我很好奇,假如这些说法在理论上建立,它们为什么会选择其他加快器呢?! |6 S; ?# m; f& n( W: r
黄仁勋:Anthropic 是一个特例,而非一种趋势。假如没有 Anthropic,TPU 又怎会增长?它完满是 Anthropic 的功劳。假如没有 Anthropic,Trainium 又怎会增长?它也完满是 Anthropic 的功劳。我以为这一点已广为人知。ASIC 的时机并不多,Anthropic 只有一个。2 r2 {# u% [. U
Q:但OpenAI 与 AMD 告竣了协议……他们正在打造本身的Titan加快器。
& ~+ l) y1 ?, Z# ~黄仁勋:是的,但我想我们都应该认可,它们很大水平上是英伟达的产物。我们仍旧会继承互助。我不介怀其他人利用其他产物或实验其他技能。假如他们不去实验,又怎么知道我们的产物有多好呢?有时间,我们必要有人提示本身这一点。我们必须不停地积极才气保住如今的职位。' ]; s7 U- Y3 D; N+ K
总是有许多浮夸的说法。看看有多少ASIC项目被取消就知道了。就算你计划造ASIC……你还得造出比英伟达更好的产物。造出比英伟达更好的产物可没那么轻易。现实上,这根本不实际。英伟达肯定遗漏了什么,真的。由于我们的规模和速率,我们是天下上唯逐一家每年都能连续产出新产物的公司。每年都有巨大的飞跃。5 ?1 R. z/ F- G+ _2 o" N
Q:我猜他们的逻辑是,“嘿,它不必要更好。它只必要比原来的差不凌驾70%就行了”,由于他们付给你的是70%的利润率。+ t6 P9 a" z5 [: a! A( Y; E3 ?
黄仁勋:不,别忘了,纵然是ASIC芯片,利润率也相称高。好比说,英伟达的利润率是70%。但ASIC芯片的利润率只有65%。你到底能省多少钱?; I  U# t: g  T7 y: x3 n
Q:哦,你是说博通之类的公司吗?, z+ e" \% y# j4 @6 H5 X( f
黄仁勋:固然,总得付钱给别人吧。就我所知,ASIC的利润率非常高。他们本身也这么以为,而且他们对ASIC惊人的利润率相称自大。
+ w! d6 u. q0 Y以是,你问了为什么。好久从前,我们确实没有本领做到这一点。其时,我并没有深刻意识到创建像 OpenAI 和 Anthropic 那样的底子性人工智能实行室有多么困难,也没故意识到他们必要供应商投入巨资。我们其时根本无力向 Anthropic 投资数十亿美元,让他们利用我们的盘算资源。但谷歌和 AWS 有。他们一开始就投入了巨资,作为回报,Anthropic 可以利用他们的盘算资源。而我们其时确实没有本领做到这一点。
/ |" D# n# z2 }' e我以为我的错误在于,我没有真正明白他们实在别无选择,风险投资家绝不会把50亿到100亿美元投资到一个人工智能实行室,指望它能像Anthropic那样乐成。以是这是我的失误。但即便我其时明白了这一点,我想我们其时也没有本领这么做。但我不会再犯同样的错误了。
6 y# p) I6 j8 O0 ]0 ~9 ~7 b$ v我很高兴能投资 OpenAI,也很高兴能资助他们扩大规模,而且我以为如许做至关紧张。厥后,当 Anthropic 找到我们时,我也很高兴能成为他们的投资者,资助他们扩大规模。只是其时我们力有未逮。假如统统可以重来——假如英伟达其时就能到达如今的规模——我绝对会非常乐意这么做。+ h2 p% l/ k, j- V7 l0 j
为什么英伟达不成为超大规模数据中央运营商?) g1 J) F- f& I# j
Q:这确实很故意思。多年来,英伟达不停是人工智能范畴最赢利的公司,赚了许多钱。如今你们开始投资人工智能了。据报道,你们在OpenAI投资了高达300亿美元,在Anthropic投资了100亿美元。如今它们的估值都进步了,我信赖还会继承增长。1 K' y0 _4 X! H5 t% F# L. g4 N  f
以是,假如你这些年来不停为他们提供盘算资源,而且预见到它的发展方向,而几年前——乃至在某些环境下,一年前——他们的代价只有如今的非常之一,而你又手握大量现金——那么,英伟达完全可以转型为基金会实行室,举行巨额投资来实现这一目的,大概更早地以如今的估值完成你如今告竣的这些生意业务。而且你其时也有充足的资金如许做。以是我很想知道,为什么你没有更早地如许做呢?5 P& K; q& X. S' ^) J
黄仁勋:我们尽早完成了这件事。假如可以,我乃至会更早去做。其时Anthropic必要我们做这件事的时间,我们却无能为力。如许做也不符合我们的天性。+ X+ b5 J) S4 N$ O, D- j
Q:怎么会如许?是现金生意业务之类的吗?( S; c: K- K, J& T( A  W# m2 C( m
黄仁勋:是的,投资规模的题目。其时我们从未在公司外部投资过,而且投资额也不大。我们其时没意识到必要投资。我不停以为他们可以像其他公司一样,直接去风投那边融资,我的天哪。但他们想做的事变,风投是做不到的。OpenAI想做的事变,风投是做不到的。我如今明确了。其时我并不知道。
! h  y  F) x( t, M+ K& T但这就是他们的过人之处。这就是他们智慧的缘故原由。他们其时意识到本身必须做如许的事。我很高兴他们这么做了。只管我们导致Anthropic不得不转投他人,但我仍旧为此感到高兴。Anthropic的存在对天下意义庞大。我为此感到欣慰。: n; e: E. j' F# n; y
Q:我猜你仍旧赚了许多钱,而且每个季度都在赚得更多。8 S0 M) J2 J+ c
黄仁勋:有遗憾也是正常的。' f- ?& I, f5 A& b
Q:以是题目依然存在。既然我们已经到了这里,而且你们也不停在赚这笔钱,那么英伟达应该怎么用呢?一个答案是,如今已经出现了一个完备的中心商生态体系,可以将这些实行室的资源付出转化为运营付出,以便他们可以或许租用盘算资源。由于芯片非常昂贵,而且由于人工智能模子不停改进,它们在其生命周期内能带来巨额利润。因此,它们创造的代价,也就是它们的代币,正在不停增长,但搭建这些体系本钱很高。英伟达有充足的资金来负担这些资源付出。究竟上,据报道,你们为CoreWeave项目提供了高达63亿美元的支持,而且已经投资了20亿美元。, r  Y4 H2 i* X( O: A* |
为什么英伟达不本身做云服务商?为什么不本身做超大规模云服务商,把盘算资源出租出去?他们有这么多钱可以这么做。* y) m3 J  B. R6 U4 U. s$ u
黄仁勋:这是公司的理念,我以为很明智。我们应该尽大概少地投入,只做须要的事变。这意味着,假如我们不去构建我们的盘算平台,我信赖这项工作就无法完成。假如我们不负担如今负担的风险——假如我们不以如今的方式构建 NVLink,假如我们不构建整个技能栈,假如我们不以如今的方式创建生态体系,假如我们不投入20年的时间,纵然大部门时间都在亏损,也要致力于 CUDA 的发展——假如我们不去做,其他人就不会去做。
" w" o# P2 Q7 Z6 c$ f假如我们当初没有创建全部CUDA-X 库,使它们都针对特定范畴……十五年前,我们开始鼎力大举开辟范畴特定库,由于我们意识到,假如我们不创建这些范畴特定库,无论是光线追踪、图像天生,乃至是早期人工智能的模子,无论是数据处置惩罚、布局化数据处置惩罚照旧矢量数据处置惩罚,假如我们不创建它们,就不会有人创建。我对此笃信不疑。我们创建了一个名为cuLitho的盘算光刻库。假如我们不创建它,就不会有人创建。因此,假如我们不做这些,加快盘算就不会发展到本日如许的水平。! U' s* Z2 e2 \/ i, T9 z
以是我们应该如许做。我们应该倾尽尽力,经心全意地投入到这项工作中。然而,世事难料。假如我不做,也会有人去做。因此,我们公司至今仍旧秉持着“尽大概多做,但尽大概少做”(doing as much as needed but as little as possible)的理念。我所做的每一件事,都遵照着这个原则。
+ p, d2 {% g: d! b% v$ Q就云盘算而言,假如我们当初不支持CoreWeave ,这些 neoclouds、这些 AI 云就不会存在。假如我们当初没有资助 CoreWeave 发展,它们也不会存在。假如我们当初没有支持Nscale ,它们就不会有本日的成绩。假如我们当初没有支持Nebius ,它们也不会有本日的成绩。现在,它们发展得非常精彩。
  A( M; `3 }& P1 l" m6 ], x这算是一种贸易模式吗?我们应该尽大概多地办事,尽大概少地干预。以是我们投资于我们的生态体系,由于我盼望我们的生态体系发达发展。我盼望架构和人工智能可以或许与尽大概多的行业、尽大概多的国家毗连起来,使整个地球可以或许基于人工智能和美国的技能栈而运转。这正是我们正在寻求的愿景。8 I* F9 p; o+ o5 x4 @6 k
您刚才提到的一点是……有许多非常良好的基金会模式公司,我们只管投资全部这些公司。这也是我们所做的。我们不挑选赢家。我们必要支持全部公司。这是我们投资的兴趣地点,也是我们业务的须要构成部门。但我们也会刻意制止挑选赢家。以是,当我投资一家公司时,我也会投资全部相干的公司。: U+ S2 S8 }. E* d
Q:你为什么刻意不去挑选赢家?  `: Y1 _2 l  ]5 r  {, |. J3 b4 U# B
黄仁勋:第一,这不是我们的职责。第二,英伟达建立之初,有60家3D图形公司。我们是唯逐一家存活下来的。假如你把这60家图形公司都列出来,问问本身哪家会乐成,英伟达肯定排在失败名单的首位。  O; S! R/ ?5 R4 e8 d
这事发生在你好久从前,但英伟达的图形架构一开始确实是错的,不是一点点错,而是我们创造了一个彻头彻尾的错误架构,开辟者根本无法维护。它注定失败。我们当初的出发点是好的,但终极却得到了错误的办理方案。全部人都以为我们会失败。而我们如今却乐成了。
( C9 V; I- e7 h( b( d) O以是我充足谦虚,可以或许熟悉到这一点。不要人为地挑选赢家。要么让他们各自觉展,要么就资助他们全部人。8 ]* l* @# A, Q
Q:有一点我不明确,你说:“我们优先发展这些NeoCloud项目,并非仅仅由于它们是NeoCloud,我们想扶持它们。”但你又枚举了一堆NeoCloud项目,说假如没有NVIDIA,它们根本不会存在。这两件事怎么能自相抵牾呢?. o2 a2 z4 e3 s( h
黄仁勋:起首,他们必须有创业的意愿,而且自动来寻求我们的资助。当他们有创业意愿,而且拥有贸易筹划、专业知识和热情时……他们显然也必须具备肯定的自身本领。但假如终极他们必要一些投资才气启动项目,我们也会尽力支持。不外,他们越早启动本身的发展引擎越好……
+ Z: h4 ]: |4 Z7 @你的题目是:“我们是否想涉足融资业务?”答案是否定的。融资业务已经存在,我们更乐意与他们互助,而不是本身成为融资者。我们的目的是专注于我们自身的焦点业务,尽大概简化我们的贸易模式,并支持我们的生态体系。- ]; t/ o* l+ [; @
像 OpenAI 如许的公司,在上市前就必要300亿美元的投资,而我们笃信他们,我也笃信他们将会成为……嗯,他们如今就已经是一家非凡的公司了。他们将会成为一家了不得的公司。天下必要他们,天下盼望他们存在,我也盼望他们存在。他们如今顺风顺水。让我们支持他们,让他们发展强大。我们会举行这些投资,由于他们必要我们如许做。但我们并非试图尽大概多地投资,而是试图尽大概少地干预。
- S) L( O+ \& `5 XQ:这大概是一个显而易见的题目,但我们已经在 GPU 短缺的环境下生存了许多年,而且随着模子性能的进步,这种环境如今变得更加严峻了。* W+ U) ]# ~8 J" q( E( @5 {2 f* n
黄仁勋:我们缺少GPU。
' L* H" U5 @# g' F8 ]8 l2 ^Q:是的。众所周知,英伟达在分配稀缺资源方面并非只看出价,而是会思量“我们想确保这些新云平台可以或许存在。以是我们给CoreWeave分配一些,给Crusoe分配一些,给Lambda分配一些。”这对英伟达有什么利益呢?起首,你是否同意这种将市场分割的说法?4 Z  p8 m1 S, U1 s
黄仁勋:不,不。你的条件完全错误。我们对这些事变非常器重。起首,假如没有采购订单,再多的讨论也无济于事。在拿到采购订单之前,我们能做什么?以是,主要使命是与全部人密切互助,积极完成猜测,由于这些项目必要很长时间才气建成,数据中央的建立更是云云。我们通过猜测来确保供需均衡等等。明确吗?这是主要使命。
# x' b2 g: N4 x3 e第二,我们已努力与尽大概多的人举行猜测,但终极您仍旧必要下单。大概由于某种缘故原由,您尚未下单。我能怎么办?在某些环境下,我们会遵照先到先得的原则。但除此之外,假如您由于数据中央尚未预备停当,大概某些组件尚未到位而无法搭建数据中央,我们大概会优先服务其他客户。这只是为了最大限度地进步我们工厂的产能。我们大概会对此举行一些调解。
# _% D$ \5 H( o0 [4 w除此之外,优先级是先辈先出。你必须下订单。假如你不下订单……固然,这方面有许多听说。好比,这统统都源于一篇关于拉里和埃隆和我共进晚餐的文章,文章里他们恳求我提供GPU 。这事根本没发生过(That never happened)。我们确实一起吃了顿饭。我们确实一起吃了顿饭,而且那是一顿非常棒的晚餐。他们从来没有恳求我提供GPU。他们只必要下订单。一旦他们下订单,我们会努力满意他们的产能需求。我们的流程很简朴。
4 W/ b  m% G, oQ:好的。听起来似乎有个列队机制,然后根据你的数据中央是否预备停当以及你何时下订单,你才气在特定时间得到资源。但这仍旧不像是价高者得。如许做有什么缘故原由吗?7 r$ u8 b7 i- }* O8 ^, U
黄仁勋:我们从来不那样做。
6 R$ ?/ X+ m& d8 IQ:为什么不直接选择价高者得呢?
! _) Z. j  X2 U% P6 b黄仁勋:由于这是糟糕的贸易做法。你定好代价,然后让别人决定买不买。我知道芯片行业的其他公司会在需求茂盛时调解代价,但我们不会。这从来都不是我们的行事方式。您可以信任我们。我更乐意做一个可靠的人,成为行业的基石。您无需推测。假如我报了价,那就是我们报的代价。就是如许。假如需求激增,那就天真烂漫。$ u4 M9 m6 ^' [
Q:另一方面,这就是为什么你和台积电保持着精良的互助关系,对吧?3 h* D/ w1 z& W$ }( f( o7 r  n
黄仁勋:是的,英伟达和他们互助已经快30年了。英伟达和台积电之间没有正式的法律条约。以是总会有些不公平的报酬。有时间我判定对,有时间我判定错。有时间我能拿到更好的代价,有时间会拿到更差的代价。但总的来说,我们之间的关系非常棒。我完全信托他们,完全可以依赖他们。0 |+ N9 G1 E1 i1 t
选择英伟达,有一点可以肯定:本年,Vera Rubin将会非常精彩。来岁,Vera Rubin Ultra将问世。后年,Feynman将横空出世。再后年,我还没公布名字呢。每年,你都可以信任我们。你得去全天下找找其他 ASIC 团队——任意挑一个——才气找到一个可以让你说:“我可以把我的全部产业都押上,我可以把我的整个公司都押上,你们每年都会为我服务。你们的token本钱每年都会降落一个数目级,我可以像信任时钟一样信任你们。”(“I can bet the farm, I can bet my entire business that you will be here for me every single year. Your token cost will decrease by an order of magnitude every single year. I can count on it like I can count on the clock.”)
+ N  r. @( L; Y' _6 v0 \. y我刚才提到了台积电。汗青上没有任何其他代工厂能做到这一点。但现在,你可以如许评价英伟达。每年你都可以信任我们。假如你想购买代价十亿美元的AI工厂盘算资源,没题目。假如你想购买代价一亿美元的,没题目。你想购买代价一万万美元的,大概仅仅是一个机架,都没题目。大概仅仅是一张显卡,好的,没题目。假如你想订购代价一千亿美元的AI工厂,没题目。我们是当当代界上唯逐一家可以如许说的公司。
3 D, h4 ^6 z: q台积电的环境也一样。我想买一台,买十亿台,都没题目。我们只必要按部就班地做好规划,做全部成熟企业都会做的事变。以是我以为,英伟达可以或许成为环球人工智能财产的基石,是我们花了二十多年才取得的成绩。这必要巨大的投入和奉献。公司的稳固性、公司的连续发展,对我们来说至关紧张。- L' P# f! F: K8 U
我们应该向中国出售人工智能芯片吗?
; ~1 B0 i% p0 C9 {/ ~Q:好的。我想问问关于中国的题目。实在我也不知道对向中国出售芯片到底好欠好有什么见解,但我喜好和高朋唱反调。以是,前次达里奥做客“谁支持出口管制”节目时,我问他,为什么美国和中国不能都拥有数据中央范畴的天秀士才呢?不外既然你持相反观点,那我就反过来问你。- \. T2 G5 I! I  a7 a- _
换个角度来看,Anthropic Games几天前发布了Mythos Preview 。他们乃至没有公开辟布这款Mythos模子,由于他们说它拥有云云强盛的网络攻击本领,在确保全部零日毛病都被修复之前,天下还没有做好预备。但他们表现,Mythos在全部主流操纵体系和欣赏器中都发现了数千个高危毛病。他们乃至在OpenBSD中也发现了一个毛病,而OpenBSD正是专门计划用来制止零日毛病的操纵体系。他们发现的这个毛病已经存在了27年。1 q& u% M8 @! n& P0 v" B
因此,假如中国可以或许得到人工智能芯片,练习像 Claude Mythos 如许具有网络攻击本领的模子,并使用更强盛的盘算本领运行数百万个实例,这会构成威胁吗?( G- j  G, S3 L! c- V4 a
黄仁勋:起首,Mythos 的练习所用的盘算本领和盘算量都相称平凡,但练习所用的却是一家非常良好的公司。这种盘算本领和盘算范例在中国非常广泛。以是你起首必要明确,芯片在中国是存在的。
; [& _3 _( [# K" U) E3 H他们生产了环球60%的主流芯片,乃至大概更多。对他们来说,这是一个非常巨大的财产。他们拥有一些天下上最顶尖的盘算机科学家。众所周知,全部这些人工智能实行室中的大多数人工智能研究职员都是中国人。他们拥有环球50%的人工智能研究职员。以是题目是,思量到他们已经拥有的全部资源——他们拥有丰富的能源、大量的芯片、以及绝大多数的人工智能研究职员——假如你担心他们,那么创造一个安全天下的最佳方法是什么?
# ^! F5 D2 S6 H, y" ], ~' n  ^将他们视为受害者,把他们酿成仇人,大概并非最佳方案。他们是对手。(Victimizing them, turning them into an enemy, likely isn’t the best answer. They are an adversary.)我们盼望美国得胜。但我以为,开展对话和研究性对话大概是最稳妥的做法。由于我们现在将中国视为对手的态度,这方面显着缺失。我们的人工智能研究职员和他们的人工智能研究职员必须举行真正的对话。我们必须积极就人工智能的用途告竣共识。
1 a! p8 T! s: i. s+ c. p5 \' ?. F- W至于查找软件毛病,这固然是人工智能的职责地点。它会在许多软件中发现毛病吗?固然会。软件毛病不可胜数。人工智能软件中也存在大量毛病。这正是人工智能的职责地点,我很高兴人工智能已经发展到可以或许资助我们大幅进步生产力的程度。
; [! O$ P" \0 u2 B  F( D4 r网络安全、人工智能网络安全、人工智能安全、人工智能隐私和人工智能保障等范畴的生态体系非常丰富,但却经常被忽视。一个巨大的人工智能初创企业生态体系正在积极为我们创造如许的将来:一个功能强盛的人工智能署理被成千上万个其他人工智能署理围绕,共同保卫着它的安全。如许的将来必将到来。/ J8 Q; R* V6 X' w" G2 K' u
让人工智能署理在无人羁系的环境下到处运行,这简直是疯了。我们非常清晰,这个生态体系必要发达发展。究竟证实,这个生态体系必要开源。这个生态体系必要开放的模子。他们必要开放的技能栈,如许全部的人工智能研究职员和良好的盘算机科学家才气构建强盛且安全的AI体系。因此,我们必须确保开源生态体系的活力。这一点不容忽视。许多开源项目都来自中国。我们不应该扼杀它。: h/ q2 `# ~8 e& R5 m4 o& F
关于中国,我们固然盼望美国拥有尽大概多的盘算本领。我们受限于能源,但我们已经投入大量资源来办理这个题目。我们绝不能让能源成为国家发展的瓶颈。但我们也盼望确保全天下的人工智能开辟者都基于美国的技能栈举行开辟,并将人工智能的贡献和进步——尤其是在开源的环境下——贡献给美国生态体系。假如创建两个生态体系——一个是只能运行在外国技能栈上的开源生态体系,另一个是运行在美国技能栈上的封闭生态体系——那将是极其愚笨的。我以为这对美国来说将是一个糟糕的效果。) I  A$ k9 ?- C( [8 a0 d
Q:由于事变许多,我先简朴概括一下。我以为,回到黑客攻击中提到的浮点运算本领差距题目,没错,他们简直拥有盘算本领,但他们现实可以或许生产的浮点运算本领只有美国的非常之一。6 K9 t1 ]! e5 c5 {5 M
那么,他们终极可否练习出像 Mythos 如许的模子呢?答案是肯定的。但题目在于,由于失败案例更多,美国实行室可以或许率先到达这种本领程度。由于 Anthropic 公司争先一步,他们会说:“好吧,我们先保存一个月,让全部美国公司都有时机利用。他们会修复全部毛病,然后我们再发布。”6 @' D* S: n  \. [% D
别的,即便他们练习出了如许的模子,大规模摆设的本领也至关紧张……假如一个网络黑客拥有上百万个如许的模子,那肯定比只有一千个要伤害得多。以是推理盘算本领真的非常紧张。究竟上,他们拥有云云多良好的AI研究职员,这才是真正令人担心的地方,由于是什么让这些工程师研究职员云云高效?答案是盘算本领。
( C' |# d$ S* [, P% x; h假如你和美国的任何一家人工智能实行室攀谈,他们都会说瓶颈在于盘算本领。无论是DeepSeek的首创人,照旧Qwen的向导层,都说过雷同的话。他们都以为瓶颈在于盘算本领。那么题目来了,岂非不应该让美国公司依附更强盛的盘算本领率先到达Mythos级别,为我们的社会做好预备,赶在中国之前,由于中国盘算本领较弱,如许做不是更好吗?& W# u7 k1 l8 |; T% S3 [
黄仁勋:我们应该永久争第一,永久拥有更多。但要让你形貌的效果成真,就必须走极度。他们必须完全没有盘算本领。假如他们有一些盘算本领,题目在于必要多少?  C2 {8 Z+ D1 d
中国的盘算本领非常巨大。要知道,中国但是环球第二大盘算市场。假如他们想整合盘算资源,完全可以满意需求。
' B- x- R: \. T而且,他们拥有的能源量简直惊人,不是吗?人工智能本质上就是一个并行盘算题目,不是吗?既然能源是免费的,为什么他们不能把芯片的数目增长4倍、10倍乃至更多呢?他们拥有云云多的能源。他们的数据中央空空荡荡,电力却依然富足。你知道他们有“鬼城”,他们的数据中央也一样空置。他们的底子办法容量云云巨大。假如他们乐意,他们完全可以把更多的芯片会合起来,哪怕是更落伍工艺的芯片
0 r3 S0 W- A+ O% t6 t; M% w他们的芯片制造本领位居天下前线。半导体行业都知道他们把持了主流芯片市场。他们的产能过剩。因此,以为中国无法制造人工智能芯片的说法完满是无稽之谈。& R4 |8 P2 Z7 Z& a) U9 K0 m
固然,假如你问我,假如全天下完全没有盘算本领,美国会不会更领先?但这根本不大概。这并非实际。他们如今的盘算本领已经非常富足了。你所担心的谁人题目,他们所需的盘算本领阈值,他们早已到达,乃至凌驾了。6 y' Z$ F( V8 b7 `2 o4 u# l
以是我以为你误解了人工智能的本质,它就像一个五层蛋糕,最底层是能源。能源富足时,芯片就充足了;芯片富足时,能源就充足了。比方,美国能源匮乏,这就是为什么英伟达必须不停改进我们的架构,并举行这种极致的协同计划,以便在我们出货的芯片数目有限的环境下——由于能源供应极其有限——实现每瓦吞吐量的惊人程度。
" V8 {* B1 i% w但假如你的瓦数完全富足,而且是免费的,你又何须在意每瓦性能呢?你已经绰绰有余了。你可以用旧芯片来做。以是7nm芯片本质上就是Hopper。Hopper的本领……我必须告诉你,现在的模子大多都是基于Hopper算法练习的,也就是Hopper算法的天生。以是7nm芯片已经充足好了。富足的能源是中国的上风。
4 q' j) c$ Y0 |2 G/ d" FQ:但题目在于,他们是否真的可以或许生产出充足的芯片。
3 [/ p/ @4 h( }$ O/ @黄仁勋:但他们简直做到了。证据是什么?华为刚刚履历了公司汗青上业绩最好的一年。
) w/ D7 B" }" E& O- O% kQ:最先辈的HBM肯定必要EUV?0 R( Z. ~, r7 \  p
黄仁勋:不对。完全不对。你可以把它们组合起来,就像我们把它们和NVL72组合起来一样。他们已经展示了硅光子学技能,可以将全部这些盘算本领毗连起来,形成一台巨型超等盘算机。你的条件完全错误。2 h: m6 ]; {# f' h( k9 l8 @! u
究竟上,他们的AI研发希望顺遂。天下上最顶尖的AI研究职员,由于盘算本领有限,反而创造出了极其智能的算法。别忘了,我刚才说过摩尔定律每年约莫推进25%。然而,依附杰出的盘算机科学,我们仍旧可以将算法性能提拔10倍。我的意思是,杰出的盘算机科学才是关键地点。; Y# Q; Q4 }  t
毫无疑问,MoE 是一项巨大的发明。毫无疑问,全部令人赞叹的留意力机制都淘汰了盘算量。我们必须认可,人工智能的大部门进步都源于算法的进步,而不但仅是硬件的改进。既然大部门进步都来自算法、盘算机科学和编程,那么他们巨大的人工智能研究职员队伍岂非不是他们最根本的上风吗?我们都看到了这一点。DeepSeek 绝非无关紧急的进步。假如 DeepSeek 先在华为平台上发布,那对我们国家来说将是劫难性的。
2 p. `" [" v$ x# A7 E9 Y: eQ:为什么会如许?由于现在像 DeepSeek 如许的模子,只要是开源的,就可以在任何加快器上运行。为什么未来环境会改变呢?4 \6 l$ h0 t+ z+ U  `5 o( y
黄仁勋:假设并非云云。假设它是针对华为优化的,假设它是针对他们的架构优化的。那将使我们处于劣势。你形貌的环境在我看来是好消息。一家公司开辟了一款软件,开辟了一个人工智能模子,而它在美式技能栈上运行结果最佳。我以为这是好消息。但你却把它设定为坏消息。如今我要告诉你坏消息:天下各地的人工智能模子都是在非美国硬件上开辟的,而它们在非美国硬件上运行结果最佳。这对我们来说是坏消息。% H+ l  l& a7 m8 q  Y0 s9 j& `
Q:我感觉并没有证据表明存在云云巨大的差别,足以制止你更换加快器。美国实行室正在全部云平台、全部差别的加快器上运行他们的模子。
4 W6 g; v$ X9 [0 d$ s$ x黄仁勋:我就是证据。你拿一个针对英伟达显卡优化的模子,然后试图在其他显卡上运行它,这是行不通的。
$ p- a5 a. I( p' C( O. fQ:但美国实行室确实会如许做。$ r+ W5 @6 V, p3 p( q3 U% ?
黄仁勋:它们的运行结果并没有更好。英伟达的乐成就是最好的证实。人工智能模子是在我们的技能栈上创建的,在我们的技能栈上运行结果也最好,这岂非不合逻辑吗?
" ?; h5 V% @* |" ?# TQ:Anthropic 的模子可以在 GPU 上运行,可以在 Trainium 上运行,也可以在 TPU 上运行。0 _' Q' n. d! S, I; n( j
黄仁勋:要改变近况,必要付出许多积极。但看看环球南边国家,看看中东地域。假如全部人工智能模子在别人的技能栈上运行结果最佳,那么你如今提出的“这对美国来说是件功德”的说法就太谬妄了。: U3 K) |* g- C  n$ A
Q:但我不太明确这个论点。假设中国公司率先开辟出下一代Mythos体系。他们率先发现了美国软件的全部安全毛病,但他们可以在英伟达硬件上运行,然后把产物运往环球南边国家。他们用英伟达硬件开辟,这有什么利益呢?好吧,它简直能在英伟达硬件上运行——2 [9 C8 u; W/ T8 g4 m
黄仁勋:这欠好,这欠好,我们不能让它发生。
5 \/ b' i: J  M8 d+ W/ hQ:你为什么以为它(指代英伟达GPU)是完全可替换的,纵然你不向他们供货,华为也能完全替换?他们落伍了,对吧?他们的芯片比你的差。
" n2 ^4 [0 F( q6 A  E黄仁勋:完满是如许……如今就有证据。他们的芯片财产规模巨大。
' h8 @) P" ?# ]+ oQ:你只要对比H200和华为910C的浮点运算本领、带宽或内存容量就知道了,它们的性能大概只有前者的一半到三分之一。+ @0 ^) w' n0 X" |  V  n
黄仁勋:他们用量更多。他们用的量是原来的两倍。- N! C- G$ M* B6 Y* y$ U" x
Q:你的论点好像是,他们拥有巨大的能源,他们必要用芯片来添补这些能源。; D$ S# u' q! _8 `2 Q
黄仁勋:而且他们很善于制造业。) ]& ^2 @0 `# S; u' _( ]. G2 k
Q:我信赖终极他们肯定能在生产本领上赛过全部人。但如今另有这关键的几年。
4 Y. y+ Q, a0 f; D; x' [黄仁勋:你所说的关键年份是指哪一年?假如将来几年至关紧张,那么我们必须确保在这关键的几年里,全天下全部的人工智能模子都创建在美国的技能栈之上。; }# q$ S* c7 q1 @! |
人工智能财产有五个层面,每个层面都必须乐成。而最必要乐成的层面现实上是人工智能应用。你为什么云云执着于谁人人工智能模子?那家公司?毕竟是出于什么缘故原由?9 z- B; m6 H6 p" `, l
能源、芯片以及人工智能研究职员的生态体系使这统统成为大概。' ]! A, T0 D- i
Q:假如美国的盘算本领存在瓶颈,那么向中国出口芯片又怎样能使美国保持领先职位呢?
5 ?/ P% ^# l; m! c- [6 b黄仁勋:我以为美国理应领先。美国的盘算本领是天下其他任何地方的100倍。美国理应领先。好吧。美国确实领先。
& Z, p) S6 }1 ]( r! @+ u7 j$ f英伟达致力于研发最先辈的技能。我们确保美国实行室可以或许第一时间获悉这些技能,并拥有优先购买权。假如他们资金不敷,我们乃至会投资扶持他们。美国理应领先。我们盼望竭尽所能确保美国保持领先职位。这一点您同意吗?我们正在为此不遗余力。
9 d  V; b' I, X9 d( `+ r- a你以为英伟达是一家美国公司?好的。起首,为什么我们不订定一个更均衡的羁系政策,让英伟达可以或许在环球范围内取得乐成,而不是让美国放弃环球市场?你为什么要让美国放弃环球市场?" C5 f  [( U1 e
芯片财产是美国生态体系的一部门,是美国技能领先职位的一部门,也是人工智能生态体系的一部门,更是人工智能领先职位的一部门。为什么你们的政策和理念会导致美国放弃天下市场的大部门份额?$ X, m& P4 t3 p* t
将人工智能与你刚才提到的任何东西相提并论都是谬妄的。
4 i2 L6 [0 Q3 P  i# g2 r" yQ:以是关键在于,如今卖芯片对我们久远发展有何资助?特斯拉恒久以来不停向中国贩卖性能杰出的电动汽车。iPhone在中国也脱销,而且质量极佳。特斯拉并没有造成中国市场的把持。中国仍旧会生产本身的电动汽车,而且占据主导职位。他们的智能手机也占据主导职位。
& N" e- `) c" k: Y& g. ^黄仁勋:本日我们开始对话时,您也认可英伟达的处境非常特别。您用了“护城河”如许的词。对我们公司而言,最紧张的就是我们生态体系的丰富性,而这离不开开辟者。环球50%的人工智能开辟者都在中国。美国不应该放弃这块宝地。
5 ^9 c: [2 {& I" }2 xQ:但是我们在美国有许多英伟达的开辟者,但这并不妨碍美国实行室将来利用其他加快器。究竟上,他们如今就在利用其他加快器,这很好,也很棒。假如你向中国贩卖英伟达芯片,我不明确为什么在中国就不能如许做,就像谷歌可以利用TPU和英伟达芯片一样。
; x5 o% x+ K7 ?; m9 G黄仁勋:我们必须不停创新,而且正如你大概知道的,我们的市场份额正在增长,而不是降落。那种以为纵然我们在中国竞争,终极也会失去谁人市场的想法……你不是在跟一个醒来就以为本身是个失败者的人语言。那种失败者的态度,那种失败者的假设,在我看来毫无原理。
# k9 a  E* {% m. K我们不是汽车。我们不是汽车。我可以本日买这个牌子的车,来日诰日再买另一个牌子的车,这很轻易。但盘算机范畴并非云云。x86架构的存在是有缘故原由的。ARM架构云云根深蒂固也是有缘故原由的。这些生态体系难以替换。这必要泯灭大量的时间和精神,而且大多数人都不肯意如许做。因此,我们的职责是继承培养这个生态体系,不停推进技能发展,从而在市场竞争中保持上风。
* t. t# b6 n  c$ m& R假如按照你形貌的那种条件来分别市场,我根本无法担当。这完全说不通。由于我不以为美国是失败者,我们的行业也不是失败者。这种失败论调,这种失败心态,在我看来毫无原理。
, B, A* V. f* E/ [1 w$ \Q:但他们之以是从你这里购买是有缘故原由的。我们有来自中国公司首创人的引述,他们表现公司在盘算本领方面碰到了瓶颈。5 o( c4 i1 D4 m$ c+ c) Y: Y3 P
黄仁勋:由于我们的芯片更好。总的来说,我们的芯片更好。这一点毋庸置疑。假如没有我们的芯片……您能认可华为本年的业绩创下记录吗?您能认可一大批芯片公司都上市了吗?您能认可吗?
) q7 A( ?4 \0 R/ b' c$ I您是否也认可,我们已往在该市场占据了很大的份额,而如今份额已经大幅降落?我们也可以认可,中国占据了环球科技财产约40%的份额。为了美国科技财产的长处而放弃这个市场,是对我们国家的侵害,是对我们国家安全的侵害,也是对我们科技向导职位的侵害。这统统仅仅是为了一家公司的长处。这在我看来毫无原理。8 s2 X9 V! h9 o$ |) E! W' N
Q:我有点糊涂了。感觉你似乎在说两件事。一是假如我们能到场竞争,我们的芯片性能会远胜华为,以是我们肯定能赢下这场与华为的竞争。二是就算没有我们,他们也会做同样的事变。这两件事怎么大概同时建立呢?
& O0 ?& w/ h+ u( b1 F( G黄仁勋:这显然是究竟。假如没有更好的选择,你只能选择唯一的选择。这怎么会不合逻辑呢?这明显很合乎逻辑。
7 X1 P6 s$ \% j: H7 rQ:他们想要英伟达芯片的缘故原由是,英伟达芯片性能更好。
9 Q7 E( J2 T% V黄仁勋:是的& `6 A9 ?& J4 v2 q0 b% k* ]
Q:更好的模子必要更多的盘算资源。更多的盘算资源意味着你可以练习出更好的模子。
6 D7 |! D2 R9 n" V黄仁勋:不,它就是更好。它更好,由于它更轻易编程。我们拥有更好的生态体系。但无论“更好”指的是什么,无论“更好”指的是什么……固然,我们会把盘算资源运送给他们。那又怎样?究竟是我们能从中受益。别忘了,我们能享受到美国技能领先职位带来的利益。我们能享受到开辟者们在美国技能栈上工作的益处。随着这些人工智能模子扩散到天下各地,我们也能享受到美国技能栈因此成为最佳选择带来的利益。我们可以继承推进和推广美国技能。我以为这是一件功德。这是美国技能领先职位中非常紧张的一部门。
$ A' I" \6 P6 E3 x# f5 U如今,你所提倡的政策导致美国电信行业根本上被倾轧出了天下市场,以至于我们乃至无法掌控本身的电信业务。我以为这并不明智。这种做法有些眼光短浅,而且导致了一些意想不到的结果,我如今正在向你形貌这些结果,但你好像很难明白。
/ d6 a6 I! K2 Y# H" s7 w0 iQ:好的,我们先退一步。题目的关键好像在于,这里既有潜伏的收益,也有潜伏的本钱。我们正在积极弄清晰的是,收益是否值得付出本钱?我想让你们意识到潜伏的本钱。盘算是练习强盛模子的输入。强盛的模子确实拥有强盛的攻击本领,比方网络攻击。美国公司率先到达 Mythos 级别的本领是一件功德,如今他们决定暂缓发布这些本领,以便美国公司和美国当局可以或许在正式发布该级别本领之前,更好地掩护他们的软件。. @" i; X6 e1 _0 b/ _/ R
假如中国拥有更强盛的盘算本领或更多的众包盘算资源,假如他们可以或许更早地开辟出雷同 Mythos 那样的盘算模子并举行广泛摆设,那将会非常糟糕。这种环境没有发生的缘故原由之一是,由于像英伟达如许的美国公司,我们拥有了更强盛的盘算本领。这是将盘算资源转移到中国所要付出的代价。以是,我们临时不谈利益。您是否意识到这是一种潜伏的代价?0 c" S7 v$ x4 G& Z) N! ~) O: i
黄仁勋:我还要告诉你,潜伏的代价是,我们答应人工智能技能栈中最紧张的一层——芯片层——拱手让出整个市场——环球第二大市场——让他们得以发展规模,创建本身的生态体系,从而使将来的人工智能模子以与美国技能栈截然差别的方式举行优化。随着人工智能在环球扩散,他们的尺度和技能栈将会逾越我们,由于他们的模子是开放的。+ T# ~! m- b  v9 }) k& B; {
Q:我想我只是对英伟达的内核工程师和CUDA工程师有充足的信心,信赖他们可以或许举行优化——
  G" c2 E. T" M3 J0 I黄仁勋:如你所知,人工智能不但仅是内核优化。
7 r' ^+ r0 r" {- e. h中国是环球最大的开源软件贡献国。这是究竟。中国也是环球最大的开放模子贡献国。这是究竟。现在,它创建在美国的技能栈之上,也就是英伟达的技能栈。这是究竟。
! W$ R) b3 ~2 N. M5 ^人工智能技能栈的五个层面都至关紧张。美国应该力图拿下全部五个层面。它们都不可或缺。固然,最紧张的层面是人工智能应用层。这一层会渗出到社会各个角落,被应用最为广泛,也将从这场工业革掷中获益最多。但我的观点是,每一层都必须乐成。
; v  J% Y5 _* _# q0 ~( k* u8 L假如我们恐吓天下人民,让他们以为人工智能就像核弹一样,让每个人都痛恨人工智能、畏惧人工智能,我不知道这对美国有什么利益。这只会害了美国。假如我们吓得全部人都不敢从事软件工程工作,由于人工智能会扼杀全部软件工程岗位——效果导致我们一个软件工程师都没有——那我们也是在害美国。- |/ J. a4 k0 h. P
假如我们由于盘算机视觉完全免费,人工智能的工作本领不会比放射科大夫差,就吓跑全部人,让各人都不想当放射科大夫,那我们就误解了工作和使命之间的区别。放射科大夫的工作是照护病人,而使命是解读扫描效果。假如我们对这一点明白云云深刻,吓跑全部人去读放射科,那么我们将面对放射科大夫短缺和医疗资源匮乏的题目。
/ _+ `- X4 q* i8 t5 B& p9 U  [; ^以是我的意思是,当你设定一个云云极度的条件,统统都从零到无穷大,终极只会吓到人们,而这根本不是究竟。生存并非云云。我们盼望美国领先吗?固然盼望。我们必要在各个层面都保持领先职位吗?固然必要。固然必要。本日你谈到Mythos,是由于Mythos很紧张。没错。太好了。6 I8 Z0 \1 r5 o4 S. x# D
但几年后,我预言,当我们想要推广美国技能体系,当我们盼望美国技能走向天下——走向印度、走向中东、走向非洲、走向东南亚——当我们的国家想要出口,由于我们想要出口我们的技能,我们想要出口我们的尺度时,我盼望你我再次举行同样的对话。我会具体地告诉你本日的对话,告诉你你的政策和你的假想是怎样导致美国毫无来由地拱手让出天下第二大市场。
& ~5 O2 A. `! p5 m我们不应该放弃。假如输了,那就输了。但我们为什么要放弃呢?如今没人主张非此即彼。没人主张非此即彼,也就是说我们应该不停把全部东西都运到中国去。没人主张那样。我们应该始终拥有最先辈的技能。我们应该始终拥有最多的技能,而且是第一。但我们也应该积极在环球范围内竞争并取得胜利。这两件事可以同时举行。这必要一些过细入微的思索,一些成熟的态度,而不是绝对的。天下原来就不是绝对的。; m1 M$ e; Z& m( f6 N7 F
Q:由于受到各种限定(比方拿不到EUV光刻机),中国的芯片真的能出口到天下各地,从而建立行业尺度吗?
. L/ U$ G- ?7 l- n% ^$ v黄仁勋:那我们直接看究竟吧?Blackwell的光刻技能真的比Hopper先辈50倍吗?真的有50倍吗?差远了。我不停在重复这句话:摩尔定律已经失效了。从晶体管自己的性能来看,Hopper和Blackwell之间的差距大概是75%。两者相隔三年,差距高达75%。Blackwell尔的性能是Hopper的50倍。
3 N& k) F- \, B, Q0 H我的观点是,架构至关紧张。盘算机科学至关紧张。半导体物理固然紧张,但盘算机科学才是重中之重。人工智能的影响很大水平上源于盘算栈,这也是CUDA云云高效、云云受人喜好的缘故原由。它是一个生态体系,一种盘算架构,它提供了极大的机动性,以至于假如你想彻底改变架构——好比创建雷同MoE的架构、雷同扩散的架构、大概创建解耦架构——你都能做到。这很轻易。
( ]$ o8 C3 G% i& C以是究竟是,人工智能不但关乎底层架构,也关乎上层技能栈。假如我们拥有针对自身技能栈和生态体系举行优化的架构和软件栈,那固然是功德,由于我们本日一开始就讨论了英伟达生态体系的丰富性。为什么人们总是喜好先写CUDA?确实云云。中国的研究职员也是云云。
: w( A9 g# h0 k- K2 {1 Q3 v4 b但假如我们被迫脱离中国,起首,这是一个政策错误。显然,这会引发猛烈反弹。这对美国来说结果很严峻。它促进了中国的芯片财产发展,加快了其人工智能生态体系的转型升级,迫使其人工智能生态体系专注于内部架构。如今亡羊补牢,为时未晚,但事已至此。
2 o/ z3 m' D( j! j, L将来你会看到,他们显然不会止步于于此。他们的制造工艺很精彩,他们会继承在现有及更先辈的工艺底子上发展。先辈工艺的差距有10倍吗?答案是否定的。架构很紧张,网络也很紧张。这就是英伟达收购Mellanox的缘故原由。网络很紧张,能源也很紧张。全部这些都很紧张。事变并不像你试图简化的那样简朴。
3 ?' c, F0 ^$ ~3 @4 p" Y) `为什么英伟达不生产多种差别的芯片架构?& q6 w% F- g; J) A: T
Q:我们之前讨论过台积电在内存等方面的瓶颈题目。! y; k1 l' X9 t" M- f4 O. t
以是,假如我们身处如许一个天下:你已经占据了N3的大部门份额——而且在某个时间你会进入N2期间,并占据N2的大部门份额——你是否以为你可以回到N7期间,也就是使用旧工艺节点的剩余产能,然后说:“嘿,人工智能的需求云云巨大,而我们扩展前沿技能的本领却无法满意,以是我们要制造一个Hopper或Ampere架构的处置惩罚器,但要运用我们现在把握的全部数值盘算知识以及你提到的全部其他改进”?你以为这种环境会在2030年之前发生吗?
4 ]$ O& K6 f. i* W1 P黄仁勋:没须要。缘故原由在于,每一代产物的架构都不但仅范围于晶体管的尺寸。它还涉及到大量的工程计划、封装、堆叠、数值盘算和体系架构。! K/ V6 d) ^7 H8 j5 h7 j2 W7 i* n
当产能耗尽时,想要容易地回到之前的制程节点……那必要投入大量的研发资源,谁也负担不起。我们有本领向前发展,但我以为我们负担不起转头路。如今,假设有一天,我们忽然意识到:“我们再也无法拥有更多的产能了。”我会选择回到7nm制程吗?固然会绝不夷由地选择它。
6 O1 V* J# J8 I! w0 A: |Q:我之前和人讨论时,有人问过我一个题目:为什么英伟达差别时开展多个架构完全差别的芯片项目?好比,可以开辟雷同Cerebras的晶圆级芯片,也可以开辟雷同Dojo 的大型封装芯片,还可以开辟不利用 CUDA 的芯片。英伟达拥有充足的资源和工程人才来并行开辟全部这些芯片。思量到人工智能和架构的将来发展方向难以猜测,为什么要把全部鸡蛋都放在一个篮子里呢?
7 X8 W; B% \1 a黄仁勋:哦,我们固然可以。只是我们没有更好的办法。我们能做全部这些事变,但结果并不抱负。我们在模仿器里模仿了全部环境,效果证实更糟。以是我们不会这么做。我们如今做的正是我们想做的项目。假如工作负载发生巨大变革——我指的不是算法,而是工作负载自己,而这取决于市场格局——我们大概会思量增长其他加快器。3 h8 {' k# g. R9 L
比方,我们近来新增了Groq ,而且筹划将其整合到我们的 CUDA 生态体系中。我们如今如许做是由于token代价飙升,可以接纳差别的订价计谋。就在几年前token要么是免费的,要么代价非常低廉。但如今,我们的客户群体各不雷同,他们必要差别的办理方案。由于客户收入很高——比方我们的软件工程师——假如我能为他们提供相应速率更快的代币,从而让他们比如今更高效,我乐意为此付费。+ V2 P: F. I7 W# ], X; n
但这个市场是近来才出现的。以是我以为我们如今有本领基于相应时间,将同一个模子分别成差别的细分市场。这就是我们决定扩展帕累托前沿,并创建一个相应时间更快、但吞吐量更低的推理细分市场的缘故原由。在此之前,更高的吞吐量总是更好的。我们以为,将来大概会出现均匀售价(ASP)非常高的代币,纵然工厂的吞吐量较低,ASP 也能补充这一点。
, _& y' z+ {* B9 W0 U这就是我们这么做的缘故原由。但除此之外,从架构角度来看,假如我有更多资金,我会加大对英伟达架构的投入。1 G/ f: V3 X5 l; x
Q:末了一个题目。假设深度学习革命没有发生,英伟达会做什么?
/ a. Q1 ^4 m# ~黄仁勋:加快盘算,这和我们不停以来所做的千篇一律。我们公司的理念是摩尔定律将会……通用盘算在许多方面都很精彩,但对于许多盘算使命来说,它并非抱负之选。2 N8 t# `, y( x
因此,我们将一种名为GPU(CUDA)的架构与CPU联合起来,从而加快CPU的工作负载。差别的代码内核或算法可以卸载到GPU上实行。如许一来,应用步伐的运行速率就能提拔100倍、200倍。这项技能有哪些应用呢?显然,它实用于工程、科学、物理、数据处置惩罚、盘算机图形学、图像天生等各个范畴。纵然人工智能本日尚未出现,英伟达的规模也会非常巨大。8 M" `' t7 _, K
缘故原由相称根本,那就是通用盘算的扩展本领已根本到达极限。而唯一的方法……大概说,实现这一目的的方法之一,就是通过范畴特定加快。我们最初关注的范畴之一是盘算机图形学,但另有很多其他范畴。种类繁多,包罗粒子物理和流体动力学、布局化数据处置惩罚,以及各种各样可以或许从 CUDA 中受益的算法。$ y8 q/ [1 E4 n
我们的任务是真正将加快盘算带给全天下,推进通用盘算无法胜任的应用,并扩展到足以资助某些科学范畴取得突破的程度。早期的一些应用包罗分子动力学、用于能源勘探的地动数据处置惩罚、图像处置惩罚等等,全部这些范畴通用盘算的服从都太低,无法胜任。
2 t8 o0 @/ v3 T+ C2 {" C* |7 j假如没有人工智能,我会非常惆怅。但正由于我们在盘算机范畴取得了进步,深度学习才得以遍及。我们让任何研究职员、任何科学家、任何门生,无论身处何地,都能利用个人电脑或GeForce显卡,开展令人赞叹的科学研究。这一根本答应从未改变,丝毫未变。
* V' V; U# A( [2 g5 @假如你看过GTC,就会发现它最初的部门完全与人工智能无关。无论是盘算光刻、量子化学,照旧数据处置惩罚等等,都与人工智能无关。而且这些内容仍旧非常紧张。我知道人工智能非常风趣,也很令人高兴,但另有许多人在做着与人工智能无关的紧张工作,张量也不是唯一的盘算方法。我们盼望可以或许资助到全部人。
关于群组、梯子等各类问题,请发送邮件至 查阅邮件的回复教程即可.
发表于 13 小时前 | 显示全部楼层
中国吹,为了中国市场?
关于群组、梯子等各类问题,请发送邮件至 查阅邮件的回复教程即可.
回复

使用道具 举报

发表于 13 小时前 | 显示全部楼层
黄仁勋总是神吹吹
关于群组、梯子等各类问题,请发送邮件至 查阅邮件的回复教程即可.
回复

使用道具 举报

发表于 13 小时前 | 显示全部楼层
锋利了
关于群组、梯子等各类问题,请发送邮件至 查阅邮件的回复教程即可.
回复

使用道具 举报

发表于 13 小时前 | 显示全部楼层
再牛的公司,也要跟着天下局势走
关于群组、梯子等各类问题,请发送邮件至 查阅邮件的回复教程即可.
回复

使用道具 举报

发表于 13 小时前 | 显示全部楼层
黄仁勋:我们只管投资全部这些公司。这也是我们所做的。我们不挑选赢家。我们必要支持全部公司。这是我们投资的兴趣地点,也是我们业务的须要构成部门。但我们也会刻意制止挑选赢家。以是,当我投资一家公司时,我也会投资全部相干的公司。Q:你为什么刻意不去挑选赢家?黄仁勋:第一,这不是我们的职责。第二,英伟达建立之初,有60家3D图形公司。我们是唯逐一家存活下来的。假如你把这60家图形公司都列出来,问问本身哪家会乐成,英伟达肯定排在失败名单的首位。
关于群组、梯子等各类问题,请发送邮件至 查阅邮件的回复教程即可.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表