小朋友、 发表于 11 小时前

传昇腾 950PR 获字节和阿里巴巴大单 ! 贩卖预计过 500 亿 ! ...

泉源:市场资讯
(泉源:电子创新网)
据外媒报道,据两位知恋人士透露(作者注:未经财产核实,请慎重对待此消息)华为昇腾 950PR 在中国客户测试希望顺遂,包罗字节跳动和阿里巴巴在内的多家科技巨头筹划下单。
这一希望对华为而言具有里程碑意义,对中国 AI 市场也具有紧张里程碑意义。据透露,本土互联网大厂此次筹划更广泛地利用新款 950PR 芯片,由于该芯片与英伟达 CUDA 软件体系的兼容性更强,相应速率也更快,这让他们更加满足。
据透露,华为筹划本年出货约 75 万颗 950PR 芯片,接纳传统 DDR 显存的 950PR 显卡售价约为每张 5 万元人民币(约合 6900 美元),而配备速率更快的 HBM 显存的高端版本售价约为 7 万元人民币。假如以昇腾 950PR 单卡售价 7 万元(HBM 版)盘算,此次贩卖营收合计 525 亿元!
此前,华为不停对峙利用其自主研发的 CANN 软件体系,而昇腾 950PR 将使此前广泛利用英伟达软件体系的中国科技公司开辟者可以或许更轻松地迁徙这些模子。



2025 年 9 月 18 日,在华为全联接大会上,华为副董事长、轮值董事长徐直军在 " 以开创的超节点互联技能,引领 AI 底子办法新范式 " 主题演讲中披露了华为接下来三年的昇腾芯片规划和演进方向。徐直军披露 2026 年第一季度将要发布昇腾 950PR,2026 年年第四序度发布昇腾 950DT。2027 年第四序度要发布昇腾 960、2028 年发布昇腾 970。
2025 年,英伟达不停推动其 H200 在中国的贩卖,这里将 H200 与昇腾 950PR 做一对比。
一、焦点规格对比(关键参数)
指标
华为昇腾 950PR
NVIDIA H200
架构定位
AI 推理优化(分身练习)
通用 AI 练习 + 推理
盘算精度上风
FP4 / FP8 强
FP8 / FP16 强
FP8 算力
~1 PFLOPS
~2 PFLOPS
FP4 算力
~1.5 – 2 PFLOPS(上风项)
不支持 / 弱
显存
~112GB HBM(HiBL)
141GB HBM3e
显存带宽
~1.4 TB/s
~4.8 TB/s
互联
自研互联(~2TB/s 级)
NVLink(~900GB/s)
功耗
~600W
~650 – 800W
一句话总结:单卡硬件本领:H200 仍显着更强(尤其带宽)低精度推理:昇腾 950PR 有布局性上风
二、性能本质差别(重点)
1 单卡算力:H200 仍领先
结论:练习、大模子盘算 → H200 更强
2 低精度推理:950PR" 弯道超车 "
关键变革:LLM 推理正在从 FP16 → FP8 → FP4,华为直接 " 跳两代精度 " 结论:推理(尤其大模子在线服务)→ 950PR 更有性价比潜力
3 内存与带宽:H200 碾压
H200:~4.8 TB/s
950PR:~1.4 TB/s
这点极其关键:LLM 瓶颈 = memory bound。带宽直接决定 token 吞吐 结论:大模子练习 / 长上下文推理 → H200 上风显着
4 多卡集群本领(真正分水岭)
H200:
950PR:
结论:超大模子练习 → NVIDIA 还是唯一解
三、架构思绪差别(非常关键)
本质:" 通用加快器 + CUDA 生态统治 "
特点:
强 Tensor Core
高带宽 HBM
CUDA 锁死开辟者
华为昇腾 950PR,本质:" 为 AI 推理重构的专用芯片 "
极致低精度(FP4)
KV cache 友爱
更像 "AI 推理 ASIC"
四、生态对比(决定胜败)
NVIDIA
结论:生态 = 护城河
华为昇腾
MindSpore + CANN
正在兼容 CUDA 生态
关键变革:已往最大短板:软件。如今在补:兼容层
五、代价 & 贸易实际
950PR:约 $6,000 – $10,000
H200:通常 $20,000+(行业区间)
结论:代价差:2 – 3 倍
可以明白为:NVIDIA 的产物是 "AI 期间的 Intel(通用盘算)" 而华为昇腾:则是 "AI 期间的 ASIC(场景优化)"。H200 = 天花板性能 + 生态把持 950PR = 本钱上风 + 推理重构路径】,以是在推理规模化遍及的本日加之大模子训推本土化,昇腾 950PR 大概更受青睐!
在刚刚竣事的华为中国互助同伴大会 2026 上,华为重磅发布并展出了搭载全新昇腾 950PR(Ascend 950PR)处置惩罚器的 AI 练习推理加快卡 Atlas 350。据华为先容,Atlas 350 的单卡算力到达了英伟达 H20 的 2.87 倍,是现在国内唯一支持 FP4 低精度的推理产物;HBM(高带宽内存)容量是 H20 的 1.16 倍,到达了 112GB,多模态天生速率可以提拔 60%;内存访问颗粒度从 512 字节淘汰到 128 字节,小算子访存服从提拔 4 倍。
看来,国产算力芯片已经渐渐追上来了!那更进一步,犹如英伟达链一样,随着国产算力芯片崛起,也肯定会动员本土算力财产链各个环节如封测、线缆、电源、光器件走强!
对此,各人怎么看?会有哪些财产链上的企业受益呢?接待留言讨论!
页: [1]
查看完整版本: 传昇腾 950PR 获字节和阿里巴巴大单 ! 贩卖预计过 500 亿 ! ...