
正当美国晶片巨头英伟达(Nvidia)乘着人工智能(AI)浪潮迅猛前行,来自中国的竞争对手华为也在悄然提速发力,两家科技巨头的竞争态势骤然升级。
最近几周,华为在AI晶片领域的新动向频频登上英美主流媒体的版面。
美国《华尔街日报》星期一(4月28日)引述知情人士称,华为已与国内数家科技大厂接触,邀请它们一同测试自家最新、最强的AI处理器——昇腾910D。华为预期最快在5月底就能拿到首批样品。
知情人士透露,昇腾910D采用了先进的封装技术,通过堆叠更多效能较低的晶片,抬高整体运算效能。
华为的期望是,这款最新晶片能超越英伟达2022年推出、目前在AI训练领域几乎是标配的热门晶片H100。但知情人士坦言,910D功耗偏高,整体能效还是追不上H100。
同时,华为也在积极推进昇腾910B和910C两款晶片的大规模量产。预计今年内,华为将向国有电信运营商、字节跳动等客户交付逾80万块晶片。有些客户已和华为洽谈,打算进一步加大采购910C。
昇腾910系列晶片最早在2019年就亮相了,初代晶片由台积电以七纳米工艺代工。但自从华为被美国列入黑名单后,后续的910B和910C才不得不交给中芯国际接棒,使用七纳米工艺制造。
在产品定位上,华为希望910B能接替英伟达为中国市场定制的H20晶片,而更高端的910C则是冲着H100去。根据美国科技博客Tom’s Hardware测试,910C的推理性能已经达到H100的60%。
路透社指出,与910D相似,910C也是靠“堆叠法”来增强算力和内存。换句话说,这些晶片并未出现根本性的技术突破,更像是在现有技术的基础上进一步优化。
今年4月,华为又推出了名为CloudMatrix 384的AI晶片“集群”系统,延续了相同的思路——把多颗晶片串联起来,堆出一台大算力机器。这套系统集成了384颗昇腾910C,主要用于AI模型开发等高负载应用。
英国《金融时报》星期三(4月30日)报道,华为目前已向中国客户交付10多套CloudMatrix集群。
华为推出CloudMatrix意在挑战英伟达的旗舰集群NVL72,但NVL72使用了72颗性能强悍的GB200超级晶片,单颗晶片的运算能力远胜910C,甚至比前一代H100还强30倍。

为此,华为通过“超级节点”技术,以光通信方式串联384颗处理器,尝试借规模和架构优势反超NVL72。在展示材料中,华为宣称CloudMatrix在关键计算指标上全面超越NVL72,整体算力高出67%,内存容量也超过三倍。
SemiAnalysis分析师帕特尔认为,华为借助先进的网络架构和数量优势,有效弥补了晶片的性能短板,“中国现在已拥有一套足以超越英伟达的AI系统”。
华为挑战英伟达
华为近期频频出手,动作之密集,或许不仅是为了响应中国“科技自主”的国家战略,更可能是在中美科技战加剧、英伟达节节受限的此刻,抓住机会加速突围,争取更大的市场份额。
随着中美在贸易和高科技领域的角力不断升温,曾试图在中美两大国间维持平衡的英伟达,似乎已越来越难左右逢源,反而陷入左右为难的尴尬处境。
根据英伟达4月16日提交给美国证券交易委员会的文件,公司已接获美国政府通知,未来将“无限期”禁止向中国等多个国家出口H20晶片,并为此认列55亿美元的潜在亏损。
2023年10月,美国政府禁止英伟达向中国市场出售H800晶片后,英伟达针对中国市场推出降级版的替代方案H20。H20性能仅有H100的三分之一,却已是中国客户能合法采购到的最强AI晶片。
尽管性能受限,但H20晶片的架构设计使其特别适合训练AI模型,因此一度成为中国科技公司的抢手货。字节跳动、腾讯、阿里巴巴等都是H20的主要买家。
中国《财经》杂志估算,这项禁令可能会使英伟达今年损失高达200亿美元的销售额。
英伟达出货受限,加上主要客户纷纷寻求替代方案,让中国晶片制造商迎来了罕见的“窗口期”。华为正是在这样的背景下,加快推进昇腾910C晶片和CloudMatrix集群系统的交付。
《金融时报》报道,华为成功吸引的新客户中,不乏原本严重依赖英伟达的企业。如今在出口禁令的影响下,这些企业已着手扩大对华为产品的采购规模。
英伟达首席执行官黄仁勋星期三在一场论坛上坦言,中国正迅速崛起,成为美国在科技领域的一个“强劲对手”,并点名华为在AI晶片设计上的布局。
黄仁勋说:“中国并不落后,就在我们身后,距离非常非常近。”

华为的短板
尽管政策环境为华为创造了突围的机会,但其新产品在实际应用中的性能,是否真如宣传所言“遥遥领先”,仍要打上问号。
以CloudMatrix集群系统为例,该系统虽通过堆叠晶片提升整体算力,但这也意味着更高的能耗。据科技博客wccftech报道,CloudMatrix的运行能耗约为英伟达NVL72的3.9倍,在AI负载下的每瓦性能也不甚理想。
与英伟达软硬件整合、生态完整的CUDA系统相比,华为的生态尚不成熟,需依赖更多资深工程师维护,整体人力成本是英伟达的三至五倍。
价格方面,CloudMatrix的售价高达6000万元人民币(约820万美元),远高于NVL72的300万美元。
至于昇腾910D晶片,咨询公司Counterpoint Research副总裁沙阿(Neil Shah)直言,尽管华为展现出显著进步,但在系统整合能力方面,包括计算架构、内存优化,以及软硬件生态等,华为仍落后英伟达三代。
不可否认,英伟达依然是当前AI领域的王者,公司2025年第一季度财报远超预期,数据中心收入同比增长逾一倍。凭借难以匹敌的CUDA平台及持续更新的Blackwell晶片,英伟达的护城河依然坚不可破。
眼下的“窗口期”虽然为华为提供了追赶的良机,但尚不足以撼动英伟达在AI晶片领域的霸主地位。华为正奋力提升良率、稳住供应链、加快生态建设试图追赶;而英伟达则加紧推进下一代Blackwell晶片,巩固技术壁垒。
两强的竞争态势仍难分难解,但可以确定的是,这恐怕不会再是一场一面倒的科技竞赛。
只是,在美国持续对中国高科技领域掐脖子的当下,英伟达的技术再先进,它的产品依然无法进入中国市场;相反,即便华为的产品存在技术落后、维护成本高昂等短板,它的产品依然是中国企业在AI领域发展的唯一驱动力。
这或许也是在当前地缘政治环境下,华为所承担的特殊功能。