21点 2026年人人顶级AI芯片制造商TOP20

发布日期:2026-01-27 00:31    点击次数:200

21点 2026年人人顶级AI芯片制造商TOP20

AI芯片市集的竞争,已不限于GPU。

字据 TrendForce 数据,基于 AI 做事器出货量增长率,展望到 2026 年,云做事提供商的定制 ASIC 出货量将增长 44.6%,而 GPU 出货量展望将增长 16.1%。这标识着 AI 硬件时势正在发生滚动,因为超大范围数据中心运营商正加大对自研芯片的投资。

主要的AI芯片坐蓐商有哪些?

1.英伟达

自 20 世纪 90 年代以来,NVIDIA 一直辛劳于为游戏行业野心图形处理器 (GPU)。NVIDIA 是一家无晶圆厂芯片制造商,其大部分芯片制造业务外包给台积电 (TSMC )。其主要业务包括:

桌面东说念主工智能管制决议

DGX Spark(原名 Project Digits)是一款面向东说念主工智能工程师和数据科学家的桌面东说念主工智能超等筹办机,它具有以下特质:展望耗资约3000好意思元;它的大小与 Mac mini 差未几,搭载 NVIDIA GB10 Grace Blackwell 超等芯片,配备 128GB 内存;卤莽处理参数高达 2000 亿的 LLM 模子推理和微调,运用 NVLink-C2C 达成高速 CPU+GPU 通讯。

数据中心管制决议

该公司基于 Ampere、Hopper 以及最新的 Blackwell 架构坐蓐东说念主工智能芯片。收获于 生成式东说念主工智能的蕃昌发展,英伟达在昔时几年取得了超卓的功绩,市值打破万亿好意思元,并牢固了其在 GPU 和东说念主工智能硬件市集的陶冶地位。下图展示了英伟达在该规模的收入逐年增长情况,以及该规模何如成为公司的主要收入开端。

{jz:field.toptypename/}

NVIDIA 的芯片组旨在管制九行八业的业务贫困。DGX A100 和 H100 是 NVIDIA 告捷的旗舰级 AI 芯片,专为数据中心的 AI 熟识和推理而野心。NVIDIA 随后推出了H200、B300 和 GB300 芯片。举例 HGX H200 和 HGX B300 等 HGX 做事器,它们王人集成了 8 个这么的芯片。NVL系列和GB200 SuperPod将更多芯片集成到更大的芯片集群中。

云霄GPU

由于其数据中心产物的雄壮实力,NVIDIA 实在把握了云 AI 市集,大多数云做事提供商仅提供 NVIDIA GPU 当作云 GPU。

NVIDIA 还推出了 DGX Cloud 产物,平直向企业提供云 GPU 基础法式,绕过云做事提供商。

用于图形处理的GPU

Xbox 使用的是 NVIDIA 和微软和谐开发的芯片组。NVIDIA 面向零卖用户的 GPU 包括 GeForce 系列。

DGX Cloud Lepton

NVIDIA于2025年5月19日在台北海外电脑展 (Computex) 上发布了 DGX Cloud Lepton,这是一个聚拢 AI 开发者和 NVIDIA GPU 云做事提供商(举例 CoreWeave、Lambda 和 Crusoe)的市集。它卤莽生动地访谒 GPU 资源,用于 AI 模子熟识和推理,从而绕过对传统云做事提供商的依赖。这进一步强化了 NVIDIA 以企业为中心的云计策。

NVIDIA Dynamo

NVIDIA Dynamo 于 2025 年 GTC 大会上发布,是一款全新的开源推理框架,专为在诀别式环境中高朦拢量、低延长地部署生成式 AI 模子而野心。如下图所示,在 NVIDIA Blackwell 平台上,央求处理速率最高可擢升 30 倍。该框架兼容 PyTorch 和 TensorRT-LLM 等常用器用,并运用解耦推理阶段和动态 GPU 调遣等更始手艺来优化性能并缩小资本。Dynamo 已在 GitHub 上发布供开发者使用,并集成到 NVIDIA NIM 微做事中,面向企业管制决议。Dynamo 卤莽相沿从单 GPU 到多 GPU 系统的可膨胀且经济高效的生成式 AI 做事。

图 1. NVIDIA Dynamo 权贵擢升了 AI 模子性能。具体而言,在 NVIDIA GB200 NVL72 平台上,它使 DeepSeek-R1 671B 模子的速率擢升了 30 倍。在使用 NVIDIA Hopper GPU时,它还能使 Llama 70B 模子的性能擢升一倍以上。

NVIDIA RTX PRO 做事器和企业级 AI 工场

NVIDIA 于 2025 年 5 月在台北海外电脑展 (Computex) 上发布了搭载 RTX PRO 6000 Blackwell 做事器版 GPU 的 RTX PRO 做事器,专为企业级 AI 工场而野心。这些做事器可为 AI、野心、工程和买卖应用提供通用加快,相沿 NVIDIA Omniverse平台上的多模态 AI 推理、物理 AI 和数字孪生等职责负载。

NVIDIA 企业级 AI 工场的考证野心,交融了 RTX PRO 做事器、NVIDIA Spectrum-X 以太网、NVIDIA BlueField DPU 和 NVIDIA AI 企业版软件,使 Cadence、富士康和礼来等诱骗伙伴卤莽构建土产货 AI 基础法式。这项霸术加快了价值万亿好意思元的 IT 行业向 GPU 加快 AI 工场的转型。

2.AMD

AMD于2023年6月发布了面向AI熟识职责负载的MI300处理器,并与NVIDIA争夺市集份额。由于生成式AI的兴起激发了需求的快速增长,导致NVIDIA的AI硬件难以采购,因此,一些初创公司、商酌机构、企业和科技巨头在2023年纷繁吸收了AMD的硬件。2025年,AMD文告收购Untether AI旗下的AI硬件和软件工程师团队。Untether AI是一家为旯旮筹办提供商和企业数据中心开发节能型AI推理芯片的公司。此举增强了AMD的AI编译器、内核开发和芯片野心智商,进一步牢固了其在推理市集的地位。此外,AMD还收购了编译器初创公司Brium,旨在优化其Instinct数据中心GPU在企业应用中的AI性能。

AMD MI350系列显卡取代MI300系列并与NVIDIA的H200系列张开竞争。AMD 还与 Hugging Face 等机器学习公司诱骗,匡助数据科学家更高效地运用其硬件。

软件生态系统至关紧要,因为硬件性能很猛进度上依赖于软件优化。举例,AMD 和 NVIDIA 曾就 H100 和 MI300 的基准测试公开争论。争论的焦点在于基准测试中使用的软件包和浮点运算类型。字据最新的基准测试扫尾,MI300 在 70B LLM 上的推感性能似乎优于或与 H100 抓平。

固然AMD的硬件正在赶上NVIDIA,但其软件在易用性方面却过时于NVIDIA。CUDA固然开箱即用,不错得志大多数任务的需求,但AMD的软件却需要多数的配置。

3.英特尔

英特尔是CPU市集上最紧要的厂商,领有悠久的半导体研发历史。与英伟达和AMD不同,英特尔使用自身的晶圆代工场坐蓐芯片。Gaudi3 是英特尔最新的 AI 加快处理器。然则,英特尔对 Gaudi3 在 2024 年的销售额预期约为 5 亿好意思元,这远低于 AMD 展望在 2024 年得回的数十亿好意思元的收入。

4.AWS

AWS坐蓐用于模子熟识的Tranium芯片和用于推理的Inferentia芯片。尽管AWS是公有云市集的陶冶者,但它是在谷歌之后才运转研发自身的芯片的。

数十万个 Tranium2 芯片用于构成 Project Rainier 集群,该集群为LLM开发商 Anthropic 的模子提供能源。

5. 谷歌云平台

Google Cloud TPU 是一款专为机器学习而野心的加快芯片,为 Google 的翻译、相片、搜索、助手和 Gmail 等产物提供相沿。它也不错通过 Google Cloud 使用。Google 于 2016 年发布了 TPU。最新的 Trillium TPU 是第六代产物。

谷歌推出了Ironwood。这一最新一代产物专为复杂的“想维模子”(举例LLM和MoE)而野心,提供大范围并行处贤达商(每个芯片4,614 TFLOPs),况兼在9,216个芯片的集群中可膨胀至42.5 Exaflops。

Ironwood 相较于 Trillium 达成了权贵的擢升,包括:能效擢升 2 倍,高带宽内存容量擢升 6 倍(192 GB/芯片),HBM 带宽擢升 4.5 倍(7.2 TB/s/芯片),21点游戏官网以及芯片间互连速率擢升 1.5 倍(1.2 Tbps)。它还配备了增强型 SparseCore,可相沿大型镶嵌式应用。此外,谷歌还坐蓐尺寸更小的 Edge TPU,以得志不同的应用需求,专为智高手机和物联网硬件等旯旮征战而野心。

6. 阿里巴巴

阿里巴巴坐蓐用于推理的芯片,举例含光800。

7. IBM

IBM于2022年发布了其最新的深度学习芯片——东说念主工智能单位(AIU)。IBM正在议论使用这些芯片来驱动其watson.x生成式东说念主工智能平台。AIU 基于IBM Telum 处理器构建,该处理器为 IBM Z 大型机做事器提供 AI 处贤达商。

8. Groq

Groq 由几位前谷歌职工创立。该公司主营 LPU(低功耗模块),这是一种新式东说念主工智能芯片架构,旨在匡助企业更温情地部署其系统。这家初创公司已筹集约 3.5 亿好意思元资金,并推出了首批产物,举例 GroqChip 处理器和 GroqCard 加快器等。该公司专注于LLM推理并发布了Llama-2 70B的基准测试扫尾。

9. SambaNova Systems

SambaNova Systems设立于2017年,辛劳于开发用于海量生成式东说念主工智能职责负载的高性能、高精度软硬件系统。该公司已开发出SN40L芯片,并筹集了跳动11亿好意思元的资金。值得扫视的是,SambaNova Systems 也向企业出租其平台。SambaNova Systems 的AI 平台即做事模式使其系统更易于吸收,并饱读吹硬件访佛运用,从而促进轮回经济。

10.Cerebras

Cerebras设立于2015年,是唯独一家专注于晶圆级芯片的大型芯片制造商。与GPU比拟,晶圆级芯片由于领有更高的内存带宽,在并行处理方面具有上风。然则,此类芯片的野心和制造如故一项新兴手艺。

{jz:field.toptypename/}

Cerebras芯片包括:

WSE-1 领有 1.2 万亿个晶体管和 40 万个处理中枢。

WSE-2 领有 2.6 万亿个晶体管和 85 万个内核,于 2021 年 4 月发布。它吸收了台积电的 7 纳米工艺。

WSE-3 领有 4 万亿个晶体管和 90 万个 AI 中枢,于 2024 年 3 月发布。它吸收了台积电的 5nm 工艺。

Celebras 的系统与阿斯利康和葛兰素史克等制药公司以及依赖该系统进行模拟的商酌执行室诱骗。此外,由于其芯片不错缩小前沿模子的推理资本,因此也对准了生命周期模子(LLM) 制造商。

Cerebras 还通过其云霄向企业提供芯片。

11.d-Matrix

d-Matrix吸收了一种新颖的法式,放弃了传统的冯·诺依曼架构,转而吸收内存筹办。固然这种法式有可能管制内存和筹办之间的瓶颈问题,但它是一种全新的、尚未经由考证的法式。

12.Rebellions

一家总部位于韩国的初创公司在2024年融资1.24亿好意思元,专注于LLM推理。Rebellions与另一家韩国半导体野心公司SAPEON统一,2025年7月,Rebellions得回了来自科技巨头三星的投资,这是其霸术进行初次公开募股(IPO)前一轮意见金额高达2亿好意思元的融资。该公司自2020年设立以来已筹集了2.2亿好意思元,并正与三星诱骗,霸术于2025年晚些时辰将第二代芯片Rebel-Quad(由四个Rebel AI芯片构成)推向市集,该芯片将吸收三星的4纳米制程工艺进行制造。

13. Tenstorrent

Tenstorrent公司坐蓐Wormhole芯片、面向商酌东说念主员的台式机以及搭载Wormhole芯片的做事器(举例Tenstorrent Galaxy)。该公司还提供其管制决议所需的软件栈。Tenstorrent于2024年12月从包括杰夫·贝佐斯在内的投资者那儿筹集了7亿好意思元,估值跳动26亿好意思元。

14.etched

etched 的作念法放手了生动性以疏导扫尾,将变压器架构平直烧录到芯片中。etched 宣称已研制出人人首款变压器专用集成电路(ASIC)。

15.Extropic

Extropic在2023年末完成了一轮1400万好意思元的融资,旨在运用热力学进行筹办。该公司尚未发布芯片。

16. Vaire

Vaire是一家总部位于英国的初创公司,辛劳于可逆筹办的开拓性商酌。可逆筹办是一种旨在打造近零能耗芯片的更始法式。与传统筹办中能量以热能时势隐匿不同,可逆筹办卤莽回收运用格外一部分能量用于后续筹办。

Vaire公司展示了一款卤莽回收50%能量的测试芯片,这标明该手艺具有缩小东说念主工智能职责负载能耗并克服当代半导体制造濒临的物理为止(即热墙)的后劲。

17. 苹果

据报说念,苹果公司的ACDC式样专注于研发用于东说念主工智能推理的芯片。苹果公司本身已是一家主要的芯片野心公司,其自主野心的半导体被应用于iPhone、iPad和MacBook等产物中。

18. Meta

Meta 熟识和推理加快器 (MTIA) 是一系列用于 AI 职责负载(举例熟识 Meta 的 LLaMa 模子)的处理器。最新式号是下一代MTIA,它基于台积电5nm工艺,据称性能比MTIA v1擢升3倍。MTIA将安设在最多可容纳72个加快器的机架中。MTIA现在仅供Meta里面使用。但改日,如若Meta推出基于LLaMa的 企业级生成式东说念主工智能 产物,这些芯片不错为该产物提供相沿。

19. 微软 Azure

在2024年Hot Chips大会上,微软发布了Maia 100,这是其首款定制AI加快器,旨在通过软硬件协同优化,擢升Azure平台上的大范围AI职责负载。Maia 100吸收台积电N5工艺,并搭载先进的内存和互连手艺,意见是达成高朦拢量和各类化的数据面容,并通过其SDK为开发者提供生动性,以便快速部署PyTorch和Triton模子。然则,微软的下一代AI芯片,代号Braga,由于野心变更、东说念主员为止和东说念主员流动率高档原因,展望将从2025年推迟到2026年发布,其能效可能过时于英伟达的Blackwell芯片。

20.OpenAI

OpenAI正与博通和台积电诱骗,吸收台积电的3纳米工艺,最终敲定其首款AI芯片的野心。OpenAI芯片团队的陶冶层领有在谷歌野心TPU的劝诫,他们的意见是在2026年达成芯片的量产。

*声明:本文系原作家创作。著述实质系其个东说念主不雅点,自身转载仅为共享与商酌,不代表自身唱和或招供,如有异议,请关联后台。

想要获取半导体产业的前沿洞见、手艺速递、趋势领路,热心咱们!



21点游戏官方网站
热点资讯
推荐资讯