万物皆可疾速运行:视频、语音、代码。

万物皆可疾速运行:视频、语音、代码。

Tenstorrent Galaxy™ 可运行任何工作负载,包括训练和推理。它在视频生成、解码和预填充基准方面处于行业领先地位,而 Tenstorrent 的开源 MLIR 编译器 TT-Forge 支持的模型数量超过任何竞争对手。视频、语言、代码——选择您的模型,快速运行。

立即购买 Tenstorrent Galaxy™

请联系我们以获取定制配置和定价

Tenstorrent Galaxy™ Blackhole

Tenstorrent Galaxy™ Blackhole

起价110,000美元

使用我们的可扩展、超密集AI服务器运行任何程序。

Blackhole Supercluster

Blackhole Supercluster

起价440,000美元

一个四 Tenstorrent Galaxy Blackhole 超级集群,可扩展以提供快速且经济实惠的 AI 解决方案。

Tenstorrent Galaxy™ Wormhole

Tenstorrent Galaxy™ Wormhole

起价70,000美元

我们的 Tenstorrent Galaxy 服务器采用我们上一代芯片技术 Wormhole 构建。仍然具有可扩展性、超高密度和高性能。

大规模部署解决方案

Tenstorrent Galaxy Blackhole 还以四个超集群的形式出现,扩展到可扩展的多服务器集群。从 4 到 36 个或更多 Tenstorrent Galaxy 系统配置都针对包括人工智能视频生成、大规模 LLM 推理和私有 AI 基础设施在内的工作负载进行了优化。

10倍速的实时高质量视频

10倍速的实时高质量视频

在 Tenstorrent Galaxy 超级集群上运行最先进的视频模型,更快地生成高质量视频。在 2.4 秒内生成 720p、81 帧的视频。

部署AI视频生成
大型上下文法学硕士推理速度最快

大型上下文法学硕士推理速度最快

Tenstorrent Galaxy 针对优质、对延迟敏感的 AI 工作负载进行了优化。运行超级集群,以支持高利润的 AI 用例,包括代理工作流、实时系统和长上下文推理。利用相同的通用 AI Tenstorrent 系统进行解码和预填充。

探索大型语言模型推理

Tenstorrent Galaxy™ Specs

Accelerator Compute, Memory, and Connectivity

Accelerators

32× Blackhole® ASICs 

Performance

23 PFLOPS Block FP8

Accelerator SRAM

6.2 GB @ 2.9 PB/s 

Accelerator DRAM

1 TB GDDR6 @ 16 TB/s

Accelerator Fabric

10× 400 GbE links per ASIC for 32 TB/s

Cluster Scale-out

Up to 56× 800 GbE QSFP‑DD ports for 11.2 TB/s

Host Compute, Memory, and Connectivity

Host CPU

1× AMD EPYC 9004 (Zen 4), up to 32 cores, ≤280 W TDP

Host Memory

Up to 576 GB (6× 96 GB) DDR5-4800 ECC RDIMM (6 slots, 0 free)

Networking

1× OCP NIC 3.0 PCIe Gen5 x16 SFF (2× 200 GbE default configuration)

Management Network

1× Dedicated RJ45 1 GbE with baseboard management controller (BMC)

Storage OS

2× 960 GB M.2 2280 PCIe Gen4 x4 NVMe SSD

Storage Internal

Up to 4× E1.S PCIe Gen5 x4 NVMe SSD (9.5/15 mm)

Software

Ubuntu 22.04

Deployment & Operations

Form Factor

6U rackmount, air‑cooled chassis

System Dimensions

Height: 17.6 in (446.8 mm), Width: 10.4 in (263.4 mm), Length: 34.8 in (884.5 mm)

System Weight

262 lbs (119 kg)

System Power Usage

8 – 10 kW avg, 12 kW max (Max system power configurable up to 14.5 kW)

Operating Temperature

50 – 95 °F (10 – 35 °C)

Pricing

$110,000 list

更多模型,快速部署

来自 HuggingFace 的模型中有 90% 可以正常运行,并且在大型语言模型、图像生成、语音、视觉、嵌入、编码器等领域的覆盖范围每天都在增长。我们的硬件支持快速模型启动,使客户能够部署生产级人工智能系统。

简单量表

底层的 Tensix Neo™ 架构旨在通过单一编程模型从一个芯片扩展到数千个。无论是位于同一芯片上,还是通过以太网连接的整个机架,核心网格都以相同的方式进行通信。可根据您的需求(无论大小)进行扩展。

您的,端到端

Tenstorrent 的完整软件栈,从编译器到内核,都是开源的。您可以开箱即用地编译和运行模型,或者深入底层直接调整内核。任何层级都不存在黑盒。