TT-LLK

Low-Level Kernels (LLKs) 使 AI 模型能够在 Tensix 核心上高效运行。

使用我们的 LLKs 高效构建复杂函数,并在 Tenstorrent 硬件上运行 AI 操作。

用途与功能

LLKs 控制 Tensix 引擎,即 Tensix 核心的基本计算单元。LLKs 还提供了一种便捷的方式来使用 Tensix 指令集。

LLKs 使低级数学运算能够以峰值性能执行。

LLKs 与 Tensix 核心

LLKs 为开发者提供了直接、优化的硬件编程路径,确保每个操作都以最小开销和最大效率执行。

LLKs 与 Tenstorrent 软件栈无缝协作

TT-Forge

TT-Forge

一个将机器学习框架与 Tenstorrent 硬件连接的编译器,使用 LLKs 优化高级模型在 Tensix 核心上的执行。

tt-metalium

tt-metalium

一个促进自定义内核开发的开源 SDK,提供对 Tenstorrent 硬件的低级访问,并利用 LLKs 实现优化性能。

软件金字塔

开发与测试

要开始使用,请查看 GitHub 上的 LLK 仓库。开发者可以访问独立的 CI 管道和测试环境,并在 Wormhole 和 Blackhole 上进行构建。