了解 PyTorch 生态系统的各个部分
Torchaudio 是一个用于音频和信号处理的 PyTorch 库。它提供了 I/O、信号和数据处理功能、数据集、模型实现以及应用程序组件。
一个专为微调大语言模型(LLMs)而设计的 PyTorch 原生库。torchtune 支持完整的微调工作流,并与主流生产推理系统兼容。
该库是 PyTorch 项目的一部分。PyTorch 是一个开源的机器学习框架。torchvision 软件包包含计算机视觉领域常用的数据集、模型架构和图像变换方法。
TorchRec 是一个 PyTorch 领域库,旨在提供大规模推荐系统(RecSys)所需的常用稀疏性与并行性原语。它允许用户训练将大型嵌入表(Embedding Tables)分片跨多个 GPU 部署的模型。
一个用于快速媒体编解码的 PyTorch 库。当在音频和视频上运行 PyTorch 模型时,torchcodec 是我们将音频和视频文件转换为模型可用数据时的推荐方案。
一个包含常用模块化数据加载原语的 Beta 版本库,用于轻松构建灵活且高性能的数据流水线。此外,其中还有一些功能仍处于原型阶段。
torchrl 是一个开源、以 Python 为核心的 PyTorch 强化学习库,专注于高模块化和优异的运行时性能,提供低级和高级的 RL 抽象,以及可重用的代价函数、回报函数和数据处理功能。
tensordict 是一个类似于字典的类,旨在简化张量批次的操作。它通过抽象定制操作并利用叶节点的自动操作分发来减少错误,从而提升代码的可读性、紧凑性和模块化程度。
PyTorch 通过 torch_xla 软件包在 XLA 设备(如 TPU)上运行。本文档介绍了如何在这些设备上运行你的模型。