longcheng-nv

Follow

longcheng-nv

Follow

0 followers · 5 following

NVIDIA

Achievements

Achievements

Popular repositories Loading

TensorRT-LLM TensorRT-LLM Public

Forked from NVIDIA/TensorRT-LLM

TensorRT LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and supports state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. Tensor…

Python
cutile-python cutile-python Public

Forked from NVIDIA/cutile-python

cuTile is a programming model for writing parallel kernels for NVIDIA GPUs

Python
Model-Optimizer Model-Optimizer Public

Forked from NVIDIA/Model-Optimizer

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks …

Python