xjli360

Follow

💭

I may be slow to respond.

Mocax xjli360

💭

I may be slow to respond.

Follow

14 followers · 11 following

Tsinghua university

Achievements

Achievements

Highlights

Pro

Pinned Loading

OpenRLHF/OpenRLHF OpenRLHF/OpenRLHF Public

An Easy-to-use, Scalable and High-performance Agentic RL Framework based on Ray (PPO & DAPO & REINFORCE++ & TIS & vLLM & Ray & Async RL)

Python 8.8k 850
datawhalechina/hugging-vis datawhalechina/hugging-vis Public

Hugging Vision, Hugging AGI.

177 18