Tuklus-Labs

Follow

Gary Duncan Tuklus-Labs

Follow

AI inference & memory systems on AMD ROCm | Custom Triton kernels | Hierarchical retrieval | MoE architectures

Washington State
https://linkedin.com/in/garyjduncan

Popular repositories Loading

pensive pensive Public

Hierarchical context retrieval for LLM applications. Multi-tier caching with FAISS + BM25 hybrid search, L1/L2/L3 tiered storage, sub-30ms latency at 10M+ tokens.

Python