apollosenvy

Follow

Gary Duncan apollosenvy

Follow

Founder @Tuklus-Labs | AI inference & memory systems | Former 25S SATCOM | Building on AMD ROCm

1 follower · 1 following

Tuklus Labs
Washington State
https://linkedin.com/in/garyjduncan

Achievements

Achievements

Popular repositories Loading

kernel-anvil kernel-anvil Public

Profile-guided GPU kernel optimizer for AMD/RDNA3. Auto-tunes llama.cpp MMVQ kernels per model shape. 2x decode speedup on 7900 XTX.

Python 52 1
llama-cpp-turboquant llama-cpp-turboquant Public

Forked from TheTom/llama-cpp-turboquant

LLM inference in C/C++

C++ 1
hamm-r hamm-r Public

Headless Agent Mobile Management Relay -- Run Claude Code from your phone

Kotlin
moirai moirai Public

Three-model local coding daemon: planner + coder + reviewer-orchestrator on a single GPU. Swap-on-demand llama-server, RO loop with tool-call discipline, turboquant KV compression on 7900 XTX.

Go