🐏 Shepherd

高性能轻量级分布式 llama.cpp 模型管理系统

✨ 核心特性

极速启动 - <500ms 启动时间
轻量高效 - 内存占用仅 ~30MB
单一二进制 - 无需运行时依赖，开箱即用
分布式架构 - 支持 Master-Client 多节点部署
多 API 兼容 - OpenAI / Anthropic / Ollama / LM Studio

📦 模型管理

自动扫描 GGUF 格式模型
一键加载/卸载，支持多目录管理
模型收藏、别名、分卷自动识别
视觉模型 (mmproj) 支持
丰富的加载参数:
- 基础参数: 上下文大小、批次大小、线程数、GPU 层数
- 采样参数: 温度、Top-P、Top-K、重复惩罚、Min-P、Presence/Frequency 惩罚
- 性能优化: Flash Attention、内存锁定、UBatch、并行槽位
- KV 缓存: 类型配置 (K/V)、统一缓存、缓存大小
- 模板系统: Jinja 禁用、自定义模板、上下文切换
- GPU 配置: 多设备支持、主 GPU 选择、设备列表

🌐 分布式架构

角色	说明	使用场景
Hybrid	混合模式（默认）	既是 Master 又是 Client，推荐用于大多数场景
Master	主节点	管理多个 Client 节点的中心化管理集群
Client	工作节点	作为 GPU 工作节点向 Master 注册

核心特性：

统一 Node 模型，节点可随时切换角色
智能心跳（5秒间隔，自动故障检测）
资源上报（CPU/GPU/内存/显存实时监控）
智能调度（资源感知、负载均衡）

🎨 Web 前端

React 19 + TypeScript + Vite 7 + Tailwind CSS 4
前端独立配置，支持多后端和运行时切换
SSE 实时事件推送

📦 快速开始

安装

从源码编译：

git clone https://github.com/shepherd-project/shepherd.git
cd shepherd
make build

下载预编译版本： 前往 Releases 下载对应平台的二进制文件。

配置

配置文件位置：config/node/*.config.yaml

节点角色由配置文件中的 node.role 字段决定：

node.role	说明
`hybrid`	混合模式（默认）
`master`	主节点模式
`client`	工作节点模式

前端独立配置： web/config.yaml - 支持多后端配置和运行时切换

运行

# 使用默认配置（hybrid 模式）
./build/shepherd

# 使用自定义配置文件
./build/shepherd --config config/node/server.config.yaml

# 查看版本
./build/shepherd --version

访问 Web UI: http://localhost:9190

🌐 分布式部署

架构示例

┌─────────────────┐     ┌─────────────────┐     ┌─────────────────┐
│   Master Node   │◄────┤  Hybrid Node    │◄────┤  Client Node    │
│   (Port 9190)   │     │ (Port 9190+9191)│     │                 │
└────────┬────────┘     └────────┬────────┘     └─────────────────┘
         │                       │
         ▼                       ▼
┌─────────────────┐     ┌─────────────────┐
│  Client Node 1  │     │  Client Node 2  │
│   (GPU Server)  │     │   (GPU Server)  │
└─────────────────┘     └─────────────────┘

快速部署

1. 启动 Master 或 Hybrid 节点：

./build/shepherd
# 或指定配置
./build/shepherd --config config/node/server.config.yaml

2. 启动 Client 节点：

# 在配置文件中设置 node.role: client 和 node.client_role.master_address
./build/shepherd --config config/node/client.config.yaml

3. 查看集群状态：

curl http://master:9190/api/nodes

💡 使用示例

OpenAI API

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:9190/v1",
    api_key="dummy"
)

response = client.chat.completions.create(
    model="llama-2-7b-chat",
    messages=[{"role": "user", "content": "Hello!"}]
)

print(response.choices[0].message.content)

分布式任务调度

# 创建任务
curl -X POST http://master:9190/api/tasks \
  -H "Content-Type: application/json" \
  -d '{
    "type": "run_python",
    "payload": {
      "script": "/path/to/script.py",
      "conda_env": "rocm7.2"
    }
  }'

🛠️ 开发

后端

make test        # 运行测试
make lint        # 代码检查
make fmt         # 代码格式化
make build-all   # 跨平台编译

前端

cd web
npm install      # 安装依赖
npm run dev      # 开发服务器（端口 3000）
npm run build    # 构建生产版本

🗺️ 路线图

v0.1.0 - 核心功能
v0.1.1 - Master-Client 分布式管理
v0.1.2 - Web UI 前端独立架构
v0.1.3 - 配置/下载/进程管理
v0.1.4 - 模型压测 UI 优化
v0.2.0 - 类型系统统一重构
v0.3.0 - 系统托盘和桌面应用
v0.4.0 - 移除废弃 API
v1.0.0 - 生产就绪

v0.2.0 更新： API 路由统一为 /api/nodes/*，类型迁移到 UnifiedNode。详见 CHANGELOG.md。

📚 文档

文档	描述
CHANGELOG.md	变更日志
贡献指南	贡献指南
脚本总览	脚本文档
Web 前端部署	前端部署指南
Web 前端开发	前端开发文档

📄 许可证

Apache License 2.0 - 详见 LICENSE 文件

🙏 致谢

llama.cpp - 核心推理引擎
LlamacppServer - 项目参考

📞 联系方式

问题反馈: GitHub Issues
功能建议: GitHub Discussions

⭐ 如果这个项目对你有帮助，请点个 Star！

Name		Name	Last commit message	Last commit date
Latest commit History 191 Commits
api-docs		api-docs
cmd		cmd
config/example		config/example
docs		docs
internal		internal
scripts		scripts
web		web
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
go.mod		go.mod
go.sum		go.sum

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🐏 Shepherd

✨ 核心特性

📦 模型管理

🌐 分布式架构

🎨 Web 前端

📦 快速开始

安装

配置

运行

🌐 分布式部署

架构示例

快速部署

💡 使用示例

OpenAI API

分布式任务调度

🛠️ 开发

后端

前端

🗺️ 路线图

📚 文档

📄 许可证

🙏 致谢

📞 联系方式

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🐏 Shepherd

✨ 核心特性

📦 模型管理

🌐 分布式架构

🎨 Web 前端

📦 快速开始

安装

配置

运行

🌐 分布式部署

架构示例

快速部署

💡 使用示例

OpenAI API

分布式任务调度

🛠️ 开发

后端

前端

🗺️ 路线图

📚 文档

📄 许可证

🙏 致谢

📞 联系方式

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages