From Zero to Agents - 企业级AI Agent工业化生产平台
Agent Factory是一个完全模块化的AI Agent工业化生产平台,每个Factory都是独立的项目模块。
- 🏗️ 模块化优先: 每个Factory是独立的项目
- 🔌 即插即用: Factory可独立开发、测试、部署
- 🚀 灵活部署: 支持单体或微服务架构
- 🎨 清晰可见: 一级目录结构,一目了然
AgentFactory/ # 从零到一训练Agent的完整流程
│
├── 1️⃣ ComputeFactory/ # 步骤1: 资源准备 - 分配GPU/CPU算力
├── 2️⃣ DataFactory/ # 步骤2: 数据准备 - 采集、清洗、标注数据
├── 3️⃣ EnvironmentFactory/ # 步骤3: 环境构建 - 创建测试场景
├── 4️⃣ TrainingFactory/ # 步骤4: 模型训练 - SFT/RL训练
├── 5️⃣ EvaluationFactory/ # 步骤5: 质量评估 - 多维度测试
├── 6️⃣ RuntimeFactory/ # 步骤6: 部署上线 - 沙箱隔离运行
│
├── 📦 shared/ # 共享资源
│ ├── backend/ # 后端共享库
│ ├── frontend/ # 前端设计系统
│ └── docs/ # 共享文档
│
├── 🎬 Demo/ # 演示程序(完整流程)
├── 📄 docs/ # 项目文档
│
├── ARCHITECTURE.md # 架构设计
├── PROJECT_SUMMARY.md # 项目总结
└── README.md # 本文件
Step 1: ComputeFactory → 分配2x GPU
↓
Step 2: DataFactory → 收集1000条训练数据
↓
Step 3: EnvironmentFactory → 创建测试环境
↓
Step 4: TrainingFactory → 训练模型(SFT/RL)
↓
Step 5: EvaluationFactory → 评估准确度≥80%
↓
Step 6: RuntimeFactory → 部署到生产环境
训练第一步:资源准备
功能: 为整个训练流程提供算力支持
- 🖥️ GPU/CPU/TPU资源池管理
- 📋 智能作业调度(优先级、可抢占)
- 📊 实时监控与成本计费
- ⚡ 弹性扩缩容
为什么第一步?
没有算力就无法训练模型,ComputeFactory确保后续所有步骤有足够的计算资源。
独立运行:
cd ComputeFactory
pip install -e .
uvicorn api.main:app --port 8001训练第二步:数据准备
功能: 构建高质量训练数据集
- 📥 Agent交互数据采集
- 🧹 PII脱敏与数据清洗
- 🏷️ 人工+LLM混合标注
- 📦 数据集版本管理(SFT/RFT/RM/Eval)
为什么第二步?
"数据是AI的燃料",高质量数据决定模型上限。DataFactory收集、清洗、标注数据,为训练做好准备。
独立运行:
cd DataFactory
pip install -e .
uvicorn api.main:app --port 8002训练第三步:环境构建
功能: 创建Agent训练和测试环境
- 🌐 多环境支持(HTTP API、Browser、RPA)
- 🎭 场景编排与任务链
- 🎬 轨迹生成(Rollout)
- 🔄 环境回放与调试
为什么第三步?
Agent需要在真实或模拟环境中学习。EnvironmentFactory提供训练场地和测试场景。
独立运行:
cd EnvironmentFactory
pip install -e .
uvicorn api.main:app --port 8003训练第四步:模型训练
功能: 核心训练流程
- 🎓 SFT监督微调
- 🎮 RL强化学习(PPO、DPO、RFT)
- 🎁 奖励建模(Reward Model)
- 📚 模型注册与版本管理
为什么第四步?
有了资源、数据和环境后,终于可以开始训练!TrainingFactory执行实际的模型优化。
独立运行:
cd TrainingFactory
pip install -e .
uvicorn api.main:app --port 8004训练第五步:质量评估
功能: 全方位模型评估
- ✅ 多维度评估(准确度、安全性、鲁棒性)
- ⚖️ LLM-as-a-judge自动评分
- 📊 基准对比(vs GPT-4/Claude)
- 🔍 错误分析与聚类
为什么第五步?
训练完的模型必须通过严格评估才能上线。EvaluationFactory确保质量达标。
独立运行:
cd EvaluationFactory
pip install -e .
uvicorn api.main:app --port 8005训练第六步:部署上线
功能: 生产环境部署与运维
特色: 基于 kubernetes-sigs/agent-sandbox
- 🔒 沙箱隔离(Process/Container/VM)
- ⚡ 预热池(<1ms快速部署)
- 🔄 生命周期管理(Pause/Resume/Hibernate)
- 📋 模板系统(4种预定义)
为什么第六步?
评估通过后,Agent终于可以部署到生产环境服务用户。RuntimeFactory提供安全可靠的运行时。
独立运行:
cd RuntimeFactory
pip install -e .
uvicorn api.main:app --port 8006# 安装所有Factory
./scripts/install-all.sh
# 启动完整平台
./scripts/start-all.sh
# 访问
# Frontend: http://localhost:5173
# API Docs: http://localhost:8000/docs# 只安装和运行你需要的Factory
cd ComputeFactory
pip install -e .
uvicorn api.main:app --port 8001# 使用Docker Compose
docker-compose up
# 或使用Kubernetes
kubectl apply -f k8s/训练一个数学计算Agent,体验所有6个工厂:
cd Demo
python3 run_e2e_demo.py结果:
- ✅ 数据收集与标注
- ✅ 训练MathAgent(95%准确度)
- ✅ 评估通过(100%测试准确度)
- ✅ 成功部署到生产环境
展示RuntimeFactory的沙箱隔离和快速部署:
cd Demo
python3 runtime_sandbox_demo.py结果:
- ✅ 沙箱分配: 0.000s(vs 10-30s冷启动)
- ✅ 多级隔离演示
- ✅ 完整生命周期管理
详细说明: Demo/README.md
每个Factory = 独立项目
├── 独立的setup.py(可pip install)
├── 独立的requirements.txt
├── 独立的API
├── 独立的测试
└── 独立的文档
优势:
- ✅ 团队可并行开发
- ✅ 代码冲突最小化
- ✅ 独立版本控制
- ✅ 灵活组合使用
AgentFactory/
├── ComputeFactory/ ← 一眼看出是计算模块
├── DataFactory/ ← 一眼看出是数据模块
└── ... ← 架构一目了然
vs 传统结构:
src/
├── services/ ← 不知道有什么
│ └── ... ← 需要深入才知道
单体模式: 所有Factory在一个进程
python main.py微服务模式: 每个Factory独立服务
# Terminal 1
cd ComputeFactory && uvicorn api.main:app --port 8001
# Terminal 2
cd DataFactory && uvicorn api.main:app --port 8002
# ...混合模式: 核心Factory独立,其他共享
# 独立
cd RuntimeFactory && uvicorn api.main:app --port 8006
# 共享
python main.py # 运行其他Factory| 指标 | 优化前 | 优化后 | 提升 |
|---|---|---|---|
| Agent部署速度 | 10-30s | <0.001s | >10,000x |
| 并发Agent数 | 50 | 200+ | 4x |
| 资源利用率 | 60% | 85%+ | +25% |
| 空闲资源消耗 | 100% | <10% | -90% |
- 确定Factory: 功能属于哪个Factory?
- 进入目录:
cd {Factory}Factory - 创建分支:
git checkout -b feature/xxx - 开发: 只修改该Factory的代码
- 测试:
pytest tests/ - 提交: 改动限定在该Factory
# 1. 复制模板
cp -r ComputeFactory NewFacto新Factory
# 2. 修改配置
cd NewFactory
# 编辑setup.py, requirements.txt, README.md
# 3. 实现功能
# ...
# 4. 测试
pytest tests/
# 5. 文档
# 更新README.md| 文档 | 说明 |
|---|---|
| ARCHITECTURE.md | 详细架构设计 |
| PROJECT_SUMMARY.md | 项目总结与成果 |
| Demo/README.md | Demo使用说明 |
| shared/docs/ | 共享文档 |
Factory文档:
- ComputeFactory/README.md
- RuntimeFactory/README.md
- ... (每个Factory都有README)
- Fork项目
- 选择要改进的Factory
- 创建功能分支
- 提交PR(限定Factory范围)
- 后端: PEP8, Black格式化
- 前端: ESLint, Prettier
- 测试: pytest (后端), Jest (前端)
- 文档: Markdown
Apache License 2.0 - 详见 LICENSE
- RuntimeFactory设计灵感来自 kubernetes-sigs/agent-sandbox
- 感谢所有贡献者
- Issues: GitHub Issues
- Discussions: GitHub Discussions
- Email: team@agentfactory.io