Skip to content

aiagentfactory/AgentFactory

Repository files navigation

Agent Factory 🏭

From Zero to Agents - 企业级AI Agent工业化生产平台

Status Architecture License


🎯 项目概述

Agent Factory是一个完全模块化的AI Agent工业化生产平台,每个Factory都是独立的项目模块

核心理念

  • 🏗️ 模块化优先: 每个Factory是独立的项目
  • 🔌 即插即用: Factory可独立开发、测试、部署
  • 🚀 灵活部署: 支持单体或微服务架构
  • 🎨 清晰可见: 一级目录结构,一目了然

📁 项目结构

AgentFactory/                   # 从零到一训练Agent的完整流程
│
├── 1️⃣ ComputeFactory/         # 步骤1: 资源准备 - 分配GPU/CPU算力
├── 2️⃣ DataFactory/            # 步骤2: 数据准备 - 采集、清洗、标注数据
├── 3️⃣ EnvironmentFactory/     # 步骤3: 环境构建 - 创建测试场景
├── 4️⃣ TrainingFactory/        # 步骤4: 模型训练 - SFT/RL训练
├── 5️⃣ EvaluationFactory/      # 步骤5: 质量评估 - 多维度测试
├── 6️⃣ RuntimeFactory/         # 步骤6: 部署上线 - 沙箱隔离运行
│
├── 📦 shared/                  # 共享资源
│   ├── backend/                # 后端共享库
│   ├── frontend/               # 前端设计系统
│   └── docs/                   # 共享文档
│
├── 🎬 Demo/                    # 演示程序(完整流程)
├── 📄 docs/                    # 项目文档
│
├── ARCHITECTURE.md             # 架构设计
├── PROJECT_SUMMARY.md          # 项目总结
└── README.md                   # 本文件

🔄 从零到一的训练流程

Step 1: ComputeFactory    → 分配2x GPU
        ↓
Step 2: DataFactory       → 收集1000条训练数据
        ↓
Step 3: EnvironmentFactory → 创建测试环境
        ↓
Step 4: TrainingFactory   → 训练模型(SFT/RL)
        ↓
Step 5: EvaluationFactory → 评估准确度≥80%
        ↓
Step 6: RuntimeFactory    → 部署到生产环境

🏭 六大工厂(按训练流程排序)

1️⃣ ComputeFactory - 计算工厂

训练第一步:资源准备

功能: 为整个训练流程提供算力支持

  • 🖥️ GPU/CPU/TPU资源池管理
  • 📋 智能作业调度(优先级、可抢占)
  • 📊 实时监控与成本计费
  • ⚡ 弹性扩缩容

为什么第一步?
没有算力就无法训练模型,ComputeFactory确保后续所有步骤有足够的计算资源。

独立运行:

cd ComputeFactory
pip install -e .
uvicorn api.main:app --port 8001

详情: ComputeFactory/README.md


2️⃣ DataFactory - 数据工厂

训练第二步:数据准备

功能: 构建高质量训练数据集

  • 📥 Agent交互数据采集
  • 🧹 PII脱敏与数据清洗
  • 🏷️ 人工+LLM混合标注
  • 📦 数据集版本管理(SFT/RFT/RM/Eval)

为什么第二步?
"数据是AI的燃料",高质量数据决定模型上限。DataFactory收集、清洗、标注数据,为训练做好准备。

独立运行:

cd DataFactory
pip install -e .
uvicorn api.main:app --port 8002

3️⃣ EnvironmentFactory - 环境工厂

训练第三步:环境构建

功能: 创建Agent训练和测试环境

  • 🌐 多环境支持(HTTP API、Browser、RPA)
  • 🎭 场景编排与任务链
  • 🎬 轨迹生成(Rollout)
  • 🔄 环境回放与调试

为什么第三步?
Agent需要在真实或模拟环境中学习。EnvironmentFactory提供训练场地和测试场景。

独立运行:

cd EnvironmentFactory
pip install -e .
uvicorn api.main:app --port 8003

4️⃣ TrainingFactory - 训练工厂

训练第四步:模型训练

功能: 核心训练流程

  • 🎓 SFT监督微调
  • 🎮 RL强化学习(PPO、DPO、RFT)
  • 🎁 奖励建模(Reward Model)
  • 📚 模型注册与版本管理

为什么第四步?
有了资源、数据和环境后,终于可以开始训练!TrainingFactory执行实际的模型优化。

独立运行:

cd TrainingFactory
pip install -e .
uvicorn api.main:app --port 8004

5️⃣ EvaluationFactory - 评估工厂

训练第五步:质量评估

功能: 全方位模型评估

  • ✅ 多维度评估(准确度、安全性、鲁棒性)
  • ⚖️ LLM-as-a-judge自动评分
  • 📊 基准对比(vs GPT-4/Claude)
  • 🔍 错误分析与聚类

为什么第五步?
训练完的模型必须通过严格评估才能上线。EvaluationFactory确保质量达标。

独立运行:

cd EvaluationFactory
pip install -e .
uvicorn api.main:app --port 8005

6️⃣ RuntimeFactory - 运行工厂

训练第六步:部署上线

功能: 生产环境部署与运维

特色: 基于 kubernetes-sigs/agent-sandbox

  • 🔒 沙箱隔离(Process/Container/VM)
  • ⚡ 预热池(<1ms快速部署)
  • 🔄 生命周期管理(Pause/Resume/Hibernate)
  • 📋 模板系统(4种预定义)

为什么第六步?
评估通过后,Agent终于可以部署到生产环境服务用户。RuntimeFactory提供安全可靠的运行时。

独立运行:

cd RuntimeFactory
pip install -e .
uvicorn api.main:app --port 8006

详情: RuntimeFactory/README.md


🚀 快速开始

方式1: 完整平台(推荐初学者)

# 安装所有Factory
./scripts/install-all.sh

# 启动完整平台
./scripts/start-all.sh

# 访问
# Frontend: http://localhost:5173
# API Docs: http://localhost:8000/docs

方式2: 独立Factory(推荐开发者)

# 只安装和运行你需要的Factory
cd ComputeFactory
pip install -e .
uvicorn api.main:app --port 8001

方式3: 微服务部署

# 使用Docker Compose
docker-compose up

# 或使用Kubernetes
kubectl apply -f k8s/

📚 Demo演示

Demo 1: 完整工厂流程

训练一个数学计算Agent,体验所有6个工厂:

cd Demo
python3 run_e2e_demo.py

结果:

  • ✅ 数据收集与标注
  • ✅ 训练MathAgent(95%准确度)
  • ✅ 评估通过(100%测试准确度)
  • ✅ 成功部署到生产环境

Demo 2: Runtime沙箱系统

展示RuntimeFactory的沙箱隔离和快速部署:

cd Demo
python3 runtime_sandbox_demo.py

结果:

  • ✅ 沙箱分配: 0.000s(vs 10-30s冷启动)
  • ✅ 多级隔离演示
  • ✅ 完整生命周期管理

详细说明: Demo/README.md


🎯 架构优势

1. 模块化架构

每个Factory = 独立项目
├── 独立的setup.py(可pip install)
├── 独立的requirements.txt
├── 独立的API
├── 独立的测试
└── 独立的文档

优势:

  • ✅ 团队可并行开发
  • ✅ 代码冲突最小化
  • ✅ 独立版本控制
  • ✅ 灵活组合使用

2. 清晰可见

AgentFactory/
├── ComputeFactory/     ← 一眼看出是计算模块
├── DataFactory/        ← 一眼看出是数据模块
└── ...                 ← 架构一目了然

vs 传统结构:

src/
├── services/          ← 不知道有什么
│   └── ...           ← 需要深入才知道

3. 灵活部署

单体模式: 所有Factory在一个进程

python main.py

微服务模式: 每个Factory独立服务

# Terminal 1
cd ComputeFactory && uvicorn api.main:app --port 8001

# Terminal 2  
cd DataFactory && uvicorn api.main:app --port 8002

# ...

混合模式: 核心Factory独立,其他共享

# 独立
cd RuntimeFactory && uvicorn api.main:app --port 8006

# 共享
python main.py  # 运行其他Factory

📊 性能指标

指标 优化前 优化后 提升
Agent部署速度 10-30s <0.001s >10,000x
并发Agent数 50 200+ 4x
资源利用率 60% 85%+ +25%
空闲资源消耗 100% <10% -90%

🛠️ 开发指南

添加新功能

  1. 确定Factory: 功能属于哪个Factory?
  2. 进入目录: cd {Factory}Factory
  3. 创建分支: git checkout -b feature/xxx
  4. 开发: 只修改该Factory的代码
  5. 测试: pytest tests/
  6. 提交: 改动限定在该Factory

创建新Factory

# 1. 复制模板
cp -r ComputeFactory NewFacto新Factory

# 2. 修改配置
cd NewFactory
# 编辑setup.py, requirements.txt, README.md

# 3. 实现功能
# ...

# 4. 测试
pytest tests/

# 5. 文档
# 更新README.md

📖 核心文档

文档 说明
ARCHITECTURE.md 详细架构设计
PROJECT_SUMMARY.md 项目总结与成果
Demo/README.md Demo使用说明
shared/docs/ 共享文档

Factory文档:


🤝 贡献指南

工作流程

  1. Fork项目
  2. 选择要改进的Factory
  3. 创建功能分支
  4. 提交PR(限定Factory范围)

代码规范

  • 后端: PEP8, Black格式化
  • 前端: ESLint, Prettier
  • 测试: pytest (后端), Jest (前端)
  • 文档: Markdown

📄 许可证

Apache License 2.0 - 详见 LICENSE


🙏 致谢


📞 联系方式


🎉 Agent Factory - 模块化的AI Agent工业化平台 🏭

每个Factory都是一个独立的世界!

Made with ❤️ by Agent Factory Team

开始使用 · 查看架构 · 运行Demo