面向特定领域专家的 AI 模型架构选型调研工具 —— 输入领域 + 时间窗,输出一份带「为何相关」判定理由的可关注架构清单(JSON)。
A model architecture survey skill for domain experts —— give it a domain and a time window, get back a curated watchlist (JSON) where every entry includes a domain-specific relevance rationale.
遵循 Agent Skills 开放标准,兼容 Claude Code、Cursor、GitHub Copilot、Codex、Windsurf、Gemini CLI、Perplexity Computer 等 30+ AI Agent 平台。
每个领域的专家都面临同样的痛点:架构创新的 80% 来自领域之外(SSM、tokenizer-free、扩散 LM、MoE 路由、长上下文等),但 arXiv / bioRxiv / Hugging Face 的信息洪流让人很难高效筛出「非本领域但对本领域高相关」的进展。手工搜索整理成本高、口径不一、容易漏。
Archer 把这件事变成一条标准化工作流:
- 锚定领域 → 多源扫描 → 用领域视角判定相关性 → 输出结构化清单
- 关键差异:每条候选的
reason字段必须显式回答「这对你领域意味着什么、能解决什么痛点」,而不只是复述摘要
npx skills add Ficere/archer需要 Node.js。安装后 Agent 会自动发现并按需加载该技能。
Requires Node.js. Once installed, your agent will auto-discover and load this skill when relevant.
其他安装方式 / Alternative methods
手动安装 / Manual install:
git clone https://github.com/Ficere/archer.git
# 复制目录到你的 Agent 的 skills 文件夹下:
# Claude Code: ~/.claude/skills/
# Cursor: .cursor/skills/
# Copilot: .github/skills/
# Codex: ~/.codex/skills/
# Gemini CLI: .gemini/skills/Perplexity Computer:
下载本仓库 zip → 在 Skills 管理页面 上传。
安装后直接用自然语言触发,无需任何配置:
帮我做一份近两周的 gLM 可关注架构清单,scope 严格限定 DNA/RNA 序列预训练模型,PLM 和 scFM 不进主体
我做小分子生成模型,想跟一下最近一个月通用 ML 里有什么对分子图建模有启发的新架构
近 30 天蛋白语言模型有什么值得关注的新架构?arXiv 和 Hugging Face 都看一下
RAG / Agent 方向最近一个季度的架构创新,重点关注上下文工程和长期记忆
| 模块 | 说明 |
|---|---|
| 领域锚定 | Step 0 强制确认 domain + inclusion/exclusion,避免输出泛化 |
| 多源扫描 | 6 轮 round-robin 搜索:领域内论文 / 通用 ML / tokenization / 扩散 / MoE / 中文源与 HF |
| 相关性轴 | 7 个内置领域 playbook(gLM / PLM / scFM / 化学 / 视觉 / 机器人 / RAG)+ 通用兜底 |
| 日期校验 | Step 2 强制 fetch_url 验证发表日期,避免把过期论文当新工作 |
| 领域价值判定 | 每条 reason 字段显式提到领域应用场景,而非摘要复述 |
| 结构化输出 | JSON 主出(含 axis、date、metadata),可选 Markdown 渲染 |
| 数量纪律 | 严格控制 12-15 项,宁缺毋滥 |
{
"header": "🧬 2026.03.16–03.30 基因组基础模型可关注架构",
"items": [
{
"title": "模型/方法名(含一行点睛副标题)",
"summary": "100-200 字客观摘要:核心思想、关键数字、与基线对比",
"reason": "60-150 字领域价值判定:为什么对你领域重要,具体应用路径",
"link": "https://arxiv.org/abs/...",
"axis": "architecture",
"date": "2026-03-24"
}
],
"metadata": { "domain": "...", "time_window": "...", "sources": [...] }
}完整示例见 assets/example-output.json,schema 见 references/schema.json。
内置领域 playbook 列表 / Built-in domain playbooks
| Playbook | 适用领域 | 关键相关性轴 |
|---|---|---|
| gLM | 基因组 / DNA / RNA 基础模型 | 编码区/非编码区差异化、染色质 3D、tokenization、长基因组上下文 |
| PLM | 蛋白语言模型 | 结构 grounding、序列+结构联合、蛋白生成 |
| scFM | 单细胞基础模型 | 跨数据集整合、细胞-基因联合表征、扰动建模 |
| Chem/Mat | 化学 / 小分子 / 材料 | GNN、equivariant、SMILES tokenization、扩散生成 |
| VLM | 视觉 / 多模态 | Native multimodal、视频长上下文、视觉 encoder |
| Robotics | 机器人 / 具身智能 | VLA、世界模型、cross-embodiment |
| RAG/Agent | 检索增强 / Agent | 上下文工程、长期记忆、Agent 编排 |
未列出的领域走通用 fallback 轴(架构 / 预训练 / tokenization / 长上下文 / 评测 / 跨模态)。详见 references/domain-playbooks.md。
scripts/render_markdown.py 可以脱离 Agent 平台把 Archer JSON 渲染为 Markdown 报告(Python 3,无第三方依赖):
python scripts/render_markdown.py archer_output.json -o report.md
python scripts/render_markdown.py archer_output.json --group-by datearcher/
├── SKILL.md # 技能入口(Agent 自动读取)
├── README.md # 本文件
├── LICENSE
├── references/
│ ├── schema.json # 输出 JSON Schema
│ ├── domain-playbooks.md # 7 个内置领域 playbook
│ ├── prompt-templates.md # 6 类 search query 模板
│ └── markdown-template.md # Markdown 报告模板
├── assets/
│ └── example-output.json # 完整输出示例(gLM 领域)
└── scripts/
└── render_markdown.py # JSON → Markdown 渲染器
Archer 的核心差异不在于「能搜索」,而在于工作流纪律:
- 强制 Step 0 — 没有领域定位就不开工,避免输出泛化的"AI 架构周报"
- 6 轮 round-robin — 每轮一个主题,强制覆盖通用 ML 高相关迁移类(这是领域专家最容易漏的)
- fetch_url 二次校验日期 — 搜索片段里的日期不可信
- reason ≠ summary — 每条都必须显式回答"这对你领域意味着什么"
- 数量纪律 — 12-15 项,超过这个数清单就失去了筛选价值
MIT