diff --git a/docs/tools.md b/docs/tools.md index b9c367a..3486fb3 100644 --- a/docs/tools.md +++ b/docs/tools.md @@ -17,46 +17,146 @@ - [Claude Code](https://claude.com/product/claude-code) Anthropic 的终端式 coding agent,强调本地运行、权限确认、与 IDE 和工作流结合。 + **使用门槛:** 低。只需具备基础终端操作能力;需支付 Anthropic API 费用。 + **适用场景:** 快速重构整个代码库、自动修复测试用例、在不离开终端的情况下进行全库搜索与修改。 - [Codex](https://openai.com/codex/) OpenAI 的 AI coding partner,强调端到端完成工程任务,适合放在当前主流 Coding Agent 工具链里持续跟踪。 + **使用门槛:** 中。通常作为底层能力,需通过 API 或集成工具调用,适合有工程搭建能力的开发者。 + **适用场景:** 构建自定义的 AI 编程助手、进行大规模的代码自动转换或文档生成。 - [GitHub Copilot CLI](https://docs.github.com/en/copilot/how-tos/copilot-cli) GitHub 提供的命令行 Copilot 入口,适合和 GitHub 工作流、autopilot 模式、插件生态一起看。 对学生/个人用户而言,GitHub Copilot Pro 的常见订阅价格约为 10 美元/月,覆盖 GPT 和 Claude 最新模型,每月可进行 300 次请求(单次对话内容token不计上限),性价比较高。 + **使用门槛:** 极低。适合所有开发者,只需订阅 Copilot 服务,对习惯命令行的人极其友好。 + **适用场景:** 忘记 Git 命令或复杂的 Shell 指令时,通过自然语言快速执行系统操作。 + +| **工具名称** | **定位 / 核心能力** | **交互特点** | **使用门槛** | **适用场景** | +| ---------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ | +| **Claude Code** | **全自主 Agent**。能理解需求、拆解任务、运行终端命令并根据测试结果迭代。 | **Auto Mode**。具备极高的多步推理能力,支持 MCP 协议接入外部上下文。 | **低**。需 Pro 订阅或 API 支付;适合习惯 Anthropic 生态的用户。 | 复杂逻辑重构、自动修复 CI 错误、跨多文件的大型功能开发。 | +| **Codex (API/底层)** | **底层能力方案**。作为构建其他 Agent 工具的“动力源”。 | **纯 API 调用**。通常不直接作为交互工具,而是嵌入在其他工程链中。 | **中**。需具备工程搭建与 Prompt 工程能力。 | 开发特定的垂直领域编程助手、大规模自动化代码迁移/文档生成工具。 | +| **GitHub Copilot CLI** | **生态集成型助手**。侧重于 Git、Shell 指令辅助及与 IDE 的深度联动。 | **Fleet 命令**。支持并行处理多个子任务,能通过 `@` 直接引用代码库文件。 | **极低**。月费约 $10;对学生和个人开发者性价比极高。 | 快速执行 Git 操作、简单的 Shell 脚本编写、以及在 GitHub 生态内的轻量协作。 | ### 2. 热门开源 Agent / 专题工具 - [OpenClaw 专题页](openclaw.md) OpenClaw 既可以被看作一个值得直接体验的开源 AI assistant / agent,也值得作为一个正在快速演化的热点项目持续跟踪,因此放在直接工具下面单独列出。 + **使用门槛:** 中高。需要自建环境或容器化部署(如 Docker),建议有一定系统运维经验。 + **适用场景:** 需要一个私有、可定制化程度极高的 AI 助手,且希望将 AI 能力深度集成到私有数据流中。 + +### 3. 代理型 IDE + +- [Cursor][https://www.cursor.com/] + AI 原生 IDE,其“Composer”模式支持跨文件同时编辑,能深度理解整个代码库的上下文。 + **使用门槛:** 极低。开箱即用,VS Code 用户可无缝迁移。 + **适用场景:** “Vibe Coding”的主战场。适合需要频繁跨文件修改、从零开始构建复杂功能模块的日常开发。 +- [Windsurf][https://codeium.com/windsurf] + Codeium 推出的下一代 IDE,其核心“Flow”特性让 AI 代理能像人类开发者一样,在理解代码、运行终端和修改文件之间无缝切换。 + **使用门槛:** 极低。强调“流式”体验,适合追求极致流畅感的开发者。 + **适用场景:** 当你需要 Agent 拥有极高的自主权(如自动运行测试、自动根据报错纠错)而不仅是代码补全时。 +- [Trae][https://www.trae.ai/] + 字节跳动推出的 AI 驱动 IDE,强调自适应学习和高效的代理模式,提供类似 Cursor 的流畅体验且目前对开发者非常友好。 + **使用门槛:** 极低。国内开发者友好,网络环境要求相对宽松。 + **适用场景:** 适合希望在中文语境下获得高响应速度、且追求高性价比 AI 开发体验的团队。 +- [Google Antigravity][https://antigravity.google/] + Google 推出的开发平台,将 IDE 拆分为编辑器、代理管理器和浏览器三个核心窗口,允许用户通过自然语言管理多个异步工作的自主 Agent 来完成从规划到测试的全流程任务。 + **使用门槛:** 中。全新的三窗格交互逻辑需要一定的学习适应成本。网络环境要求高。 + **适用场景:** 处理极其复杂的系统性工程,通过多个异步 Agent 并行处理“规划-编码-测试”全链路。 + +| **工具名称** | **核心优势** | **交互特点** | **使用门槛** | **建议场景** | +| --------------- | -------------- | ------------------------------------------ | ------------ | ------------------------------------------ | +| **Cursor** | 上下文理解极强 | **Composer** 模式,支持跨文件批量修改 | 极低 | 个人开发者日常主力,快速构建全栈功能 | +| **Windsurf** | 代理自主权高 | **Flow** 特性,AI 可自主操作终端和查看报错 | 极低 | 需要 AI 高度介入测试、调试和运行逻辑的场景 | +| **Trae** | 响应快且免费 | 国内网络友好,UI 交互逻辑类似 Cursor | 极低 | 追求极致响应速度、对性价比敏感的国内团队 | +| **Antigravity** | 流程可视化 | **三窗格**布局(编辑器、代理、浏览器) | 中(需适应) | 复杂系统设计,需要明确区分规划与执行的工程 | + +### 4. 轻量级/插件级 Agent + +- [Roo Code (原 Cline)][https://github.com/RooCode/Roo-Code] + 一个VS Code 开源插件,赋予 AI 读写本地文件、执行终端命令及使用浏览器的权限。 + **使用门槛:** 中。需自行配置 API Key,且需要理解 Agent 的权限管理机制。 + **适用场景:** 不想更换 IDE,但希望在 VS Code 内部获得类似独立 Agent 的自主文件操作和浏览器联动能力。 +- [Aider][https://aider.chat/] + 专注于终端的命令行编程助手,擅长在现有 Git 仓库中进行复杂的重构和功能开发,并能自动生成精简的 Commit Message。 + **使用门槛:** 中。纯命令行交互,适合习惯“极简主义”和高效 Git 工作流的资深程序员。 + **适用场景:** 在现有的复杂 Git 项目中进行精准的局部修复或功能迭代,且需要完美的版本控制记录。 +- [Github Copilot][https://github.com/features/copilot] + Copilot 的工作地点是你的 GitHub、IDE、项目工具、聊天应用和自定义 MCP 服务器。 + **使用门槛:** 极低。标准化的行业标杆,订阅即用。 + **适用场景:** 广泛的日常编码辅助、标准库查询、以及在 GitHub 生态(如 Codespaces)中的原生体验。 + +| **工具名称** | **角色定位** | **核心能力** | **灵活度** | **适用场景** | +| ------------------ | ------------ | --------------------------------------------- | ---------- | --------------------------------------------- | +| **Aider** | Git 配对编程 | 专注于 Git 增量修改,自动生成精简 Commit | 中 | 既有项目的局部功能迭代与代码库维护 | +| **Roo Code** | VS Code 增强 | 赋予 VS Code 文件、终端、甚至操作浏览器的权限 | 极高 | 在不离开 VS Code 的前提下获得“全能 Agent”体验 | +| **GitHub Copilot** | 行业标准助手 | 补全、对话、以及庞大的第三方 Extension 生态 | 一般 | 基础代码辅助、标准库查询、GitHub 工作流集成 | ## 扩展工具 - [Mem0](https://github.com/mem0ai/mem0) 为 AI agent 提供持久化记忆层,支持跨会话的上下文记忆管理,适合在 Coding Agent 工作流中保持项目理解的连续性。 + **使用门槛:** 中高。需集成到 Agent 的代码逻辑中,适合开发者。 + **适用场景:** 解决 Agent “转头就忘”的问题,让你的编程助手记住你的代码风格和历史偏好。 - [Spec Kit](https://github.com/github/spec-kit) GitHub 开源的规范驱动开发(Spec-Driven Development)工具包,通过 `/specify`、`/plan`、`/tasks`、`/implement` 等命令,将模糊需求转化为结构化的规格文档和技术方案,再由 AI coding agents 落地为代码。强调“先文档后实现”,适合需要规范流程、多人协作或长期维护的项目。 + **使用门槛:** 中。需要团队认同“先文档后代码”的开发文化。 + **适用场景:** 严谨的工程项目。防止 Agent 瞎写,通过规范化的任务拆解确保 AI 生成的代码符合工程标准。 +- [MCP (Model Context Protocol)][https://modelcontextprotocol.io/] + 由 Anthropic 发起的开放标准,允许 AI 工具通过统一接口接入本地数据、Google Drive、GitHub 等外部上下文,极大地扩展了 Agent 的知识边界。 + **使用门槛:** 高。需要理解协议规范,甚至需要自建 MCP 服务器。 + **适用场景:** 需要让 AI “看见”你的本地数据库、Google Calendar 或其他不直接联网的私有工具时。 +- [Greptile][https://www.greptile.com/] + 为超大型代码库提供 API 级的语义搜索和理解,让你的 Coding Agent 能够瞬间掌握数十万行代码的架构关系。 + **使用门槛:** 中。主要面向中大型企业级代码库。 + **适用场景:** 面对百万行以上的陈旧代码库,需要 AI 快速定位逻辑关系或进行大规模影响分析。 +- [Plandex][https://github.com/plandex-ai/plandex] + 专门处理复杂积压任务的 AI 任务管理器,能将大型工程目标拆解为细小的步骤,并跨多个文件进行原子级的代码生成。 + **使用门槛:** 中。涉及长任务管理和状态回滚的逻辑理解。 + **适用场景:** 应对那些需要连续修改几十个文件、且不能出错的长期复杂任务。 ## 辅助工具 ### 1. 终端与会话管理 -- `tmux` +- [tmux][https://github.com/tmux/tmux] 对长期运行 agent、远程服务器开发、多会话协作非常实用。至少建议掌握:`tmux new -s `、`tmux attach -t `、`tmux ls`、`Ctrl-b d`、`tmux kill-session -t `。 + **使用门槛:** 低。需记快捷键。 + **适用场景:** 远程服务器跑 Agent、多任务终端并排监控。 +- [Warp][https://www.warp.dev/] + 集成了 AI 能力的现代终端,支持自然语言转命令、报错自动修复,并能将复杂的运维指令序列保存为团队共享的流程。 + **使用门槛:** 低。Warp 像普通软件一样好用。 + **适用场景:**将常用 AI 指令保存为快捷工作流。 ### 2. 远程与移动端协作 - [Happy Coder](https://happy.engineering/docs/) 一个面向 Claude Code、Codex 等 AI coding agents 的移动端与远程控制工具,适合“离开工位后继续看 agent 在做什么”这类场景。 + **使用门槛:** 低。简单的远程接入配置。 + **适用场景:** 当你在外面吃火锅,但想用手机看看家里电脑上的 Agent 代码写到哪一步了。 ### 3. 自建中转站 - [Sub2API](https://github.com/Wei-Shaw/sub2api) 一个面向订阅额度分发与 API Key 管理的 AI API gateway platform,强调多账户管理、鉴权计费、负载调度、并发控制和管理面板,适合作为 Claude Code、Codex、Gemini 等上层工具的模型接入层。 + **使用门槛:** 高。需要具备服务器运维、数据库配置能力,并熟悉 API 鉴权与计费逻辑。 + **适用场景:** 团队级或多账户模型管理。适合作为 Claude Code 或 Gemini 等工具的底层接入层,实现额度分发与并发控制。 - [One API](https://github.com/songquanpeng/one-api) 一个较有代表性的通用大模型聚合网关,强调通过 OpenAI 兼容接口统一接入多家模型服务,适合用来理解“模型聚合与统一 API 暴露”这一类系统。 + **使用门槛:** 中高。需要自建服务环境,适合对“模型聚合”有一定技术理解的开发者。 + **适用场景:** 通用开发场景。当你需要通过单一的 OpenAI 兼容接口,统一调用来自不同供应商的多家大模型服务时。 - [One Hub](https://github.com/MartialBE/one-hub) 一个基于 `one-api` 演化的增强分支,强调新的 UI、供应商管理、监控统计、价格更新和多供应商支持,适合关注面板与运维能力增强的读者继续跟踪。 + **使用门槛:** 中高。在 One API 的基础上增加了更多管理特性,运维复杂度略有提升。 + **适用场景:** 强运维与监控需求场景。适合对面板 UI 美观度、实时监控统计以及多供应商价格更新有更高要求的用户。 - [Claude Relay Service](https://github.com/Wei-Shaw/claude-relay-service) 一个面向 Claude 访问场景的专项 relay 服务,强调多账户管理、Claude API 中转与自建部署;其 README 中也提示新项目可优先关注 `sub2api` 这一代方案。 + **使用门槛:** 中。专项中转服务,部署相对聚焦,但目前该项目更推荐迁移至功能更全的 Sub2API。 + **适用场景:** 专注 Claude 的特定中转需求。适合早期已部署该方案,或仅需针对 Claude API 进行简单中转与自建部署的场景。 + +| **工具/平台类型** | **代表工具** | **核心功能** | **维护成本** | **适用对象** | +| ------------------- | -------------- | -------------------------------------------- | ------------ | ----------------------------------------- | +| **企业/团队级网关** | **Sub2API** | 深度支持额度分发、负载均衡与计费管理 | 高(需运维) | 实验室或初创团队统一管理多个 API 账号 | +| **个人通用网关** | **One API** | 将各种模型统一包装成标准 OpenAI 接口 | 中 | 需要频繁切换多种模型进行实验的开发者 | +| **第三方聚合平台** | **OpenRouter** | 注册即用,免去维护 Key 的烦恼,支持 fallback | 极低 | 追求省心,想低成本尝试最新开源/闭源模型 | +| **IDE 灵活插件** | **Continue** | 在编辑器侧边栏随意配置本地/云端模型 | 低 | 混合使用本地 Ollama 模型与云端 API 的场景 | ### 4. 第三方中转站 @@ -64,13 +164,33 @@ - [OpenRouter](https://openrouter.ai/) 目前最主流的海外中转平台,统一 OpenAI 兼容接口接入 Claude、GPT、Gemini、Llama 等数百个模型,按量计费,支持 fallback 和模型路由。 + **使用门槛:** 极低。注册账号充值即可。 + **适用场景:** 想低成本尝试各种新模型,无需自己维护多个平台账号。 - [硅基流动 SiliconFlow](https://siliconflow.cn/) 国内主流中转平台,接入通义、GLM、DeepSeek、Llama 等模型,提供 OpenAI 兼容 API,部分开源模型有免费额度。 + **使用门槛:** 极低。注册账号充值即可。 + **适用场景:** 想低成本尝试各种新模型,无需自己维护多个平台账号。 ### 5. 提示词与内容辅助 - [PromptUp](https://promptup.net/) 一个提示语收集与浏览网站,适合在需要快速参考 prompt 写法、任务模板和表达方式时作为辅助入口使用。 + **使用门槛:** 极低。网页端直接访问,无技术背景要求。 + **适用场景:** 灵感激发。适合在编写 Coding Agent 的系统提示词、任务模板或复杂 Prompt 时作为参考入口。 + +### 6. 前端界面 + +- [pretext](https://github.com/chenglou/pretext) + 高性能纯 TypeScript 文本布局引擎,它通过在 Canvas 中预先测量文本来完全绕过 DOM 布局回流(Reflow),从而在支持多语言复杂排版的同时,实现比传统方案快数百倍的跨端文本渲染性能。 + **使用门槛:** 极高(开发侧)。仅建议 UI 开发或底层引擎开发人员关注。 + **适用场景:** 构建高性能、零闪烁的 AI 对话界面,追求极致的渲染效率。 + +### 7. 模型快捷调用 + +- [Continue][https://www.continue.dev/] + 灵活的开源 IDE 插件,支持在侧边栏自由接入任何本地(如 Ollama)或云端模型,是构建自定义 AI 工作流的首选支撑工具。 + **使用门槛:** 低。极具灵活性的插件。 + **适用场景:** 想要白嫖本地模型(如 Ollama 跑的 Llama 3)来辅助写代码,或频繁切换不同云端模型。 ## 科研工具 @@ -78,15 +198,44 @@ - [Hugging Face Papers](https://huggingface.co/papers) 适合快速发现最新 AI 论文,按社区讨论热度排序,更新频率高。 + **使用门槛:** 极低。只需关注社区动态,无需深厚的学术功底即可快速浏览。 + **适用场景:** 紧跟技术前沿。适合每天花几分钟快速筛选当前 AI 社区讨论热度最高的论文,捕捉 Vibe Coding 相关的技术趋势。 ### 2. 文献阅读与管理 - [Zotero](https://www.zotero.org/) 常用的文献管理工具,适合论文收藏、分类、批注和引用管理,尤其适合实验室长期积累阅读清单与专题资料。 + **使用门槛:** 低。学术圈通用工具。 + **适用场景:** 建立自己的“AI Agent 论文仓库”,在阅读时参考全球开发者对该算法的实时评价。 - [alphaXiv](https://www.alphaxiv.org/) 在 arXiv 论文页面上叠加社区批注和讨论,适合在阅读时获取他人观点和重点标注。 + **使用门槛:** 低。学术圈通用工具。 + **适用场景:** 建立自己的“AI Agent 论文仓库”,在阅读时参考全球开发者对该算法的实时评价。 - [NotebookLM](https://notebooklm.google.com/) Google 提供的 AI 文献阅读助手,可以上传论文 PDF 后进行问答、摘要和交叉对比,适合快速理解长论文或同时消化多篇相关工作。 + **使用门槛:** 极低。傻瓜式操作。 + **适用场景:** 手里攥着 20 篇 Agent 论文没时间读,通过它快速总结这些论文是否提到了同一种优化思路。 +- [Consensus][https://consensus.app/] + 专为学术研究设计的 AI 搜索引擎,能从数亿篇同行评审论文中直接提取结论,非常适合在进行底层算法调研时快速验证技术可行性。 + **使用门槛:** 低。订阅制或部分免费。 + **适用场景:** 寻找技术支撑。 +- [Elicit][https://elicit.com/] + 科研全流程助手,支持自动提取论文的关键数据(如样本量、方法论),并能通过语义关联发现你遗漏的相关文献。 + **使用门槛:** 低。订阅制或部分免费。 + **适用场景:** 寻找技术支撑。 +- [Semantic Scholar][https://www.semanticscholar.org/] + 由 AI 驱动的文献库,其“TLDR”功能能为你提供论文的极简摘要,帮助在海量新论文中快速筛选出对 Vibe Coding 有启发的研究。 + **使用门槛:** 低。订阅制或部分免费。 + **适用场景:** 寻找技术支撑。 + +| **工具名称** | **擅长领域** | **AI 介入深度** | **核心产出** | **适用场景** | +| --------------------- | -------------------- | -------------------- | ---------------------------- | ----------------------------------------------- | +| **Hugging Face** | 实时热度监测 | 极低(社区驱动) | 每日热榜、模型/数据关联 | 捕捉今日最火的 AI 趋势,寻找可复现代码 | +| **Zotero / alphaXiv** | 知识库管理与社交 | 低(侧重管理) | 结构化的论文库、社区讨论批注 | 长期跟踪某个专题(如 AI Agent 内存管理) | +| **NotebookLM** | 深度消化私有文档 | 极高(对话式) | 摘要、交叉对比、音频简报 | 快速理解 20+ 篇特定领域的论文合集 | +| **Consensus** | 搜索证据/结论 | 高(事实提取) | 基于同行评审论文的确定性回答 | 验证某个算法在学术界是否有据可查 | +| **Elicit** | 自动化综述与数据提取 | 高(结构化提取) | 关键参数/结论对比表 | 跨论文提取特定指标,验证不同技术路线的优劣 | +| **Semantic Scholar** | 语义检索与关联发现 | 中(TLDRs/引文分析) | 一句话摘要 (TLDR)、引文图谱 | 在海量文献中快速初筛对 Vibe Coding 有启发的研究 | ## 后续可补充内容