ai-guide/Vibe Coding 零基础教程/10 编程工具/10 优质 AI 编程扩展推荐.md

# 优质 AI 编程扩展推荐

大家好，我是程序员鱼皮。给大家分享一些我自己在用的 AI 编程扩展，帮你大幅提高 AI 编程效率和代码质量。

**万字长文 + 100 多张图**，绝对干货！点个收藏，让我们开始吧~


## 一、MCP 服务器类

MCP 的全称是 Model Context Protocol 模型上下文协议。简单来说，就是让 AI 大模型能够连接外部工具和数据源的一个开放标准。

打个比方，MCP 就像是 AI 的 USB-C 接口，原本 AI 只能根据训练数据来回答问题、生成代码，但有了这个统一接口，它就能连接各种外部工具，比如打开浏览器看网站、搜索并抓取网页内容、部署项目到云端、访问数据库等等，能力一下子就丰富起来了。

![](https://pic.yupi.icu/1/%E6%BC%AB%E7%94%BB%E5%9B%BE1%E5%A4%A7.jpeg)


### ⭐️ Firecrawl MCP 网页内容抓取

首先要介绍的是 [Firecrawl MCP](https://www.firecrawl.dev/)，让 AI 能够自动抓取和理解网页内容。

我在开发项目时经常需要从网上获取参考资料、阅读官方文档和技术博客，或者分析竞品的功能实现。如果人工来做这件事，需要先打开网站、再手动复制粘贴内容，或者自己写个爬虫脚本，麻烦得一批。

有了 Firecrawl MCP，这事儿就简单多了。我直接在 AI 编程工具中跟 AI 说：

- 帮我获取这个网站的内容
- 帮我读一下这个文档
- 帮我从网上搜索 XX 相关的信息

它就能自动把网页的内容、结构、甚至是动态加载的数据都给我抓下来。

![](https://pic.yupi.icu/1/image-20260116105912027.png)


**如何使用？**

首先你需要在 [Firecrawl 官网](https://www.firecrawl.dev/app/api-keys) 注册账号，并创建一个调用服务的 API Key。

![](https://pic.yupi.icu/1/image-20260116105955795.png)

然后进入到 AI 编程工具中配置一下 MCP 服务器。这里我以 Cursor 为例，其他 AI 编程工具对接 MCP 的方法可以看各自的官方文档，比如 [Claude Code 接入 MCP 文档](https://docs.anthropic.com/en/docs/claude-code/mcp)。

打开 Cursor 设置，找到 Tools & MCP，点击 `+ New MCP Server`。

![](https://pic.yupi.icu/1/image-20260116110425690.png)

本质上就是修改 MCP 配置文件，添加这样的配置：

```json
{
  "mcpServers": {
    "firecrawl-mcp": {
      "command": "npx",
      "args": ["-y", "firecrawl-mcp"],
      "env": {
        "FIRECRAWL_API_KEY": "你的API密钥"
      }
    }
  }
}
```

![](https://pic.yupi.icu/1/image-20260116110454499.png)

这段配置的意思是：通过 npx 命令来运行 firecrawl-mcp 这个工具，并且把你的 API 密钥传给它。如果你电脑上还没有安装 npx，需要先 [到官网安装 Node.js](https://nodejs.org/zh-cn)，npx 会随着 Node.js 一起安装。

配置好之后，看到绿色的成功点点，表示能够正常使用了。

![](https://pic.yupi.icu/1/image-20260116110558199.png)

除了基础的网页抓取，Firecrawl MCP 还支持批量抓取整站内容、递归抓取网站的多层链接、失败自动重试等高级功能。

类似的开源项目还有 [Crawl4AI](https://github.com/unclecode/crawl4ai)，定位是对大模型友好的爬虫工具，同样内置了 MCP Server 和 Agent Skills 技能包，可以作为 Firecrawl 的替代方案。


### Brave Search MCP 隐私搜索

接下来是 [Brave Search MCP](https://github.com/brave/brave-search-mcp-server)，让 AI 能够进行注重隐私保护的网络搜索。

在开发过程中，我经常需要让 AI 帮我搜索最新的技术资料、查找某个库的使用示例、或者了解某个技术问题的解决方案。传统的做法是自己去搜索引擎查，然后把结果复制给 AI，比较麻烦。

有了 Brave Search MCP，我直接跟 AI 说：

- 帮我搜索一下 React 19 的新特性
- 查一下这个错误怎么解决

它就能通过 Brave 搜索引擎去找答案。而且 Brave 搜索不会追踪你的搜索记录，隐私保护做得很好。

![](https://pic.yupi.icu/1/image-20260116111803869.png)


**如何使用？**

首先去 [Brave Search API](https://brave.com/search/api/) 注册账号，然后进入 API Key 管理页面，首先要选择一个订阅计划。必须选择免费版啊！每月有 2000 次查询额度，对于个人开发来说够用了。

![](https://pic.yupi.icu/1/image-20260116110947801.png)

但这里比较坑的一点是，即使订阅免费版，也要填写付款方式，没有海外银行卡的朋友可以撤了。

订阅成功后，创建 API Key：

![](https://pic.yupi.icu/1/image-20260116111311536.png)

拿到 API Key 后，在 Cursor 的 MCP 配置中添加：

```json
{
  "mcpServers": {
    "brave-search": {
      "command": "npx",
      "args": ["-y", "brave-search-mcp"],
      "env": {
        "BRAVE_API_KEY": "你的API密钥"
      }
    }
  }
}
```

配置好后，AI 就能随时帮你搜索最新信息了。

支持网页、图片、视频、新闻等多种类型的内容搜索，甚至能搜索本地商家信息（比如附近的咖啡店）。

![](https://pic.yupi.icu/1/image-20260116111954334.png)

它还带有 AI 摘要功能，能把搜索结果自动总结成简洁的答案。


### ⭐️ Context7 获取最新文档

[Context7](https://context7.com/) 能帮 AI 获取到最新的技术文档。

我们都知道，AI 的训练数据是有截止时间的，比如 GPT-4 的知识可能只更新到 2023 年。这就导致一个问题，当你问 AI 关于某个框架最新版本的用法时，它给出的答案可能是过时的。

Context7 就是来解决这个问题的。它会自动从官方文档网站抓取最新的、特定版本的文档内容，然后提供给 AI。

![](https://pic.yupi.icu/1/image-20260116112229490.png)

这样一来，AI 给出的代码示例和建议就是基于最新文档的，不会去用已经废弃的写法，大大提高了项目能正常运行的概率。


**如何使用？**

访问 [Context7 Dashboard](https://context7.com/dashboard) 注册账号并获取 API Key，个人使用是免费的。

![](https://pic.yupi.icu/1/image-20260116112322940.png)

然后在 MCP 配置中添加：

```json
{
  "mcpServers": {
    "context7": {
      "url": "https://mcp.context7.com/mcp",
      "headers": {
        "CONTEXT7_API_KEY": "你的API密钥"
      }
    }
  }
}
```

之后你在 AI 编程工具中跟 AI 对话时，只要跟技术文档相关，或者主动提一嘴 "use context7"，它就会自动去获取最新文档来回复你。

![](https://pic.yupi.icu/1/image-20260116112656483.png)


### Web to MCP 复刻网页组件

[Web to MCP](https://web-to-mcp.com/) 是一个 Chrome 扩展，搭配 MCP 使用，能把网页上的任何 UI 组件直接发送给 AI，让 AI 生成对应的代码，用最快的速度抄作业！

![](https://pic.yupi.icu/1/image-20260116113052973.png)

很多时候，我在浏览网站时看到一个不错的 UI 组件，想让 AI 帮我实现类似的效果。以前的做法是截图，然后跟 AI 描述：“帮我做一个类似这样的按钮，圆角、渐变色、带阴影……” 既费时又不准确。

有了 Web to MCP，我只需要在网页上点击某个想复刻的元素：

![](https://pic.yupi.icu/1/image-20260116113725321.png)

它就会自动捕获组件的 DOM 结构、CSS 样式、甚至是交互效果，并且给你一个让 AI 复刻组件的提示词。

你只需要把提示词发送给 AI，AI 会调用 MCP 拿到完整的组件信息，并生成代码来复刻组件。

![](https://pic.yupi.icu/1/image-20260116114142631.png)

相比于直接给 AI 模糊的截图，生成的代码更准确了。

![](https://pic.yupi.icu/1/image-20260116114426822.png)


**如何使用？**

1）通过官网或者在 Chrome 应用商店搜索 Web to MCP 来安装扩展

![](https://pic.yupi.icu/1/image-20260116113138693.png)

2）用 Google 账号登录，获取你的 MCP 配置：

![](https://pic.yupi.icu/1/image-20260116113241575.png)

3）在 AI 编程工具的 MCP 配置中添加：

```json
{
  "mcpServers": {
    "web-to-mcp": {
      "url": "https://web-to-mcp.com/mcp/你的唯一ID"
    }
  }
}
```

之后浏览网页时，点击扩展图标，选中你想要的组件，就能直接在 AI 编程工具里引用它，并且快速生成风格一致的代码了。


### Chrome DevTools MCP 浏览器调试

[Chrome DevTools MCP](https://github.com/ChromeDevTools/chrome-devtools-mcp) 是 Chrome 官方团队开发的 MCP 服务器，让 AI 能够直接控制 Chrome 浏览器进行操作和调试。

在做前端开发时，我经常需要调试页面、查看网络请求、分析性能问题。以前这些都得手动在浏览器的开发者工具里操作，现在有了这个工具，我可以直接让 AI 帮我做这些事。

比如我跟 AI 说：“帮我分析当前这个网站加载慢的原因”，它就能打开 Chrome DevTools，分析网络请求、查看资源加载时间，然后告诉我哪里有问题。

![](https://pic.yupi.icu/1/image-20260116115138719.png)

或者我说：“帮我测试一下这个表单提交功能”，它就能自动填写表单、点击提交按钮、查看请求响应。

**如何使用？**

在 MCP 配置中添加：

```json
{
  "mcpServers": {
    "chrome-devtools": {
      "command": "npx",
      "args": ["-y", "chrome-devtools-mcp@latest"]
    }
  }
}
```

配置好后，AI 就能帮你自动化测试、调试页面了。工具会自动连接到你正在运行的 Chrome 浏览器，无需额外设置。

这个工具还支持元素定位、网络请求监控、性能分析、页面截图等功能，非常适合前端开发和测试。


### EdgeOne Pages MCP 一键部署

[EdgeOne Pages MCP](https://github.com/TencentEdgeOne/edgeone-pages-mcp) 是腾讯云团队开发的部署工具，能把你的项目一键部署到腾讯云的加速网络，让别人能访问你的网站，并且给你的网站提速。

开发完项目后，你一定会想让别人访问你的网站。传统的部署流程很繁琐，需要人工打包代码、上传代码到服务器、配置域名、设置 HTTPS 安全证书，一套流程下来得花不少时间。

![](https://pic.yupi.icu/1/%E6%BC%AB%E7%94%BB%E5%9B%BE2%E5%A4%A7.jpeg)

有了 EdgeOne Pages MCP，我直接在 AI 编程工具里跟 AI 说：“帮我部署这个项目”，它就能自动完成打包、上传、部署的全过程，最后给我一个可以直接访问的 URL。而且部署到全球加速网络，各地访问速度都很快。

![](https://pic.yupi.icu/1/1752212029384-16cfba8f-babb-49c0-9d41-3b76ee78eecf.png)


**如何使用？**

首先到 [EdgeOne 控制台](https://console.cloud.tencent.com/edgeone/pages) 开通 Pages 服务：

![](https://pic.yupi.icu/1/1752209404627-3a3193d9-4c94-4f80-ad02-435ff22f16ed.png)

然后获取 API Token，作为调用服务的凭证：

![](https://pic.yupi.icu/1/1752209504079-6741bbd0-438e-48a4-86be-6eddfc3efa83.png)

在 MCP 配置中添加：

```json
{
  "mcpServers": {
    "edgeone-pages-mcp-server": {
      "command": "npx",
      "args": ["edgeone-pages-mcp"],
      "env": {
        "EDGEONE_PAGES_API_TOKEN": "你的API Token"
      }
    }
  }
}
```

配置好后，就能让 AI 帮你一键部署项目了。部署是免费的，支持静态网站、全栈项目、自动配置 HTTPS 和 CDN 加速等功能，非常适合个人项目和小型应用。

![](https://pic.yupi.icu/1/1752211869664-b74dc4d9-57b1-4bb7-9f02-703112b613eb.png)


### COS MCP 对象存储

[COS MCP](https://github.com/Tencent/cos-mcp) 能让 AI 直接操作腾讯云对象存储。

对象存储就是云端的文件存储服务，可以理解为云盘。

![](https://pic.yupi.icu/1/image-20260116120009365.png)

在团队协作开发中，我们经常需要让 AI 参考一些项目规范文档、或者引用一些图片。以前的做法是把这些文件放在本地，然后手动上传给 AI，既不方便，也不利于团队维护、修改和共享。

有了 COS MCP，我可以说一句话把这些需要共享的文件存到云端，然后让 AI 直接去读取。

![](https://pic.yupi.icu/1/image-20260116122211103.png)

比如我跟 AI 说：“按照我们团队 COS 共享的项目规范文档来写这个功能”，它就能自动从 COS 里读取规范文档，然后按照规范来写代码。

![](https://pic.yupi.icu/1/image-20260116122453843.png)


**如何使用？**

1）首先需要开通腾讯云 COS 对象存储服务。访问 [腾讯云 COS 控制台](https://console.cloud.tencent.com/cos)，创建一个存储桶（Bucket）：

![](https://pic.yupi.icu/1/image-20260116120711822.png)

2）然后在 "访问管理" > "API 密钥管理" 中获取 SecretId 和 SecretKey，注意一定不要泄露这些信息！

![](https://pic.yupi.icu/1/image-20260116121022222.png)

3）在 MCP 配置中添加：

```json
{
  "mcpServers": {
    "cos-mcp": {
      "command": "npx",
      "args": [
        "cos-mcp",
        "--Region=你的地域",
        "--Bucket=你的存储桶",
        "--SecretId=你的SecretId",
        "--SecretKey=你的SecretKey"
      ]
    }
  }
}
```

![](https://pic.yupi.icu/1/image-20260116121243549.png)

配置好后，AI 就能读取和管理你云端的文件了，相当于给了 AI 一个网盘。

此外，这个工具还支持图片搜索、图片处理、文档转换、视频封面生成等功能。

![](https://pic.yupi.icu/1/image-20260116121658701.png)


### GitHub MCP 代码仓库管理

[GitHub MCP](https://github.com/github/github-mcp-server) 是 GitHub 官方开发的 MCP 服务器，让 AI 能够直接操作 GitHub 代码仓库。

程序员朋友们对 GitHub 肯定不陌生，这是全球最大的代码托管平台，可以用它来存储代码、团队协作开发。

![](https://pic.yupi.icu/1/image-20260116122621938.png)

在日常开发中，我可能需要搜索 GitHub 代码仓库、创建 Issue 问题反馈、提交 PR 代码合并请求、查看代码变更、分析提交历史等等。以前这些操作都得在 GitHub 网站上手动完成，现在我可以直接让 AI 帮我做。

比如我跟 AI 说：“我最近在 GitHub 上开源了哪些项目？star 数如何？”

![](https://pic.yupi.icu/1/image-20260116123701822.png)

它就能快速给我在 GitHub 上的项目生成一份数据报告：

![](https://pic.yupi.icu/1/image-20260116123734660.png)

或者我说：“帮我看看最近一周的代码变更”，它就能分析 Git 提交记录，告诉我都改了什么。

![](https://pic.yupi.icu/1/image-20260116124022290.png)


**如何使用？**

首先需要在 GitHub 获取到你的 [Access Token](https://github.com/settings/tokens)，作为访问你 GitHub 资源的凭证：

![](https://pic.yupi.icu/1/image-20260116122846165.png)

然后在 MCP 配置中添加：

```json
{
  "mcpServers": {
    "github": {
      "url": "https://api.githubcopilot.com/mcp/",
      "headers": {
        "Authorization": "Bearer 你的GitHub凭证"
      }
    }
  }
}
```

这个工具还支持代码分析、CI/CD 监控、安全扫描等功能，基本上你在 GitHub 中能做的事，AI 都能帮你做。

![](https://pic.yupi.icu/1/image-20260116123148068.png)


## 二、IDE 扩展插件类

MCP 服务器讲完了，接下来聊聊 IDE 扩展插件。

IDE 就是集成开发环境，简单理解就是写代码的软件，比如 VS Code、JetBrains IDEA 这些，可以通过安装插件来增强编辑器的能力，让你的开发体验更上一层楼。

值得一提的是，现在很多有图形界面的 AI 编程工具（比如 Cursor）都是基于 VS Code 开发的，自然也支持 VS Code 的插件，所以下面我也主要分享 VS Code 插件，装上就能用。

![](https://pic.yupi.icu/1/image-20260116124127539.png)


### Claude Code 官方扩展

Claude Code 是 Anthropic 推出的 AI 编程助手，原本是独立的命令行工具。而 [Claude Code VS Code 扩展](https://www.anthropic.com/news/enabling-claude-code-to-work-more-autonomously) 能让你在代码编辑器中直接使用 Claude Code，不用额外打开终端。

在 VS Code 或 Cursor 的扩展商店搜索 "Claude Code" 即可安装：

![](https://pic.yupi.icu/1/image-20260116124255886.png)

这个扩展的优点是提供了图形界面，你可以通过侧边栏面板和 Claude 对话，能够灵活输入文字。

![](https://pic.yupi.icu/1/image-20260116124614180.png)

当 AI 修改代码时，你能在编辑器里实时看到变化，并且自动显示 diff 对比，让你清楚地知道 AI 改了哪些地方。

![](https://pic.yupi.icu/1/image-20260116124700221.png)

我经常用它来重构代码、修复 Bug、添加新功能。它还支持多会话并行，也就是说你可以同时让多个 Claude 代理处理不同的任务，比如一个负责前端，一个负责后端，大大提高开发效率。

![](https://pic.yupi.icu/1/image-20260116124928547.png)

顺带一提，类似的插件还有 Cline、GitHub Copilot 等，功能都差不多，大家可以根据自己的喜好选择。


### GitLens Git 可视化

[GitLens](https://www.gitkraken.com/gitlens) 能让你更直观地查看 Git 代码的修改历史。

![](https://pic.yupi.icu/1/image-20260116125249627.png)

Git 是程序员用来管理代码版本的工具，简单理解就是能记录代码的每一次修改，包括谁改的、什么时候改的、为什么改。

有了这些记录，出了 Bug 时我就能快速找到 “凶手” 追责。

![](https://pic.yupi.icu/1/%E6%BC%AB%E7%94%BB%E5%9B%BE3%E5%A4%A7.jpeg)

但 Git 只是个命令行工具，想查看历史记录还需要手敲命令，看起来也不太舒服。

![](https://pic.yupi.icu/1/image-20260116125146713.png)

当我通过编辑器的扩展商店安装了 GitLens 后，把鼠标放到任意代码行上，GitLens 就会自动显示这行代码的作者、相关的 PR 合并请求等等。

![](https://pic.yupi.icu/1/image-20260116125445257.png)

进入 Git 管理面板，整个项目的提交记录一目了然。

![](https://pic.yupi.icu/1/image-20260116125736701.png)

此外，它还支持 AI 功能，能自动生成提交信息、解释代码变更、生成变更日志、用 AI 解释某次改动的目的。

![](https://pic.yupi.icu/1/image-20260116130129466.png)


### ⭐️ Office Viewer 文档预览

[Office Viewer](https://github.com/cweijan/vscode-office) 能帮你在编辑器里直接预览和编辑各种文档。

![](https://pic.yupi.icu/1/image-20260116130347383.png)

我们知道，AI 输出的文档内容以 Markdown 格式为主，默认的编辑器中打开 Markdown 文件只能看到原始的标记语法，不够直观。

![](https://pic.yupi.icu/1/image-20260116130450441.png)

看长文的时候，我还要用 Typora 等专业的 Markdown 编辑器打开文档，比较麻烦。

在扩展商店搜索 "Office Viewer" 并安装后，可以直接在编辑器中使用所见即所得的 Markdown 编辑器，看文档、写文档都很方便，不用来回切换窗口。

![](https://pic.yupi.icu/1/image-20260116130527681.png)

此外，这个插件支持 Excel 表格、Word 文档、PDF 文档、SVG、字体文件、压缩包等多种格式，堪称编辑器里的万能文档查看器。


### ⭐️ ESLint 代码质量检查

[ESLint](https://eslint.org/) 是前端 JavaScript / TypeScript 项目必备的代码检查工具。

![](https://pic.yupi.icu/1/image-20260116130608877.png)

虽然编辑器本身也能检查一些基本的语法错误，但对于代码规范、潜在的逻辑漏洞等问题，就需要专业的代码检查工具来把关了。

现在很多 AI 生成的项目代码都会自带 ESLint 配置文件（比如 `.eslintrc.js` 或者 `eslint.config.js`），定义好团队统一的代码检查规则。

![](https://pic.yupi.icu/1/image-20260116131035221.png)

在扩展商店搜索 "ESLint" 并安装后，插件会自动检测项目中的规则配置文件，然后实时检查代码中的问题，并给出修复建议。

![](https://pic.yupi.icu/1/image-20260116131356553.png)

这样一来，AI 写的代码如果有不规范的地方，你立刻就能发现并让 AI 修正，避免埋下隐患。


### ⭐️ Prettier 代码格式化

[Prettier](https://prettier.io/) 是一个代码格式化工具，能自动统一代码风格。

![](https://pic.yupi.icu/1/image-20260116130633473.png)

团队协作时，每个人的编码习惯不同，有的代码缩进 4 格、有的缩进 2 格；有的用单引号、有的用双引号。大家的代码风格五花八门，看着就很乱，代码审查时也容易出现 Beef。

这时就需要统一的格式化规范了。现在很多 AI 生成的项目代码都会自带 Prettier 配置文件（比如 `.prettierrc`），定义好统一的格式化规则。

![](https://pic.yupi.icu/1/image-20260116131553797.png)

在扩展商店搜索 "Prettier" 并安装后，就可以用快捷键一键格式化代码。

![](https://pic.yupi.icu/1/image-20260116131725960.png)

还可以在 VS Code 的设置里搜索 "Format On Save" 并开启，这样每次保存代码时就会自动格式化，保证整个项目的代码风格一致。

![](https://pic.yupi.icu/1/image-20260116132036643.png)


### Error Lens 错误实时显示

[Error Lens](https://github.com/usernamehw/vscode-error-lens) 能让你一眼看到代码中的错误。

![](https://pic.yupi.icu/1/image-20260116130706384.png)

一般情况下，如果代码中有错误，你得把鼠标移到红色波浪线上才能看到错误提示，不够直观。

![](https://pic.yupi.icu/1/image-20260116140447236.png)

在扩展商店搜索 "Error Lens" 并安装后，错误信息会直接高亮显示在代码行尾，你一眼就能看到哪里有问题。

![](https://pic.yupi.icu/1/image-20260116140619858.png)


### Console Ninja 控制台日志显示

[Console Ninja](https://github.com/wallabyjs/console-ninja) 能让你在编辑器里直接看到代码的运行结果。

![](https://pic.yupi.icu/1/image-20260116130745078.png)

在调试前端代码时，我经常需要看 `console.log` 打印出来的日志输出。要先切换到浏览器，再按 F12 打开开发者工具来查看控制台，比较麻烦。

![](https://pic.yupi.icu/1/image-20260116140819516.png)

在扩展商店搜索 "Console Ninja" 并安装后，直接在编辑器里就能看到输出结果，看到每个日志是从哪个文件哪一行输出的，还能显示网络请求和错误堆栈。

![](https://pic.yupi.icu/1/image-20260116141109420.png)

有了它，不用频繁切换窗口了，调试效率大大提升。


## 三、Agent Skills 技能类

Agent Skills 是给 AI 装备的技能包，让 AI 在特定任务上表现得更专业。和 MCP 一样，Agent Skills 现在也是 AI 编程生态中不可或缺的一部分，而且它是跨工具通用的开放标准，不绑定特定的编辑器。

详细的 Agent Skills 入门教程可以阅读工具实战目录下的《Agent Skills：通用 AI 技能库》。


### Agent Skills 通用 AI 技能库

[Agent Skills](https://claude.com/blog/skills) 是 Anthropic 新推出的 AI 技能系统。

它定义了一种 **封装 AI 工作流** 的标准：开发者可以把复杂的任务指令、脚本和资源打包成一个 **技能（Skill）**；作为用户，你只需要安装这些技能，AI 就能立刻学会这项本事，不用重复造轮子。

![](https://pic.yupi.icu/1/%E6%BC%AB%E7%94%BB%E5%9B%BE7%E5%A4%A7.jpeg)

让我们来实战一下，利用 [frontend-design](https://www.claudeskill.site/en/skills/anthropic-agent-skills:frontend-design)  这个 Agent Skills 来优化生成网站的界面。

⭐️ 推荐观看视频动画版，更通俗易懂：[https://bilibili.com/video/BV1T7zzBQEaA](https://www.bilibili.com/video/BV1T7zzBQEaA/)

1）安装 Agent Skills

首先打开 Claude Code，输入一行命令，把官方提供的 Skills 注册为插件市场：

```markdown
/plugin marketplace add anthropics/skills
```

![](https://pic.yupi.icu/1/image-20260116145357194.png)

然后输入 `/plugin`，通过 Tab 键切换到 Marketplaces 界面，批量安装官方提供的 Skills。包括：

- document-skills：文档技能包，可以处理 Excel、Word、PPT、PDF 等文档。
- example-skills：示例技能包 ，可以处理技能创建、构建 MCP、视觉设计、算法艺术、网页测试、动图制作、主题样式等。

![](https://pic.yupi.icu/1/claudecode%E6%8F%92%E4%BB%B6%E5%AE%89%E8%A3%85.png)

安装好之后，输入 `/skills` 命令，就能看到所有已经安装完成的技能了，我们要的 `frontend-design` 也在其中。

![](https://pic.yupi.icu/1/image-20260116145938235.png)

可以在本地找到 Skills 的安装位置，你会发现，SKills 的本质就是一组封装好的提示词文档 + 脚本文件等：

![](https://pic.yupi.icu/1/image-20260116151949110.png)

还有另外一种安装方式，也可以在 Claude Code 中输入一行命令来安装 [frontend-design](https://www.claudeskill.site/en/skills/anthropic-agent-skills:frontend-design) 技能。

```markdown
skill install anthropic-agent-skills:frontend-design
```


2）安装完 SKills 后，你只需要和之前一样跟 AI 对话，程序会自动根据你的任务选择使用什么 Skills。

比如我让 AI 开发一个精美的狼人杀网页游戏，它会询问我是否要使用 `frontend-design`  技能。

![](https://pic.yupi.icu/1/image-20260116152325220.png)

使用这个技能后，AI 会选择独特的设计风格，生成的界面既有个性又专业，告别千篇一律的蓝紫渐变色。而且不需要你每次都重复输入一堆设计要求，非常方便！

![](https://pic.yupi.icu/1/image-20260116153402176.png)

不用技能是这样的，对比一下：

![](https://pic.yupi.icu/1/image-20260116155623890.png)

目前 [Anthropic 官方技能仓库](https://github.com/anthropics/skills) 已经提供了丰富的技能集合，涵盖编程相关的数据库优化、API 安全、测试策略、代码审查、文档生成，还有办公相关的 PPT 制作、Excel 处理、Word 文档、PDF 生成等各个方面。

如果官方提供的技能不够用，你还可以上传自定义技能，或者访问以下平台下载社区贡献的技能：

- ⭐️ [鱼皮 AI 导航 - Skills 大全](https://ai.codefather.cn/skills)：持续更新优质技能，释放 AI 执行潜力
- [Claude Skills Hub](https://www.claudeskill.site/)：社区技能市场

![](https://pic.yupi.icu/1/image-20260201150711260.png)

值得一提的是，Agent Skills 现已成为 [通用标准](https://agentskills.io)。除了 Claude，[Cursor](https://cursor.com/docs/context/skills) 等主流 AI 编程工具也会陆续提供支持。也就是说，你在一个工具里用的技能，在另一个工具里也能复用。


### Skills 安装管理工具

**skills CLI**：Vercel 官方出品的命令行工具，一行命令就能安装任何 Skills，简单好用。

用法是 `npx skills add <owner/repo>`，比如 `npx skills add vercel-labs/agent-skills` 就能装上 Vercel 官方的所有 Skills。

> 指路：https://www.npmjs.com/package/skills

![](https://pic.yupi.icu/1/image-20260204114830800.png)


**find-skills**：Vercel 出品的 Skills 发现工具，帮你快速找到和安装需要的 Skills。支持交互式搜索和关键词搜索，用 `npx skills find` 命令即可启动。

> 指路：通过 `npx skills add vercel-labs/skills` 安装

![](https://pic.yupi.icu/1/image-20260204144654011.png)


**skill-creator**：Anthropic 官方的 Skill 创建工具，教你怎么创建自定义 Skill。会引导你按照最佳实践编写 SKILL.md 文件，包括技能描述、触发条件、执行步骤等。

> 指路：通过 `npx skills add anthropics/skills` 安装

![](https://pic.yupi.icu/1/1769307998192-27ac24c2-c732-401d-a19e-ebe07086d73b-20260204144825800.png)


**Skill Seeker**：这个工具牛了，能自动抓取文档网站、GitHub 仓库、PDF 文件，然后直接转换成 Agent Skills，省去了手写技能说明文档的麻烦。支持多源抓取、代码深度分析、一键打包，特别适合给自己常用的库或框架快速生成 Skills。

> 指路：https://github.com/yusufkaraaslan/Skill_Seekers

![](https://pic.yupi.icu/1/image-20260204115524485.png)


**everything-claude-code**：Anthropic 黑客松冠军的完整配置集合，包括 agents、skills、hooks、commands、rules、MCPs，都是实战验证过的配置，拿来就能用。想一次性配置好 Claude Code 的话装这个就够了。

> 指路：https://github.com/affaan-m/everything-claude-code

![](https://pic.yupi.icu/1/image-20260204121536989.png)


### Skills 资源平台

**skills.sh**：Vercel 官方出品的 Skills 排行榜，能看到每个 Skill 的安装量、使用趋势，还支持一键安装。想知道哪些 Skills 最火，来这里看就对了。

> 指路：https://skills.sh

![](https://pic.yupi.icu/1/image-20260204115906122.png)


**鱼皮 AI 导航 - Skills 专区**：我的中文 Agent Skills 导航网站，按分类整理好了几百个 Skills，界面友好、查找方便，适合国内的朋友们使用。

> 指路：https://ai.codefather.cn/skills

![](https://pic.yupi.icu/1/image-20260201150711260.png)


**skillsmp**：自动抓取 GitHub 上所有 Skills 项目，按分类、更新时间、Star 数量整理，数据更新及时。

> 指路：https://skillsmp.com/zh

![](https://pic.yupi.icu/1/image-20260204120006396.png)


**MCP Market**：MCP Market 的每日 Skills 榜单，能看到每天最热门的 Skills 排名，帮你发现新趋势。

> 指路：https://mcpmarket.com/daily/skills

![](https://pic.yupi.icu/1/image-20260204120133997.png)


### Skills 开源合集


**anthropics/skills**：Anthropic 官方 Skills 仓库，包含文档处理（PDF、Word、PPT、Excel）、前端设计、MCP 构建、算法艺术等十几个高质量的 Skills。建议刚开始玩 Skills 的朋友首先安装这个。

> 指路：https://github.com/anthropics/skills

![](https://pic.yupi.icu/1/1769307079120-6aaf2999-fee5-4fdb-a5e3-2ba66824b4de-20260204142715111.png)


**awesome-claude-skills**：Skills 精选列表，收录了各种类型的 Skills，分类清晰，是目前最全的 Skills 合集之一。

> 指路：https://github.com/ComposioHQ/awesome-claude-skills

![](https://pic.yupi.icu/1/image-20260204120329382.png)


**openai/skills**：OpenAI 官方的 Codex Skills 目录。可以通过 Codex 内置的 `$skill-installer` 命令一键安装，让 Codex 在特定任务上表现更专业。

> 指路：https://github.com/openai/skills


**vercel-labs/agent-skills**：Vercel 出品的 React/Next.js 最佳实践，包括 React 开发规范、Web 设计指南、组件组合模式等，做前端的同学必装。

> 指路：https://github.com/vercel-labs/agent-skills


**expo/skills**：Expo 官方的 React Native 开发 Skills。Expo 是一个基于 React Native 的移动应用开发框架，可以让你用 JavaScript / TypeScript 开发 iOS 和 Android 应用。这个 Skills 包括原生 UI 构建、数据获取、部署、CI/CD 等，做移动端开发的朋友可以装上。

> 指路：https://github.com/expo/skills


**kepano/obsidian-skills**：Obsidian 出品的 Skills 集合。Obsidian 是一款基于本地 Markdown 文件的知识管理和笔记应用，深受程序员和知识创作者喜爱。

这些 Skills 能增强 Obsidian 的功能，让 AI Agent 能更好地管理你的笔记和知识库。

> 指路：https://github.com/kepano/obsidian-skills

![](https://pic.yupi.icu/1/image-20260204125639748.png)


**stripe/ai**：Stripe 官方 AI Skills。Stripe 是全球领先的在线支付处理平台，被无数互联网公司用于收款。

这个 Skills 包含金融支付相关的最佳实践，比如优先使用 Checkout Sessions API、动态支付方式配置、订阅计费集成等，做支付功能的朋友可以参考。

> 指路：https://github.com/stripe/ai


**trailofbits/skills**：Trail of Bits 安全公司出品的 Skills，专注安全研究和漏洞检测。内容非常丰富，包含智能合约安全审计、Burp Suite 项目解析、Semgrep 规则创建、YARA 恶意软件检测规则编写、差异化代码审查、常量时间分析、属性测试等 20+ 个安全相关插件，强烈推荐给安全方向的朋友。

> 指路：https://github.com/trailofbits/skills


**Notion Skills**：Notion 官方出品的 Skills，让 AI 能更好地与 Notion 工作区交互。可以帮你自动整理会议记录和待办事项、帮你整理和组织研究资料等，适合重度使用 Notion 的朋友。

> 指路：https://www.notion.so/notiondevs/Notion-Skills-for-Claude-28da4445d27180c7af1df7d8615723d0

![](https://pic.yupi.icu/1/image-20260204143151405.png)


### 项目开发 Skills

**superpowers**：一套完整的 AI 编程技能框架和软件开发方法论。它包含十几个可组合的编程技能，比如头脑风暴、编写计划、执行计划、TDD 测试驱动开发、系统性调试、代码审查等。

装了它之后，AI 不会直接开始写代码，而是会先问清楚需求、出设计方案让你确认、制定详细执行计划，最后才分步骤实现。适合开发大型项目、需要高质量代码的场景。

> 指路：https://github.com/obra/superpowers

![](https://pic.yupi.icu/1/01-AI%E8%8E%B7%E5%BE%97%E8%B6%85%E8%83%BD%E5%8A%9B%E6%A2%97%E5%9B%BE.jpeg)


**planning-with-files**：被 X 上的开发者评为最强 Skill！它借鉴了被 Meta 以 20 亿美元收购的 Manus AI 的核心工作模式：用 Markdown 文件作为 AI 的外部记忆，解决 AI 上下文丢失的问题。适合多步骤任务、研究任务、跨多次对话的项目开发，让 AI 在复杂项目中也能保持清醒不跑偏。

> 指路：https://github.com/OthmanAdi/planning-with-files


**ui-ux-pro-max**：专业前端设计 Skill，让 AI Agent 具备专业设计师的能力，生成的界面不再是千篇一律的 AI 风格。支持各种主流 AI 编程工具，强烈推荐。

> 指路：https://github.com/nextlevelbuilder/ui-ux-pro-max-skill

![](https://pic.yupi.icu/1/image-20260204143423578.png)


**vercel-react-best-practices**：Vercel 出品的 React 最佳实践，让 AI 按照 React 官方推荐的模式来写代码，包括组件设计、状态管理、性能优化等规范，避免写出反模式的代码。做 React 项目必装。

> 指路：通过 `npx skills add vercel-labs/agent-skills` 命令安装


**web-design-guidelines**：Web 设计规范 Skill，包含间距、颜色、排版、响应式设计等专业设计规范，让 AI 生成的页面更加美观，而不是千篇一律的 AI 风格。

> 指路：通过 `npx skills add vercel-labs/agent-skills` 命令安装


**frontend-design**：Anthropic 官方的前端设计 Skill，帮你开发独具辨识度的生产级前端界面。

> 指路：通过 `npx skills add anthropics/skills` 安装


**vue-skills**：Vue.js 最佳实践 Skills，尤雨溪团队成员维护。让 AI 按照 Vue 生态的最佳实践来写代码，包括 Vue 3 组合式 API、Vite 构建配置、Vitest 单元测试、Pinia 状态管理、UnoCSS 样式方案等。做 Vue 项目必装。

> 指路：https://github.com/vuejs-ai/skills


**supabase-postgres-best-practices**：Supabase 出品的 PostgreSQL 数据库最佳实践，教 AI Agent 怎么写出高质量的数据库代码，包括查询优化、索引设计等。

> 指路：https://github.com/supabase/agent-skills

![](https://pic.yupi.icu/1/image-20260204143740866.png)


### 浏览器自动化 Skills

**browser-use**：让 AI Agent 能访问和操作网站的工具（不仅是 Skill，也可以独立使用），功能强大，可以用来做自动化测试、数据抓取、网页操作等。

> 指路：https://github.com/browser-use/browser-use


**agent-browser**：Vercel 出品的浏览器自动化 Skill，让 AI Agent 能操作浏览器。比如可以自动填表单、点击按钮、截图、抓取动态渲染的内容等，非常适合做端到端测试、自动化爬虫、网页监控等场景。

> 指路：https://github.com/vercel-labs/agent-browser


### 内容创作 Skills

**remotion-dev/skills**：Remotion 官方出品的视频动画制作 Skills，能用 Claude Code 一句话生成可编辑的动画视频，几分钟就能做出专业效果，最近特别火。

> 指路：https://github.com/remotion-dev/skills

![](https://pic.yupi.icu/1/68747470733a2f2f7075622d36343664383038643963623234306365613533626564633736646433636430632e72322e6465762f66697265736869702d717569636b2e676966.gif)


**baoyu-skills**：宝玉老师自用的 Skills 集合，包括公众号文章写作、PPT 制作、封面图生成、小红书配图、漫画生成等，对内容创作者非常有帮助，直接把大佬的创作工作流复制过来用。

> 指路：https://github.com/JimLiu/baoyu-skills

![小红书配图技能](https://pic.yupi.icu/1/image-20260204144449881.png)


**humanizer**：去除 AI 生成痕迹的 Skill，让 AI 写的文章更像人写的。

> 指路：https://github.com/blader/humanizer


**heygen-com/skills**：HeyGen 官方的 Skills。HeyGen 是一个 AI 数字人视频生成平台，可以用虚拟人物来制作视频。这个 Skills 让 AI 能调用 HeyGen API 生成数字人视频，包括选择虚拟形象、配置语音、生成透明背景视频、视频翻译配音等功能，还支持和 Remotion 集成做程序化视频合成。

> 指路：https://github.com/heygen-com/skills


### 网站审计 Skills

**seo-audit**：SEO 审计 Skill，帮你分析网站的 SEO 问题并给出优化建议。来自 marketingskills 仓库，该仓库还有 25+ 个营销相关技能，涵盖转化优化、文案撰写、数据分析、增长策略等。

> 指路：https://github.com/coreyhaines31/marketingskills


**audit-website**：网站安全审计 Skill，基于 squirrelscan 工具，包含 230+ 条审计规则，覆盖 SEO、性能、可访问性、内容和安全等 21 个类别，还能检测 96 种泄露的密钥。

> 指路：https://github.com/squirrelscan/skills


## 四、跨编辑器通用工具

接下来聊聊跨编辑器通用的工具。这些工具不依赖特定的编辑器，适用于 Cursor、VS Code、Claude Code、GitHub Copilot 等几乎所有主流的 AI 编程工具。


### Spec-kit 规范驱动开发

[Spec-kit](https://speckit.org/) 是 GitHub 推出的规范驱动开发（SDD）框架。

什么是 SDD 呢？

传统开发流程是：想到什么写什么，边写边改，最后再补文档。这样容易导致需求不清晰、代码和文档对不上。

而规范驱动开发的思路正好相反：先把需求写成规范文档，并且把规范文档当作代码的 **唯一真相来源**。你可以把规范文档理解为 **法律条文**，它包含了详细的需求描述、系统设计和接口定义。AI 必须严格遵守这些条文来生成代码，确保产出完全符合预期。

![](https://pic.yupi.icu/1/%E6%BC%AB%E7%94%BB%E5%9B%BE4%E5%A4%A7.jpeg)

听起来有些抽象，我们可以跟着 [Spec-kit GitHub 仓库](https://github.com/github/spec-kit) 的官方文档来实战一下。

首先打开终端，利用 uvx 命令直接安装运行 Specify 工具，并初始化一个项目：

```bash
uvx --from git+https://github.com/github/spec-kit.git specify init my-project
```

![](https://pic.yupi.icu/1/image-20260116141308958.png)

选择你使用的 AI 编程工具，Spec-kit 支持 Claude Code、GitHub Copilot 等几乎所有主流编程工具。这里我选 Claude Code：

![](https://pic.yupi.icu/1/image-20260116141507190.png)

根据操作系统选择脚本类型，Windows 选下面的，其他选上面的：

![](https://pic.yupi.icu/1/image-20260116141537030.png)

执行完这个命令后，会在当前目录下创建一个 `my-project` 文件夹：

![](https://pic.yupi.icu/1/image-20260116141613246.png)

文件夹里面包含了这些核心文件：

- `.specify/memory/constitution.md`：项目的基本准则和约定
- `.specify/scripts/`：一些可执行脚本
- `.specify/templates/`：模板文件
- `.claude/commands/`：定义了一套内置的斜杠命令，让你在 AI 编程工具中可以直接调用

![](https://pic.yupi.icu/1/image-20260116142528820.png)

初始化程序还给了我们一些指引，告诉我们接下来如何运用这些命令来开发项目。

![](https://pic.yupi.icu/1/image-20260116141715310.png)

用 Claude Code 打开这个项目文件夹，就可以在对话中使用定义好的命令了。

![](https://pic.yupi.icu/1/image-20260116142740271.png)

接下来就是标准化的开发流程，参考 [官方文档](https://github.com/github/spec-kit)，主要分为 7 个步骤：

1）Constitution 制定项目准则

运行 `/speckit.constitution` 命令，定义项目的基本原则、代码规范、性能标准等。这是项目的 “宪法”，后续所有开发都要遵守。

比如：

```markdown
/speckit.constitution 禁止使用蓝紫渐变色风格的 UI
```

💡 如果你要做中文项目，最好在制定项目准则时就明确告诉 AI “整个网站使用中文”。

![](https://pic.yupi.icu/1/image-20260116160508054.png)

AI 更新了项目准则文档：

![](https://pic.yupi.icu/1/image-20260116160610169.png)

建议每一步我们都用 Git 提交一个版本，这样出了问题后能及时回滚，也便于我们看到每一步改动的文件。

![](https://pic.yupi.icu/1/image-20260116160745548.png)


2）Specify 编写功能规范

运行 `/speckit.specify` 命令，描述要做什么功能、为什么做、用户需求是什么。比如：

```markdown
/speckit.specify 我想做个【自动提醒我喝水的网站】
```

![](https://pic.yupi.icu/1/image-20260116161231223.png)

AI 为这次的需求创建了一个新的 Git 分支，防止污染现有项目。在这个分支下创建了一个需求规格文档（spec.md） + 一个需求检查文档（requirements.md）。

![](https://pic.yupi.icu/1/image-20260116161307642.png)

需求规格文档非常详细，还包含了边缘测试用例，针对用户各种可能的操作进行处理。

![](https://pic.yupi.icu/1/image-20260116161926017.png)

需求检查文档中记录了 AI 对于需求的理解，打钩表示 AI 理解并确认了：

![](https://pic.yupi.icu/1/image-20260116161500358.png)


3）Clarify 澄清不明确的地方（可选）

如果你发现需求检查文档中有的条目没有打钩，那你需要通过 Clarify 命令来让 AI 引导你进一步明确需求，直到所有的条目都打上勾。

运行 `/speckit.clarify` 命令，AI 会提出结构化的问题，让你来回答。从而帮你填补需求中的空白，比如边界情况、错误处理等。

![](https://pic.yupi.icu/1/image-20260116162702812.png)

我运气不错，不需要这一步 AI 就已经理解了所有条目，接下来可以进入制定技术方案阶段。

![](https://pic.yupi.icu/1/image-20260116162201772.png)


4）Plan 制定技术方案

运行 `/speckit.plan` 命令，让 AI 决定用什么技术栈、系统架构、数据模型、API 接口等。

![](https://pic.yupi.icu/1/image-20260116163506902.png)

制定技术方案完成，这次生成了一大堆文档，简单了解一下：

- CLAUDE.md 项目开发指南，记录技术栈和项目结构，用于指导 Claude Code 接下来如何开发
- quickstart.md 快速入门指南，包含 6 个实施阶段和部署方案
- plan.md 实施方案，定义了纯客户端架构、存储策略、宪法合规性检查等
- data-model.md 数据模型设计，定义了 4 个核心实体（提醒设置、水量日志、每日进度、历史记录）和存储结构
- research.md 技术研究文档，记录了 8 项关键技术决策
- contracts/api-contract.md API 接口文档

![](https://pic.yupi.icu/1/image-20260116164021646.png)

接下来，我们就可以准备开发实现了。

![](https://pic.yupi.icu/1/image-20260116163553725.png)


5）Tasks 拆解任务

运行 `/speckit.tasks` 命令，把计划拆解成可执行的任务列表，并标注依赖关系和优先级。

![](https://pic.yupi.icu/1/image-20260116164537006.png)

生成了一个任务列表文档，每一步要做什么都非常清晰：

![](https://pic.yupi.icu/1/image-20260116164612533.png)


6）Analyze 分析检查（可选）

运行 `/speckit.analyze` 命令，检查规范、计划、任务是否完整一致，提前发现设计缺陷。

![](https://pic.yupi.icu/1/image-20260116164936733.png)

可以看到，AI 没有检查出问题，还让我自信地进行下一步，真爽死了！


7）Implement 执行实现

最后，运行 `/speckit.implement` 命令，让 AI 按照任务列表生成代码。

![](https://pic.yupi.icu/1/image-20260116170006815.png)

大功告成，看一下效果~

![](https://pic.yupi.icu/1/image-20260116170146827.png)

因为我这里始终没有提到使用中文输出，所以网站内容都是英文的，不过我感觉效果还可以。

到这里，我们已经学会了如何用 Spec-kit 开发完整项目，再复习一下完整流程：

![](https://pic.yupi.icu/1/%25E6%25BC%25AB%25E7%2594%25BB%25E5%259B%25BE5%25E5%25A4%25A7.jpeg)

即使不用 Spec-kit，我们开发完整项目时也可以人工遵循这些步骤。

这种模式最大的好处是 **对齐**。所有人都基于同一份清晰的规范文档工作，大家对需求的理解高度一致，既减少了沟通中的误解，又能确保代码质量。

不过缺点也很明显，对于小项目，本来直接写代码几分钟就能搞定了，上面这套流程走下来差不多要半个小时！

所以这套流程比较适合团队从 0 开始做完整的新项目，虽然流程比直接写代码慢一些，但能大大降低返工的风险，长远来看反而更高效。


### OpenSpec 轻量规范框架

[OpenSpec](https://openspec.dev/) 是一个轻量的规范驱动开发框架，比 Spec-kit 更简单易用。

它的核心理念是把规范文档作为代码库的一部分，每次改功能都 **先写变更提案** => 确认后再实现 => 实现完再把变更归档到规范文档中，让文档和代码始终保持同步。

![](https://pic.yupi.icu/1/%E6%BC%AB%E7%94%BB%E5%9B%BE6%E5%A4%A7.jpeg)

访问 [OpenSpec 官方仓库](https://github.com/Fission-AI/OpenSpec/) 查看文档。

首先确保你的电脑安装了符合要求的 Node.js 版本（比如我这里要求 Node.js >= 20.19.0），然后全局安装 OpenSpec CLI：

```bash
npm install -g @fission-ai/openspec@latest
```

进入你的项目目录，运行初始化命令：

```bash
openspec init
```

初始化过程中会让你选择要集成的 AI 工具（比如 Claude Code、Cursor 等），我这里选择 Cursor。

![](https://pic.yupi.icu/1/image-20260116163202471.png)

运行命令后，OpenSpec 会自动在你的项目中生成一个 `openspec/` 目录，里面包含：

- `openspec/specs/`：存放主规范文档，记录了项目的完整现状
- `openspec/changes/`：存放变更提案，记录了每次修改的计划
- ⭐️ `openspec/AGENTS.md`：让 AI 编程助手使用 OpenSpec 进行规范驱动开发的操作指南，包含了如何创建变更提案、编写需求规范、验证和归档变更的完整工作流程。
- `openspec/project.md`：当前项目的上下文说明（用来记录项目的信息）

![](https://pic.yupi.icu/1/image-20260116164308965.png)

此外，还会根据你选择的 AI 编程工具，生成对应的命令文件，比如 Cursor 的：

![](https://pic.yupi.icu/1/image-20260116173814973.png)

有了这些文件，我们就可以开始规范化的开发流程了。参考 [官方文档](https://github.com/Fission-AI/OpenSpec/)，主要分为 5 个步骤：

1）Draft 起草变更提案

直接在 AI 编程工具中跟 AI 说，让它创建变更提案。比如我想添加用户搜索功能：

```markdown
创建一个 OpenSpec 的 change，添加功能：根据名称和邮箱搜索用户
```

也可以用 AI 编程工具（比如 Claude Code、Cursor）的斜杠命令：

```markdown
/openspec:proposal 添加功能：根据名称和邮箱搜索用户
```

![](https://pic.yupi.icu/1/image-20260116171714070.png)

AI 会给这个功能创建一个独立的目录 `openspec/changes/add-user-search/`，目录下创建一系列文档：

- `proposal.md`：描述要改什么、为什么改
- `tasks.md`：实施步骤的任务分解
- `specs/…/spec.md`：需求变更的具体内容

![](https://pic.yupi.icu/1/image-20260116171953809.png)


2）Verify & Review 验证和审查

可以运行下列命令，查看 AI 创建的变更提案是否正确：

```bash
openspec list                        # 查看所有变更
openspec validate add-user-search    # 验证格式是否正确
openspec show add-user-search        # 查看详细内容
```

![](https://pic.yupi.icu/1/image-20260116172259055.png)


3）和团队一起审查提案

如果需要完善，可以继续跟 AI 对话，比如：

```markdown
你能帮我添加更多搜索条件和限制么？
```

AI 会更新规范和任务列表，直到大家达成一致。


4）Implement 实现变更

规范确认后，让 AI 开始实现：

```markdown
规范已经很完美了，开始生成代码吧
```

也可以用斜杠命令：

```markdown
/openspec:apply add-user-search
```

AI 会按照 `tasks.md` 中的任务列表逐一实现，并标记完成状态。

![](https://pic.yupi.icu/1/image-20260116172654371.png)

很快生成完成，AI 的输出非常整齐，所有改动一目了然：

![](https://pic.yupi.icu/1/image-20260116172905921.png)


5）Archive 归档变更

所有任务完成后，让 AI 归档这次变更：

```markdown
请归档这次变更
```

也可以用斜杠命令：

```markdown
/openspec:archive add-user-search
```

或者在终端运行：

```bash
openspec archive add-user-search --yes
```

![](https://pic.yupi.icu/1/image-20260116172957759.png)

这个命令会：

- 将变更文件夹移动到 `openspec/changes/archive/` 归档区
- 将需求变更自动合并到 `openspec/specs/` 主规范中
- 保持文档和代码的同步

![](https://pic.yupi.icu/1/image-20260116174247313.png)

这样一来，通过 `openspec/changes/` 的历史记录，你可以随时追溯每次变更的来龙去脉。

此外，整个开发过程中，建议大家定期运行 `openspec validate` 验证命令， 确保规范的完整性。


---


到这里，相信大家也能感受到 OpenSpec 和 Spec-kit 的区别了。

- Spec-kit 需要完整的 7 步流程：制定准则 → 写需求 → 澄清疑问 → 定方案 → 拆任务 → 检查 → 写代码），适合从 0 开始做大型新项目
- OpenSpec 的流程更简化：起草提案 → 审查 → 实现 → 归档 → 验证，上手更快，适合在现有项目上迭代功能。


### AIChat 命令行增强工具

[AIChat](https://github.com/sigoden/aichat) 是一个功能完善的 AI 命令行助手，集成了 20+ 主流大模型。

现在主流的 AI 编程工具（Cursor、VS Code 等）都内置了终端，有时我们需要敲命令来执行任务，但是命令记不住怎么办？

用了 AIChat 后，你只需要在终端中说人话，它的 **Shell 助手** 能力就会把你的自然语言自动转换成准确可执行的命令。

使用方法非常简单。打开终端，通过包管理器一行命令就能安装：

```bash
# macOS/Linux
brew install aichat

# Windows
scoop install aichat
```

安装完成后，运行 `aichat` 命令，首次执行会引导你创建配置，选择你要用的大模型并填写 API Key：

![](https://pic.yupi.icu/1/image-20260116143602756.png)

然后就可以愉快地跟 AI 对话了：

![](https://pic.yupi.icu/1/image-20260116143719965.png)

但是我个人主要用它的 Shell 助手能力（给命令添加 `-e` 选项），而不是 AI 对话能力。

![](https://pic.yupi.icu/1/ai-chat-e.gif)

比如我想批量重命名文件，但不记得命令怎么写，在终端里执行下列命令：

```markdown
aichat -e 帮我把当前目录下所有 .txt 文件改成 .md
```

它就会生成对应的 shell 命令，我确认后它就自动执行了。

![](https://pic.yupi.icu/1/image-20260116144218847.png)

还可以通过快捷键来智能补全命令：

![](https://pic.yupi.icu/1/ai-chat-completion.gif)

除了 Shell 助手，AIChat 还有一些进阶功能。比如支持 RAG 检索增强生成，可以让 AI 基于你的本地文档回答问题；支持创建 AI 代理，把指令、工具和文档组合成自动化工作流。

![](https://pic.yupi.icu/1/ai-chat-agents.png)

此外，如果你想对比不同模型的效果，运行 `aichat --serve` 可以启动本地网页界面，同时对比多个模型的回答。

![](https://pic.yupi.icu/1/ai-chat-compare-model.png)


## 五、AI 的效率工具箱

前面介绍的 MCP、插件、Skills 都是跑在 AI 编程工具里的扩展。而接下来要介绍的这些开源项目，本身就是独立的效率工具 —— 它们天生就是为 AI 设计的，让 AI 能读文件、听语音、剪视频、连接外部服务，从一个只会聊天的嘴强王者，变成真正能干活的六边形战士。


### AI 的阅读器 - 文件处理工具

日常工作中，很多资料都是 PDF、Word、Excel、PPT 格式的。但 AI 默认只能读纯文本，你直接把一个 PDF 丢给它，大概率读不出什么有用的东西。

解决方法很简单：AI 最喜欢 Markdown 了，那不妨把文件先转成 Markdown，再交给它处理就好了。


**MarkItDown**

[MarkItDown](https://github.com/microsoft/markitdown) 是微软开源的万能格式转换器。PDF、Word、Excel、PPT、图片、音频、HTML，甚至 YouTube 视频，它都能一把梭转成 Markdown。

> 开源指路：https://github.com/microsoft/markitdown

![](https://pic.yupi.icu/1/image-20260403142348396.png)

安装和使用非常简单，一行 pip 命令搞定：

```bash
pip install markitdown
```

装好之后，在终端输入一行命令就能转换文件。而且它还提供了 MCP Server，可以直接接入到 AI 编程工具中。之后你在项目里丢一个 PDF 或 Word 文件让 AI 分析，它就会自动调用 MarkItDown 先转成 Markdown 再处理，非常丝滑。

![](https://pic.yupi.icu/1/image-20260403142531441.png)

MarkItDown 的优点在于格式覆盖广，几乎啥格式都能转。但遇到排版很复杂的 PDF，比如论文里的多栏排版、数学公式、复杂表格，就有点力不从心了。

这时候可以看看下面两个更专业的工具。


**MinerU**

[MinerU](https://github.com/opendatalab/MinerU) 专攻 PDF 深度解析，能把公式转成 LaTeX、表格转成 HTML，还能自动提取图片，最终输出的是包含图文的多模态 Markdown。如果你经常需要处理论文、技术报告这类排版复杂的文档，MinerU 比 MarkItDown 更靠谱。

> 开源指路：https://github.com/opendatalab/MinerU

![](https://pic.yupi.icu/1/image-20260403143732593.png)


**Docling**

[Docling](https://github.com/docling-project/docling) 是 IBM 开源的文档解析工具。除了 PDF 之外还支持 Word、PPT、Excel、图片，在复杂文档的版面理解和结构还原上比 MarkItDown 更强。甚至装上语音识别扩展后还能处理音视频，提取音轨转成文字。

> 开源指路：https://github.com/docling-project/docling

![](https://pic.yupi.icu/1/image-20260403143816972.png)

简单来说：日常转换选 MarkItDown，论文公式选 MinerU，复杂版面选 Docling，按需搭配就好。


### AI 的耳朵和剪辑师 - 音视频工具

除了文档，音视频也是我们日常工作中经常打交道的内容。会议录音要整理、视频素材要下载、格式要转换……这些活儿交给 AI 来做，效率高到飞起。


**whisper.cpp**

[whisper.cpp](https://github.com/ggml-org/whisper.cpp) 是 OpenAI Whisper 模型的 C/C++ 移植版，纯本地运行的语音转文字工具。最大的优势就是不需要 GPU 也不需要联网，CPU 就能跑，完全不用担心隐私数据外泄。

转录会议录音、播客、视频字幕都不在话下，支持多种语言的语音识别，还能自动检测语种，丢进去一段音频就能出文字。

> 开源指路：https://github.com/ggml-org/whisper.cpp

![](https://pic.yupi.icu/1/image-20260403144636577.png)


**yt-dlp**

[yt-dlp](https://github.com/yt-dlp/yt-dlp) 是一个视频下载神器，支持上千个网站，包括 YouTube、B 站、TikTok、Twitter 等等，你能想到的基本都有。

它是纯命令行工具，AI 调用起来非常丝滑，指定一个 URL 和输出格式就完事了。还能选择分辨率、提取纯音频、下载字幕，功能非常全面。

> 开源指路：https://github.com/yt-dlp/yt-dlp

![](https://pic.yupi.icu/1/image-20260403151136014.png)


**FFmpeg**

[FFmpeg](https://github.com/FFmpeg/FFmpeg) 可能是整个计算机历史上最重要的开源项目之一，几乎所有涉及音视频的软件底层都在用它。不管是转码、裁剪、拼接、加字幕、提取音频还是转换格式，一条命令就能搞定。

人类记 FFmpeg 参数头皮发麻，但 AI 记参数可太擅长了！比如你跟 AI 说 "把这个视频裁剪前 30 秒并转成 GIF"，它立刻就能生成对应的 FFmpeg 命令并执行。换成人工操作，可能还得先去搜半天参数……

> 开源指路：https://github.com/FFmpeg/FFmpeg

![](https://pic.yupi.icu/1/image-20260403152202764.png)

组合使用的话，yt-dlp 负责下载素材，whisper.cpp 负责语音转文字，FFmpeg 负责音视频处理，三板斧一套下来，AI 就能完成从下载、转录到剪辑的完整工作流了。


### AI 的手脚 - 浏览器自动化

前面在 Skills 板块已经提到了 [Browser Use](https://github.com/browser-use/browser-use)，这里再展开聊聊。

Browser Use 不仅是一个 Skill，它本身也是一个功能强大的独立框架 —— 基于 Python 的浏览器自动化工具，让 AI 能像真人一样操控浏览器。

比如你跟 AI 说：“帮我打开某个网站，找到 Java 学习路线并截图。”

它就能一步步完成，支持点击、输入、滚动等各种操作，甚至支持多标签页操作和自动规划执行步骤，复杂的多步任务也能搞定。

> 开源指路：https://github.com/browser-use/browser-use

![](https://pic.yupi.icu/1/image-20260403141700375.png)

适合用来做自动化测试、批量数据抓取、后台系统的重复性操作等场景。它的底层基于微软开源的 Playwright 浏览器自动化框架，稳定性和兼容性都不错。


### AI 的百宝箱 - 外部服务集成

想让 AI 帮你发邮件、创建 GitHub Issue、更新 Notion 文档、给聊天软件发消息？这些事情每个都要对接不同的平台和 API，认证方式也各不相同，一个个对接起来很麻烦。

[Composio](https://github.com/ComposioHQ/composio) 就是帮 AI 搞定这些脏活累活的。它预先集成了 1000+ 外部服务，帮你处理好 OAuth 认证、API 调用、错误重试这些细节。AI 只需要调一个函数就能操作 GitHub、Gmail、Slack、Notion 等各种平台，省去了逐个对接的痛苦。

> 开源指路：https://github.com/ComposioHQ/composio

![](https://pic.yupi.icu/1/image-20260403152926005.png)

不管你用 Python 还是 TypeScript 开发 AI 应用，都能直接用上。官方还提供了不少现成的应用模板，拿来就能用。


### AI 的备忘录 - 记忆管理

用过 AI 编程的同学应该都有过这种体验：跟 AI 聊了好几轮的需求和技术细节，结果一开新对话，它全忘了，又得从头介绍一遍。

虽然现在不少 AI 编程工具已经自带了记忆管理功能，但如果你想自己开发 AI 应用，记忆这块儿就得自己解决。

[Mem0](https://github.com/mem0ai/mem0) 能给 AI 装上一个持久记忆层。它会自动从对话中提取关键信息存到数据库里，下次对话时自动检索出来。这样一来，AI 能记住你喜欢用什么编程语言、你的项目用了什么技术栈、上次聊到哪了，下次对话直接接着来，不用重复交代背景了。

> 开源指路：https://github.com/mem0ai/mem0

![](https://pic.yupi.icu/1/image-20260403150058803.png)

它支持用户级、会话级、Agent 级三层记忆管理，不同用户的上下文不会互相混淆。如果你在学 AI 应用开发，建议研究一下 Mem0 的记忆系统实现，很有参考价值。


## 写在最后

看到这里，相信你已经了解了各种实用的 AI 编程扩展。

其中标星 ⭐️ 的是我强烈建议安装的：

- Firecrawl MCP：让 AI 能抓取网页内容
- Context7：获取最新技术文档
- EdgeOne Pages MCP：一键部署项目
- Office Viewer：在编辑器中预览文档
- ESLint + Prettier：保证代码质量
- Agent Skills：给 AI 装备专业技能包

其他的扩展你可以按需选择。刚开始学习时，不要贪多，先把基础的用熟练了，再逐步尝试其他工具。


## 推荐资源

1）鱼皮 AI 导航网站：[AI 资源大全、最新 AI 资讯、免费 AI 教程](https://ai.codefather.cn)

2）编程导航学习圈：[学习路线、编程教程、实战项目、求职宝典、交流答疑](https://www.codefather.cn)

3）程序员面试八股文：[实习/校招/社招高频考点、企业真题解析](https://www.mianshiya.com)

4）程序员写简历神器：[专业模板、丰富例句、直通面试](https://www.laoyujianli.com)

5）1 对 1 模拟面试：[实习/校招/社招面试拿 Offer 必备](https://ai.mianshiya.com)