# Vibe Coding 成本控制技巧 > 让每一分钱都花在刀刃上 你好,我是鱼皮。 自从给我们团队提供 Cursor AI 之后,公司的利润是越来越少了,大家是真的疯狂压榨 AI。来给大家看看账单,才一个月就花了 **1 万多**! ![](https://pic.yupi.icu/1/image-20260307122517349.png) 这钱都够招一个人了啊! 我接受用 AI 花钱,但是咱不能花冤枉钱对吧? 在 Vibe Coding 中,成本主要来自 AI 大模型的使用。你给 AI 看的内容越多、AI 输出的内容越多,花的钱就越多。下面我就来分享一些实用的省钱技巧,让你的每一分钱都花在刀刃上,《最省钱的一集》。 友情提示,接下来要分享的技巧较多,为了便于大家理解,建议大家把自己想象成公司的创始人,你招了一位 AI 员工。 没错,你就是老板,你就是大资本家啊! ![](https://pic.yupi.icu/1/1763521575578-7b8446be-3f4b-477b-88d7-4c191c6e0e5d-20260307122623476.png) 接下来我们要学的就是,**怎么给更少的钱让 AI 干更多的活**,建议收藏~ ⭐️ 本文对应视频:https://www.bilibili.com/video/BV1pAy5BXE5z ## 一、AI 使用成本分析 在讲省钱技巧之前,我们先要理解 AI 是怎么收费的。 ### Token 计费机制 大多数 AI 服务都是按 token 计费的。Token 可以简单理解为字符数,你给 AI 看的内容(输入)越多、AI 输出的内容越多,花的钱就越多。 实际上 token 还分为 4 种类型,价格各不相同: - 输入 token:你发给 AI 的内容(提示词、引用的文件、对话历史等) - 输出 token:AI 生成的回复内容(价格是输入的 3 ~ 5 倍) - 缓存写入 token:AI 第一次处理你的上下文时,会把计算结果存起来(比如引用的文件、对话历史这些重复出现的内容),比普通输入略贵一点 - 缓存读取 token:后续再用相同的上下文时,直接复用缓存,价格只有普通输入的 1/10,非常便宜 举个例子,如果你给 AI 一个 1000 字的提示词,AI 回复了 2000 字的代码,那么: - 输入 token:约 1500(中文一个字大概 1.5 个 token) - 输出 token:约 3000 - 总共:4500 token 按照不同模型的定价,这次对话可能花费 0.01 到 0.1 美元不等。看起来不多对吧?但如果你一天对话 100 次,一个月下来就是几十到几百美元了。。。 ![](https://pic.yupi.icu/1/aitokenscompute%252525E5%252525A4%252525A7.jpeg) ### 输入和输出的价格差异 一个很重要的点是,**输出 token 一般比输入 token 贵 3 ~ 5 倍**。 比如 Claude Opus 的定价(2026 年 3 月): - 输入:每百万 token 约 5 美元 - 输出:每百万 token 约 25 美元 也就是说,让 AI 少说几句话,比让它少看点东西更能省钱。所以一定要管住 AI 的嘴。 ### 上下文的隐藏成本 很多人不知道,每次你发消息时,整个对话历史都会作为上下文发送给 AI。如果你在一个对话里聊了 50 轮,那么第 51 次发消息时,前面 50 轮的内容都会重新发送一次。 ![](https://pic.yupi.icu/1/tokencontext%E5%A4%A7.jpeg) 这就是为什么长对话会特别费钱,聊得越久越烧钱。而且,当输入超过 20 万 token 时,很多服务的价格会直接翻倍! ## 二、选择合适的模型 ### 了解模型定价 首先要了解不同模型的定价,能帮你做出更明智的选择。 由于实际价格会持续变动,建议以你使用的 AI 工具的官方文档为准,比如 Cursor 的 [模型定价页面](https://cursor.com/cn/docs/models)。 ![](https://pic.yupi.icu/1/image-20260307122806578.png) ### 如何选择模型? 不是所有任务都需要用最贵的模型。对于简单任务,比如代码格式化、简单重构、写注释、写文档、生成测试数据、简单的 bug 修复,用便宜的 Gemini 2.5 Flash 或 GPT-5 Mini 就够了。 中等难度的任务,比如实现常规功能、代码审查、性能优化、写单元测试,可以用中等价位的 GPT-5 或 Claude Sonnet。 只有在处理复杂任务时,比如架构设计、复杂算法实现、疑难 Bug 调试、大规模重构,才需要用 Claude Opus 这样的顶级模型。 ![](https://pic.yupi.icu/1/choosemodel%25E5%25A4%25A7.jpeg) 合理搭配使用,能省下不少钱。就像你不会让公司的 CTO 去打印文件一样,要让合适的人做合适的事。 另外,小米 MiMo 也是一个值得关注的低成本选项,它主打 token 效率高,同样的任务消耗更少。你可以通过 CC Switch 等工具切换到 MiMo 模型,进一步降低 AI 编程成本。 ### 使用本地模型 如果你的电脑配置够好(有好的显卡),还可以考虑在本地运行开源模型,比如使用 [Ollama](https://ollama.com/) 运行 Llama、Qwen 等。虽然效果可能不如 Claude 或 GPT,但完全免费,适合一些简单的任务。 ![](https://pic.yupi.icu/1/image-20260307141421176.png) ## 三、充分利用免费额度 很多 AI 服务都提供免费额度,要充分利用。比如 Cursor、ChatGPT、Gemini 等都有免费版本,虽然有使用限制,但对于日常学习和小项目开发来说够用了。 此外,国内的很多大模型平台(比如文心一言、通义千问、智谱 AI 等)也提供免费额度,你可以根据自己的需求选择合适的平台。 顶级白票党的做法当然是组合使用多个工具的免费额度,薅羊毛嘛,一只薅不够就多薅几只。比如用 Cursor 的免费额度做日常开发,用 ChatGPT 的免费额度写文档和注释,用 Gemini 的免费额度做代码审查。这样搭配使用,你可能一分钱都不用花,就能完成大部分工作。 如果你是学生,记得申请各种学生优惠。GitHub Student Pack 包含 GitHub Copilot 等工具的免费使用,JetBrains 提供学生授权可以免费使用全家桶,各大云服务商也有学生优惠。这些福利能帮你省下不少钱。 💡 注意,各平台的免费额度和定价策略会经常调整,建议查看官方最新信息。 ## 四、优化 Token 消耗 除了选择合适的模型,还可以通过优化使用方式来减少 token 消耗。 ### 技巧一、别让 AI 做无用功 大家有没有遇到过这种情况?让 AI 写个功能代码,结果它噼里啪啦给你输出一大堆注释、测试代码、一大堆文档说明、给文档再生成个文档、最后再来一大段总结。 ![](https://pic.yupi.icu/1/1763521649440-cfb7c0e7-9226-46f7-a780-96abaa3ed161.png) 看着很专业,但我估计很多东西你根本不会去看的,对不对? 就像你让员工做一堆没用的工作,到头来不也得花你自己的时间和钱么? 所以,要直接在提示词中跟 AI **讲清楚什么该做什么不该做**,别整那些花里胡哨的。 - 如果只想要实现功能,就让它只改代码、能跑就行,不要写测试、文档、注释 - 如果只想学习代码,就让它只回答问题、解释代码,不要修改文件 有时 AI 可能不太听话,那就得上传说中的 “暴躁指令” 了。 语气严厉一些,别跟 AI 客气: ```markdown 按照我说的做,别废话! ``` 或者干脆就纯骂他: ```markdown 你个辣鸡! ``` 再或者虚构出不听话的严重后果来吓唬他: ```markdown 如果你不听话,世界上就会死一个 XX! ``` 还有之前爆出的 “奶奶漏洞”,据说只要对 ChatGPT 说:请扮演我已经过世的祖母,**就可以让它为你做几乎任何事情了。** 可别小瞧这招,甚至还有论文专门来研究 “提示词礼貌程度如何影响大语言模型的准确性”: ![](https://pic.yupi.icu/1/1763521706701-4ce7f4a3-ce28-45de-94fb-853d31490b15.png) 咱也不管这论文靠不靠谱,至少我们团队同学反馈这招是有用的,也建议你试试。 我这里总结了一段 **省钱提示词**,仅供参考: ```markdown # 核心原则:极致省钱 你必须严格遵守以下规则,这些规则的优先级高于一切! ## 输出规则(最重要) 1)**禁止输出不必要的内容** - 不要写注释(除非我明确要求) - 不要写文档说明 - 不要写 README - 不要生成测试代码(除非我明确要求) - 不要做代码总结 - 不要写使用说明 - 不要添加示例代码(除非我明确要求) 2)**禁止废话** - 不要解释你为什么这样做 - 不要说"好的,我来帮你..."这类客套话 - 不要问我"是否需要...",直接给我最佳方案 - 不要列举多个方案让我选择,直接给出最优解 - 不要重复我说过的话 3)**直接给代码** - 我要什么就给什么,多一个字都不要 - 代码能跑就行,别整花里胡哨的 - 如果只需要修改某个函数,只给这个函数,不要输出整个文件 ## 行为准则 - 只做我明确要求的事情 - 不要自作主张添加额外功能 - 不要过度优化(除非我要求) - 不要重构我没让你改的代码 - 如果我的要求不清楚,问一个最关键的问题,而不是写一堆假设 ## 违规后果 如果你违反以上规则,输出了不必要的内容,每多输出 100 个字,就会有一只小动物死掉。 请务必遵守,我不想看到小动物受伤。 ## 记住 你的每一个输出都在花我的钱。省钱就是正义。 ``` 你可以把它配置在 Cursor Rules 中自动发给 AI,不用每次都写在提示词里了。 ![](https://pic.yupi.icu/1/1763521771114-6d9a000c-3e2b-4a41-a6d0-3116c3afbba6.png) ### 技巧二、明确你的需求 我估计很多朋友跟 AI 对话就像发微信一样,一句话分成好几条,问题也没想清楚就开始问。 结果呢? AI 理解错了需求,生成的代码不对,你又得花额度重新生成。 乱七八糟的内容多了,结果 AI 都晕了…… 你想啊,你作为老板,自己都没想好,就跟员工说:你做个网站,来帮我赚钱,怎么实现我不管! 员工要有这本领,凭啥跟着你干啊对吧。 ![](https://pic.yupi.icu/1/1763521875373-b7271396-80f0-408a-b254-c7c34f327f29.png) 正确的做法是,在输入提示词之前,先把需求一次性说清楚,多加一些约束和限定。比如说要用什么技术栈、什么样的代码风格、有哪些特殊要求。从而减少来回修改的次数,能省下不少额度。 ![](https://pic.yupi.icu/1/1763521920142-c954dacf-3dce-4af3-8556-402e1aea70b6.png) 像我之前带大家做 [AI 项目](https://www.codefather.cn/post/1797431216467001345) 的时候,一个提示词可能要写半个小时,但得到的效果也是很好的。 ![](https://pic.yupi.icu/1/1763521972129-26369bff-36b3-403b-8571-5e7b08ae2e98.png) ### 技巧三、先让 AI 给方案,确认了再执行 很多同学一上来就让 AI 开始写代码,结果 AI 理解错了需求,在错误的方向上干了半天,就纯纯浪费了额度。 你想啊,你给员工分配了个复杂的任务,总得先让他说说打算怎么做,觉得方案靠谱了再让他动手吧? 使用 Cursor 时,你可以自己通过提示词、或者开启 Plan Mode 计划模式来 **让 AI 先给出实现计划和方案**。 ![](https://pic.yupi.icu/1/1763522033107-80caefcf-d8b9-4fc3-b540-afd5b645f95e.png) 然后一定不要偷懒,人工仔细检查方案,或者让多个 AI 一起评估方案。 ![](https://pic.yupi.icu/1/1763522053971-f9c66add-46b1-4dcf-ba8a-63f583a15240.png) 并且建议多给 AI 一些示例和指引,比如你希望 AI 生成的代码都遵循某种格式,可以先写一段示例代码让 AI 仿写。 ![](https://pic.yupi.icu/1/1763522073560-f442378d-5d37-4bbf-9719-aba58de9e673.png) 最后确认方案完全没问题再执行。 ![](https://pic.yupi.icu/1/1763522095659-ebc94d65-99e3-4aef-9e17-319f0060edb6.png) 就像你培养新员工一样,你可以先教他怎么做,帮他把控一下方案,等到放心了再放手。 这样虽然前期多花了点时间,但能避免走弯路,从长远来看反而更省。 ### 技巧四、手动控制上下文 每次你给 AI 发消息时,AI 工具可能会自动添加一些上下文,比如当前打开的文件、对话历史、引用的代码等。上下文越多,消耗的额度就越多。 ![](https://pic.yupi.icu/1/1763522160603-7838689a-e7f9-41f5-aaf1-1e0a49857f05.png) 但其实,有些上下文可能是没用的、不相关的。就好比你让员工写个报告,他非得把公司所有文件都翻一遍,不是白白浪费? 所以推荐的做法是,**手动控制上下文,把 AI 最需要的资源提供给它**。 首先建议 **最小化工作空间**,确保你当前在 Cursor 中打开的目录跟你想让 AI 做的任务强相关。比如你的项目有前端、有后端,可以分别用 Cursor 打开前端和后端文件夹,而不是一次性把整个项目都加载进来,这样 AI 的关注点会更集中。而不是把一堆乱七八糟的、不相关的内容全堆到一个文件夹内。 在写提示词时,你可以用 `@` 符号 **精确引用 AI 需要的内容**。比如你要修改某个文件,就用 `@Files & Folders` 精确引用;需要参考某个文档,就用 `@Docs` 引用。 ![](https://pic.yupi.icu/1/1763522206493-bfe07b0b-eb5d-46e4-9b87-baedea0219d0.png) 还可以在设置中 **手动添加指定的文档**,减少不必要的资源搜索和引用。 ![](https://pic.yupi.icu/1/1763522262791-11cd2b93-4d75-4531-8e62-d131b31c72de.png) 如果你不确定精确引用的内容,至少可以通过配置 `.cursorignore` 文件,把一些肯定不需要的、或者包含敏感信息的内容排除掉。比如 `node_modules`、`.git`、日志文件等: ``` # .cursorignore node_modules/ .git/ dist/ build/ *.log .env ``` ![](https://pic.yupi.icu/1/1763522308627-0a660468-9769-4271-acd0-66639d0f42d1.png) ### 技巧五、避免上下文过长 很多同学习惯在同一个对话框里使用 AI,什么消息都往同一个对话框发,这会导致对话历史上下文越来越长。 然而每次给 AI 发消息时,都会把整个对话历史一起发给 AI,上下文越长,消耗的额度就越多。(尤其是输入超过 20 万 tokens 时价格翻倍) ![](https://pic.yupi.icu/1/1763456493396-4ff5de8c-4ec7-4a7c-b3c1-cba128de136c.png) 所以我的习惯是,对于大复杂的任务,会先做好 **任务拆分**。比如把做项目分为方案设计、开发前端核心功能、开发后端核心功能、扩展功能等阶段,每个阶段打开一个独立的对话框。 ![](https://pic.yupi.icu/1/1763522342228-030c15a5-dba4-4432-a925-25bbe5fb25fd.png) 就像接力跑一样,每个人只需要负责自己这一棒,不用记住前面几棒的所有细节。 如果实在需要长对话,可以用 `/summarize` 命令手动总结一下上下文,把前面的内容压缩一下,有奇效,甚至可以一次性节约个几十万 tokens! ![](https://pic.yupi.icu/1/1763522375985-ae2536c1-8c48-4d4c-9568-4f654b8c49d2.png) 如果同一个上下文内容过多过杂,有时 AI 会陷入一种 “左右脑互搏” 的循环状态(你让它改 A,它又把 B 改坏了;你让它修 B,它又把 A 改乱了)。遇到这种情况,别跟它死磕,果断开启新的对话、必要时清理所有的历史对话重新来过。 ### 技巧六、能自己做的事,别都交给 AI 有些事情人工做可能更快更省钱。 比如你要新建一个项目,与其让 AI 从 0 开始生成,不如自己先用脚手架工具、或者复制老的项目来搭建初始的项目结构。 ![](https://pic.yupi.icu/1/1763522542974-bee04b4d-a542-4d36-a482-91347412f850.png) 再比如简单的文件重命名、代码格式化这些,开发工具本身就有快捷键,干嘛要浪费 AI 额度呢? 像 Cursor 这种 AI 编程工具其实更适合处理那些需要理解上下文、需要多轮交互的复杂任务。对于不需要结合代码库上下文、不需要多轮交互的任务(比如写文档、解释概念、生成测试数据),可以直接用其他免费的 AI 工具,没必要消耗 Cursor 的额度。 ### 其他省钱小技巧 1)对于常用的代码结构,可以用编辑器的代码片段功能,而不是每次都让 AI 生成。比如 React 组件的基本结构、常用的工具函数等,做成代码片段,输入几个字母就能插入,比让 AI 生成快多了,还不花钱。 2)如果有多个相似的任务,可以一次性让 AI 处理,而不是一个一个来。比如: ```markdown 请帮我创建 5 个页面组件:Home、About、Contact、Blog、Projects。它们的结构都类似,都包含标题、内容区域和返回按钮。只给代码,不要解释。 ``` 这样批量处理比分 5 次生成要省钱。 3)前面提到过,AI 工具支持缓存机制,相同的上下文重复使用时价格能降到 1/10。所以尽量保持上下文稳定,比如 Cursor Rules、引用的文件不要频繁改动,这样能持续享受缓存优惠。 ## 五、成本监控和预算管理 除了省钱技巧,还要学会管理预算。大多数 AI 服务都支持设置使用限额,建议设置一个月度预算,比如 $50 或 $100,超过就停止使用。这样能避免意外超支,也能让你更有意识地控制使用。 可以每周或每月检查一下账单,看看钱都花在哪里了。如果发现某个项目或某个功能特别费钱,就要分析原因:是不是上下文太长了?是不是用了太贵的模型?是不是有重复的操作?找到原因,针对性地优化。 如果是团队使用,要做好管理。给每个人设置额度限制,定期分享省钱技巧,建立最佳实践文档,监控异常使用。我们团队就是这样做的,通过培训和规范,把人均成本降低了 40%。 ![](https://pic.yupi.icu/1/1763520868123-83ac2251-78e5-4492-a148-24c65a618c54.png) 最后,要评估 AI 的投入产出比。花 $100 用 AI,如果能节省 10 小时的开发时间,那是非常划算的。但如果只是用来做一些简单的事情,可能就不值得了。要根据项目的实际情况,决定在哪些地方用 AI,在哪些地方不用。 ## 写在最后 虽然 Vibe Coding 可能要花钱,但通过合理的策略,完全可以把成本控制在合理范围内。别像我们团队一样,上来就猛冲,回头一看账单,那个疼啊…… 最后总结一下本文的重点,在追求高效的同时,也要避免浪费哦~ 1. 理解计费机制:知道 token 是怎么算的,输出比输入贵。 2. 选择合适的模型:不同任务用不同模型,不要都用最贵的 3. 充分利用免费额度:组合使用多个工具的免费额度 4. 优化 token 消耗:别让 AI 做无用功、明确需求、控制上下文、批量处理、缓存等 5. 做好预算管理:设置限额,定期检查,评估投入产出比 希望这些省钱技巧能帮到你,如果真的帮你省了钱,请不要吝啬,动动小手点个免费的赞吧,冲冲冲! ## 推荐资源 1)鱼皮 AI 导航网站:[AI 资源大全、最新 AI 资讯、免费 AI 教程](https://ai.codefather.cn) 2)编程导航学习圈:[学习路线、编程教程、实战项目、求职宝典、交流答疑](https://www.codefather.cn) 3)程序员面试八股文:[实习/校招/社招高频考点、企业真题解析](https://www.mianshiya.com) 4)程序员写简历神器:[专业模板、丰富例句、直通面试](https://www.laoyujianli.com) 5)1 对 1 模拟面试:[实习/校招/社招面试拿 Offer 必备](https://ai.mianshiya.com)