Files

T

yupi-translate-app[bot] 43df9dfd27 [GitHub Global] Translate Vibe Coding 零基础教程/10 编程工具/工具实战/Gemini CLI 首测：免费开源很香，但坑点很多！.md to zh-TW

2026-02-05 12:02:01 +00:00

13 KiB

Raw Blame History

Gemini CLI：Google 的免費 AI 命令列工具實測

你好，我是魚皮。

Google 推出了一個很有意思的 AI 命令列工具 —— Gemini CLI，直接把 AI 塞進了終端裡。

根據官方介紹，這個工具能：

處理大型程式碼庫（高達 100 萬的 Token 上下文）
有多模態能力：能從 PDF 或草圖生成新應用
能自動化維運：幫你查詢程式碼合併請求、處理複雜的程式碼合併
整合了大量工具：支援連接 MCP 伺服器，支援圖像、影片、音訊生成
還有內建搜尋等等

對標 Claude Code，現在還有免費使用額度、而且最好的是程式碼開源！

截止到 2026 年 1 月，Gemini CLI 已經有 9 萬+ GitHub Stars，火箭式漲星！

那這個工具到底怎麼樣呢？我來帶大家實際體驗一下，說說我自己真實的使用感受。

⭐️ 推薦觀看影片版：https://bilibili.com/video/BV1LuKdzjEAc

一、安裝和啟動

按照官方提供的文件，我們要先安裝 Node.js 執行環境，直接去官網安裝就好了，注意版本要 >= 20（2026 年最新要求）。

然後打開終端，輸入一行命令全域安裝工具：

npm install -g @google/gemini-cli

或者用 Homebrew 安裝（macOS/Linux）：

brew install gemini-cli

安裝完成後，輸入 gemini 命令，做一些基礎的設定：

接下來是關鍵了，需要經過一波帳號驗證，個人用戶選第一項就好。

這裡大家可能會遇到 2 種驗證失敗的情況，第一種是網路原因（這個不好搞），第二種是說帳號類型不符合要求，如圖：

對於第二種情況，解決方案很簡單。進入 Google Cloud 控制台，新建一個專案得到 project_id：

然後在終端輸入下列命令設定環境變數，重試就能登入進去了：

export GOOGLE_CLOUD_PROJECT=<你的 project_id>

登入成功後，我們就可以開始使用了。

二、實戰測試

接下來我選了 8 個不同的場景來從多個方面驗證它的能力，大家也可以感受下 Gemini CLI 的真實水平到底如何，大家說好才是真的好。

1、基礎問答

輸入提示詞：

你好，請問你能做些什麼？有什麼優勢？

結果沒想到，一上來就報錯了？而且各種胡言亂語。

過了一會兒，終於滿屏飄紅了，看報錯的意思是我沒開啟 API 權限：

直接訪問錯誤資訊中的網址，就能去控制台開啟 API 權限了，開一下開一下：

再來！這次 AI 的回覆就對味了，他說自己是個AI軟體工程師，確保操作的透明和安全。結果還可以，就是速度有點小慢啊，這麼一個簡單的問題花了 20 秒，這也是智能體的一個副作用吧。

2、網頁搜尋

輸入提示詞，讓 AI 自動上網下載表情包：

請幫我獲取 10 張健康的熊貓頭表情包，並且下載到當前目錄下

結果 AI 給我推薦了幾個表情包網站，無法直接下載：

是不是不支援下載工具啊？

我們輸入下 / 鍵，就可以看到 Gemini CLI 支援的命令：

進入查看工具列表，發現好像沒有網頁資源下載工具，也是難為 AI 了。但是它支援編寫 Shell 腳本，所以我們不妨引導 AI 編寫腳本來實現資源下載。

提示詞：

請幫我獲取 10 張健康的熊貓頭表情包，並且下載到當前目錄下，你可以通過編寫可執行腳本來實現圖片的下載

這次就可以看到智能體開始自主規劃任務了，先創建了一個腳本，然後「寫文件」操作需要我們確認，這裡建議選擇僅允許一次，安全一些：

遇到問題它會嘗試 重新規劃 然後重試，這也是智能體的一個關鍵能力：

任務執行完後還記得清理腳本，這個很不錯。

好了，大功告成，我們看看下載好的文件，這個尺寸是認真的麼？果然翻車了，下載的圖片根本不對！

3、文件操作

輸入下列提示詞，讓 AI 幫忙處理我本地的表情包文件：

幫我把所有的表情包尺寸放大 1 倍，並且轉換為 WEBP 格式，然後將所有表情包組合在一起生成為 GIF

然後應該要指定文件路徑吧，不然 AI 可能不知道要處理什麼。

結果當我輸入 @ 鍵指定文件路徑時，好傢伙，輸入框直接卡死了？該說不說，這個互動體驗不夠好，我每次選擇文件都會卡，而且選擇不了目錄。

經過一番折騰，我發現得慢點選擇，跟著程序列舉出的目錄樹進行選擇，就先選一個圖片吧：

好，這次 AI 聰明了，問我是不是要處理多個文件，必須的：

然後 AI 發現無法處理圖片，要下載一個圖片處理工具，然後它說要利用 Mac 上的軟體包管理工具來安裝，同意即可：

經過漫長的等待，等了快 10 分鐘竟然還沒好？！

可能是我自己的網路原因吧，但我實在等不下去了。老實說測到這裡，我心態都已經有點崩了，凌晨兩點半隔這兒等軟體安裝？

不是，這玩意你寫個簡單的 Python 腳本不就搞定了？

感覺這個工具還是得給程式設計師用，要稍微加一些引導，比如我們讓 AI 利用 Python 腳本實現任務：

幫我把所有的表情包尺寸放大 1 倍，並且轉換為 WEBP 格式，然後將所有表情包組合在一起生成為 GIF，使用 Python 腳本實現

可以看到 AI 安裝了圖像處理庫，然後創建了一個虛擬環境，你別說它對安全性的考慮還是 ok 的：

然後編寫腳本並執行：

任務成功完成，看下效果：

尺寸確實放大了，格式也轉換成功了，GIF 也成功生成了。終於順利完成了一次任務，還不戳。通過這種方式處理本地圖片確實是要比網頁端的 AI 應用方便很多。

4、生成程式碼

輸入下列提示詞，讓 AI 幫我做個像素攝影網站：

請幫我製作一個網站，能夠調用攝像頭進行拍照，並將照片轉為像素風，支援下載，要求界面簡潔炫酷

這次生成速度還是挺快的，就是過程中得多次進行人工確認：

我們來看下生成的網站效果：

可以調整像素的密度，還可以一鍵下載照片，效果還是挺不錯的，這次任務 AI 也順利完成了~

5、解釋程式碼

給剛剛生成的專案補充一個學習指南，輸入提示詞：

幫我生成該專案的學習指南，幫助新開發者快速上手

由於 AI 有上下文，它直接 get 到了我想讓他分析哪個專案，然後很快生成了一個專案文件。

然後我讓 AI 幫我打開文件文件：

本來是想讓 AI 直接打開 Markdown 閱讀軟體的，但沒想到它直接給我輸出了一堆無關的內容，我表示不理解。

那我自己打開好了吧，生成的文件內容還是過關的，標準的 GitHub 開源專案文件。

6、生成架構圖

好，鑒於剛剛的任務完成得還可以，我們加大難度。讓 AI 生成一個專案的分層架構圖：

幫我針對當前專案，生成分層架構圖

結果就有點烏龍了，AI 給我生成了一個架構設計文件：

你管這純英文文件叫做架構圖？

那我再發揮一下僅存的專業性，讓他幫我生成架構圖的繪圖程式碼：

幫我針對當前專案，生成分層架構圖的 draw.io 程式碼

這次看著靠譜多了：

來，我們把 AI 生成的架構圖程式碼文件拖到 draw.io 中打開。

不是哥們？你管這叫架構圖？

來，同樣的任務，我們用 Cursor + Claude 4 試一試。

哎，你看人家 Claude 很有自信，說「我可以為您生成一個更完整和詳細的分層架構圖」：

好，看下生成後的效果，是不是高下立判啊！

7、生成可視化圖表

讓 AI 幫我分析專案的提交記錄，輸入提示詞：

根據當前專案的提交記錄，生成可視化圖表，便於我來分析專案的發展歷程

可以看到 AI 使用 git log 命令查看程式碼提交記錄，然後開始生成圖表。

等等？圖表在哪兒呢？？？

我的預期肯定是生成一個圖片，或者起碼是一個字符畫，看著像圖也行啊，有點為難他了。

8、多模態

等驗證到多模態的時候已經是凌晨 3 點，我都已經麻了，唉，最後再堅持試試多模態吧。

輸入生成圖片提示詞：

幫我基於當前目錄下的圖片，生成一個風格相似的新圖片

這次 AI 乾脆直接拒絕了，不支援圖片創作，你倒是寫個腳本啊？！你不用 AI，用個圖像處理也行對不對？

那再解釋個圖片試試，輸入解釋圖片提示詞：

幫我解釋當前目錄下所有的圖片

這倒是解釋出來了，吐槽一下，竟然還是英文輸出，可能跟程序本身的語言設定有關吧，體驗沒有那麼好。

Gemini CLI 背後用的應該是 Gemini 2.5 Pro 模型，是具有原生多模態輸入能力的，也就是說能識圖，但是並不能創作圖片，包括創作音訊和影片應該都是通過第三方大模型（或者 MCP 工具實現的）。

最後再讓他解釋個 PDF 吧，輸入提示詞：

幫我總結 PDF 的內容，並生成一個新的 PDF

結果出乎我意料了，AI 提示輸入超出了 token 限制？

13 KiB Raw Blame History Unescape Escape