Files
ai-guide/translations/zh-TW/Vibe Coding 零基础教程/10 编程工具/工具实战/Gemini CLI 首测:免费开源很香,但坑点很多!.md
T

13 KiB
Raw Blame History

Gemini CLIGoogle 的免費 AI 命令列工具實測

你好,我是魚皮。

Google 推出了一個很有意思的 AI 命令列工具 —— Gemini CLI,直接把 AI 塞進了終端裡。

根據 官方介紹,這個工具能:

  • 處理大型程式碼庫(高達 100 萬的 Token 上下文)
  • 有多模態能力:能從 PDF 或草圖生成新應用
  • 能自動化維運:幫你查詢程式碼合併請求、處理複雜的程式碼合併
  • 整合了大量工具:支援連接 MCP 伺服器,支援圖像、影片、音訊生成
  • 還有內建搜尋等等

對標 Claude Code,現在還有免費使用額度、而且最好的是程式碼開源!

截止到 2026 年 1 月,Gemini CLI 已經有 9 萬+ GitHub Stars,火箭式漲星!

那這個工具到底怎麼樣呢?我來帶大家實際體驗一下,說說我自己真實的使用感受。

推薦觀看影片版:https://bilibili.com/video/BV1LuKdzjEAc

一、安裝和啟動

按照官方提供的文件,我們要先安裝 Node.js 執行環境,直接去 官網 安裝就好了,注意版本要 >= 202026 年最新要求)。

然後打開終端,輸入一行命令全域安裝工具:

npm install -g @google/gemini-cli

或者用 Homebrew 安裝(macOS/Linux):

brew install gemini-cli

安裝完成後,輸入 gemini 命令,做一些基礎的設定:

接下來是關鍵了,需要經過一波帳號驗證,個人用戶選第一項就好。

這裡大家可能會遇到 2 種驗證失敗的情況,第一種是網路原因(這個不好搞),第二種是說帳號類型不符合要求,如圖:

對於第二種情況,解決方案很簡單。進入 Google Cloud 控制台,新建一個專案得到 project_id

然後在終端輸入下列命令設定環境變數,重試就能登入進去了:

export GOOGLE_CLOUD_PROJECT=<你的 project_id>

登入成功後,我們就可以開始使用了。

二、實戰測試

接下來我選了 8 個不同的場景來從多個方面驗證它的能力,大家也可以感受下 Gemini CLI 的真實水平到底如何,大家說好才是真的好。

1、基礎問答

輸入提示詞:

你好,請問你能做些什麼?有什麼優勢?

結果沒想到,一上來就報錯了?而且各種胡言亂語。

過了一會兒,終於滿屏飄紅了,看報錯的意思是我沒開啟 API 權限:

直接訪問錯誤資訊中的網址,就能去控制台開啟 API 權限了,開一下開一下:

再來!這次 AI 的回覆就對味了,他說自己是個AI軟體工程師,確保操作的透明和安全。結果還可以,就是速度有點小慢啊,這麼一個簡單的問題花了 20 秒,這也是智能體的一個副作用吧。

2、網頁搜尋

輸入提示詞,讓 AI 自動上網下載表情包:

請幫我獲取 10 張健康的熊貓頭表情包,並且下載到當前目錄下

結果 AI 給我推薦了幾個表情包網站,無法直接下載:

是不是不支援下載工具啊?

我們輸入下 / 鍵,就可以看到 Gemini CLI 支援的命令:

進入查看工具列表,發現好像沒有網頁資源下載工具,也是難為 AI 了。但是它支援編寫 Shell 腳本,所以我們不妨引導 AI 編寫腳本來實現資源下載。

提示詞:

請幫我獲取 10 張健康的熊貓頭表情包,並且下載到當前目錄下,你可以通過編寫可執行腳本來實現圖片的下載

這次就可以看到智能體開始自主規劃任務了,先創建了一個腳本,然後「寫文件」操作需要我們確認,這裡建議選擇僅允許一次,安全一些:

遇到問題它會嘗試 重新規劃 然後重試,這也是智能體的一個關鍵能力:

任務執行完後還記得清理腳本,這個很不錯。

好了,大功告成,我們看看下載好的文件,這個尺寸是認真的麼?果然翻車了,下載的圖片根本不對!

3、文件操作

輸入下列提示詞,讓 AI 幫忙處理我本地的表情包文件:

幫我把所有的表情包尺寸放大 1 倍,並且轉換為 WEBP 格式,然後將所有表情包組合在一起生成為 GIF

然後應該要指定文件路徑吧,不然 AI 可能不知道要處理什麼。

結果當我輸入 @ 鍵指定文件路徑時,好傢伙,輸入框直接卡死了?該說不說,這個互動體驗不夠好,我每次選擇文件都會卡,而且選擇不了目錄。

經過一番折騰,我發現 得慢點選擇,跟著程序列舉出的目錄樹進行選擇,就先選一個圖片吧:

好,這次 AI 聰明了,問我是不是要處理多個文件,必須的:

然後 AI 發現無法處理圖片,要下載一個圖片處理工具,然後它說要利用 Mac 上的軟體包管理工具來安裝,同意即可:

經過漫長的等待,等了快 10 分鐘竟然還沒好?!

可能是我自己的網路原因吧,但我實在等不下去了。老實說測到這裡,我心態都已經有點崩了,凌晨兩點半隔這兒等軟體安裝?

不是,這玩意你寫個簡單的 Python 腳本不就搞定了?

感覺這個工具還是得給程式設計師用,要稍微加一些引導,比如我們讓 AI 利用 Python 腳本實現任務:

幫我把所有的表情包尺寸放大 1 倍,並且轉換為 WEBP 格式,然後將所有表情包組合在一起生成為 GIF,使用 Python 腳本實現

可以看到 AI 安裝了圖像處理庫,然後創建了一個虛擬環境,你別說它對安全性的考慮還是 ok 的:

然後編寫腳本並執行:

任務成功完成,看下效果:

尺寸確實放大了,格式也轉換成功了,GIF 也成功生成了。終於順利完成了一次任務,還不戳。通過這種方式處理本地圖片確實是要比網頁端的 AI 應用方便很多。

4、生成程式碼

輸入下列提示詞,讓 AI 幫我做個像素攝影網站:

請幫我製作一個網站,能夠調用攝像頭進行拍照,並將照片轉為像素風,支援下載,要求界面簡潔炫酷

這次生成速度還是挺快的,就是過程中得多次進行人工確認:

我們來看下生成的網站效果:

可以調整像素的密度,還可以一鍵下載照片,效果還是挺不錯的,這次任務 AI 也順利完成了~

5、解釋程式碼

給剛剛生成的專案補充一個學習指南,輸入提示詞:

幫我生成該專案的學習指南,幫助新開發者快速上手

由於 AI 有上下文,它直接 get 到了我想讓他分析哪個專案,然後很快生成了一個專案文件。

然後我讓 AI 幫我打開文件文件:

本來是想讓 AI 直接打開 Markdown 閱讀軟體的,但沒想到它直接給我輸出了一堆無關的內容,我表示不理解。

那我自己打開好了吧,生成的文件內容還是過關的,標準的 GitHub 開源專案文件。

6、生成架構圖

好,鑒於剛剛的任務完成得還可以,我們加大難度。讓 AI 生成一個專案的分層架構圖:

幫我針對當前專案,生成分層架構圖

結果就有點烏龍了,AI 給我生成了一個架構設計文件:

你管這純英文文件叫做架構圖?

那我再發揮一下僅存的專業性,讓他幫我生成架構圖的繪圖程式碼:

幫我針對當前專案,生成分層架構圖的 draw.io 程式碼

這次看著靠譜多了:

來,我們把 AI 生成的架構圖程式碼文件拖到 draw.io 中打開。

不是哥們?你管這叫架構圖?

來,同樣的任務,我們用 Cursor + Claude 4 試一試。

哎,你看人家 Claude 很有自信,說「我可以為您生成一個更完整和詳細的分層架構圖」:

好,看下生成後的效果,是不是高下立判啊!

7、生成可視化圖表

讓 AI 幫我分析專案的提交記錄,輸入提示詞:

根據當前專案的提交記錄,生成可視化圖表,便於我來分析專案的發展歷程

可以看到 AI 使用 git log 命令查看程式碼提交記錄,然後開始生成圖表。

等等?圖表在哪兒呢???

我的預期肯定是生成一個圖片,或者起碼是一個字符畫,看著像圖也行啊,有點為難他了。

8、多模態

等驗證到多模態的時候已經是凌晨 3 點,我都已經麻了,唉,最後再堅持試試多模態吧。

輸入生成圖片提示詞:

幫我基於當前目錄下的圖片,生成一個風格相似的新圖片

這次 AI 乾脆直接拒絕了,不支援圖片創作,你倒是寫個腳本啊?!你不用 AI,用個圖像處理也行對不對?

那再解釋個圖片試試,輸入解釋圖片提示詞:

幫我解釋當前目錄下所有的圖片

這倒是解釋出來了,吐槽一下,竟然還是英文輸出,可能跟程序本身的語言設定有關吧,體驗沒有那麼好。

Gemini CLI 背後用的應該是 Gemini 2.5 Pro 模型,是具有原生多模態輸入能力的,也就是說能識圖,但是並不能創作圖片,包括創作音訊和影片應該都是通過第三方大模型(或者 MCP 工具實現的)。

最後再讓他解釋個 PDF 吧,輸入提示詞:

幫我總結 PDF 的內容,並生成一個新的 PDF

結果出乎我意料了,AI 提示輸入超出了 token 限制?