13 KiB
Gemini CLI:Google 的免費 AI 命令列工具實測
你好,我是魚皮。
Google 推出了一個很有意思的 AI 命令列工具 —— Gemini CLI,直接把 AI 塞進了終端裡。
根據 官方介紹,這個工具能:
- 處理大型程式碼庫(高達 100 萬的 Token 上下文)
- 有多模態能力:能從 PDF 或草圖生成新應用
- 能自動化維運:幫你查詢程式碼合併請求、處理複雜的程式碼合併
- 整合了大量工具:支援連接 MCP 伺服器,支援圖像、影片、音訊生成
- 還有內建搜尋等等
對標 Claude Code,現在還有免費使用額度、而且最好的是程式碼開源!
截止到 2026 年 1 月,Gemini CLI 已經有 9 萬+ GitHub Stars,火箭式漲星!
那這個工具到底怎麼樣呢?我來帶大家實際體驗一下,說說我自己真實的使用感受。
⭐️ 推薦觀看影片版:https://bilibili.com/video/BV1LuKdzjEAc
一、安裝和啟動
按照官方提供的文件,我們要先安裝 Node.js 執行環境,直接去 官網 安裝就好了,注意版本要 >= 20(2026 年最新要求)。
然後打開終端,輸入一行命令全域安裝工具:
npm install -g @google/gemini-cli
或者用 Homebrew 安裝(macOS/Linux):
brew install gemini-cli
安裝完成後,輸入 gemini 命令,做一些基礎的設定:
接下來是關鍵了,需要經過一波帳號驗證,個人用戶選第一項就好。
這裡大家可能會遇到 2 種驗證失敗的情況,第一種是網路原因(這個不好搞),第二種是說帳號類型不符合要求,如圖:
對於第二種情況,解決方案很簡單。進入 Google Cloud 控制台,新建一個專案得到 project_id:
然後在終端輸入下列命令設定環境變數,重試就能登入進去了:
export GOOGLE_CLOUD_PROJECT=<你的 project_id>
登入成功後,我們就可以開始使用了。
二、實戰測試
接下來我選了 8 個不同的場景來從多個方面驗證它的能力,大家也可以感受下 Gemini CLI 的真實水平到底如何,大家說好才是真的好。
1、基礎問答
輸入提示詞:
你好,請問你能做些什麼?有什麼優勢?
結果沒想到,一上來就報錯了?而且各種胡言亂語。
過了一會兒,終於滿屏飄紅了,看報錯的意思是我沒開啟 API 權限:
直接訪問錯誤資訊中的網址,就能去控制台開啟 API 權限了,開一下開一下:
再來!這次 AI 的回覆就對味了,他說自己是個AI軟體工程師,確保操作的透明和安全。結果還可以,就是速度有點小慢啊,這麼一個簡單的問題花了 20 秒,這也是智能體的一個副作用吧。
2、網頁搜尋
輸入提示詞,讓 AI 自動上網下載表情包:
請幫我獲取 10 張健康的熊貓頭表情包,並且下載到當前目錄下
結果 AI 給我推薦了幾個表情包網站,無法直接下載:
是不是不支援下載工具啊?
我們輸入下 / 鍵,就可以看到 Gemini CLI 支援的命令:
進入查看工具列表,發現好像沒有網頁資源下載工具,也是難為 AI 了。但是它支援編寫 Shell 腳本,所以我們不妨引導 AI 編寫腳本來實現資源下載。
提示詞:
請幫我獲取 10 張健康的熊貓頭表情包,並且下載到當前目錄下,你可以通過編寫可執行腳本來實現圖片的下載
這次就可以看到智能體開始自主規劃任務了,先創建了一個腳本,然後「寫文件」操作需要我們確認,這裡建議選擇僅允許一次,安全一些:
遇到問題它會嘗試 重新規劃 然後重試,這也是智能體的一個關鍵能力:
任務執行完後還記得清理腳本,這個很不錯。
好了,大功告成,我們看看下載好的文件,這個尺寸是認真的麼?果然翻車了,下載的圖片根本不對!
3、文件操作
輸入下列提示詞,讓 AI 幫忙處理我本地的表情包文件:
幫我把所有的表情包尺寸放大 1 倍,並且轉換為 WEBP 格式,然後將所有表情包組合在一起生成為 GIF
然後應該要指定文件路徑吧,不然 AI 可能不知道要處理什麼。
結果當我輸入 @ 鍵指定文件路徑時,好傢伙,輸入框直接卡死了?該說不說,這個互動體驗不夠好,我每次選擇文件都會卡,而且選擇不了目錄。
經過一番折騰,我發現 得慢點選擇,跟著程序列舉出的目錄樹進行選擇,就先選一個圖片吧:
好,這次 AI 聰明了,問我是不是要處理多個文件,必須的:
然後 AI 發現無法處理圖片,要下載一個圖片處理工具,然後它說要利用 Mac 上的軟體包管理工具來安裝,同意即可:
經過漫長的等待,等了快 10 分鐘竟然還沒好?!
可能是我自己的網路原因吧,但我實在等不下去了。老實說測到這裡,我心態都已經有點崩了,凌晨兩點半隔這兒等軟體安裝?
不是,這玩意你寫個簡單的 Python 腳本不就搞定了?
感覺這個工具還是得給程式設計師用,要稍微加一些引導,比如我們讓 AI 利用 Python 腳本實現任務:
幫我把所有的表情包尺寸放大 1 倍,並且轉換為 WEBP 格式,然後將所有表情包組合在一起生成為 GIF,使用 Python 腳本實現
可以看到 AI 安裝了圖像處理庫,然後創建了一個虛擬環境,你別說它對安全性的考慮還是 ok 的:
然後編寫腳本並執行:
任務成功完成,看下效果:
尺寸確實放大了,格式也轉換成功了,GIF 也成功生成了。終於順利完成了一次任務,還不戳。通過這種方式處理本地圖片確實是要比網頁端的 AI 應用方便很多。
4、生成程式碼
輸入下列提示詞,讓 AI 幫我做個像素攝影網站:
請幫我製作一個網站,能夠調用攝像頭進行拍照,並將照片轉為像素風,支援下載,要求界面簡潔炫酷
這次生成速度還是挺快的,就是過程中得多次進行人工確認:
我們來看下生成的網站效果:
可以調整像素的密度,還可以一鍵下載照片,效果還是挺不錯的,這次任務 AI 也順利完成了~
5、解釋程式碼
給剛剛生成的專案補充一個學習指南,輸入提示詞:
幫我生成該專案的學習指南,幫助新開發者快速上手
由於 AI 有上下文,它直接 get 到了我想讓他分析哪個專案,然後很快生成了一個專案文件。
然後我讓 AI 幫我打開文件文件:
本來是想讓 AI 直接打開 Markdown 閱讀軟體的,但沒想到它直接給我輸出了一堆無關的內容,我表示不理解。
那我自己打開好了吧,生成的文件內容還是過關的,標準的 GitHub 開源專案文件。
6、生成架構圖
好,鑒於剛剛的任務完成得還可以,我們加大難度。讓 AI 生成一個專案的分層架構圖:
幫我針對當前專案,生成分層架構圖
結果就有點烏龍了,AI 給我生成了一個架構設計文件:
你管這純英文文件叫做架構圖?
那我再發揮一下僅存的專業性,讓他幫我生成架構圖的繪圖程式碼:
幫我針對當前專案,生成分層架構圖的 draw.io 程式碼
這次看著靠譜多了:
來,我們把 AI 生成的架構圖程式碼文件拖到 draw.io 中打開。
不是哥們?你管這叫架構圖?
來,同樣的任務,我們用 Cursor + Claude 4 試一試。
哎,你看人家 Claude 很有自信,說「我可以為您生成一個更完整和詳細的分層架構圖」:
好,看下生成後的效果,是不是高下立判啊!
7、生成可視化圖表
讓 AI 幫我分析專案的提交記錄,輸入提示詞:
根據當前專案的提交記錄,生成可視化圖表,便於我來分析專案的發展歷程
可以看到 AI 使用 git log 命令查看程式碼提交記錄,然後開始生成圖表。
等等?圖表在哪兒呢???
我的預期肯定是生成一個圖片,或者起碼是一個字符畫,看著像圖也行啊,有點為難他了。
8、多模態
等驗證到多模態的時候已經是凌晨 3 點,我都已經麻了,唉,最後再堅持試試多模態吧。
輸入生成圖片提示詞:
幫我基於當前目錄下的圖片,生成一個風格相似的新圖片
這次 AI 乾脆直接拒絕了,不支援圖片創作,你倒是寫個腳本啊?!你不用 AI,用個圖像處理也行對不對?
那再解釋個圖片試試,輸入解釋圖片提示詞:
幫我解釋當前目錄下所有的圖片
這倒是解釋出來了,吐槽一下,竟然還是英文輸出,可能跟程序本身的語言設定有關吧,體驗沒有那麼好。
Gemini CLI 背後用的應該是 Gemini 2.5 Pro 模型,是具有原生多模態輸入能力的,也就是說能識圖,但是並不能創作圖片,包括創作音訊和影片應該都是通過第三方大模型(或者 MCP 工具實現的)。
最後再讓他解釋個 PDF 吧,輸入提示詞:
幫我總結 PDF 的內容,並生成一個新的 PDF
結果出乎我意料了,AI 提示輸入超出了 token 限制?










































