351 lines
13 KiB
Markdown
351 lines
13 KiB
Markdown
# Gemini CLI:Google 的免費 AI 命令列工具實測
|
||
|
||
你好,我是魚皮。
|
||
|
||
Google 推出了一個很有意思的 AI 命令列工具 —— Gemini CLI,直接把 AI 塞進了終端裡。
|
||
|
||

|
||
|
||
根據 [官方介紹](https://github.com/google-gemini/gemini-cli),這個工具能:
|
||
|
||
- 處理大型程式碼庫(高達 100 萬的 Token 上下文)
|
||
- 有多模態能力:能從 PDF 或草圖生成新應用
|
||
- 能自動化維運:幫你查詢程式碼合併請求、處理複雜的程式碼合併
|
||
- 整合了大量工具:支援連接 MCP 伺服器,支援圖像、影片、音訊生成
|
||
- 還有內建搜尋等等
|
||
|
||
對標 Claude Code,現在還有免費使用額度、而且最好的是程式碼開源!
|
||
|
||

|
||
|
||
截止到 2026 年 1 月,Gemini CLI 已經有 **9 萬+ GitHub Stars**,火箭式漲星!
|
||
|
||
那這個工具到底怎麼樣呢?我來帶大家實際體驗一下,說說我自己真實的使用感受。
|
||
|
||
⭐️ 推薦觀看影片版:[https://bilibili.com/video/BV1LuKdzjEAc](https://www.bilibili.com/video/BV1LuKdzjEAc/)
|
||
|
||
|
||
|
||
## 一、安裝和啟動
|
||
|
||
按照官方提供的文件,我們要先安裝 Node.js 執行環境,直接去 [官網](https://nodejs.org/) 安裝就好了,**注意版本要 >= 20**(2026 年最新要求)。
|
||
|
||
然後打開終端,輸入一行命令全域安裝工具:
|
||
|
||
```bash
|
||
npm install -g @google/gemini-cli
|
||
```
|
||
|
||
或者用 Homebrew 安裝(macOS/Linux):
|
||
|
||
```bash
|
||
brew install gemini-cli
|
||
```
|
||
|
||
安裝完成後,輸入 `gemini` 命令,做一些基礎的設定:
|
||
|
||

|
||
|
||
接下來是關鍵了,需要經過一波帳號驗證,個人用戶選第一項就好。
|
||
|
||

|
||
|
||
這裡大家可能會遇到 2 種驗證失敗的情況,第一種是網路原因(這個不好搞),第二種是說帳號類型不符合要求,如圖:
|
||
|
||

|
||
|
||
對於第二種情況,解決方案很簡單。進入 [Google Cloud](https://console.cloud.google.com/) 控制台,新建一個專案得到 `project_id`:
|
||
|
||

|
||
|
||
然後在終端輸入下列命令設定環境變數,重試就能登入進去了:
|
||
|
||
```bash
|
||
export GOOGLE_CLOUD_PROJECT=<你的 project_id>
|
||
```
|
||
|
||
登入成功後,我們就可以開始使用了。
|
||
|
||
|
||
|
||
## 二、實戰測試
|
||
|
||
接下來我選了 8 個不同的場景來從多個方面驗證它的能力,大家也可以感受下 Gemini CLI 的真實水平到底如何,大家說好才是真的好。
|
||
|
||

|
||
|
||
### 1、基礎問答
|
||
|
||
輸入提示詞:
|
||
|
||
```
|
||
你好,請問你能做些什麼?有什麼優勢?
|
||
```
|
||
|
||
結果沒想到,一上來就報錯了?而且各種胡言亂語。
|
||
|
||

|
||
|
||
過了一會兒,終於滿屏飄紅了,看報錯的意思是我沒開啟 API 權限:
|
||
|
||

|
||
|
||
直接訪問錯誤資訊中的網址,就能去控制台開啟 API 權限了,開一下開一下:
|
||
|
||

|
||
|
||
再來!這次 AI 的回覆就對味了,他說自己是個AI軟體工程師,確保操作的透明和安全。結果還可以,就是速度有點小慢啊,這麼一個簡單的問題花了 20 秒,這也是智能體的一個副作用吧。
|
||
|
||

|
||
|
||
|
||
|
||
### 2、網頁搜尋
|
||
|
||
輸入提示詞,讓 AI 自動上網下載表情包:
|
||
|
||
```markdown
|
||
請幫我獲取 10 張健康的熊貓頭表情包,並且下載到當前目錄下
|
||
```
|
||
|
||
結果 AI 給我推薦了幾個表情包網站,無法直接下載:
|
||
|
||

|
||
|
||
是不是不支援下載工具啊?
|
||
|
||
我們輸入下 `/` 鍵,就可以看到 Gemini CLI 支援的命令:
|
||
|
||

|
||
|
||
進入查看工具列表,發現好像沒有網頁資源下載工具,也是難為 AI 了。但是它支援編寫 Shell 腳本,所以我們不妨引導 AI 編寫腳本來實現資源下載。
|
||
|
||

|
||
|
||
提示詞:
|
||
|
||
```markdown
|
||
請幫我獲取 10 張健康的熊貓頭表情包,並且下載到當前目錄下,你可以通過編寫可執行腳本來實現圖片的下載
|
||
```
|
||
|
||
這次就可以看到智能體開始自主規劃任務了,先創建了一個腳本,然後「寫文件」操作需要我們確認,這裡建議選擇僅允許一次,安全一些:
|
||
|
||

|
||
|
||
遇到問題它會嘗試 **重新規劃** 然後重試,這也是智能體的一個關鍵能力:
|
||
|
||

|
||
|
||
任務執行完後還記得清理腳本,這個很不錯。
|
||
|
||

|
||
|
||
好了,大功告成,我們看看下載好的文件,這個尺寸是認真的麼?果然翻車了,下載的圖片根本不對!
|
||
|
||

|
||
|
||
|
||
|
||
### 3、文件操作
|
||
|
||
輸入下列提示詞,讓 AI 幫忙處理我本地的表情包文件:
|
||
|
||
```markdown
|
||
幫我把所有的表情包尺寸放大 1 倍,並且轉換為 WEBP 格式,然後將所有表情包組合在一起生成為 GIF
|
||
```
|
||
|
||
然後應該要指定文件路徑吧,不然 AI 可能不知道要處理什麼。
|
||
|
||
結果當我輸入 `@` 鍵指定文件路徑時,好傢伙,輸入框直接卡死了?該說不說,這個互動體驗不夠好,我每次選擇文件都會卡,而且選擇不了目錄。
|
||
|
||

|
||
|
||
經過一番折騰,我發現 得慢點選擇,跟著程序列舉出的目錄樹進行選擇,就先選一個圖片吧:
|
||
|
||

|
||
|
||
好,這次 AI 聰明了,問我是不是要處理多個文件,必須的:
|
||
|
||

|
||
|
||
然後 AI 發現無法處理圖片,要下載一個圖片處理工具,然後它說要利用 Mac 上的軟體包管理工具來安裝,同意即可:
|
||
|
||

|
||
|
||
經過漫長的等待,等了快 10 分鐘竟然還沒好?!
|
||
|
||

|
||
|
||
可能是我自己的網路原因吧,但我實在等不下去了。老實說測到這裡,我心態都已經有點崩了,凌晨兩點半隔這兒等軟體安裝?
|
||
|
||

|
||
|
||
不是,這玩意你寫個簡單的 Python 腳本不就搞定了?
|
||
|
||
感覺這個工具還是得給程式設計師用,要稍微加一些引導,比如我們讓 AI 利用 Python 腳本實現任務:
|
||
|
||
```markdown
|
||
幫我把所有的表情包尺寸放大 1 倍,並且轉換為 WEBP 格式,然後將所有表情包組合在一起生成為 GIF,使用 Python 腳本實現
|
||
```
|
||
|
||
可以看到 AI 安裝了圖像處理庫,然後創建了一個虛擬環境,你別說它對安全性的考慮還是 ok 的:
|
||
|
||

|
||
|
||
然後編寫腳本並執行:
|
||
|
||

|
||
|
||
任務成功完成,看下效果:
|
||
|
||

|
||
|
||
尺寸確實放大了,格式也轉換成功了,GIF 也成功生成了。終於順利完成了一次任務,還不戳。通過這種方式處理本地圖片確實是要比網頁端的 AI 應用方便很多。
|
||
|
||
|
||
|
||
### 4、生成程式碼
|
||
|
||
輸入下列提示詞,讓 AI 幫我做個像素攝影網站:
|
||
|
||
```markdown
|
||
請幫我製作一個網站,能夠調用攝像頭進行拍照,並將照片轉為像素風,支援下載,要求界面簡潔炫酷
|
||
```
|
||
|
||
這次生成速度還是挺快的,就是過程中得多次進行人工確認:
|
||
|
||

|
||
|
||
我們來看下生成的網站效果:
|
||
|
||

|
||
|
||
可以調整像素的密度,還可以一鍵下載照片,效果還是挺不錯的,這次任務 AI 也順利完成了~
|
||
|
||

|
||
|
||
|
||
|
||
### 5、解釋程式碼
|
||
|
||
給剛剛生成的專案補充一個學習指南,輸入提示詞:
|
||
|
||
```markdown
|
||
幫我生成該專案的學習指南,幫助新開發者快速上手
|
||
```
|
||
|
||
由於 AI 有上下文,它直接 get 到了我想讓他分析哪個專案,然後很快生成了一個專案文件。
|
||
|
||

|
||
|
||
然後我讓 AI 幫我打開文件文件:
|
||
|
||

|
||
|
||
本來是想讓 AI 直接打開 Markdown 閱讀軟體的,但沒想到它直接給我輸出了一堆無關的內容,我表示不理解。
|
||
|
||

|
||
|
||
那我自己打開好了吧,生成的文件內容還是過關的,標準的 GitHub 開源專案文件。
|
||
|
||

|
||
|
||
|
||
|
||
### 6、生成架構圖
|
||
|
||
好,鑒於剛剛的任務完成得還可以,我們加大難度。讓 AI 生成一個專案的分層架構圖:
|
||
|
||
```markdown
|
||
幫我針對當前專案,生成分層架構圖
|
||
```
|
||
|
||
結果就有點烏龍了,AI 給我生成了一個架構設計文件:
|
||
|
||

|
||
|
||
你管這純英文文件叫做架構圖?
|
||
|
||

|
||
|
||
那我再發揮一下僅存的專業性,讓他幫我生成架構圖的繪圖程式碼:
|
||
|
||
```markdown
|
||
幫我針對當前專案,生成分層架構圖的 draw.io 程式碼
|
||
```
|
||
|
||
這次看著靠譜多了:
|
||
|
||

|
||
|
||
來,我們把 AI 生成的架構圖程式碼文件拖到 draw.io 中打開。
|
||
|
||
不是哥們?你管這叫架構圖?
|
||
|
||

|
||
|
||
來,同樣的任務,我們用 Cursor + Claude 4 試一試。
|
||
|
||
哎,你看人家 Claude 很有自信,說「我可以為您生成一個更完整和詳細的分層架構圖」:
|
||
|
||

|
||
|
||
好,看下生成後的效果,是不是高下立判啊!
|
||
|
||

|
||
|
||
|
||
|
||
### 7、生成可視化圖表
|
||
|
||
讓 AI 幫我分析專案的提交記錄,輸入提示詞:
|
||
|
||
```markdown
|
||
根據當前專案的提交記錄,生成可視化圖表,便於我來分析專案的發展歷程
|
||
```
|
||
|
||
可以看到 AI 使用 git log 命令查看程式碼提交記錄,然後開始生成圖表。
|
||
|
||

|
||
|
||
等等?圖表在哪兒呢???
|
||
|
||
我的預期肯定是生成一個圖片,或者起碼是一個字符畫,看著像圖也行啊,有點為難他了。
|
||
|
||
|
||
|
||
### 8、多模態
|
||
|
||
等驗證到多模態的時候已經是凌晨 3 點,我都已經麻了,唉,最後再堅持試試多模態吧。
|
||
|
||
輸入生成圖片提示詞:
|
||
|
||
```markdown
|
||
幫我基於當前目錄下的圖片,生成一個風格相似的新圖片
|
||
```
|
||
|
||
這次 AI 乾脆直接拒絕了,不支援圖片創作,你倒是寫個腳本啊?!你不用 AI,用個圖像處理也行對不對?
|
||
|
||

|
||
|
||
那再解釋個圖片試試,輸入解釋圖片提示詞:
|
||
|
||
```markdown
|
||
幫我解釋當前目錄下所有的圖片
|
||
```
|
||
|
||
這倒是解釋出來了,吐槽一下,竟然還是英文輸出,可能跟程序本身的語言設定有關吧,體驗沒有那麼好。
|
||
|
||

|
||
|
||
Gemini CLI 背後用的應該是 Gemini 2.5 Pro 模型,是具有原生多模態輸入能力的,也就是說能識圖,但是並不能創作圖片,包括創作音訊和影片應該都是通過第三方大模型(或者 MCP 工具實現的)。
|
||
|
||
最後再讓他解釋個 PDF 吧,輸入提示詞:
|
||
|
||
```markdown
|
||
幫我總結 PDF 的內容,並生成一個新的 PDF
|
||
```
|
||
|
||
結果出乎我意料了,AI 提示輸入超出了 token 限制?
|
||
|