Google 「Gemini CLI」是什麼?新一代終端 AI 代理功能、應用與使用方法全面解析

Gemini CLI 核心亮點速覽:

  • 直接呼叫強大模型: Google 「Gemini CLI」 讓你直接驅動最新的大規模語言模型 Gemini 2.5 Pro
  • 一站式開發助理: 不僅限於問答,更能從程式碼生成、測試建立到執行錯誤自行修復,提供一站式開發支援
  • 親民的開源工具: 根據 Apache 2.0 許可證發布,提供每分鐘最多 60 個請求、每天最多 1,000 個請求的免費額度,讓個人開發者也能輕鬆上手。

Gemini CLI 是什麼?

2025 年 6 月 25 日,Google 正式發布了一款能直接呼叫最新大規模語言模型 Gemini 2.5 Pro 的開源工具:「Gemini CLI」

Gemini CLI 憑藉其卓越的 100 萬個 Token 上下文窗口,以及每分鐘 60 個請求、每天 1,000 個請求的慷慨免費預覽額度,迅速在社群媒體上引發熱議,許多開發者紛紛表示:「Gemini 的命令行版本終於來了!」

值得一提的是,Gemini CLI 使用了與 VS Code 擴充功能 Gemini Code Assist 相同的代理平台,但它更加輕量級,可以輕鬆地從腳本中呼叫整合

在本文中,我們將為您詳細解析 Gemini CLI 是什麼、它能做什麼,以及如何開始使用這個強大的終端 AI 工具。

Gemini CLI 概覽:定義與核心優勢

定義與發布:

    Gemini CLI 是 Google 推出的一款開源 AI 工具,它是一個輕量且功能強大的終端用 AI 代理 (command-line AI agent)

    該工具於 2025 年 6 月 25 日正式公開,並透過 Apache 2.0 許可證發布。

    核心功能與模型:

    直接呼叫 Gemini 2.5 Pro: Gemini CLI 能夠直接驅動 Google 最新的大規模語言模型 Gemini 2.5 Pro,這是其最核心的優勢。

    全方位開發工作流: 它超越了傳統的一問一答模式,能一氣呵成地完成程式碼生成、測試建立,甚至自動修復執行錯誤,展現了多步驟規劃和自動復原的強大代理能力。

    超大上下文窗口: 具備破紀錄的 100 萬個 Token 上下文窗口 (context window),能處理極其複雜和大量的資訊。

    通用 AI 設計理念: Gemini CLI 被設計為一個**「萬能 AI」**,而不僅僅是程式碼補完工具,這意味著它有更廣闊的應用潛力。

    輕量且靈活: 雖然搭載了與 VS Code 擴充功能 Gemini Code Assist 相同的代理基礎,但它更輕量、更便於從腳本中自由呼叫,適合整合進各種自動化流程。

    Gemini CLI 主要功能一覽:不只是問答,更是全方位 AI 助理

    Gemini CLI 的設計宗旨是成為一個輕量且強大的終端用 AI 代理,它能夠直接呼叫大規模語言模型「Gemini 2.5 Pro」,為開發者和內容創作者帶來革命性的變革。

    以下是 Gemini CLI 的主要功能和應用範疇:

    自動化與開發流程整合:

    • 程式碼生成、測試與自我修復: Gemini CLI 不僅能生成程式碼,更具備多步驟規劃和自動復原機制,實現程式碼生成、測試建立乃至執行錯誤的自我修復,是真正的「本格派代理」。
    • 程式碼理解與重構: 它能讀取並總結大型程式碼庫的設計意圖和依賴關係,並提出優化的重構方案,極大提升開發效率。
    • Git 整合與流程自動化: 可與 Git 儲存庫無縫整合,例如自動總結 Pull Request 內容,或引導式自動執行複雜的 Git rebase 步驟,簡化版本控制流程。
    • 生成程式碼與技術文件:
      • 您可以指示它使用特定語言(如 Python 3.11)建立一個 CLI 工具(例如 img-resizer),並定義其功能(接收參數、使用 Pillow 進行影像縮放並儲存為 JPEG、顯示進度條、錯誤時返回 exit code)。Gemini CLI 能成功生成可執行程式碼。
      • 此外,它還能解析指定目錄下的程式碼(例如 main.py),圖解其處理流程(使用 Mermaid.js 序列圖),並自動生成 Markdown 格式的技術文件,大幅減少文檔撰寫時間。

    多模態與內容生成:

    • 自動生成應用程式範本: 具備多模態推論能力,能夠讀取 PDF 規格書或手繪草圖,進而自動生成應用程式範本
    • 媒體內容生成與發布: 透過 Model Context Protocol (MCP) 支援,可以擴展 Imagen、Veo 等生成工具。這使得 Gemini CLI 能夠透過與 Imagen/Veo/Lyria 整合,僅用單行命令生成影片(例如 30 秒的宣傳影片),並直接發布到 Slack 等平台。雖然初始設定下可能無法直接生成圖片,但官方文件指出透過 MCP 整合後即可實現。

    通用資訊處理與報告撰寫:

    • 網路資訊整合與報告撰寫: 當啟用 Google Search grounding 功能後,Gemini CLI 能獲取最新的網路資訊來撰寫報告,展現類似 CLI 版 NotebookLM 的通用性。它甚至能針對您的問題進行網路搜索並給出實用建議,例如,在得知天氣預報後,提醒您「不要忘記帶傘」。
    • 問答與資訊提供: 能流暢處理一問一答式的問題,並以日語等語言流暢回應。它甚至能解釋 Gemini CLI 自身的潛在應用場景,並提供具體示例和其優勢

    擴展性與彈性:

    • 外掛程式擴展: 透過 Model Context Protocol (MCP) 支援,可以像外掛程式一樣靈活擴展 Imagen、Veo 等生成工具或 Google Search Grounding 功能。
    • 跨應用場景規模化: Gemini CLI 被設計為同一個二進位檔即可從個人開發擴展到企業級應用。當您需要大量執行或呼叫其他模型時,只需設定 Google AI Studio/Vertex AI 的 API 金鑰,即可無縫轉為按量計費模式。

    Gemini CLI 定價與方案比較

    Google 旨在讓個人開發者能夠輕鬆上手使用 Gemini CLI,因此在預覽期間提供了慷慨的免費試用額度。

    方案月費使用限制說明
    個人(預覽)免費每分鐘 60 次 / 每天 1,000 次Google 帳號即可使用
    程式碼輔助標準版每用戶 $19提供優先資源與增強功能適用於 VS Code 擴充與 CLI 工具
    企業版合約制專用模型、SLA、SSO、本地推理等進階功能大型團隊、組織專用
    API(AI Studio/Vertex)依用量計費約 $0.007 / 1k tokens 輸入適合需要彈性擴展的應用場景

    總結:Google 「將 AI 從 IDE 中解放」的願景

    Gemini CLI 的發布,完美體現了 Google 「將 AI 從 IDE (整合開發環境) 中解放」的願景。它不僅是一個強大、靈活且易於使用的 AI 代理工具,更為從個人開發到大規模 DevOps,乃至創意內容生成的廣泛應用場景,開啟了無限可能。

    您是否已經準備好,讓這個終端 AI 代理成為您日常工作流中的得力助手了呢?對是值得投資的方向。