Gemini CLI 简介:开源免费AI超级助手,重塑终端开发体验!
创建时间:2025年07月20日 10:30:12

cli_coding.png

Google 在2025年6月25日正式发布了开源 Gemini CLI! 这是一个开源(Apache 2.0 许可)命令行人工智能代理,是一个通过命令行调用 Gemini API 的终端工具。 终端党们,你们的超级AI助手来了!

Gemini CLI 是什么?

Gemini CLI 是开源的人工智能代理,将 Gemini 大模型直接接入您的终端,提供对 Gemini 轻量级访问,提供从提示到模型的最直接路径。基于 ReAct 推理-行动循环,为开发者提供在本地或远程 MCP 服务器上调用 Gemini 系列模型的能力。您可以借助它完成从代码生成、调试到自动化运维的全流程任务。

小常识:什么是CLI? CLI:Command-Line Interface(命令行界面),是一种文本交互模式。。

使用Gemini CLI,您可以:

  • 基于 Gemini模型100万Token上下文分析和编辑大型代码库
  • 借助 Gemini多模态功能,分析PDF和处理图片等。
  • 自动化操作任务,例如:查询拉取请求。
  • 使用工具MCP服务扩展新功能,例如:用Imagen、Veo或Lyria生成媒体。
  • 使用Gemini内置的Google搜索工具进行查询。

为什么要使用Gemini CLI?

使用 Gemini CLI 的理由有一个就足够:免费使用顶级模型且用量给够! 对标每月 $20 竞品,诚意拉满!

  • 免费:目前 Gemini CLI 是免费使用 Gemini顶级模型 Pro 的唯一官方渠道,只需 Google账号,无需绑定信用卡。
  • 模型牛:Gemini CLI 的核心是Gemini 2.5 Pro,这是一个能够处理多达 100 万个 token 的多模态基础模型,允许开发者输入大型代码库、文档和文件树,进行全面的多步骤分析或转换。
  • 用量够:史上最慷慨免费额度,个人用户通过谷歌账号登录,即可获得 Gemini 2.5 Pro 的使用权,享有 100 万 Token 的上下文窗口,以及 每分钟 60 次、每天 1000 次 的模型请求额度。

gemini_free.png

Gemini CLI 的目标并不仅限于辅助编码,还可进行研究、生成内容,以及自动化日常任务,Gemini CLI 都将成为编码、设计、日常办公等多种场景的多功能提效利器

核心特性

1. 多模态能力支持

Gemini CLI 能力远超文本,是一个真正的多模态工具,能看懂、能创造,让你的终端充满想象力。

  • 看懂图片:丢给他一张发票图片,提取信息并转换成JSON格式。
  • 生成媒体:调用Google的媒体生成模型,根据文字描述直接创造出图片和短视频。

2. 内置 Google 搜索

AI回答不再是“过去时”,能实时联网,当询问最新的技术框架或API用法时,能给出基于当前网络信息的、最准确的答案,而不是过时的信息。

3. 本地文件系统深度集成

通过 @ 符号,可以轻松地将本地的一个或多个文件、甚至整个文件夹作为 上下文(Context) 发给 Gemini。

示例:输入 请帮我重构 @src/zhishile_main.js 这个文件 ,Gemini 就会读取该文件的内容并给出重构建议,无需手动复制粘贴。

4. Shell模式集成(自然语言执行 Shell 命令)

通过 ! 符号,可以切换为 Shell 模式,与系统终端的深度集成。直接在 Gemini CLI 会话中运行系统命令,如:文件操作、环境配置,避免频繁切换终端窗口。

同时,也可以在交互模式下,通过自然语言让 Gemini 生成复杂的命令行指令,并直接执行它,或者运行已知的命令。

示例:输入 查找当前文件夹下所有大于 10MB 的 .log 文件,Gemini 可能会返回命令: find . -type f -name "*.log" -si  ze +10M ,在得到用户确认后立即运行。

5. 脚本化工作流

开发者可以在不离开终端的情况下,完成代码编写、阅读、调试、编写测试、生成 Git 提交信息、寻求 AI 帮助等一系列任务,极大地减少了上下文切换的成本。

不止聊天,能作为命令直接在终端运行,融入自动化脚本,实现生成文档、代码摘要等高级操作。

示例:

gemini --prompt '分析项目架构'

毫无疑问,Gemini CLI 凭借其免费策略、强大的搜索集成、大上下文和惊艳的多模态能力,为开发者提供了卓越的日常辅助、信息查询和原型构建体验。


接下来,让我们开始安装Gemini CLI。