首页 > 教程攻略 > ai资讯 >谷歌发布官方 CLI,可操作所有谷歌文档

谷歌发布官方 CLI,可操作所有谷歌文档

来源:互联网 时间:2026-05-28 09:59:17

今天上午,一个名为Google Workspace CLI的项目悄然出现在GitHub上,并且直接归属于Google Workspace的官方组织。这个动作本身,就足以引起开发者社区的关注。

项目的热度攀升得飞快。开始撰写本文时,它的Star数还停留在2700;准备发布前刷新了一下,已经涨到了3500;而就在刚刚,这个数字又跳到了3700。这种增长速度,在技术工具类项目中并不多见。

项目的发布也颇具分量,由Google Cloud AI的负责人Addy Osmani亲自在推特上宣布。虽然项目的README里明确写着“这不是谷歌官方支持的产品”,但考虑到它挂在官方组织下,且核心开发者来自Google Workspace的开发者关系团队,再加上高管的公开背书,其定位已经相当清晰:这是一个得到谷歌官方认可、但暂不提供标准服务承诺的“亲儿子”项目。

它在解决一个具体问题

这个工具的出现,直指一个正在浮现的核心矛盾:过去三十年里,我们为人类眼睛和鼠标设计的图形界面,对AI智能体(Agent)来说,却是一道难以逾越的屏障。

邮件、文档、日历、云盘……所有这些生产力工具的操作逻辑都建立在点击、拖拽和视觉反馈之上。但Agent没有眼睛,也不会用鼠标。它们需要的是另一种交互范式:发送一个明确的指令,然后接收结构化的数据,接着继续执行下一个任务。整个过程必须是无GUI、可编程、且机器可读的。

Google Workspace CLI正是为此而生。它将Google Workspace繁杂的API,封装成一行行简洁的命令行指令,并且所有输出——无论是成功的结果还是报错信息——都采用标准的JSON格式。这意味着Agent可以直接解析和处理,无需再费力“理解”网页上的复杂布局。

来看几个具体的例子:

让Agent列出最近的10个文件,只需:

gws drive files list --params '{"pageSize": 10}'

新建一个名为“Q1预算”的表格,命令是:

gws sheets spreadsheets create --json '{"properties": {"title": "Q1预算"}}'

甚至可以在Google Chat中发送一条消息(`--dry-run`参数用于预览,不会真实发送):

gws chat spaces messages create
  --params '{"parent": "spaces/xyz"}'
  --json '{"text": "部署完成"}'
  --dry-run

这种设计,本质上是在为AI时代的生产力工具铺设“机器可读”的轨道。

覆盖 Google Workspace 的全部主要产品

目前,这个CLI工具已经覆盖了Google Workspace的核心产品矩阵:Drive、Gmail、Calendar、Sheets、Docs、Chat、Admin以及其他相关API。

其中一个设计颇为巧妙:它没有预设一个固定的命令列表。相反,它在每次运行时,都会动态查询谷歌官方的API目录(Discovery Service),实时生成可用的命令。这意味着,只要谷歌为其Workspace产品新增了API,这个CLI工具就能自动支持,无需等待版本更新。

在认证方面,它考虑得相当周全,覆盖了从本地开发、持续集成(CI)环境到服务账号(Service Account)的各种场景,并且支持直接传入已有的访问令牌。所有凭证在本地都会进行加密存储,兼顾了便利性与安全性。

Agent 接入有三种方式

无论你使用哪种Agent框架或工具,都能找到合适的方式接入。

第一种,作为命令行工具直接调用。

这是最基础的用法。安装后,Agent(例如Claude Code、OpenClaw等)可以直接在Shell中执行命令,并获取JSON结果。这为同时调度多个Agent处理Workspace中的任务提供了可能。

第二种,作为MCP服务器运行。

只需一行命令:

gws mcp -s drive,gmail,calendar

启动后,任何支持MCP协议的客户端,如Claude Desktop、Gemini CLI或VS Code,都能直接调用这些工具,实现更深度的集成。

第三种,通过Skills方式接入。

项目仓库内置了超过100个SKILL.md文件,详细说明了每个API的用法,还提供了50个针对Gmail、Drive等产品的常用操作“配方”。对于OpenClaw用户,工具甚至能自动检测并提示安装。一键安装所有技能的命令也非常简单:

# 一行命令安装全部
npx skills add https://github.com/googleworkspace/cli

OpenClaw 的作者,想一决高下

有趣的是,市场并非没有先行者。OpenClaw的开发者Peter Steinberger,几个月前就因为找不到好用的工具,自己动手造了一个名为`gog`的Google Workspace CLI。

当谷歌官方工具发布时,Peter在推特上回应说,他会进行详细的评估测试,看看哪个工具更适合Agent使用。但他也坦言:“看到它要求的JSON命令格式,我不太确定了。”

两者的设计哲学确实不同。`gog`的命令更接近自然语言,例如:

gog gmail search 'newer_than:7d'

而Google Workspace CLI则更贴近底层API的结构:

gws drive files list --params '{"pageSize": 5}'

对于Agent而言,封装层级越高、命令越像自然语言,其理解和执行的难度就越低,出错的可能性也越小。在这场“谁更懂Agent”的较量中,最终结果还有待评估。Addy Osmani也公开表示,欢迎Peter提交功能请求。

还有一个细节

如果你仔细查看项目仓库,会发现根目录下有一个与`README.md`并列的`AGENTS.md`文件。

这份文件是专门写给AI编程助手(比如Claude Code)的贡献指南,详细说明了如何为该项目编写代码、提交Pull Request以及进行安全检查。文件里有一句话特别值得玩味:“这个CLI经常被AI Agent调用,写代码时永远假设输入可能是恶意的。”

这传递出一个明确的信号:

开发者已经默认,未来维护代码库的将有人类也有AI,同时默认调用这些接口的也将是Agent。

这种“为AI而生,由AI参与构建”的思路,正在成为开源项目的新范式。事实上,`gog`的仓库里也有同名的指导文件。

此外,该工具还支持接入Google Cloud的Model Armor服务。这能在API返回的内容到达Agent之前,自动扫描是否存在提示词注入(prompt injection)等攻击,并可根据设置进行警告或直接拦截。这再次强调了同一个理念:在AI驱动的世界里,调用方(Agent)本身也成为了需要防护的攻击面。

目前,该工具版本号为v0.3.4,仍处于活跃开发阶段。在v1.0正式版发布前,API可能存在破坏性变更。但毫无疑问,它已经为自动化工作流打开了一扇新的大门。

相关下载