Gemini 3.1 Flash-Lite、GPT-5.3 Instant 发布
两大AI巨头的最新轻量级模型几乎同时登场,一场关于“快”与“好”的较量正在上演。一边是谷歌的Gemini 3.1 Flash-Lite,以极致的速度和动态成本控制为卖点;另一边是OpenAI的GPT-5.3 Instant,旨在修复前代模型的“聊天体验”,让对话更自然。这场对决,不仅仅是技术路线的比拼,更是对下一代AI应用形态的预演。
Gemini 3.1 Flash-Lite 发布
主打“动态思考等级”与极致性价比
谷歌这次推出的
Gemini 3.1 Flash-Lite(预览版)
速度最快、成本最低、最适合高并发场景
其核心新特性是
动态思考等级
关键性能指标
谷歌AI负责人Jeff Dean在社交平台上公布了一些硬核数据,让人眼前一亮:
| 指标 | 数据 |
|---|---|
| 输入价格 | $0.25 / 百万 tokens |
| 输出价格 | $1.50 / 百万 tokens |
| LMArena Elo | 1432 |
| GPQA Diamond | 86.9% |
| 首 token 延迟 | 比 Gemini 2.5 Flash 快 2.5 倍 |
第三方评测机构
Artificial Analysis
100万tokens的上下文窗口
每秒360个tokens
有所上涨
Arena 排名
在权威的LMArena排行榜上,Flash-Lite的表现中规中矩:文本竞技场排名第36位,代码竞技场排名约第35位。这个成绩放在整个模型生态里看,算不上顶尖,但结合其成本和速度定位,它无疑在
性能与成本的边界上,找到了一个极具竞争力的甜点
社区反应
AI社区对这次发布的讨论,除了技术参数,更多集中在两个有趣的槽点上。
首先是命名。
其次是发布节奏。
多模态定位
谷歌工程师还特别强调了Flash-Lite的一个实用定位:
“数据管道模型”
AI工作流或智能体管道
OpenAI 推出 GPT-5.3 Instant
主打“更自然的聊天”
几乎在同一时间,OpenAI向所有ChatGPT用户推送了
GPT-5.3 Instant
过度谨慎、免责声明泛滥、回答过于保守
官方改进
根据OpenAI的官方说明,GPT-5.3 Instant主要带来了四方面改进:
- 更自然的对话体验
- 更少不必要的拒答
- 更少的防御性免责声明
- 搜索与回答的结合更顺畅
显然,OpenAI正在努力让AI助手变得更像“人”,而不是一个时刻把安全手册挂在嘴边的客服。
幻觉率改善
在追求自然的同时,准确性也没有被牺牲。OpenAI的内部数据显示,新模型在“幻觉”(即事实性错误)控制上有了显著提升:
| 场景 | 改善 |
|---|---|
| 有搜索 | 幻觉降低 26.8% |
| 无搜索 | 幻觉降低 19.7% |
这意味着,无论是联网检索还是纯模型生成,回答的可靠性都更强了。
API 与 Arena
目前,开发者已经可以在API中调用
GPT-5.3-chat-latest
并排对比评测
GPT-5.4 被提前预告
更引人遐想的是,OpenAI还发布了一条充满悬念的推文:“sooner than you think”(比你想的更快),暗示
GPT-5.4可能即将发布
与美国国防部/国家安全局合同争议
最后插一个 Anthropic 的收入增长曲线:
当谷歌和OpenAI在模型性能上贴身肉搏时,另一家巨头Anthropic则展示了截然不同的“钞能力”。今天流出的数据相当震撼:Anthropic的收入实现了爆炸式增长,
一年时间从10亿飙升至190亿
根据记者Shirin Ghaffary披露的数据,Anthropic的
年度化收入
收入增长时间线
| 时间 | 年化收入 |
|---|---|
| 2025 年 1 月 | $1B |
| 2025 年 5 月 | $3B |
| 2025 年 6 月 | $4B |
| 2025 年 8 月 | $5B |
| 2025 年 10 月 | $7B |
| 2025 年 12 月 | 10B |
| 2026 年 2 月 | $14B |
| 2026 年 3 月 | $19B |
换算一下,这意味着在短短