首页 > 教程攻略 > ai资讯 >不限时免费，全球榜单前十AI Lab开放全模态API，我先替你测了

不限时免费，全球榜单前十AI Lab开放全模态API，我先替你测了

来源：互联网时间：2026-06-01 16:39:58

先说几点观察。Tokenmaxxing——把Token消耗拉到极限——正在成为开发者社区里的新晋热词。Token预算被越来越多的人看作是衡量AI使用深度的关键指标，甚至有初创公司CEO直接把Anthropic的账单晒在LinkedIn上，把它当成公司AI化程度的某种勋章。

图源：Swan AI CEO Amos Bar-Joseph

但一个关键问题正在被忽略：我们究竟在用这些Token创造什么？

成本的确在往上蹿。高盛的预测是未来几年Token使用量可能增长24倍以上；英伟达应用深度学习副总裁更是直言，AI成本已经超过了团队薪资。

图源：高盛

然而，产出的质量呢？数据给出的答案，就不那么乐观了。

代码生成领域尤其典型。Waydev跟踪了50多家企业，发现AI生成代码的长期保留率仅为10%~30%。GitClear的报告更加直接：重度AI使用者的代码返工量，是非AI用户的9.4倍。Jellyfish的统计则显示，部分团队的代码吞吐量提升了2倍，但代价是Token成本飙升了近10倍。

代码翻修量增速超过生产力增速，数据来源：GitClear

当Token的消耗持续往上走，投入产出比就变成了谁都绕不开的问题。Token焦虑，正在成为很多团队AI落地过程中最真实的阻力。

也正是在这场蔓延的焦虑中，Agnes AI的动作显得格外扎眼——这家在全球榜单排名第九的AI Lab宣布，自6月1日起，旗下全模态模型API无限期免费开放。

01.当Token越来越贵，一家AI Lab把账单直接清零

Agnes AI本次开放覆盖了三款核心模型：文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.0-Flash，以及视频模型Agnes-Video-V2.0。

自6月1日起，这些模型API将面向全球开发者无限期免费开放。对于中小团队、独立开发者和创作者来说，模型调用的成本门槛可以说被一把清空，试错空间被极大释放。

在Agnes AI看来，高质量AI不应该只是高预算公司的特权。免费开放文本、图片、视频全模态模型API，意味着有限的预算可以更多地投向产品创新和功能迭代。

02.文本、图片、视频一起开放，一手实测看看实力

成本归零了，开发者自然更关心：模型到底能不能打？我们分别对文本、图像和视频模型进行了一轮实测。

文本模型：1M超长上下文，快速搭建生产力场景

Agnes-2.0-Flash支持1M上下文窗口和工具调用，覆盖代码开发、企业知识库、智能客服、文档处理以及Agent工作流等场景。为了看看这些能力在实际中的表现，我们从代码生成、网页搭建到前端设计都跑了一轮。

首先是编程能力。让Agnes-2.0-Flash生成一款飞机大战网页游戏。

好家伙，模型不仅把飞机大战的完整玩法框架生成了出来——战机、小怪、Boss战、计分、生命值，还主动加入了连击提示、粒子爆炸、动态星空背景和音效。完成度远超出一般Demo，几乎就是个可以直接上手玩的成品。

第二个测试换了个方向。只用一句提示词，Agnes-2.0-Flash就搭好了一个SBTI人格测试网站。

网站包含完整的测试流程、结果计算逻辑以及人格类型展示页面，用户完成答题后直接就能看到结果。整个体验和市面上常见的在线人格测试产品已经很接近了。

前两个案例看下来，无论是网页小游戏还是测试网站，Agnes-2.0-Flash都能较快完成。接下来，我们决定提高一下难度，重点考察前端设计和产品界面生成能力。

第三个测试是摄影作品展示网站。生成结果给人的第一印象是审美在线，整体布局和视觉风格已经接近不少独立摄影师作品集网站的完成度。

如果这考验的是审美和页面布局，那么社交产品则更考验复杂的交互能力。我们进一步让Agnes-2.0-Flash生成一个类似X的社交分享网站。

最终页面包含了信息流、搜索框、关注按钮、侧边导航栏、推荐内容等多个核心模块，关注、点赞等按钮还带有相应的动画反馈。从视觉和交互来看，和X的产品形态极为接近。

整体来说，如果只是作为产品Demo或前端原型展示，Agnes-2.0-Flash的能力已经可以满足不少项目早期验证和演示的需求。

图像模型：主打可编辑，人像精修、电商图和信息图全覆盖

Agnes-Image-2.0-Flash支持图改图、多图融合、背景替换、局部编辑、文字修改和风格转换等能力，适用于电商主图、广告设计、产品海报和社交媒体内容生产等高频场景。

先来一组人物形象重塑任务，重点测试人像特写的编辑能力。模型需要在保留原人物身份特征的同时，将其重新塑造成韩流偶像打歌舞台的风格。

结果很有意思。大幅修改人物造型的同时，人脸一致性保持得相当稳定。皮肤纹理、光影层次和镜头质感也得到了强化，人物看起来更贴近专业摄影和商业视觉作品的效果。

第二组测试，我们把目标放在电商设计场景。上传一张护发精油的实拍照片，要求模型生成一张完整的电商海报。

最终生成的结果不仅保留了产品主体和品牌Logo，还自动补充了产品卖点文案、视觉装饰元素以及符合电商风格的版式设计。产品主体突出，光影和质感增强，背景加入了与产品调性相符的视觉元素。对于电商运营、品牌营销和内容团队来说，这类能力能够有效减少拍摄、修图和排版的工作量。

信息图是对图像模型更复杂的考验。我们设计了两组不同方向的信息图任务。

第一组偏向流程图和知识科普场景。

生成结果不仅完成了完整的流程结构搭建，还自动加入了大量图标、插画和视觉引导符号。不同步骤之间通过箭头、色块和层级关系连接，即使包含大量文字信息，整体依然保持着不错的视觉辨识度。

第二组测试继续提高难度。要求模型根据海洋生物特征生成一套建筑概念设计信息图，既要展示灵感来源，也要呈现设计推导过程和最终建筑方案。

模型完成了从生物形态分析、设计语言提炼到建筑概念落地的完整表达，包含了参考素材、结构拆解、色彩分析、空间推演以及最终效果图等多个板块。

两组测试呈现出同一个特点：当信息密度持续提升时，Agnes-Image-2.0-Flash不仅能生成对应内容，还会主动组织版面结构，让图片同时承担“展示”和“解释”两种功能。对于制作科普内容、商业汇报、设计方案和社交媒体长图来说，这种能力相当实用。

视频模型：支持音画同出，电影感、角色演技都在线

Agnes-Video-V2.0支持音画同步生成、首帧生视频、首尾帧生视频以及多帧生成，输出分辨率可选720P或1080P，适用于短视频制作、广告素材生产、剧情分镜和自动化视频工作流。

先测试音画同步生成能力。

第一个案例是一段架子鼓演奏视频。画面中的男孩坐在鼓组前完成演奏动作，开头先用脚踩下底鼓踏板，随后才开始用鼓槌演奏。整个过程鼓点出现的时机和人物动作能保持同步。对于音乐演奏类内容来说，这类细节往往比单纯的画面质量更难处理。

第二个案例进一步增加了复杂度。乐队画面中需要同时出现主唱、吉他手和鼓手三名人物。除了乐器演奏声，视频还包含了主唱开场时清晰的人声报数。从最终效果看，人声、乐器以及人物动作之间保持了较好的同步。主唱开口时的口型变化，鼓手和吉他手的演奏动作，都和对应的声音基本匹配。

单从这两个案例来看，Agnes-Video-V2.0具备处理复杂音频元素的能力。相比后期单独配音的方案，音画同步生成能够减少剪辑和配音环节，对短视频创作、音乐内容制作以及剧情视频生成都会更加方便。

随后，我们又测试了一个更具电影质感的场景。视频中，一名身穿西装的男子走在街头，打电话与另一端的人交流。从最终效果看，人物口型与台词对应得不错，面部表情和情绪变化也会随着对话内容调整，整体表演很自然。更吸引人的是画面的电影感，和背景声配合之下，视频看起来更像实景拍摄的片段。

最后，我们测试了一个更具挑战性的人物表演场景。整个片段几乎没有大幅度动作，更多依赖眼神、呼吸和面部细节来传递情绪。从最终效果看，人物表演呈现出很强的层次感。相比单纯的“流泪”镜头，这种情绪表达更接近影视作品中的表演方式。从微表情、情绪递进到镜头表现，Agnes-Video-V2.0生成的视频开始具备戏剧张力，也让AI生成角色向真人演员的表现力又靠近了一步。

从工作流的角度看，文本模型负责规划与代码，图像模型专注视觉编辑，视频模型完成动态呈现。三者不是孤立的单点能力，而是一套开发者可以组合与调用的全模态能力体系。

03.全球AI Lab第9名，连续登上国际榜单

免费开放不是因为它能力不行，恰恰相反——Agnes AI目前位列全球AI Lab第9名，并且连续获得多个国际评测体系认可。

文本模型Agnes-2.0-Flash进入Claw-Eval榜单，排名国内前7。这个榜单关注真实Agent场景下的复杂任务规划、工具调用和连续执行能力，被认为是更接近实战的评测体系。

图源：Claw-Eval榜单

图像模型Agnes-Image-2.0-Flash则进入Artificial Analysis Image Editing Leaderboard前列。该榜单采用真实用户盲评，根据生成质量主观打分。

图源：Artificial Analysis

同时，视频模型Agnes-Video-V2.0也出现在了Artificial Analysis Image-to-Video（With Audio）排行榜中，覆盖音画同步生成能力评测。

图源：Artificial Analysis

从PinchBench全球前十，到Claw-Eval与Artificial Analysis持续上榜，Agnes已经在文本、图片、视频三大模态获得了国际评测体系的认可。正是因为有这样的底气，Agnes才把全套API免费开放，让开发者直接在真实应用里使用。

04.结语：免费开放背后，一场关于AI基础设施的新竞争

随着模型性能不断接近，开发者对成本、稳定性、调用便利性和工程化能力的关注正在上升。

云计算行业曾经经历过类似的阶段：当基础设施逐渐普及，应用生态也随之扩张。AI领域正在出现相似的变化。越来越多的开发者希望把精力投入产品设计和用户需求，却仍然被调用成本牵制着。

Agnes这次无限期免费开放全模态模型API，提供了一个值得观察的新样本：在继续提升模型能力的同时，进一步降低开发和使用的门槛。这让更多开发者、创作者和中小团队拥有了持续试验新产品的空间。对整体AI生态来说，除了能力增长，普及速度同样值得关注。

不限时免费，全球榜单前十AI Lab开放全模态API，我先替你测了

01.当Token越来越贵，一家AI Lab把账单直接清零

01.当Token越来越贵，一家AI Lab把账单直接清零

02.文本、图片、视频一起开放，一手实测看看实力

02.文本、图片、视频一起开放，一手实测看看实力

文本模型：1M超长上下文，快速搭建生产力场景

图像模型：主打可编辑，人像精修、电商图和信息图全覆盖

视频模型：支持音画同出，电影感、角色演技都在线

03.全球AI Lab第9名，连续登上国际榜单

03.全球AI Lab第9名，连续登上国际榜单

04.结语：免费开放背后，一场关于AI基础设施的新竞争

04.结语：免费开放背后，一场关于AI基础设施的新竞争

相关阅读

相关下载