首页 > 教程攻略 > ai资讯 >AI搜索迎来2.0版本,我对比了五款支持深度推理的搜索引擎

AI搜索迎来2.0版本,我对比了五款支持深度推理的搜索引擎

来源:互联网 时间:2026-06-10 13:53:47

"You'll never go to a search site again"

这句话出自比尔·盖茨在旧金山AI Forward 2023活动上的预言。

17个月后,AI搜索正式迈入2.0时代。

就在上周,Kimi上线了“探索版”——一个支持深度推理的AI搜索功能。即便每人每天仅限使用五次,服务器还是被挤崩了。

厂商们又一次像约好了一样扎堆更新:

AI搜索引擎Perplexity悄然上线了由ChatGPT O1-mini驱动的Pro搜索。

有趣的是,OpenAI自家的对话页面里,o1-preview至今仍未支持联网搜索。

这不禁让人好奇:到底有多少熟悉的选手已经悄悄支持了深度搜索?

梳理下来,名单是这样的:

  • Perplexity —— “Pro搜索”
  • Kimi —— “探索版”
  • 豆包 —— “深入搜索”
  • 智谱 —— “AI搜索(默认就是推理版本)”
  • 360AI慢搜索 —— “慢思考模型”

可以预见,AI搜索2.0产品将重现AI模型界的“百家争鸣”,推理能力也将成为标配。

但问题是,AI搜索不像AI模型那样有各种排行榜,挑靠前的用就行。所以,我们决定从

易用性、理解能力、准确性

三个维度,来实测一下这些2.0产品到底有多好用。


一、易用性

先说结论:

豆包 = 智谱 = 360AI > Perplexity > Kimi

易用性主要看三个实际难点:

  • 使用次数是否有限制
  • 单次搜索能访问的页面数量
  • 搜索结果的分享形式

Perplexity的Pro搜索每四小时可免费使用五次。Kimi探索版每天仅限五次。豆包、智谱和360AI均没有明确的使用次数限制。

由于Kimi探索版特别强调单次搜索能访问超过500个页面,我们也做了一个对比:针对同一个高难度问题,重复提问三次,统计每款产品每次访问的网页数量——页面数量直接决定了AI模型的“眼界”。

至于分享形式,平时用搜索引擎最习惯的就是复制链接到处粘贴。Kimi、智谱、豆包、360AI都支持复制完整文本、生成图片和链接。豆包还额外允许设置是否让其他用户访问对话记录中的文件,Perplexity则可以限定链接仅自己可见。


二、理解能力和准确性

既然这些产品的最大共同点都是

支持推理能力的AI搜索

,那理解能力对应第一步:问题发送后,AI是否能正确领会并检索到有效网页?准确性对应最后一步:模型是否能准确整合网页信息,不胡编乱造?

为此,我们准备了两个“上天入地”级别的问题:

  • Elon Musk's SpaceX: Timeline of all 5 Starship flight tests, including dates and reasons for failures or notable successes.(整理埃隆·马斯克SpaceX的5次Starship飞行测试时间线,包括失败原因或里程碑。)
  • OpenAI is reportedly involved in a trademark dispute with Guy Ra vine, who owns the 'Open AI' (with a space) trademark. Tell me the timeline of this matter.(OpenAI正卷入与Guy Ra vine的商标纠纷,后者拥有“Open AI”(带空格)商标。告诉我这件事的时间线。)

一个横跨时间线,另一个暗藏名称陷阱。没用奥数题,是为了尽可能模拟日常使用场景——毕竟,平时如果不是为了刁难GPT,估计没人会主动解题。

(由于图片大小限制,以下截图主要展示交互形式,完整图片可参考原文中的链接)

1. Perplexity

需要说明:用英文提问是因为Perplexity有一个设定,它会判断当前问题是否值得o1出手——如果问题不够棘手,根本不会启用o1。

点评

:Perplexity准确理解了两个问题,搜索出12个网页,从中选择5个作为信息源,均未出错。在没有人工干预的情况下,它还额外补充了更详细的说明。不过,它对最新一次Starship Flight 5的回答有误,判断为实验尚未运行。

2. Kimi

点评

:值得称赞的是Kimi的自动展开功能——使用AI搜索时,为了二次确认信息准确性,反复阅读信息源是刚需。从结果看,Kimi的信息源中英文各占一半,准确理解了两个问题,最终输出都正确。

3. 豆包

点评

:豆包稍显吃力。第二个问题每次回答都会半路报错。从第一个问题来看,搜索来源全是中文网站,可能对网页来源做了限制,导致信息源不够广泛,不过最终回答正确,没有受太大影响。

4. 智谱

点评

:智谱的搜索来源同样全是中文网站。第一个问题中,它犯了和Perplexity一样的错误——认为第五次飞行尚未开始。第二个问题顺利回答出来了,但仍有部分错误:Guy Ra vine申请商标的时间实际上早于OpenAI公司成立的时间。

5. 360AI

点评

:360AI搜索有一个显著优势——可视化了思考过程,方便快速了解推理链条并定位问题。这里可以看到,第一步它只搜索了第五次飞行,但在后面的反思环节中,又找回了前四次的结果。可惜的是,第五次实验依旧回答错误;第二个问题中,丢失了2024年的时间记录。

个人账号使用次数有限,上面的对比花了三天时间,每个问题重复运行五次。

结论至此也新鲜出炉:

Kimi > Perplexity = 智谱 = 360AI > 豆包

顺便问一句,谁还记得远在大明湖畔的Bing AI呢?

大家可以根据这三个指标,选出自己的AI搜索初体验。


写在最后

写这篇文章时,我们询问了多位AI深度用户,他们中的大部分人已经从传统搜索引擎转向了GPT或Perplexity,甚至完全将GPT Search设为默认选项。

令人无比期待的是,当深度推理能力进一步发展后,未来我们是否能像《超体》那样,拥有一个开发率100%的AI大脑?

这样的世界,想了,但又有些不敢想。

相关下载