AI搜索迎来2.0版本,我对比了五款支持深度推理的搜索引擎
"You'll never go to a search site again"
这句话出自比尔·盖茨在旧金山AI Forward 2023活动上的预言。
17个月后,AI搜索正式迈入2.0时代。
就在上周,Kimi上线了“探索版”——一个支持深度推理的AI搜索功能。即便每人每天仅限使用五次,服务器还是被挤崩了。
厂商们又一次像约好了一样扎堆更新:
AI搜索引擎Perplexity悄然上线了由ChatGPT O1-mini驱动的Pro搜索。
有趣的是,OpenAI自家的对话页面里,o1-preview至今仍未支持联网搜索。
这不禁让人好奇:到底有多少熟悉的选手已经悄悄支持了深度搜索?
梳理下来,名单是这样的:
- Perplexity —— “Pro搜索”
- Kimi —— “探索版”
- 豆包 —— “深入搜索”
- 智谱 —— “AI搜索(默认就是推理版本)”
- 360AI慢搜索 —— “慢思考模型”
可以预见,AI搜索2.0产品将重现AI模型界的“百家争鸣”,推理能力也将成为标配。
但问题是,AI搜索不像AI模型那样有各种排行榜,挑靠前的用就行。所以,我们决定从
易用性、理解能力、准确性
一、易用性
先说结论:
豆包 = 智谱 = 360AI > Perplexity > Kimi
易用性主要看三个实际难点:
- 使用次数是否有限制
- 单次搜索能访问的页面数量
- 搜索结果的分享形式
Perplexity的Pro搜索每四小时可免费使用五次。Kimi探索版每天仅限五次。豆包、智谱和360AI均没有明确的使用次数限制。
由于Kimi探索版特别强调单次搜索能访问超过500个页面,我们也做了一个对比:针对同一个高难度问题,重复提问三次,统计每款产品每次访问的网页数量——页面数量直接决定了AI模型的“眼界”。
至于分享形式,平时用搜索引擎最习惯的就是复制链接到处粘贴。Kimi、智谱、豆包、360AI都支持复制完整文本、生成图片和链接。豆包还额外允许设置是否让其他用户访问对话记录中的文件,Perplexity则可以限定链接仅自己可见。
二、理解能力和准确性
既然这些产品的最大共同点都是
支持推理能力的AI搜索
为此,我们准备了两个“上天入地”级别的问题:
- Elon Musk's SpaceX: Timeline of all 5 Starship flight tests, including dates and reasons for failures or notable successes.(整理埃隆·马斯克SpaceX的5次Starship飞行测试时间线,包括失败原因或里程碑。)
- OpenAI is reportedly involved in a trademark dispute with Guy Ra vine, who owns the 'Open AI' (with a space) trademark. Tell me the timeline of this matter.(OpenAI正卷入与Guy Ra vine的商标纠纷,后者拥有“Open AI”(带空格)商标。告诉我这件事的时间线。)
一个横跨时间线,另一个暗藏名称陷阱。没用奥数题,是为了尽可能模拟日常使用场景——毕竟,平时如果不是为了刁难GPT,估计没人会主动解题。
(由于图片大小限制,以下截图主要展示交互形式,完整图片可参考原文中的链接)
1. Perplexity
需要说明:用英文提问是因为Perplexity有一个设定,它会判断当前问题是否值得o1出手——如果问题不够棘手,根本不会启用o1。
点评
2. Kimi
点评
3. 豆包
点评
4. 智谱
点评
5. 360AI
点评
个人账号使用次数有限,上面的对比花了三天时间,每个问题重复运行五次。
结论至此也新鲜出炉:
Kimi > Perplexity = 智谱 = 360AI > 豆包
顺便问一句,谁还记得远在大明湖畔的Bing AI呢?
大家可以根据这三个指标,选出自己的AI搜索初体验。
写在最后
写这篇文章时,我们询问了多位AI深度用户,他们中的大部分人已经从传统搜索引擎转向了GPT或Perplexity,甚至完全将GPT Search设为默认选项。
令人无比期待的是,当深度推理能力进一步发展后,未来我们是否能像《超体》那样,拥有一个开发率100%的AI大脑?
这样的世界,想了,但又有些不敢想。