首页 > 教程攻略 > ai资讯 >8000字竞品分析干货!超详细的AI对话类产品分析与思考

8000字竞品分析干货!超详细的AI对话类产品分析与思考

来源:互联网 时间:2026-06-14 14:15:26

AI对话产品最近热度不减,市面上涌现了讯飞星火、文心一言、通义、Kimi、豆包等几款主流产品。这次我们挑这五款,从页面布局、对话交互到亮点设计,横向拆解一遍,看看它们各自在输入框、对话流、差异化功能上是怎么做的。

一、AI 产品的输入框布局

① 基础的元素

从五大竞品中提炼出的基础元素包括:

  • 提示文本

    :用于引导用户输入和发送的占位符文本。
  • 发送图标

    :触发发送动作的按钮。
  • 上传文件

    :支持文档、图片等文件上传。
  • 产品说明

    :团队显示的文本免责声明,用于告知法律或重要信息。

② 各产品的布局展示

讯飞星火

:采用上下结构布局。基础框架上,把一些快捷功能融入输入框内部,增加与输入信息的关联性;Web 端融入了移动端的丝滑交互——语音录入;同时将一部分智能体模型外置展示,放在输入框下方,方便用户调用。

文心一言

:采用框内布局展示。功能主要聚焦于输入框内。输入框内上下布局,用分割线分隔:上方展示产品智能体模型及指令,下方聚焦文本操作(直接输入、上传文件图片),发送按钮放在右下角。

通义千问

:充分利用周边结构布局。输入框左上右三个方向都有操作功能:上方展示部分智能体,左侧聚焦上传功能,右侧聚焦指令功能(调用及新建)。

Kimi

:采用框内布局展示。功能集中在输入框内,左右布局:左侧展示联网搜索,给予用户操作结果预期;右侧展示发送按钮及产品能力(上传、常用语);同时根据提示文本可一键切换 Kimi 探索版。

豆包

:采用上下结构布局。上方展示智能体模型;输入框内操作都放在右侧,避免影响左侧输入内容展示,加入语音录入功能,同时加入截图提问客户端引导下载入口。

③ 差异化的设计

(1)联网/深度搜索

五款产品中,讯飞星火、Kimi、豆包支持联网搜索;讯飞星火、通义千问、豆包支持深度搜索。

  • 联网搜索

    :AI 产品通过连接互联网,利用搜索引擎获取相关信息,返回网页链接或信息片段。
  • 深度搜索

    :利用深度学习、自然语言处理等技术对信息进行深层次挖掘分析,提供更准确全面的结果。

讯飞星火

:联网搜索为系统自动使用,取决于功能需求(如实时数据需联网);深度搜索入口在 AI 搜索菜单下,仅当启用联网搜索时展示。

通义千问

:深度搜索需用户手动选择,入口在普通搜索结果页或输入框上方按钮。

Kimi

:联网搜索用户手动选择,系统默认开启。输入框内「联网搜索」按钮,侧栏展示检索网页具体内容,便于浏览。Kimi 探索版是深度推理 AI 搜索,通过模拟人类思考模式提供更智能的结果。

豆包

:联网搜索为系统自动使用,根据内容需求决定是否联网;深入搜索需用户手动选择,在 AI 搜索菜单或首页展示。

(2)指令调用

五款产品中,讯飞星火、文心一言、通义千问、Kimi 支持使用指令进行问答。

  • 讯飞星火

    :可在指令中心直接调用或修改指令。
  • 文心一言

    :可在指令中心直接调用或新建自定义指令,入口在输入框内「我的指令」或快捷键“/”。
  • 通义千问

    :入口为按钮「指令中心」或快捷键“/”,支持新建指令。
  • Kimi

    :入口为输入框内「常用语」按钮,可自定义设置唤醒词,通过输入关键词唤醒调用。

指令是聚焦文本框的操作,文心一言与输入框关系紧密,能提高操作效率;而 Kimi 只需输入关键词即可唤醒,操作很便捷。

(3)预判设计

Kimi 和豆包在粘贴图片后提供预判指令:Kimi 在输入框内显示提示文本「整理核心内容」;豆包显示按钮「解释这张图片」。布局上,讯飞星火和 Kimi 展示在输入框下方,其余三款在框内。交互上,通义千问需输入指令才可发送,其他四款按钮直接可点击。

豆包的预判形式清晰直观,Kimi 的文本提示可能不易被注意。

(4)语音录入

讯飞星火和豆包支持语音录入。讯飞星火点击「语音」按钮触发和结束,编辑文本时语音不会停止,但再次语音时已编辑文本会被清空。豆包点击「语音」按钮触发,编辑文本时语音自动终止。豆包的处理更合理:编辑文本本身是对语音的下一步处理,此时语音结束,避免编辑好的文本被清空。

(5)文本润色

讯飞星火和文心一言支持文本润色。讯飞星火旧版入口在触发输入框时显示「指令内容优化」按钮,新版功能尚在但入口不易找到。文心一言入口在输入框内或新建指令内容框内,输入文字后高亮显示,润色后保留原内容供用户选择。

④ 我的思考

AI 产品的输入框设计无非两种布局:框内布局、框内+框外。如果功能简洁明了,框内放得下,就采用框内布局(如 Kimi);如果要展现的内容多且需区分类型,则采用框内+框外结合,将上传、语音等与文本操作紧密相关的内容放框内,系统推荐内容放框外(如讯飞星火、通义千问、豆包)。文心一言将所有内容放框内,输入框内东西太多,视觉上容易分散注意力。

二、AI 产品的对话交互

① 基础的元素

从五大竞品提炼的基础元素:用户输入消息、AI 输出响应、头像(参与对话者身份标识)、功能按钮(重新生成、复制、分享等)、反馈按钮(赞/踩)、推荐输入(建议下一步提示)、生成式 AI 输出标签。

② 各产品的布局展示

讯飞星火

:新版对话布局左右结构,用户输入有底色,AI 输出无底色(用背景底色)。AI 输出内容、操作按钮及推荐输入左对齐排布。头部加入产品 LOGO,强化品牌意识。

文心一言

:上下结构,用户输入无底色,AI 输出有底色,用户头像默认,AI 头像为产品 Logo。AI 输出内容及标签在卡片内部,操作按钮和推荐输入在卡片下方。

通义千问

:左右结构,用户无头像,AI 有头像;底色不同区分明显。AI 输出内容及操作按钮在卡片内部,推荐输入在卡片下方,单条竖向排列。

Kimi

:左右结构,底色加头像区分,用户默认图标,AI 为自定义头像且区分历史与最新。AI 输出内容和操作按钮在卡片内部,推荐输入在下方,单条竖向排列。

豆包

:左右结构,底色区分,用户输入有底色,AI 输出无底色。AI 输出内容、操作按钮及推荐输入左对齐排列。

③ 交互的内容差异

(1)加载状态

各产品在加载状态上的表现集中在四部分:文本生成起始点缓冲、文本跟随加载、发送按钮加载、头像加载。

  • 讯飞星火

    :普通生成用文本生成起始点缓冲;联网生成切换成常驻加载提示用户正在联网搜索。发送按钮高亮但不可点击。
  • 文心一言

    :输入后发送按钮变为加载样式;内容生成中头像加载,文本跟随加载。
  • 通义千问

    :普通生成短暂加载后陆续生成;深度生成展示问题理解进度条,加载提示“正在搜索中”。按钮由发送变为停止生成。
  • Kimi

    :结合四种方式,发送后按钮置灰不可点;文本生成前起始点缓冲,生成中跟随加载及头像跳动;联网生成提示“正在阅读文本”,探索版提示“正在规划、正在搜索”。
  • 豆包

    :普通生成起始点缓冲、跟随加载、按钮变为停止发送;联网生成加入“基于XX个搜索来源”提示;深入生成加入“正在深入搜索中”及来源。

文本生成起始点缓冲、跟随加载及头像加载结合的方式比较推荐,发送按钮固定变为停止生成,视觉更聚焦输出内容。

(2)长文本内容生成

两种处理形式:超出首屏向上滚动(讯飞星火、文心一言、豆包);超出首屏屏幕固定,展示「一键置底」按钮(通义千问、Kimi)。

采用屏幕固定方式的优点在于:用户只需看首屏即可判断是否需要继续查看,需要时手动滚动或点击置底按钮,不需要就点击停止生成。但问题在于通义千问和 Kimi 在输出结束时没有明确提示,用户可能不知道生成已完成。如果在输出结束时页面自动跳转到底部会更好。

(3)重新生成的思考

内容重新生成:

  • 文心一言

    :采用分页及卡片堆叠方式展示多对话层级,鼠标 hover 气泡提示“查看全部”,点击展开右侧面板;重新生成卡片中询问用户意见。
  • 讯飞星火

    :旧版卡片+分页,新版去掉卡片,仅留右上角分页。
  • 通义千问、豆包

    :卡片内展示分页。
  • Kimi

    :采用撤回消息方式,上一条对话算历史,点击查看弹窗展示。

文心一言的卡片堆叠+分页形式视觉清晰,同时外露调研入口,用户既然做了再次生成,就有对第一条不满意的可能性,在此做调研很合理。Kimi 的撤回消息方式在连续多次重新生成时,需要一条条点击查看,操作不如分页直接切换方便。

分页的小细节:各产品状态区分,豆包处理最好——在系统中操作要让用户有心理预期,豆包的状态区分明显。

输入重新编辑:

  • 讯飞星火、文心一言

    :在文本后面展示分页。
  • 通义千问

    :在文本下方展示分页。
  • Kimi、豆包

    :直接替换上一个文本位置。

展示分页形式(无论下方还是后面)在视觉上提示用户有两条内容,而直接覆盖则让用户无法查找上一个内容,体验不好。

关于再次编辑快捷键的细节交互:五款产品在首页都支持回车键发送,但重新编辑时讯飞星火、通义千问不支持;换行快捷键也不一致。这种频繁操作的不一致会增加用户理解成本,设计时需要注意全局一致性。

④ 停止生成的思考

按钮摆放位置:

  • 文心一言、Kimi

    :按钮在输出文本框下方,跟随文本展示。
  • 通义千问、豆包

    :点击发送后,发送按钮变为停止生成按钮(在输入框内)。
  • 讯飞星火

    :固定在输入框右上方。

输入框内形式符合心理预期:在这里做发送动作,也可以做停止动作。另外,结合长文本生成场景:Kimi 超出首屏屏幕固定时,跟随文本的停止生成按钮就看不到了,用户需要提前操作或滚动查找;通义千问的停止按钮在输入框内则没有这个问题。

停止生成展示:

通义千问、Kimi、文心一言有明确提示“已停止”;豆包用“...”表示剩余未生成部分;讯飞星火既无标识也无提示,容易让用户误以为生成了完整的段落。

(5)快捷开启新对话

五款产品中只有讯飞星火在生成对话后提示「全新对话」按钮。这充分考虑了用户场景:完成一个任务后可能需要立即开始另一个话题,该按钮能快速进入新对话,提高操作流畅性。

三、各产品的亮点设计

讯飞星火

:「群聊」功能是独有设计。用户可选择多个智能体模型加入群聊,指定某个智能体回答问题,无需分别开启不同窗口,对于特定场景的用户来说效率很高。

通义千问

:效率工具集令人印象深刻,尤其是「实时记录」功能——实时语音转文字、区分发言人、智能总结要点、生成思维导图。这对需要做会议纪要和溯源问题的打工人非常实用。

Kimi

:首页 logo 设计与节假日活动融合得最好。中秋节版本在 logo 中融入节日元素,配合动效,鼠标 hover 时月饼打开。这种细节让活动氛围更强,其他产品大多只在首页模块加活动主题。

四、浏览器插件体验

浏览器插件多为悬浮窗展示。Kimi 保持简洁,聚焦四功能:名词解释(划词、框选截图)、总结全文、解释当前屏幕、快捷对话,搭配快捷键使用。划词框选功能在阅读网页或编辑文档时很方便。

讯飞星火外置三功能:总结、翻译、提问。其翻译仅支持当前页面,切换页面不生效;而豆包的翻译支持全局翻译,且中英对照方式更方便对比查看。

豆包外置五功能:语音录入、收藏网页、截图识文字、总结页面、翻译页面,可结合快捷键使用。亮点在于场景化设计:在写文档时,右侧提示「编辑」按钮,点击后豆包可以帮你写、重写,这些操作与写作紧密相关,位置恰到好处。

最后

竞品分析是一个长期的过程。通过横向和纵向的对比,能更了解每个产品,根据自己的需求选择合适的 AI 对话工具。阶段性总结也帮助我们学会从多维度思考,基于这些竞品提供的经验和启示,更好地理解 AI 对话类产品的未来走向。

相关下载