又见2050:用AI重塑产品工作流
AI时代,产品设计工作流正在经历一场革命性的重塑。
先聊聊其中最具代表性的一个方向——
用AI重塑产品设计的工作流
这个话题其实源自之前分享过的一篇文章《Agentic Workflow:AI重塑了我的工作流》,不过那版内容更多是从技术驱动的视角切入的。而在"人人都有可能成为产品经理"这个AI时代的大背景下,又有了不少新的体会和思考。所以想借着这个机会,把一些实践经验和思考整理出来。
那场分享主要围绕三个方面:生成式AI的出现到底改变了什么;作为一个AI产品经理,结合Vibe Coding(比如Cursor、Cline)这类工具后,创造力是如何爆发的;以及在AI时代下,思考方式和工作模式有哪些变化,如何更好地使用和驾驭AI工具。
简单把核心内容整理一下:
生成式AI对信息检索的改变
自2022年末ChatGPT-3.5等生成式AI技术兴起以来,搜索习惯经历了一场深刻的变革。过去依赖谷歌、百度这类传统搜索引擎,通过关键词查询来找答案;现在越来越多的人直接转向以ChatGPT为代表的大规模语言模型,通过问答式交互获得解答。虽然本质上都是为了满足查询需求,但这种自然语言对话式的交互体验,已经对传统搜索引擎的业务模式造成了碘伏性冲击——不仅改变了信息获取的路径,也在重塑用户对"信息检索"这一行为本身的认知和期待。
举个具体的例子。过去面对一份10万字的PDF文档,可能需要花费大量时间去阅读和筛选其中真正有价值的信息,而借助生成式AI,可以迅速将文档导入系统,利用AI快速筛选出哪些内容值得关注、哪些是不容错过的重点。这种方式极大地实现了信息降噪,让人们能更高效地获取真正有价值的知识点。
AI在视觉创作中的应用
现代技术的发展也极大地简化了信息表达和视觉创作的流程。只需要通过简单的文本描述,就可以利用AI生成风格各异的图片——比如调用通义万相或Midjourney这样的图像生成API,根据文字描述就能创建出对应的视觉作品。图表和流程图的制作也一样,Mermaid这类工具允许用户通过简洁的语法快速生成专业的流程图、甘特图等。这种方式不仅降低了视觉创作的技术门槛,也让非专业设计人员能高效完成信息可视化工作,真正做到了"言出法随"。
几天前GPT-4o的图像生成与编辑能力发布后,它对图像细节的强大控制力让人感到震撼——已经具备了碘伏传统设计理念的潜力。尝试将一个电商主图框架模板从中文翻译成英文,结果令人惊讶:不仅内容翻译流畅自然,连版式布局也自动进行了智能调整。如果用传统方式在Photoshop里做类似修改,需要手动逐层编辑图层、调整排版,非常繁琐;现在一句话指令,一切自动完成。还尝试给了一些商品主图的相关信息要求融合进设计,它精准完成了抠图、背景融合,细致处理了光影效果,整体视觉效果相当专业。整个过程只花了大约3分钟——而用传统方式,即使是熟练设计师恐怕也至少需要一个小时以上。这次体验让人真切感受到了什么叫做"言出法随,想即所得"。
工作流的本质与变化
日常工作中涉及的众多流程,核心其实可以归纳为:输入了什么信息,期望从中获得什么样的输出。尽管可能不清楚大型模型内部的具体运作机制——所谓的"黑箱",其中可能集成了无数小工具、插件、大语言模型、视觉模型或逻辑处理条件等组件,但对我们而言,更重要的是明确目标是什么、期望得到什么结果、需要提供怎样的输入、以及如何更有效地控制这些大型模型来达成目的。
所以,相当长一段时间里,大家都在学习如何优化提示词的方法,让大型模型更好地遵循指令进行输出。比如设定:"你是一位具备特定领域专业知识的专家,根据我的提示撰写内容,并确保你拥有某些特定技能",同时对输出内容施加一系列限制,如字数上限、回复格式等具体要求。
还记得之前有很多火爆的提示词框架吗?像LangGPT社区发起的这套框架就是典型代表。在这些框架的设计中,流程拆解本身就是重要一环——它会指引你:第一步做什么、第二步做什么、第三步做什么……通过这样的分步指导帮助我们逐步推进思考。如果一句话来概括,这类提示词框架的核心就是:让我们一步一步思考。
但到了今年,情况有了新的变化。春节期间随着DeepSeek等具备强推理能力的大模型出现,逐渐不再需要设计那么复杂的提示词框架了。如今只需简洁地表达一句核心诉求,大模型就能够自动推演、不断拆解,围绕目标探索出更全面的方向,最终生成更符合预期的结果。这种演变让人与大模型的交互变得更加自然、更加高效。
提示词会消失吗?
在回答这个问题之前,不妨先回顾一下早期SaaS软件中关于工作流设计的思路。比如RPA工具中通常会设计出非常丰富的工作流节点,通过点击页面元素、获取网页对象等方式编排出一套完整流程,实现自动抓取网页数据的能力。又如Zapier这类工具中,用户可以预设好一系列固定步骤,比如自动填充表单信息并发送给指定对象——这就是典型的固定式流程设计。
再比如ComfyUI这类框架,基于Stable Diffusion模型将图像处理的各个环节通过节点方式进行流程化编排,帮助更高效地生成指定风格的图像模型。底层依然是典型的流程化设计逻辑。此外还有DSL配置文件这类方式,通过固定的导入导出机制极大方便了流程的搭建与复用。尤其在高度确定性的应用场景下,这种标准化、风格化的流程设计依然不可或缺。
像扣子(Coze)这样的AI工程应用搭建平台,同样具备流程编排的能力。设计一个"口语专家"智能体时,需要先定义好人设特征,确定要调用的各类插件能力(语音识别、内容生成、语义纠错等),再通过一系列流程化的节点串联起来,遵循预设的表达逻辑,最终实现理想的对话效果。这种通过流程化内容搭建和编排的方式,依然是实现复杂应用行为的重要手段。
进一步拆解这些工作流,会发现它们的底层逻辑依然非常复杂。本质上是期望系统在有一个明确输入的前提下,产出一个明确的输出结果。即便在某些节点引入了随机性和多样性,让流程看起来更灵活,但整体上,输入-输出的确定性依然是这些工作流设计的基本诉求。
于是又有人开始思考:既然希望系统能遵循我们的习惯,而且以更简单的方式执行指令,能否让这种流程遵循变得更加自然、更高效呢?去年比较火的Rabbit R1就提出了新的探索方向——不仅仅是模仿单次动作,还希望能实现快速的流程化复制,让系统更灵活地适配不同任务场景。
AI原生应用的实践
与其说各种流程在不断变化,不如先回过头来思考:这一系列流程化变革,究竟给生活带来了多大的碘伏?特别是通过AI驱动的流程创新,诞生了一批真正意义上的AI原生应用——它们不是简单地在原有软件上叠加AI功能,而是从底层开始重新定义了交互方式和工作流。
比如之前做过一款叫Pailido的应用,本质上是一个基于AI的拍立得相机。底层通过多模态AI卷层驱动,实现了图像和文本之间的智能联动。使用时只需要选择不同的应用场景——比如小红书文案、闲鱼文案、外卖点评等各种风格化模板,然后对准场景点击拍照,相机就能根据当前画面内容自动生成对应风格的文案。它实现的是从确定场景到确定文字的高效流程,相比传统方式(先上传图片、再手动撰写提示词、再调用大模型生成),只需要选中场景并拍摄一次,就能直接拿到预期结果。本质上就是在AI交互中极大缩短了原本繁琐的流程。
最近还做了一个新尝试——开发了一个语音笔记功能。通过设置iOS快捷指令,只需要快速点击几下就能一键唤醒应用,然后直接跟它语音对话。把脑海中想法说出来,它就能快速记录并自动把内容整理后写入备忘录。为了提升记录准确性和搜索便捷性,底层也预置了不少提示词、关键词匹配逻辑以及灵感启发的设置。为什么做这件事?因为思考速度远远快于打字速度——一分钟可以想到大约100个字的内容,但如果打字可能连50个字都打不完,而且思路容易被打断。通过语音输入加大模型润色整理的方式,不仅记录更快,还能让内容更加流畅有条理。
最近另一个热门话题是Vibe Coding——也就是AI编程。这种新兴方式正在深刻重塑整个产品的设计逻辑。过去需要根据需求手动撰写大量代码,一步步搭建原型;如今通过与AI协作,只需要用自然语言描述想法,AI就能辅助生成底层代码、搭建界面、优化交互逻辑。尝试过使用Cursor以及VS Code Cline这类工具,结合阿里云百炼的API,去快速开发产品的Landing Page以及比较完整的功能页面。整个过程中只需要输入一份比较详细的功能文档,就可以快速生成对应的前端页面,还能实现数据分析报告、内容策略报告这类实际功能的输出。更值得一提的是,整个开发过程中几乎没有手动改过任何一行代码——从最初的功能构思到数据接入,再到内容生成和页面搭建,整个项目大概只花了不到20个小时就完成了整体的包装与上线。
人与AI协作关系的变迁
看了这么多案例,再回到今天的主题——用AI重塑产品设计的工作流,会有更深的理解。这些变化不仅仅是实践与尝试中的感受,更是人与AI协同关系正在发生深刻变迁的直接体现。AI已经从简单的工具,逐步成为思考伙伴、执行助手,甚至在某些场景下成为创意与决策过程的重要推动者。在这样的背景下,需要重新审视人与AI协作的关系,重新理解如何更好地利用AI,在未来的工作流中占据主动、释放更大的创造力。
回想一下,上一次看到那张AI能力层级图的时候,可能还在想:AI大概只能作为Copilot(辅助驾驶员)模式,帮忙完成一些具体的操作。但随着扣子空间、Manus等一系列纯AI Agent产品的陆续发布,会越来越清晰地感受到:纯Agent模式正在离我们越来越近。AI不仅仅是辅助人类完成指令,而是逐步具备了自主感知、判断和执行完整任务的能力。未来,它们可能不再是简单的工具,而是真正可以作为工作流中的智能协作伙伴,独立承担起越来越复杂的任务链条。
作为一个产品经理,每次回顾当年自己画的那张图,依然觉得很有意思。回头来看,真正需要关心的始终是两个核心问题:输入是什么?期待得到怎样的输出?至于中间的处理过程,过去它更像一个黑盒——通过确定性的工作流来驱动这个黑盒运转,一环扣一环,每一步都预先设定好。而到了今天,随着Agent系统的出现,这一切发生了本质变化。现在的Agent可以根据需要自主调用不同的MCP模块、动态选择工作流,甚至能实时检索外部信息,在过程中做出判断和调整。最终所获得的结果依然与当初的目标一致——从明确输入,到达成预期输出。不同的是,实现路径已经从"预设式执行"转变为"自主式演进"了。而这正是AI原生工作方式带来的最根本的变革。
在那张图里定义了非常多关于输入、处理、输出、反馈的要素:包括希望系统如何进行格式化、结构化的输出,也包括逻辑提取、可视化呈现等一系列能力要求。其中尤其需要重点关注的是被高亮标出的部分——不仅体现了对AI协作能力的更高期望,也代表了未来在设计AI工作流时需要优先思考和优化的方向。它们关乎的不只是简单的结果输出,而是整个链路上信息处理的质量、速度与可解释性。
未来的工作流设计
在AI时代下,新的工作流程设计会呈现出怎样的变化?未来很多时候只需要简单地口头表达需求:"帮我完成一份需求文档""帮我设计一个针对某某主题的访谈提纲""指导我如何整理用户旅程地图""我有一个简单的功能需求文档,希望直接通过Vibe Coding的方式帮我快速生成界面""帮我完成一个结构完整、视觉专业的PPT"。这些场景过去往往需要产品经理、设计师、运营等角色多轮沟通、多轮手动制作,而现在只需一句话的描述,系统就能理解意图、自动完成中间的繁琐环节,直接产出高质量的结果。这样的流程设计已经非常接近自然思考方式了——不再是先写需求文档,再开发,再调整,而是从想法到成品几乎无缝衔接。
比如使用秘塔AI这类AI搜索引擎时,会发现它和传统搜索方式有着本质不同。过去想要了解一家公司时,往往不知道该如何准确地提出问题——可能只是简单地问"它是什么样的公司""核心业务特点是什么""有哪些主要竞争对手"等等,但实际上无法完整枚举出所有需要了解的角度,也缺乏系统化提问的框架。传统搜索引擎只能基于关键词零散返回结果,需要自己去筛选、整理和归纳。而在AI搜索中,AI不仅能理解模糊需求,还能主动引导发现更多潜在的重要信息维度——行业地位、增长潜力、融资情况、客户画像、技术壁垒、市场趋势等,甚至能基于不同场景给出对应的分析框架。从信息检索到信息洞察,AI极大地提升了整个工作流程的智能化和主动性。
所以,在这样的AI工作流时代,真正需要专注做好的一件事就是:
学会提问。
具备优秀的提问能力,可以极大地激发出大模型作为工具的潜能,帮助在最短时间内快速获得某一个领域的Know-how信息,而不是停留在浅层的、零碎的搜索结果上。一个好的提问能引导AI更准确理解意图、调动更深层次的知识网络,从而给出更有洞察力、更具结构化的回应。可以说,提问的质量,决定了与AI协作的上限。
像DeepSeek这样的推理模型,或者通义千问的QwQ模式,它们的出现进一步改变了与AI协作的方式。现在只需要简单提问,比如"我想了解某个行业的核心方法论是什么",像通义千问这样的通用大模型已经具备了非常丰富且系统的知识能力,不仅能快速理解意图,还能帮助在极短时间内掌握一个陌生行业的基本框架和核心要点。过去需要通过大量阅读、调研才能积累的Know-how,如今借助这类大模型,只需通过正确的提问和方法论引导,就能迅速实现信息的高效抓取与系统学习。大模型已经成为了获取领域知识、构建认知框架的重要翻跟斗。
通过与大模型协作,现在可以轻松获得诸如麦肯锡的PEST分析、产业链拆解、行业结构分析、价值链分析、SWOT分析、关键成功因素提炼等一整套专业方法论。放在以前,哪怕是熟悉这些名词本身也需要经过长时间的学习和积累才能逐一掌握和应用。而如今结合大模型的能力,可以轻松地成为一个行业研究的"专家",快速构建起完整的认知框架。如果再结合像秘塔AI这样的AI搜索工具实时补充多维度的信息源,那么在很大程度上,传统AI产品设计的工作流程也被极大地简化和提速了。认知的门槛被大幅降低,执行的速度被大幅提升,工作流正在被悄然重塑。
最后,用一句一直深有感触的话来收尾,来自著名媒介理论家马歇尔·麦克卢汉:
"我们塑造了工具,然后工具又塑造了我们。"
在今天这个不断演进的AI时代,技术不仅是我们手中的武器,更在悄无声息地重塑着思维方式、工作方法乃至世界观。在AI时代,很多事物之间可以不断排列组合,激发出前所未有的潜能。就像MCP在应用创建上的探索,虽然有时看起来像是"拿着锤子找钉子",但它确实是一种非常好的灵感激发方式,在前所未有的环境下赋予新的创造力。作为产品经理,始终要围绕真实需求出发——纯工具型或纯功能型的产品经理,未来被AI替代的风险会非常大。无穷的想象力,才是这个时代最宝贵、最不可替代的能力。不断用新的方式更快地创造出属于这个时代的、独一无二的竞争力。