年过半,AI 大模型在各行业的落地实践走到哪了?
来源:互联网
时间:2026-05-31 18:45:10
转眼间,2024 年已经过半。AI 大模型的热度,已经从纯粹的技术探索,转向了扎扎实实的落地实践。各行各业都在这场浪潮里寻找新的业务增长点,这已经不是什么新鲜事了。
一个很核心的观点是:大模型的出现,某种程度上实现了“知识平权”。它降低了技术门槛,让过去看似不可能的事情,变成了可能。宁德核电人工智能实验室负责人王澍就提到,核电行业因为其特殊性,从业人员的技术意识和能力有限,传统AI又依赖规则驱动,门槛高,所以过去对AI的应用并不广泛。但大模型给了他们一个新的切入点。
即便是在物流、金融这些已经普遍应用AI的行业,大模型也带来了新的突破。顺丰科技运筹优化算法专家王一帆指出,在复杂的供应链领域,传统技术面临着求解性能和使用门槛两大挑战,而大模型解决了很多以前的瓶颈问题。蚂蚁集团投研支小助技术负责人纪韩则以知识图谱技术的演进为例,谈到金融市场变化快,管理知识图谱的成本越来越高,模型和知识图谱很难跟上变化节奏。而大模型因为能阅读大量报告,发现其中的金融逻辑共性,让机器进行复杂分析变得更加可行。
当然,面对不同行业,大模型的落地过程依然挑战重重。比如成本投入是否划算、会带来哪些新风险、如何克服内外部阻力等等。
大模型技术的应用落地现状
InfoQ:几个月前,宁德核电推出了自主训练的核工业大模型,王老师可以介绍一下几个月来的应用进展吗?
:自从发布后,大模型展现出了多方面的发展潜力。作为知识管理平台,它在持续迭代中泛化能力提升显著。基于它开发的首款应用“AI讲师”,已经在一些试点课程中推广使用。在生产领域,设备管理等方面也推出了试点产品。同时,我们在AI人才培养上也取得了进展,不仅培养复合型人才,还推进了种子教育计划。核电领域计算机背景相对薄弱,必须培养自己的教员,为不同层次的一线员工提供培训。换句话说,全员都需要掌握不同程度的技能来适应行业需求。另外,我们的大模型本身也实现了拟人化,作为实验室的AI智囊,参与了日常的头脑风暴和科研项目研讨。
InfoQ:金融行业因为高度的复杂性、动态性和不确定性,一直是AI技术的应用热点。纪老师,目前蚂蚁集团在大模型层面有哪些探索和典型实践?
:我的工作主要聚焦在用大模型及多智能体技术解决投资研究中的问题。投资研究分定量和定性两个方向。定量研究方面,我们已有多年的技术积累,大模型引入后,一种成熟的做法是用它来生成代码,让不擅长编程的分析师也能进行初级定量分析。定性研究方面,分析师需要大量阅读新闻、研报、财报等文字材料,这正是大模型的优势领域。基于此,我们开发了“投研支小助”这个智能助手,辅助分析师日常工作。目前,蚂蚁集团及紧密合作伙伴已经开始内测,用它来辅助理财师和分析师,解决过去机器难以处理的问题。
InfoQ:大模型产出的内容,目前在内部的应用率和采纳率如何,准确性大概是什么水平?
:可以肯定的是,大模型的应用在两个主要方面成效显著。第一,对理财师而言,过去他们能服务的客户数量有限,因为需要为每位客户准备个性化材料。通过机器辅助,他们的服务半径显著扩大,覆盖客户的能力实现了数量级提升。第二,以支付宝的理财服务为例,过去我们每天只能挑选30-50篇重点事件进行解读。深入应用大模型后,我们可以对细分行业进行更细致的分析,覆盖全市场,数量可达100-200篇以上。目前,我们是机器先生产一批分析解读,再由人工专家审核改写。这让分析报告的数量从过去的几十篇提升到了上百篇,实现了数量级增长。
InfoQ:一帆老师,多年来顺丰一直在用智能算法优化物流供应链,结合大模型,最近有哪些新应用或实践?
:顺丰一直致力于解决物流和供应链中的优化问题,包括库存、销量预测、路径规划等全链路场景。我们既用传统运筹学,也积极运用AI。大模型兴起后,顺丰投入了大量资源,利用我们在供应链领域的经验和积累,在两个主要领域进行了深入研究。
在
,传统的对话式机器人需要用户提非常具体的问题。借助大模型,用户可以用更宽泛的问题提问,大模型能进行细致筛选,提取精准信息,再传递给传统AI问答工具,进行深入分析,提供全局性的分析建议。
在
,比如装箱、库存优化、路径规划等问题,传统技术可能会遇到性能或定制化问题。大语言模型最初用于词汇生成,但路径规划中的访问次序优化,与词汇生成的顺序逻辑在数理上是相关的。我们借鉴了这点,将其应用于路径规划,取得了不错效果。
传统 AI 技术的瓶颈与挑战
InfoQ:在与企业交流中,我们发现大家对大模型的潜力很看好,但在实际投入时往往很谨慎。大家希望对比了解,大模型能解决哪些传统技术解决不了的问题?
:在大模型技术兴起前,核电领域对AI的应用并不广泛,主要集中在一些特定领域。原因有两个:一是能力或意识层面,AI知识门槛高,核电人员缺少计算机背景,很难具备应用AI的意识和能力。大模型的出现带来了变革,它实现了知识平权,提供了技术条件,让我们能参与进来。二是业务层面,传统AI依赖规则驱动,但核电领域的复杂性让我们难以找到和应用这些规则。大模型的端到端目标驱动和自然语言交流机制,让没有深厚IT背景的人也能把不可能变为可能。
:在使用大模型之前,行业里有些瓶颈问题很难解决。在复杂的供应链领域,第一个挑战是
。比如,传统技术一天能求解100个案例,每个得分90分以上,但想突破瓶颈,高效求解更多就很困难。大模型改变了这一局面,现在我们可以一天解决一千甚至一万个案例。虽然目前平均分可能还比不上传统方法,但潜力巨大。另一方面,
。以前需要算法专家设计方法,现在有了大模型平台,只要按规定格式标注和投喂数据,它就能不断训练迭代,成为一个高度智能的工具。面对新场景,它能快速得出好结果,不再依赖专业算法能力,大大降低了门槛。
:在金融领域,
,业界一直在尝试用机器解决主观决策问题。像早期的Alphasense和Kensho公司,就是利用NLP和知识图谱技术来理解新闻、关联资产涨跌。但这些模型和知识图谱很难跟上世界的变化,管理成本也越来越高,从2013年到2023年这十年间,通过机器进行决策的尝试相对沉寂。直到大模型爆发,才重新发现新的可能。现在,我们可能不再需要费尽心思从分析师大脑中提取方法论,大模型只需要大量金融语料,比如分析师写的报告,就能从中抽象出他们的分析逻辑。由于大模型能阅读大量报告,它能够
,这种能力过去几乎不可能通过机器实现。大模型的出现,为金融领域带来了一种全新的可能性,
。
AI 大模型落地过程中的挑战 & 应对办法
InfoQ:王老师提到,宁德核电在AI应用上起步较晚,核电又是个相对传统、保守的领域。引入大模型的风险,最初是如何考虑的?
:核电行业的保守程度可能远超想象。我们有一条基本原则——任何未经证明安全的行为,都视为不安全。安全是底线。换句话说,
。但现实中考虑引入看似不太成熟的大模型,听起来有点矛盾。实际上,这背后有两个考虑。第一,判断大模型是否值得投入。经过大半年的可行性验证,我们看到了价值,认为值得。确定这点后,再评估风险。核电行业并非所有岗位都涉及安全风险,因此我们
,比如知识管理和人才培养。既然判断这项技术必须用,那问题就变成了如何更好地实施,找到既能发挥大模型优势,又能确保安全可控的方法。
面对新技术,尤其是大模型这样不太成熟的技术,核电行业面临的挑战是全方位的。核电领域对AI,包括大模型的认知基础非常薄弱,对新生事物往往存在偏见甚至敌意。如何推广大模型并最终取得成果,我总结了几个关键步骤。第一,
:我去年7月开始,自己投入约10万元买电脑,自学部署开源大模型,训练了一个效果出乎意料的大模型,最终打动了领导。第二,
:领导同意后,需要在全一线推广。我们去年推出了“全民大模型”计划,让所有人用大模型解决工作中的效率问题。第三,
:不断对管理层和员工进行科普宣讲,灌输“不学AI就可能被淘汰”的概念。第四,
:因为基础差、覆盖面广,我们必须培养能讲授AI知识的内部教员,既能降低成本,也能让企业相信我们能持续推进。目前,从最高层到基层,已经形成了“大模型技术价值巨大”的共识。
InfoQ:蚂蚁在技术与业务结合上一直走在前列,作为先行者,在大模型应用过程中遇到的最大落地难点是什么?
:在蚂蚁,我们对大模型技术持有非常开放和包容的态度,很多同事自发利用业余时间研究尝试,加上公司鼓励支持,创造了很好的环境。在金融领域,我们面临的挑战主要是
。金融领域对严谨性要求极高,因此我们在模型调试和训练上投入了大量精力,使用了
,包括正例和反例,确保生成内容符合金融逻辑。我们还建立了
,确保合规性和专业性。由于早期基础模型在数值感知和时间识别方面有限,我们通过与传统专家系统和规则系统结合,确保生成内容的准确性。
这个过程中,我们特别重视人才梯队建设。金融领域的专家知识积累相对欠缺,研究方法论主要通过口头传授。要让模型效果达到预期,
需要真正懂金融的专业人士对结果进行打分、标注和修正
。最初,让资深分析师参与标注比较困难,但随着一些对新事物更开放的研究员参与,模型开始展现出效果,比如帮助生成分析报告。这吸引了更多分析师愿意参与打标和迭代。这个过程涉及技术人员、算法人员和分析师之间的信任磨合,最终形成良性循环,让大家认同大模型能解决实际问题。这可能是金融机构以及对应用准确性有高要求的领域,都会遇到的情况。
InfoQ:不同行业在应用新技术时遇到的问题往往有共性。一帆老师,请分享顺丰在供应链优化方面的经验。
:面对新技术的应用和推广,不同行业的问题确实有共性。我们的任务是说服相关人员采纳技术,并帮助他们有效使用。供应链领域我们积累了很多经验,但新技术的出现也带来了新挑战。第一,AI发展迅速,技术迭代快,依赖于多样化场景,我们需要不断跟踪验证新技术。第二,
是挑战,供应链客户对服务细节要求各异,如何将这些差异化需求转化为大模型能识别的特征,需要大量迭代调整。第三,
是关键,没有历史数据,不能期望大模型一步到位。第四,
问题,它追求泛化效果,要针对特定客户达到预期,需要在泛化基础上做更多定制化调试。第五,和前面老师一样,我们也需要
,因为大模型开发涉及大量软硬件和人力投入,需要充分支持才能见效。
传统 AI 技术与大模型的有机协同
InfoQ:对于企业而言,大模型未必越大越好,未来传统AI和大模型如何有机协同配合?
:在实际应用中,
。我们经常研究什么样的模型规模适合解决特定复杂度的问题。早期研究阶段,倾向于用大模型达到接近人类专家的水平。真正投入生产时,必须考虑是否有必要处理所有事件。比如财报季,A股市场每天可能有五六百家公司发布财报,每份报告数十万字,用大参数模型处理会消耗巨大资源。我们需要
识别哪些信息真正适合用大模型处理,哪些对业务有重大增量价值
。对于长尾公司,不必用过于强大的模型。
我们采用了多智能体技术来模拟金融专家的分析任务,通过不同节点分工合作,如问题拆解、定量分析、定性分析和信息汇总。这个过程被抽象成
,即Planning(规划)、Executing(执行)、Expressing(表达)、Reviewing(评审),
模仿专家分解任务、执行任务、撰写报告和通过同行评审迭代分析结果的过程
。不同任务节点的难度不同,所需模型规模也不同。我们认为,能够根据不同任务选择适配模型,并建立相应基础设施,是未来工业实践的关键,可以确保任务复杂度与成本开销合理匹配。
:大模型泛化能力强,但不一定越大越好。大型模型推理能力强,但特定领域专业深度可能不够,表现出“
”的特点。对此,我们研究采用了结合“大模型”和“小模型”的思路。“小模型”就是传统AI分析工具,擅长在特定问题上给出精确答案。结合这两种模型,可以在供应链分析等领域进行更有效的尝试。具体操作是,
,理解用户问题类型,然后解析归类。比如在供应链分析中,可能包括根因分析、销量预测等。用户宽泛提问,大模型将问题提炼并分发到不同小模型中,
。最后,这些
,比如图形、报表。这种结合能发挥各自长处,互补不足。
:大模型确实不是越大越好。在核电行业,大模型训练是我们积累的技术优势之一。除了传统AI与大模型的结合,我想进一步探讨的是
传统AI、通用大模型、垂直大模型以及人如何协同作战
。关键在于发挥各自优点,而不是过分关注缺点。大模型的优点主要有两个:一是回答问题极其精准,二是强大的泛化能力,也就是头脑风暴能力。人的特点在于能迅速判断答案正确与否。通过这种协同,许多过去难以处理的问题,至少有了新的解决思路。这些感受来自我过去一年训练和使用大模型的亲身体验。
AI + 业务场景如何真正释放价值
InfoQ:技术先进性要落实到业务场景才能带来价值。如何将大模型技术与业务需求紧密结合?阻力是什么,如何跨越?
:在大模型到来前,如何让业务人员理解AI或运筹学算法,这个挑战已经存在多年。我们的目标是促进技术和业务互通,推动算法项目落地。第一,需要
,将业务需求转化为算法语言。第二,要
,比如对时效性要求高但精度要求低的项目,大模型或快速启发式方法可能合适;对规划层面的项目,可能需要更传统的方法保证稳定性。第三,要
,在客户使用习惯上培养,逐步引导,并通过KPI报表等方式证明技术有效性。第四,顺丰作为物流代表,正在
,这是一个长期过程。
:企业普遍面临的共性问题之一是
。引入大模型后,我们首先解决了这方面的问题,比如文本自动生成图表和PPT,这在国有企业中已经成为常规操作。但在安全至上的核电行业,大模型的应用面临特有挑战。一是
,包括幻觉问题和泛化能力不足。解决需要耐心迭代。二是
,大家不熟悉如何使用,或没意识到优势。可以通过培训、奖励、适度行政压力等手段来激发动力。此外,大模型在写论文方面的应用,提供了一个很好的突破口,能帮助员工在学术和专业领域取得更好成果。
:大模型在金融领域已经开始展现显著价值。比如,
。在投资研究领域,它能辅助专家阅读大量资料,极大地提高市场研究的及时性和覆盖度。在
,大模型通过文本分析识别矛盾点,进行欺诈检测。在
,蚂蚁通过“支小宝”将高端金融管家服务带给普通用户,让每个人都获得个性化的投资顾问和保险配置服务。在市场波动时,金融助手能通过专业分析帮助用户理解市场动态,解决投资焦虑。从普惠金融角度看,这具有巨大的社会价值。
未来畅想与规划
InfoQ:对于AI大模型 + 业务场景,各位老师有什么畅想和规划?企业当下该做好哪些准备?
:我们公司内部普遍认为,当前大模型和智能体技术,正处在学习模仿金融专家的阶段。现阶段,它能辅助专家工作;未来我们希望它不仅仅是助手,还能进行独立的金融决策,成为专家的Agent替身。这是一个长远目标。
:我们在供应链分析和决策两个领域已经取得初步成果。如果进展顺利,公司计划在下半年推出一些基于大模型的新产品。
:在传统公司,准备工作应从三个方面规划。一是
:建立一种机制,避免让带薪上班成为常态。这里有一个矛盾:产品可行性验证前,企业不太会投资;但没企业投资,产品也无法完成验证。机制建设需要优先考虑。二是
:垂直领域的大模型开发需要该领域的专业人员深度参与。与其外部培养,不如加强内部人员培养,让他们掌握大模型技术。三是
:这一点排在第三,因为只要有足够资金,算力是相对容易获取的资源。虽然重要,但相比前两者,不是最迫切需要解决的问题。