首页 > 教程攻略 > ai资讯 >杭州六小龙之群核科技--AI助力测试提效与大模型落地应用实践

杭州六小龙之群核科技--AI助力测试提效与大模型落地应用实践

来源：互联网时间：2026-06-19 14:21:24

从2023年底起，群核科技质量团队就开始不断强调AI可能给测试带来的价值，随后迅速组建了专门的AIGC虚拟小组，着手进行基础设施搭建和局部探索。

从实际建设进度来看，AI带来的效果非常显著。2024年底DeepSeek的发布确实给业界带来了不小的震撼，AI的推理能力已经今非昔比。行业内围绕AI在质量测试和效能领域做了大量探索。结合这些探索、经验以及我们自身取得的成果，可以确定的是，我们必须紧跟这个趋势，用各种AI工具武装自己，并将其融入日常工作流，才能真正实现效能的提升。

经过一段时间的实战，我们明确了2025年的重点建设方向：

探索更好的AI模型，为测试提效提供强力引擎
搭建更易用的AI测试平台，方便各个应用快速接入
持续推动各项测试效能领域和流程的提效
积极推广，带领测试同学真正认识AI、用好AI

下面就把我们取得的一些进展分享出来，希望能激发更多创新思路，推动这个领域往前走一步。

01 探索更好的AI模型，助力测试提效

2025年开年至今，我们的测试平台已经接入了多个业界领先的大模型，在各个领域的反馈都相当不错。

接入时间	模型	应用领域	接入效果/反馈
2025年1月	DeepSeek v3&r1	知识库问答
2025年2月	text-embedding-3-small bge-m3-embedding	向量模型&知识库领域	相比之前，准确度提升了20%
2025年2月	Claude3.5&Claude 3.7 Sonnet	自动化测试代码编写	业务线试用中，本地生成比较稳定，准确率大幅提升

02 搭建更易用的AI测试平台，方便大家应用接入

目前，质量部的AI测试平台FastQA已经接入了20多个各类应用，平台本身也在持续迭代优化。

时间	平台优化	预期/效果
2025年2月	模型对接优化
2025年2月	平台版本升级	同步升级，支持插件、工作流编排等，与公司模型对接，版本更稳定
2025年1月	企信对接问答优化	支持企信群 @机器人方式对话，方便对接知识库应用

03 不断助力各项测试效能领域/流程提效

在提升模型和平台能力的同时，我们更关心这些能力能否在真实测试场景中落地。这也是目前成果最密集的领域，已经在以下几个关键方向取得了实质性进展。

3.1【AI助力工单提效】

思路：

通过维护工单AI知识库并对接openAPI，实现AI在线问答和自动创建工单。

进展：

目前在技术支持团队中效果最佳。80%的内部咨询实现了自动回复，帮助客服和技术支持人员从重复劳动中解脱出来。自动创建工单也进一步减少了人工提单的工作量，提升了工单质量，节省了大量沟通成本。整体上，用户问题的解决体验得到改善，处理流程简化，客户满意度也随之提升。

应用展示：

在群聊内@AI虚拟账户，进行问题咨询，自助解决FAQ类问题。
在群聊内@AI虚拟账户发送创建工单指令，可自动创建工单。
在应用内，点击【客服酷小宝】，可进行问题咨询，自助解决FAQ类问题。
在应用内，点击【客服酷小宝】，发送创建工单指令，也可自动创建工单。

3.2【UI自动化代码生成】

思路：

借助VS Code插件和AI知识库，让AI根据用例描述自动生成自动化脚本。同时，利用油猴插件和AI能力，生成符合酷家乐UI自动化规范的xpath表达式。

进展：

在三个业务试点中，生成的代码准确率在50%到80%之间。xpath的编写成本降低了约30%，同时质量也得到提升。

3.3【AI精选文档分享】

思路：

利用AI，根据高质量文档的规则，自动爬取并分析近期文档，然后推送高质量文档供大家学习。

进展：

目前已在质量部门全面推行，AI的分析和推送获得了大量同事的认可。

3.4【AI知识库秒级搭建】

思路：

根据CF标签进行文档爬取，快速将CF文档转化为FastQA平台的知识库内容。

进展：

已在质量效能部门内部推广，运行两周就累计录入知识量2000页，并且仍在快速扩充。配套提供了一系列“一条龙”服务：AI知识库创建、CF文档AI打标、AI知识库自动导入，以及丰富的AI应用（如企信答疑群的AI智能机器人自助应答、openAPI接入等）。预计在Q2完成流程规范的评审，作为新流程纳入公司级ITM流程标准。

3.5【AI用例编写】

思路：

使用AI Agent解析文档并生成测试用例，包括阅读CF、解析文档中的图片、拆分功能点、为每个功能点设计用例，并检查用例的中英文情况。

应用：

可以大幅提升用例编写效率。

3.6【AI页面检测】

思路：

针对国际化翻译中容易出现的多语言问题，根据国际化网页设计规范，利用AI知识库预设正确的和错误的国际化翻译及布局情况，通过AI动态检测当前版本的多语言、文本规范性和页面布局。

进展：

基本流程已经跑通，典型页面的错误识别率超过80%，目前正进入工程化和常态化运行阶段。

04 测试管理平台接入AI能力

4.1【测试分析报告撰写】

在编写大项目的测试分析报告时，引入LLM大模型的文本+视觉能力，根据需求文档、CF文档链接或设计稿，生成初步的测试分析报告。这能有效帮助测试人员拓展思路，为撰写详尽的报告提供有力启发。

4.2【AI用例生成】

生成新功能用例时，利用LLM依据需求文档初步生成功能用例，经人工二次确认修改后，可一键导入系统。这不仅为测试人员打开了编写思路，也辅助他们编写出更全面、细致的用例。

4.3【影响用例自动识别（调研中）】

在评估影响范围时，由于受影响功能在开发阶段已确认，且相关用例已存在用例库，我们可以采用RAG/KAG模型，通过检索增强技术，快速精准定位相关用例并呈现给测试人员。这会极大节省查找时间，为回归用例的编写提供重要参考。

4.4【AI用例评审】

用例评审环节同样可以引入LLM。具体做法是制定一套严谨的评审规则，让大模型在这些规则下运行。模型会给出用例的合格分数，并提供针对性的修改意见，帮助测试人员进行优化，确保用例达到较高的质量标准。

05 更多领域探索

除了上述应用，我们还在几个方向上进行了探索，同样值得期待。

5.1【用户分析-AI辅助七鱼会话分类打标】

目标：

实现70%以上的七鱼分类自动精准打标。

思路：

在七鱼会话结束后，将会话信息和初始分类输入大模型，让模型给出一个精准的四级分类，再回传给七鱼平台打标，以此减少客服的工作量。

进度：

进行中，基础建设已完成，提示词正在调优。

5.2【自动化测试平台接入AI能力】

目标：

目标1：阿波罗自动化测试平台实现AI辅助提效，涵盖接口测试和UI自动化测试，提升自动化执行失败和异常情况的排查能力，以及小助手自助应答率，在去年基础上提升20%。
目标2：自动化issue有效性在去年基础上提升10%。

思路：

开发Jenkins错误日志排查工具，结合常见典型错误日志特征进行聚合归类，提升问题排查分析能力。
利用CI链路问题排查分析能力，在上述基础上进一步按链路顺序分析，遵循常规SRE排查思路进行链路问题的识别和智能分析。
平台开放功能布点，当检测到自动化测试失败时，测试同学可点击智能分析快速诊断，降低排查环境或脚本问题的时间，提升平台使用体验。
与业务线形成合力，共同维护自动化知识库经典案例库，提升问题智能小助手的自助回答和问题分析能力。

进度：

目前整体处于前期技术设计框架阶段。

06 持续推广使用AI

我们部门非常重视AI在提效方面的价值，也希望团队每个成员都能提升这方面的能力和意识。为此，我们制定了“三步走”计划：

第一步：团队进行AI相关的培训学习和考试，建立知识基础。
第二步：团队熟悉并掌握各类AI工具的使用，通过考试检验。
第三步：结合自身业务及测试能力/平台，进行AI提效思考并探索接入。

当前的核心培训是AIGC知识培训。对外分享方面，团队已在2024年MTSC大会上进行了相关分享，并计划继续投稿2025年的MTSC。质量效能公众号上也吸引了众多外部公司的测试同学，就AI建设展开热烈讨论。

07 小结

随着AI的持续发展，它对互联网及软件工程领域的巨大价值已经显现，测试领域无疑是重要的受益方之一。

AI就像一个万花筒，对测试同学而言，持续学习和掌握AI只是第一步。更关键的是，要结合实际的业务场景和诉求，合理地利用AI能力，与我们现有的系统和流程做深度结合，这才是发挥其最大价值的根本所在。