AIGC应用落地年我们的ChatBI让大模型不仅仅停留在聊天
CES观察:AI无处不在,但大语言模型的主要应用场景仍停留在聊天
资深分析师Anshel Sag说过这样一句话:“在去年的CES上,AI还没什么存在感;今年?它直接成了海啸。”这个形容一点不夸张。大模型的热浪席卷了整个会场,可实际体验下来,从电脑到小家电,AI化的深度参差不齐——几乎所有的产品都只能算是沾了个边。AI确实无处不在,但和产品之间的融合究竟有多深?只能说“有了”,离“好用”还差得很远。这篇文章会围绕互联网二手房数据,用上语义分析、机器学习和大模型技术,从统计、分析到挖掘输出多种结论,目的是帮用户避开那些浅尝辄止的坑,挖出真正有价值的判断。
01 传统BI面对的问题
传统BI到底卡在哪里?至少有三个痛点:
- 业务人员提需求,信息部门来开发,一来二去,信息传递必然有损耗。而且业务人员并不一定代表行业最深刻的理解——在某些方面,大模型的覆盖面反而更广。
- 开发周期长。等报表和分析报告正式发布,最佳营销时间窗口很可能已经过去了。
- 对数据的洞察水平,高度依赖团队里每个人的能力高低。所以我们这套方案,是把大模型的通用性和行业数据的独特性结合起来,给出更智能的解法。
02 ChatBI要解决的问题
那ChatBI又是怎么破局的?具体来说,它瞄准了五个方向:
- 基于大模型智能生成(AIGC)应用模块——报表、图表、挖掘结论都能自动产出,打破个人认知的边界。
- 以智能助手的身份,直接成为业务人员或研发人员的助理。而且,这个助手还能进一步修正和训练,越用越顺手。
- 后台引擎提供了丰富的agent,能满足个性化的报表需求,多维度图表、深度数据探查、数据挖掘能力全部集成,大大增强了分析能力。
- 所见即所得。只要用文本输入就能找到答案,再也不用在繁琐的目录菜单里翻来翻去。
- 打破数据源的壁垒,支持跨数据源的融合,数据和数据之间的墙被推倒了。
03 解决方案
毫无疑问,AI与各种场景的融合正在不断加深,而这种融合从各个方面都在提升智能产品的能力。我们的团队基于互联网二手房数据,借助AIGC技术,做了一套“预训练+实时数据”的AIGC案例。这算是给“生成AI融合万物”的期许开了个好头。从这些“实体化”了的AI中,和大家一起挖一挖未来可能的趋势。
入口和ChatGPT一样——简便的输入框,客户通过自然语言就能完成交互。
综述:数据总览
当用户想获取某个主题的数据,比如输入“深圳二手房信息总览”,ChatBI模型会反馈一份综述信息,让用户对该主题有一个全面的了解。
模态一:统计报表
用户输入“查看小区名称总房价信息”,就能得到列表结论。如果想调整表头,比如行列合并、加粗、标记等,也都可以通过文本交互实现。需要过滤条件?直接说就行,立等可得。
模态二:图表
图表方面,趋势、对比、分布、同环比等常见统计场景全部覆盖。
模态三:挖掘结论
(1)指标相关性
(2)关联关系
模态四:开放性问题
大语言模型在语言交互、知识检索之外还有一个很强的泛化能力——统合信息进行预测。当这些信息是非语言、或者我们难以理解的语言时,预测在某种程度上就成了翻译。比如,很多科学家已经在尝试用大语言模型理解鲸鱼、狐狸的语言,并且取得了一定效果。
在私有模型的基础上,我们结合私有化部署的通用模型输出行业结论,供综合分析使用。举个例子:输入“推荐一个在福田区的小区,具体要求是低楼层、坐北朝南、四室一厅、一年内的小区”,就能得到如下结论。