T-RAG=RAG+微调+实体识别
来源:互联网
时间:2026-06-01 16:31:36
T-RAG 的核心思路可以这样理解:它把 RAG 架构、开源的微调语言模型(LLM),以及实体树向量数据库这三样东西整合在一起,专门用来做上下文检索。简单说,就是给传统的检索增强生成加了一棵“实体树”,让模型能更聪明地定位信息。

背景介绍
大型语言模型在各个领域用得越来越广,尤其是在
私有企业文档的问答场景
数据安全
模型稳定性
数据隐私
因为文档本身敏感,安全风险是第一道坎。
为了防止数据泄露,用公有 API 调私有模型这条路被直接堵死了
技术亮点
这项研究真正有价值的地方在于,它提出了一种
结合检索增强生成(RAG)和基于企业文档微调的开源 LLM 的应用方案
Correct-Verbose
T-RAG
Tree-RAG(T-RAG)的工作流程其实挺清晰的。用户问一个问题,系统先从向量数据库里搜出相关的文档片段,作为 LLM 的背景知识。如果问题里提到了任何和组织相关的实体(比如某个部门、某个人),系统就会从实体树里把这些实体的信息拎出来,一并加到背景知识里。最后,经过微调的 Llama-27B 模型基于这些信息给出回答。
实体树
T-RAG 一个很突出的特点,就是在向量数据库之外额外弄了个实体树(entities tree)来辅助上下文检索。这棵树里存的是和企业组织相关的内部实体信息,以及它们之间的层级结构。每个节点代表一个实体,父节点说明它属于哪个大组。检索的时候,T-RAG 会拿实体树去增强从向量数据库里拿到的上下文。具体怎么查询和生成上下文呢?过程如下:
- 一个解析器模块先扫描用户的问题,看有没有组织内部实体名称的关键字。
- 如果找到了一个或几个匹配项,就从实体树里提取每个匹配实体的详细信息。
- 把这些细节转成文字描述,告诉模型这个实体叫什么、在组织层级里处于什么位置。
- 然后把这段信息跟从向量数据库搜到的文档块组合在一起,拼出最终的上下文。
- 这样一搞,当用户问起某个具体实体时,模型手里就有了关于这个实体及其层级位置的结构化知识,回答自然更精准。
结合上头的图,用一个组织结构图的例子就能直观展示树搜索和检索的过程:
- 除了拿相关的背景文档,系统还会用 spaCy 库加自定义规则,识别出问题里的命名实体。
- 如果问题包含一个或多个实体,就从实体树里提取该实体的层级位置信息,再转成文本。
- 这些文本和检索到的文档拼在一起,成为最终的上下文。
- 特别说明一下:如果用户问题里压根没提任何实体,系统就直接跳过树搜索,只靠检索文档提供上下文。
总结
这项研究让人挺受启发的,因为它把 RAG、模型微调和实体识别给串起来了。一方面,靠内部部署的开源模型解决了数据隐私的硬伤;另一方面,实实在在地压低了推理延迟和 token 使用成本,还能照顾到不同地区用户的需求。另外,用 spaCy 框架做实体搜索和上下文生成,这个思路也很值得借鉴。最重要的还不是理论——这背后是构建实际 LLM 应用的经验总结,落到地上干活的那种,价值很高。