创建知识库元素
在传统应用系统中,经常面临用户手册散落在各个文档,常见问题答案需要反复查找的问题。
AI知识库元素正是为了解决这些痛点而生。它不仅是文档的存储容器,还具备语义理解的检索能力。它将各类文档转化为可被“理解”的结构化知识,当用户提出问题时,知识库会理解语义意图,返回知识库中匹配的答案。
创建AI知识库元素
在元素目录树点击搜索框右侧的+
按钮,选择AI知识库
-标准知识库
。随后弹出创建AI知识库元素的弹窗。
创建弹窗中需依次完成名称
,向量数据库
,向量模型
和重排模型
的选择。点击确定
完成创建。
tip
向量模型对搜索的结果有较大的影响,请根据实际情况选择,创建完成后不允许再次修改。
创建完成后会在左侧元素树中显示。
原理说明
核心构成要素
AI知识库基于先进的RAG(检索增强生成)架构,由五个核心组件协同工作:
- 向量模型:将文档和查询转换为高维向量表示,实现语义理解
- 重排模型:对初步检索结果进行精确排序,提升匹配准确度
- 向量数据库:高效存储和检索向量数据,支持大规模相似度计算
- 文档处理器:智能解析、分块、清洗文档内容,优化向量化效果
- 关系数据库:存储文档元数据和文本块,确保数据一致性
系统架构
技术原理
语义理解技术:采用先进的文本向量化模型,将自然语言转换为数学向量空间中的点,使计算机能够理解文本的语义关系,而不仅仅是关键词匹配。
两阶段检索机制:
- 向量检索阶段:在向量空间中快速定位语义相似的候选文档
- 重排序阶段:基于查询上下文对候选结果进行精确排序
混合存储策略:向量数据库专门处理高维向量的相似度计算,关系数据库管理结构化的元数据,两者协同确保检索的高效性和准确性。
数据处理流程
检索机制
用户查询经过向量化后,系统在向量空间中检索出TopK个语义相似的候选文档,通过相似度阈值过滤低质量结果,最后使用重排模型基于查询上下文进行精确排序,返回TopN个最相关的知识片段。
关于检索参数配置和在后端可视化编程中的具体使用方法,请参见使用知识库进行全文与语义检索。