跳到主要内容

创建知识库元素

在传统应用系统中,经常面临用户手册散落在各个文档,常见问题答案需要反复查找的问题。

AI知识库元素正是为了解决这些痛点而生。它不仅是文档的存储容器,还具备语义理解的检索能力。它将各类文档转化为可被“理解”的结构化知识,当用户提出问题时,知识库会理解语义意图,返回知识库中匹配的答案。

创建AI知识库元素

提示

建议先完成大模型厂商向量数据库的创建,再创建AI知识库,以便在创建流程中直接选择对应元素。大模型厂商推荐阿里百炼硅基流动,他们有比较丰富的向量和重排模型供开发者选择。

创建AI知识库元素

在元素目录树点击搜索框右侧的+按钮,选择AI知识库-标准知识库。随后弹出创建AI知识库元素的弹窗。

创建弹窗

创建弹窗中需依次完成名称,向量数据库向量模型重排模型的选择。点击确定完成创建。

提示

向量模型对搜索的结果有较大的影响,请根据实际情况选择,创建完成后不允许再次修改。

元素树中显示

创建完成后会在左侧元素树中显示。

原理说明

核心构成要素

AI知识库基于先进的RAG(检索增强生成)架构,由五个核心组件协同工作:

  • 向量模型:将文档和查询转换为高维向量表示,实现语义理解
  • 重排模型:对初步检索结果进行精确排序,提升匹配准确度
  • 向量数据库:高效存储和检索向量数据,支持大规模相似度计算
  • 文档处理器:智能解析、分块、清洗文档内容,优化向量化效果
  • 关系数据库:存储文档元数据和文本块,确保数据一致性

系统架构

技术原理

语义理解技术:采用先进的文本向量化模型,将自然语言转换为数学向量空间中的点,使计算机能够理解文本的语义关系,而不仅仅是关键词匹配。

两阶段检索机制

  1. 向量检索阶段:在向量空间中快速定位语义相似的候选文档
  2. 重排序阶段:基于查询上下文对候选结果进行精确排序

混合存储策略:向量数据库专门处理高维向量的相似度计算,关系数据库管理结构化的元数据,两者协同确保检索的高效性和准确性。

数据处理流程

检索机制

用户查询经过向量化后,系统在向量空间中检索出TopK个语义相似的候选文档,通过相似度阈值过滤低质量结果,最后使用重排模型基于查询上下文进行精确排序,返回TopN个最相关的知识片段。

关于检索参数配置和在后端可视化编程中的具体使用方法,请参见使用知识库进行全文与语义检索