跳到主要内容
版本:2.0.x

创建可被 Agent 检索的 AI 知识库

AI 知识库用于沉淀产品手册、制度文件、FAQ、操作说明、网页资料等事实性内容。平台会将这些资料处理成可检索的知识片段,供 AI Agent 在回答问题时查阅,也可在后端可视化编程中通过知识库方法进行语义检索、关键词检索、文档新增和文档删除。

知识库适合解决“根据哪些资料回答”的问题。如果要规范 Agent 的处理步骤、输出格式或业务规则,应结合 AI技能 或 Agent 系统提示词一起使用。

创建用于产品文档问答的 AI 知识库元素

提示

建议先完成大模型厂商向量数据库的创建,再创建 AI 知识库,以便在创建流程中直接选择对应元素。大模型厂商推荐阿里百炼硅基流动,它们提供较丰富的向量模型和重排模型。

Loading...

在元素目录树点击搜索框右侧的+按钮,选择AI知识库-标准知识库。随后弹出创建 AI 知识库元素的弹窗。

Loading...

创建弹窗中填写名称,选择向量数据库向量模型重排模型为可选项:配置后可对向量召回结果进行二次排序;不配置时,知识库会直接使用向量检索结果。点击确定完成创建。

提示

向量模型对检索效果影响较大,创建后不能直接修改。若后续需要更换向量模型或向量数据库,应规划文档重新向量化和数据迁移。

Loading...

创建完成后会在左侧元素树中显示。

知识库如何把资料变成可检索内容

开发者通常只需要关注三类配置:

  • 向量数据库:保存文档片段的语义索引。开发测试可使用本地化配置,生产环境建议使用独立部署的向量数据库。
  • 向量模型:决定文档和用户问题如何转成语义向量,是知识库检索效果的基础。
  • 重排模型:可选。用于对召回片段重新排序,适合资料量较大、候选结果相近、需要提高前几条命中质量的场景。配置重排模型后,还可以在知识库设置中开启关键词召回,让向量召回和关键词召回共同提供候选片段。

创建知识库后,继续在知识库文档管理中添加本地文件或 Web URL,并通过查询测试验证检索效果。

文档处理流程

上传资料后,平台会解析内容、按配置拆分片段、清洗文本并向量化。处理完成的文档状态会显示为OK,此后即可被查询测试、Agent 或后端函数检索。

检索机制

用户查询经过向量化后,系统会先召回 TopK 个语义相近的候选片段,并按向量相似度阈值过滤低质量结果。

如果知识库配置了重排模型,并在知识库设置中启用了关键词召回,系统会同时执行关键词召回,将关键词命中的候选片段与向量召回结果合并去重,再交给重排模型排序和过滤。这样既能覆盖语义相近的内容,也能增强专有名词、编号、术语和精确关键词的命中能力。

如果没有配置重排模型,关键词召回不可启用,知识库会直接返回向量检索结果中的前 TopN 个片段。

关于检索参数配置和在后端可视化编程中的具体使用方法,请参见使用知识库进行语义检索和关键词检索