跳到主要内容

向量数据库

向量数据库是JitAi平台中用于存储和检索知识库内容的核心组件,是AI知识库元素的底层存储引擎。

通过配置向量数据库,AI知识库可以将文档内容转换为向量数据存储。这种存储方式使得应用能够基于语义相似度快速检索相关知识,为智能问答、内容推荐等功能提供强大的数据支撑。

向量数据库创建

提示

向量数据库默认使用余弦相似度作为距离度量算法,该算法特别适用于文本语义相似性计算。

Chroma向量数据库

Chroma是JitAi平台默认集成的向量数据库,它具有轻量级、易部署、高性能的特点,支持余弦相似度、欧几里得距离等多种相似性度量算法。它既可以作为嵌入式数据库在本地运行,也可以部署为独立服务支持远程访问,为不同规模的应用提供灵活的向量存储解决方案。

本地向量数据库配置

本地向量数据库采用内置存储方式,数据直接保存在JitAi平台的本地环境中。这种模式无需额外的数据库服务器,开箱即用(只需配置名称即可),适合小规模应用和开发测试场景。

本地化

输入名称连接模式选择持久化模式,点击保存即可创建本地向量数据库。

远程向量数据库连接

远程向量数据库通过连接外部独立部署的Chroma数据库服务来存储和检索数据,适合生产环境以及集群方式部署的应用服务。

远程

除了配置名称外,还要配置数据库地址端口超时时间认证令牌

向量数据库编程接口

health_check

检查向量数据库的连接状态和运行健康情况,返回数据库基本信息。API文档

create_collection

在向量数据库中创建新的集合,用于存储和管理相关的向量数据。API文档

add_vectors

将向量数据及其元数据存储到指定的集合中。API文档

query_vectors

基于查询向量在集合中搜索最相似的向量数据。API文档