跳至主要内容
前往文档
⌘U
Weaviate 数据库

使用 Weaviate 的 APIs 和工具开发 AI 应用

部署

部署、配置和维护 Weaviate 数据库

Weaviate Agents

使用 Weaviate 构建和部署智能代理

Weaviate Cloud

在云端管理和扩展 Weaviate

更多资源

集成
贡献者指南
活动 & 工作坊
Weaviate Academy

需要帮助?

Weaviate Logo询问 AI 助手⌘K
社区论坛

模型提供商集成

Weaviate 与各种 自托管基于 API 的模型集成,这些模型来自各种提供商。

这可以增强开发体验,例如能够

  • 直接将对象导入到 Weaviate,而无需手动指定嵌入向量,以及
  • 使用生成式 AI 模型构建集成的检索增强生成 (RAG) 管道。

模型提供商集成

基于 API

模型提供商嵌入向量生成式 AI其他
Anthropic-文本-
Anyscale-文本-
AWS文本文本
Cohere文本, 多模态文本重排序器
上下文 AI-文本重排序器
Databricks文本文本-
FriendliAI-文本-
Google文本, 多模态文本-
Hugging Face文本--
Jina AI文本, 多模态-重排序器
Mistral文本文本-
NVIDIA文本, 多模态文本重排序器
OctoAI (已弃用)文本文本-
OpenAI文本文本-
Azure OpenAI文本文本-
Voyage AI文本, 多模态-重排序器
Weaviate文本, 多模态--
xAI-文本-

启用所有基于 API 的模块

从 Weaviate v1.33 开始,所有基于 API 的模型集成默认可用。对于旧版本,您可以设置 ENABLE_API_BASED_MODULES 环境变量true 以启用所有这些模块。

本地托管

模型提供商嵌入向量生成式 AI其他
GPT4All (已弃用)文本 (已弃用)--
Hugging Face文本, 多模态 (CLIP)-重排序器
KubeAI文本--
Model2vec文本--
Meta ImageBind多模态--
Ollama文本文本-
Weaviate Academy

课程嵌入模型评估与选择

嵌入模型是向量搜索的核心。了解如何评估和选择适合您用例的嵌入模型。

开放学院课程

Weaviate 如何生成嵌入向量?

当启用嵌入向量的模型提供商集成时,Weaviate 会自动为添加到数据库中的对象生成嵌入向量。

这是通过将源数据提供给集成提供商来完成的,然后提供商将嵌入向量返回给 Weaviate。然后,嵌入向量存储在 Weaviate 数据库中。

Weaviate 按照以下方式生成对象的嵌入向量

  • 选择具有 texttext[] 数据类型的属性,除非它们被配置为跳过
  • 在连接值之前,按字母顺序 (a-z) 对属性进行排序
  • 如果配置了,则在前面加上集合名称
区分大小写

对于 Weaviate v1.27 之前的版本,上述创建的字符串在发送到模型提供商之前会转换为小写。从 v1.27 开始,字符串将按原样发送。

如果您希望文本转换为小写,可以通过设置 LOWERCASE_VECTORIZATION_INPUT 环境变量来实现。对于 text2vec-contextionary 集成,文本始终转换为小写。

问题和反馈

如果您有任何问题或反馈,请在 用户论坛 中告诉我们。