模型提供商集成
Weaviate 与各种 自托管 和 基于 API 的模型集成,这些模型来自各种提供商。
这可以增强开发体验,例如能够
- 直接将对象导入到 Weaviate,而无需手动指定嵌入向量,以及
- 使用生成式 AI 模型构建集成的检索增强生成 (RAG) 管道。
模型提供商集成
基于 API
启用所有基于 API 的模块
从 Weaviate v1.33 开始,所有基于 API 的模型集成默认可用。对于旧版本,您可以设置 ENABLE_API_BASED_MODULES 环境变量 为 true 以启用所有这些模块。
本地托管
| 模型提供商 | 嵌入向量 | 生成式 AI | 其他 |
|---|---|---|---|
| GPT4All (已弃用) | 文本 (已弃用) | - | - |
| Hugging Face | 文本, 多模态 (CLIP) | - | 重排序器 |
| KubeAI | 文本 | - | - |
| Model2vec | 文本 | - | - |
| Meta ImageBind | 多模态 | - | - |
| Ollama | 文本 | 文本 | - |

课程嵌入模型评估与选择
嵌入模型是向量搜索的核心。了解如何评估和选择适合您用例的嵌入模型。
开放学院课程Weaviate 如何生成嵌入向量?
当启用嵌入向量的模型提供商集成时,Weaviate 会自动为添加到数据库中的对象生成嵌入向量。
这是通过将源数据提供给集成提供商来完成的,然后提供商将嵌入向量返回给 Weaviate。然后,嵌入向量存储在 Weaviate 数据库中。
Weaviate 按照以下方式生成对象的嵌入向量
- 选择具有
text或text[]数据类型的属性,除非它们被配置为跳过 - 在连接值之前,按字母顺序 (a-z) 对属性进行排序
- 如果配置了,则在前面加上集合名称
区分大小写
对于 Weaviate v1.27 之前的版本,上述创建的字符串在发送到模型提供商之前会转换为小写。从 v1.27 开始,字符串将按原样发送。
如果您希望文本转换为小写,可以通过设置 LOWERCASE_VECTORIZATION_INPUT 环境变量来实现。对于 text2vec-contextionary 集成,文本始终转换为小写。
问题和反馈
如果您有任何问题或反馈,请在 用户论坛 中告诉我们。
