环境变量
要配置在 Docker 或 Kubernetes 部署中运行的 Weaviate,您可以设置这些环境变量。
布尔环境变量
对于布尔环境变量,"on"、"enabled"、"1" 和 "true" 都将被解释为 true。
所有其他值都将被解释为 false。
运行时配置更新
Weaviate 支持运行时配置管理。请查看如何 配置它以及可用的环境变量。
通用
| 变量 | 描述 | 类型 | 示例值 |
|---|---|---|---|
ASYNC_INDEXING | 如果设置,Weaviate 会异步地将向量索引创建到对象创建过程。这对于导入大量数据非常有用。(默认值:false) | 布尔值 | false |
AUTOSCHEMA_ENABLED | 是否根据需要使用自动模式推断模式。(默认值:true) | 布尔值 | true |
DEFAULT_QUANTIZATION | 默认量化技术 - 可以被集合定义中指定的量化方法覆盖。可用值:rq-8、rq-1、pq、bq、sq 和 none。默认值:none。注意:如果为集合的索引类型选择的量化方法不受支持(例如,PQ 和 SQ 不受 flat 索引的支持),则该量化将不会应用于该集合。 新增于 v1.33 | 字符串 | rq-8 |
DEFAULT_VECTORIZER_MODULE | 默认向量化器模块 - 可以被集合定义中的向量化器覆盖。 | 字符串 | text2vec-contextionary |
API_BASED_MODULES_DISABLED | Weaviate 自动启用所有 基于 API 的模块 的使用。将此变量设置为 true 以限制访问,并仅允许通过 ENABLE_MODULES 变量使用特定的模块。默认值:false新增于 v1.33 | 布尔值 | true |
DISABLE_LAZY_LOAD_SHARDS | 新增于 v1.23。当 false 时,启用延迟分片加载以提高多租户部署中的平均恢复时间。 | 字符串 | false |
DISABLE_TELEMETRY | 禁用 遥测 数据收集 | 布尔值 | false |
DISK_USE_READONLY_PERCENTAGE | 如果磁盘使用率高于给定的百分比,受影响节点上的所有分片都将被标记为 READONLY,这意味着所有未来的写入请求都将失败。有关详细信息,请参阅 磁盘压力警告和限制。 | 字符串 - 数字 | 90 |
DISK_USE_WARNING_PERCENTAGE | 如果磁盘使用率高于给定的百分比,将由受影响节点磁盘上的所有分片记录警告。有关详细信息,请参阅 磁盘压力警告和限制。 | 字符串 - 数字 | 80 |
ENABLE_API_BASED_MODULES | 启用所有基于 API 的模块。从 v1.33 开始移除 | 布尔值 | true |
ENABLE_MODULES | 指定启用的模块和可以使用哪些模块。 | 字符串 - 逗号分隔的名称 | text2vec-openai,generative-openai |
ENABLE_TOKENIZER_GSE | 启用 GSE 分词器 以供使用 | 布尔值 | true |
ENABLE_TOKENIZER_KAGOME_JA | 启用 Kagome 分词器用于日语 以供使用(从 v1.28.0 开始为实验性功能) | 布尔值 | true |
ENABLE_TOKENIZER_KAGOME_KR | 启用 Kagome 分词器用于韩语 以供使用(从 v1.25.7 开始为实验性功能) | 布尔值 | true |
GODEBUG | 控制运行时内的调试变量。请参阅官方 Go 文档。 | 字符串 - 逗号分隔的名称=值对列表 | gctrace=1 |
GOMAXPROCS | 设置可以同时执行的最大线程数。如果设置了此值,它将受到 LIMIT_RESOURCES 的尊重。 | 字符串 - 数字 | NUMBER_OF_CPU_CORES |
GOMEMLIMIT | 设置 Go 运行时的内存限制。建议值为总 Weaviate 内存的 80-90%。Go 运行时会尝试确保长期和临时内存分配不超过此值,从而使垃圾回收器在内存使用接近限制时更加激进。了解有关 GOMEMLIMIT 的更多信息。 | 字符串 - SI 单位的内存限制 | 4096MiB |
INVERTED_SORTER_DISABLED | 强制使用“对象桶”策略,并且不考虑反向排序。大多数用户永远不应该设置此标志;它用于基准测试和作为安全网。默认值:false | 布尔值 | false |
GO_PROFILING_DISABLE | 如果为 true,则禁用 Go 性能分析。默认值:false。 | 布尔值 | false |
GO_PROFILING_PORT | 设置 Go 性能分析器的端口。默认值:6060 | 整数 | 6060 |
GRPC_MAX_MESSAGE_SIZE | gRPC 消息的最大大小(以字节为单位)。(新增于 v1.27.1) 默认值:10MB | 字符串 - 数字 | 2000000000 |
GRPC_PORT | Weaviate 的 gRPC 服务器侦听传入请求的端口。默认值:50051 | 字符串 - 数字 | 50052 |
HNSW_GEO_INDEX_EF | 平衡地理索引搜索速度和召回率。此值控制基于地理位置的查询的搜索深度。默认值:800新增于 v1.31.22 | 字符串 - 数字 | 1000 |
LIMIT_RESOURCES | 如果为 true,Weaviate 将自动尝试自动检测并限制其使用的资源量(内存和线程)到(总内存的 0.8 *)和(核心数-1)。它将覆盖任何 GOMEMLIMIT 值,但它将尊重 GOMAXPROCS 值。 | 布尔值 | false |
LOG_FORMAT | 设置 Weaviate 日志格式json (默认值):以 JSON 格式输出日志数据。例如:{"action":"startup","level":"debug","msg":"finished initializing modules","time":"2023-04-12T05:07:43Z"}text:将日志数据输出到字符串。例如:time="2023-04-12T04:54:23Z" level=debug msg="finished initializing modules" action=startup | 字符串 | |
LOG_LEVEL | 设置 Weaviate 日志级别。默认值:infopanic:仅限 Panic 条目。(新增于 v1.24)fatal:仅限 Fatal 条目。(新增于 v1.24)error:仅限 Error 条目。(新增于 v1.24)warning:仅限 Warning 条目。(新增于 v1.24)info:常规操作条目。debug:非常详细的日志记录。trace:比 debug 更细粒度的信息事件。 | 字符串 | |
MAXIMUM_ALLOWED_COLLECTIONS_COUNT | Weaviate 节点中允许的最大集合数。值为 -1 会移除限制。默认值:-1(无限制)与其提高集合计数限制,请考虑 重新思考您的架构。 新增于 v1.30 | 字符串 - 数字 | 20 |
MAXIMUM_CONCURRENT_BUCKET_LOADS | 启动期间可以同时加载的最大桶数。这是为了防止在加载大量集合时压垮操作系统。默认值:100新增于 v1.31.22 | 字符串 - 数字 | 50 |
MAXIMUM_CONCURRENT_SHARD_LOADS | 启动期间可以同时加载的最大分片数。这是为了防止在加载大量集合时压垮操作系统。默认值:100 | 字符串 - 数字 | 50 |
MEMORY_READONLY_PERCENTAGE | 如果内存使用率高于给定的百分比,受影响节点上的所有分片都将被标记为 READONLY,这意味着所有未来的写入请求都将失败。(默认值:0 - 即无限制) | 字符串 - 数字 | 75 |
MEMORY_WARNING_PERCENTAGE | 如果内存使用率高于给定的百分比,将由受影响节点磁盘上的所有分片记录警告。(默认值:0 - 即无限制) | 字符串 - 数字 | 85 |
MODULES_CLIENT_TIMEOUT | 对 Weaviate 模块的请求超时时间。默认值:50s | 字符串 - 持续时间 | 5s、10m、1h |
OBJECTS_TTL_ALLOW_SECONDS | 如果设置,则 OBJECTS_TTL_DELETE_SCHEDULE 将是包含秒的 6 字段 cron 格式。默认值:true | 布尔值 | false |
OBJECTS_TTL_DELETE_SCHEDULE | 删除过期对象的计划。使用标准的 cron 格式,或描述符(例如 @hourly)。默认值:"" | 字符串 - cron 格式 | 0 */6 * * *(每 6 小时) |
OPERATIONAL_MODE | 设置实例的 操作模式。选项:READ_WRITE(默认值)、READ_ONLY、WRITE_ONLY、SCALE_OUT。根据选择的模式限制可用操作。 | 字符串 | READ_WRITE |
ORIGIN | 设置 Weaviate 的 http(s) 源 | 字符串 - HTTP 源 | https://my-weaviate-deployment.com |
PERSISTENCE_DATA_PATH | Weaviate 数据存储的路径。 关于文件系统和性能的说明. | string - 文件路径 | /var/lib/weaviate 从 v1.24 开始,默认值为 ./data |
PERSISTENCE_HNSW_DISABLE_SNAPSHOTS | 如果设置,HNSW 快照将被禁用。默认值:true在 v1.31 中添加 | 布尔值 | false |
PERSISTENCE_HNSW_SNAPSHOT_INTERVAL_SECONDS | 创建下一个快照之前必须经过的最小秒数。默认值:21600 秒(6 小时)在 v1.31 中添加 | 字符串 - 数字 | 3600 |
PERSISTENCE_HNSW_SNAPSHOT_MIN_DELTA_COMMITLOGS_NUMBER | 自上次快照以来创建的新的提交日志文件的最小数量。默认值:1在 v1.31 中添加 | 字符串 - 数字 | 100 |
PERSISTENCE_HNSW_SNAPSHOT_MIN_DELTA_COMMITLOGS_SIZE_PERCENTAGE | 触发新快照所需的新的提交日志的总大小的最小百分比(相对于上一个快照的大小)。默认值:5(意味着相对于上一个快照的大小,新的提交日志占 5%)在 v1.31 中添加 | 字符串 - 数字 | 15 |
PERSISTENCE_HNSW_SNAPSHOT_ON_STARTUP | 如果设置,Weaviate 将尝试在启动期间创建新的快照,如果自上次快照以来提交日志中发生更改。如果没有更改,则将加载现有的快照。默认值:true在 v1.31 中添加 | 布尔值 | false |
PERSISTENCE_HNSW_MAX_LOG_SIZE | HNSW 预写式日志的最大大小。增加此值以提高日志压缩效率,或减少此值以减少内存需求。默认值:500MiB | 字符串 | 4GiB(IEC 单位),4GB(SI 单位),4000000000(字节) |
PERSISTENCE_LSM_ACCESS_STRATEGY | 用于访问虚拟内存中磁盘数据的函数。默认值:mmap | 字符串 | mmap 或 pread |
PERSISTENCE_LSM_MAX_SEGMENT_SIZE | 在 LSM 存储中的分段的最大大小。将其设置为限制压缩期间的磁盘使用峰值,约为分段大小的两倍。默认值:无限制 | 字符串 | 4GiB(IEC 单位),4GB(SI 单位),4000000000(字节) |
PROMETHEUS_MONITORING_ENABLED | 如果设置,Weaviate 将收集 与 Prometheus 兼容格式的指标 | 布尔值 | false |
PROMETHEUS_MONITORING_GROUP | 如果设置,Weaviate 将跨所有分片对相同类别的指标进行分组。 | 布尔值 | true |
QUERY_CROSS_REFERENCE_DEPTH_LIMIT | 设置查询中要解析的交叉引用的最大深度。默认值为 5。 在 v1.24.25、v1.25.18、v1.26.5 中添加。 | 字符串 - 数字 | 3 |
QUERY_DEFAULTS_LIMIT | 设置查询中要返回的对象的默认数量。 | 字符串 - 数字 | 25 从 v1.24 开始,默认值为 10 |
QUERY_MAXIMUM_RESULTS | 设置可以检索的最大对象总数。 | 字符串 - 数字 | 10000 |
QUERY_SLOW_LOG_ENABLED | 记录慢查询以进行调试。需要重新启动才能更新。 (在 1.24.16、1.25.3 中新增) | 布尔值 | False |
QUERY_SLOW_LOG_THRESHOLD | 设置慢查询日志记录的阈值时间。需要重新启动才能更新。 (在 1.24.16、1.25.3 中新增) | 字符串 | 2s 值是时间: 3h、2s、100ms |
REINDEX_SET_TO_ROARINGSET_AT_STARTUP | 允许 Weaviate 执行一次性重新索引,以使用 Roaring 位图。 在 1.18 及更高版本中可用。 | 布尔值 | true |
REVECTORIZE_CHECK_DISABLED | 禁用 Weaviate 检查向量是否可以从对象先前版本重用的优化。禁用后,通过消除新对象读取-写入模式来提高写入吞吐量。默认值:false | 布尔值 | false |
TENANT_ACTIVITY_READ_LOG_LEVEL | 设置租户读取活动的日志级别。对于分析或调试目的很有用。默认值:debug | 字符串 | info |
TENANT_ACTIVITY_WRITE_LOG_LEVEL | 设置租户写入活动的日志级别。对于分析或调试目的很有用。默认值:debug | 字符串 | info |
TOKENIZER_CONCURRENCY_COUNT | 限制同时运行的 GSE 和 Kagome 分词器的组合数量。默认值:GOMAXPROCS | 字符串 - 数字 | NUMBER_OF_CPU_CORES |
TOMBSTONE_DELETION_CONCURRENCY | 用于墓碑删除的最大核心数。将其设置为限制用于清理的核心数。默认值:可用核心的一半。(在 v1.24.0 中新增) | string - int | 4 |
TOMBSTONE_DELETION_MAX_PER_CYCLE | 每个清理周期要删除的最大墓碑数。将其设置为限制清理周期,因为它们会占用大量资源。例如,对于具有 3 亿对象分片的集群,设置最大值为 10000000(10M)。默认值:无 | string - int(在 v1.24.15 / v1.25.2 中新增) | 10000000 |
TOMBSTONE_DELETION_MIN_PER_CYCLE | 每个清理周期要删除的最小墓碑数。将其设置为防止在低于阈值时触发不必要的清理周期。例如,对于具有 3 亿对象分片的集群,设置最小值为 1000000(1M)。默认值:0(在 v1.24.15、v1.25.2 中新增) | string - int | 100000 |
USE_GSE | 启用 GSE 分词器以供使用。(与 ENABLE_TOKENIZER_GSE 相同。我们建议使用 ENABLE_TOKENIZER_GSE 以与其他可选分词器保持命名一致。) | 布尔值 | true |
USE_INVERTED_SEARCHABLE | 使用更高效的磁盘内格式存储可搜索属性,专为 BlockMax WAND 算法设计。将此设置为 true 并同时使用 USE_BLOCKMAX_WAND 以在查询时启用 BlockMax WAND。在 v1.28 中添加,默认值:false从 v1.30 默认值:true了解更多 | 布尔值 | true |
USE_BLOCKMAX_WAND | 对 BM25 和混合搜索使用 BlockMax WAND 算法。与 USE_INVERTED_SEARCHABLE 结合使用以获得性能优势。在 v1.28 中添加,默认值:false从 v1.30 默认值:true了解更多 | 布尔值 | true |
模块特定
| 变量 | 描述 | 类型 | 示例值 |
|---|---|---|---|
BACKUP_* | 各种备份提供程序模块的配置变量。它们在 备份页面上详细介绍。 | ||
AZURE_BLOCK_SIZE | 用于备份的 Azure Blob 存储的块大小。默认值:41943040(40MB) | int - bytes | 10000000 |
AZURE_CONCURRENCY | 备份操作期间并行上传/下载的部分的最大数量。默认值:1 | int | 3 |
CLIP_INFERENCE_API | 如果启用了 clip 模块,则访问 clip 模块的端点 | 字符串 | http://multi2vec-clip:8080 |
CONTEXTIONARY_URL | contextionary 容器的服务发现 | string - URL | http://contextionary |
IMAGE_INFERENCE_API | 如果启用了 img2vec-neural 模块,则访问该模块的端点 | 字符串 | https://:8000 |
LOWERCASE_VECTORIZATION_INPUT | 如果为 true,Weaviate 在向量化之前将所有输入文本小写。在 v1.27 中添加(默认值:false)对于 text2vec-contextionary,将其设置为 true | 布尔值 | true |
OFFLOAD_S3_BUCKET | 用于卸载的 S3 存储桶(默认值:weaviate-offload) | 字符串 | my-custom-offload-bucket |
OFFLOAD_S3_BUCKET_AUTO_CREATE | 如果 S3 存储桶不存在,是否自动创建用于卸载的 S3 存储桶(默认值:false) | 布尔值 | true |
OFFLOAD_S3_CONCURRENCY | 卸载操作期间并行上传/下载的部分的最大数量(默认值:25) | 字符串 - 数字 | 10 |
OFFLOAD_TIMEOUT | 请求超时值,以秒为单位(默认值:120) | 字符串 - 数字 | 60 |
TRANSFORMERS_INFERENCE_API | 如果启用了 transformers 模块,则访问该模块的端点 | 字符串 | http://text2vec-transformers:8080 |
USE_GOOGLE_AUTH | 自动查找 Google Cloud 凭据,并根据需要为 Weaviate 生成 Vertex AI 访问令牌(了解更多)。(默认值:false) | 布尔值 | true |
USE_SENTENCE_TRANSFORMERS_VECTORIZER | (实验性)使用 sentence-transformer 向量化器代替默认向量化器(来自 transformers 库)。仅适用于自定义映像。 | 布尔值 | true |
CLIP_WAIT_FOR_STARTUP | 如果为 true,Weaviate 将等待 multi2vec-clip 模块启动后再启动(默认值:true)。 | 布尔值 | true |
NER_WAIT_FOR_STARTUP | 如果为 true,Weaviate 将等待 ner-transformers 模块启动后再启动(默认值:true)。(在 v1.25.27、v1.26.12、v1.27.7 中可用) | 布尔值 | true |
QNA_WAIT_FOR_STARTUP | 如果为 true,Weaviate 将等待 qna-transformers 模块启动后再启动(默认值:true)。(在 v1.25.27、v1.26.12、v1.27.7 中可用) | 布尔值 | true |
RERANKER_WAIT_FOR_STARTUP | 如果为 true,Weaviate 将等待 reranker-transformers 模块启动后再启动(默认值:true)。(在 v1.25.27、v1.26.12、v1.27.7 中可用) | 布尔值 | true |
SUM_WAIT_FOR_STARTUP | 如果为 true,Weaviate 将等待 sum-transformers 模块启动后再启动(默认值:true)。(在 v1.25.27、v1.26.12、v1.27.7 中可用) | 布尔值 | true |
GPT4ALL_WAIT_FOR_STARTUP | 如果为 true,Weaviate 将等待 text2vec-gpt4all 模块启动后再启动(默认值:true)。(在 v1.25.27、v1.26.12、v1.27.7 中可用) | 布尔值 | true |
TRANSFORMERS_WAIT_FOR_STARTUP | 如果为 true,Weaviate 将等待 text2vec-transformers 模块启动后再启动(默认值:true)。(在 v1.25.27、v1.26.12、v1.27.7 中可用) | 布尔值 | true |
USAGE_GCS_BUCKET | GCS 存储桶名称(如果使用 GCS,则必需) | 字符串 | my-weaviate-usage-bucket |
USAGE_GCS_PREFIX | GCS 报告的可选对象前缀 | 字符串 | usage-reports |
USAGE_S3_BUCKET | S3 存储桶名称(如果使用 S3,则必需) | 字符串 | my-weaviate-usage-bucket |
USAGE_S3_PREFIX | S3 报告的可选对象前缀 | 字符串 | usage-reports |
RUNTIME_OVERRIDES_ENABLED | 启用运行时覆盖配置 | 布尔值 | true |
RUNTIME_OVERRIDES_PATH | 运行时覆盖配置文件路径 | 字符串 | ${PWD}/tools/dev/config.runtime-overrides.yaml |
RUNTIME_OVERRIDES_LOAD_INTERVAL | 重新加载运行时覆盖配置的间隔。默认值:2m | duration | 2m |
USAGE_SCRAPE_INTERVAL | 抓取使用情况指标的间隔。默认值:1h | duration | 1h |
USAGE_SHARD_JITTER_INTERVAL | 分片级别操作的抖动间隔,以避免在有数千个分片时使文件系统不堪重负。默认值:100ms | duration | 100ms |
USAGE_POLICY_VERSION | 使用情况跟踪的策略版本 | 字符串 | 2025-06-01 |
USAGE_VERIFY_PERMISSIONS | 在启动时验证存储桶权限。默认值:false | 布尔值 | true |
身份验证和授权
| 变量 | 描述 | 类型 | 示例值 |
|---|---|---|---|
AUTHENTICATION_ANONYMOUS_ACCESS_ENABLED | 允许用户无需身份验证即可与 weaviate 交互 | 布尔值 | true 从 v1.24 开始,默认值为 true |
AUTHENTICATION_APIKEY_ALLOWED_KEYS | 允许的 API 密钥。 每个密钥对应于下面的特定用户身份。 | string - 逗号分隔的列表 | jane-secret-key,ian-secret-key |
AUTHENTICATION_APIKEY_ENABLED | 启用基于 API 密钥的身份验证 | 布尔值 | false |
AUTHENTICATION_APIKEY_USERS | 基于 API 密钥的身份。 每个身份对应于上面的特定密钥。 | string - 逗号分隔的列表 | jane@doe.com,ian-smith |
AUTHENTICATION_DB_USERS_ENABLED | 允许运行时 用户管理。默认值:false | 布尔值 | true |
AUTHENTICATION_OIDC_CERTIFICATE | OIDC 证书(PEM 格式) | string - PEM | -----BEGIN CERTIFICATE-----\n...\n-----END CERTIFICATE----- |
AUTHENTICATION_OIDC_CLIENT_ID | OIDC 客户端 ID | 字符串 | my-client-id |
AUTHENTICATION_OIDC_ENABLED | 启用基于 OIDC 的身份验证 | 布尔值 | false |
AUTHENTICATION_OIDC_GROUPS_CLAIM | OIDC 组声明 | 字符串 | groups |
AUTHENTICATION_OIDC_ISSUER | OIDC 令牌颁发者 | string - URL | https://myissuer.com |
AUTHENTICATION_OIDC_JWKS_URL | OIDC JWKS URL | string - URL | https://myissuer.com/.well-known/jwks.json |
AUTHENTICATION_OIDC_SCOPES | 要请求的 OIDC 范围 | string - 逗号分隔的列表 | openid,email |
AUTHENTICATION_OIDC_SKIP_CLIENT_ID_CHECK | 跳过 OIDC 客户端 ID 检查 | 布尔值 | false |
AUTHENTICATION_OIDC_USERNAME_CLAIM | OIDC 用户名声明 | 字符串 | email |
AUTHORIZATION_ADMINLIST_ENABLED | 启用 AdminList 授权方案(与 AUTHORIZATION_RBAC_ENABLED 互斥) | 布尔值 | true |
AUTHORIZATION_ADMINLIST_USERS | 在使用 AdminList 方案时具有管理员权限的用户 | string - 逗号分隔的列表 | jane@example.com,john@example.com |
AUTHORIZATION_ADMINLIST_READONLY_USERS | 在使用 AdminList 方案时具有只读权限的用户 | string - 逗号分隔的列表 | alice@example.com,dave@example.com |
RBAC 授权
| 变量 | 描述 | 类型 | 示例值 |
|---|---|---|---|
AUTHORIZATION_RBAC_ENABLED | 启用 RBAC 授权方案(与 AUTHORIZATION_ADMINLIST_ENABLED 互斥)。 | 布尔值 | true |
AUTHORIZATION_RBAC_ROOT_USERS | 在使用 RBAC 方案时具有内置 root/administrator 角色的用户。使用 RBAC 时必须定义至少一个 root 用户。 | string - 逗号分隔的列表 | admin-user,another-admin-user |
多节点实例
| 变量 | 描述 | 类型 | 示例值 |
|---|---|---|---|
CLUSTER_ADVERTISE_ADDR | 手动设置节点向集群广播的地址。如果系统主机名无法通过 DNS 解析(例如,查找错误),则很有用。 | 字符串 | 127.0.0.1 |
CLUSTER_DATA_BIND_PORT | 用于交换数据的端口。 | 字符串 - 数字 | 7103 |
CLUSTER_GOSSIP_BIND_PORT | 用于交换网络状态信息的端口。 | 字符串 - 数字 | 7102 |
CLUSTER_HOSTNAME | 节点的hostname。如果默认操作系统hostname可能会随时间变化,请始终设置此值。 | 字符串 | node1 |
CLUSTER_JOIN | 集群设置中“创始”成员节点的服务名称 | 字符串 | weaviate-node-1:7100 |
HNSW_STARTUP_WAIT_FOR_VECTOR_CACHE | 如果为 true,节点启动时向量缓存预填充是同步的。节点在缓存热身时报告准备好提供服务。默认为 false。在 1.24.20 和 1.25.5 中添加。 | 布尔值 | false |
COLLECTION_RETRIEVAL_STRATEGY | 设置数据请求的集合定义检索行为。
v1.27.10、v1.28.4 中添加) | 字符串 | LeaderOnly |
RAFT_BOOTSTRAP_EXPECT | 启动时投票节点数量 | 字符串 - 数字 | 1 |
RAFT_BOOTSTRAP_TIMEOUT | 等待集群启动的时间(秒) | 字符串 - 数字 | 90 |
RAFT_DRAIN_SLEEP | 关机前的缓冲时间,允许正在进行的操作完成。(默认:200ms) | 字符串 - 数字 | 2s |
RAFT_ENABLE_FQDN_RESOLVER | 如果为 true,则使用 DNS 查找而不是 memberlist 查找 Raft。在 v1.25.15 中添加,并在 v1.30 中删除。(了解更多) | 布尔值 | true |
RAFT_ENABLE_ONE_NODE_RECOVERY | 启用在重新启动时运行单节点恢复例程。如果默认主机名已更改并且单节点集群认为应该有两个节点,则此功能很有用。 | 布尔值 | false |
RAFT_FQDN_RESOLVER_TLD | 用于 DNS 查找的顶级域名,格式为 [node-id].[tld]。在 v1.25.15 中添加,并在 v1.30 中删除。(了解更多) | 字符串 | example.com |
RAFT_GRPC_MESSAGE_MAX_SIZE | 内部 raft gRPC 消息的最大大小(字节)。默认为 1073741824 | 字符串 - 数字 | 1073741824 |
RAFT_JOIN | 手动设置 Raft 投票节点。如果设置,则需要手动调整 RAFT_BOOTSTRAP_EXPECT 以匹配 Raft 投票节点数。 | 字符串 | weaviate-0,weaviate-1 |
RAFT_METADATA_ONLY_VOTERS | 如果为 true,投票节点仅处理模式。它们不接受任何数据。 | 布尔值 | false |
RAFT_TIMEOUTS_MULTIPLIER | Raft 共识超时和 memberlist TCP 超时的乘数。(默认:5) | 字符串 - 数字 | 10 |
REPLICA_MOVEMENT_MINIMUM_ASYNC_WAIT | 副本移动在文件复制后但在完成移动之前等待的时间,以便正在进行中的写入完成。默认:60 秒在 v1.32 中添加 | 字符串 - 数字 | 90 |
REPLICATED_INDICES_REQUEST_QUEUE_ENABLED | 启用/禁用多节点集群中复制索引的请求队列缓冲区。可以在运行时修改。默认:false | 布尔值 | true |
REPLICATION_ENGINE_MAX_WORKERS | 并行处理副本移动的 worker 数量。默认:10在 v1.32 中添加 | 字符串 - 数字 | 5 |
REPLICATION_MINIMUM_FACTOR | 集群中所有集合的最小复制因子。 | 字符串 - 数字 | 3 |
异步复制
在
v1.29 中添加配置异步复制的环境变量已在 v1.29 中引入。要了解有关其用法的更多信息,请访问 复制操作指南。
| 变量 | 描述 | 类型 | 示例值 |
|---|---|---|---|
ASYNC_REPLICATION_DISABLED | 禁用异步复制。默认:false | 布尔值 | false |
ASYNC_REPLICATION_HASHTREE_HEIGHT | 用于节点之间数据比较的哈希树的高度。如果高度为 0,则每个节点将仅存储每个分片的一个摘要。默认:16,最小值:0,最大值:20了解潜在的内存消耗增加。 | 字符串 - 数字 | 10 |
ASYNC_REPLICATION_FREQUENCY | 节点之间定期数据比较的频率(秒)。默认:30 | 字符串 - 数字 | 60 |
ASYNC_REPLICATION_FREQUENCY_WHILE_PROPAGATING | 节点同步后节点之间数据比较的频率(毫秒)。默认:10 | 字符串 - 数字 | 20 |
ASYNC_REPLICATION_ALIVE_NODES_CHECKING_FREQUENCY | 后台进程检查节点可用性变化的频率(秒)。默认:5 | 字符串 - 数字 | 20 |
ASYNC_REPLICATION_LOGGING_FREQUENCY | 后台进程记录任何事件的频率(秒)。默认:5 | 字符串 - 数字 | 7 |
ASYNC_REPLICATION_DIFF_BATCH_SIZE | 指定比较节点之间摘要信息时的批处理大小。默认:1000,最小值:1,最大值:10000 | 字符串 - 数字 | 2000 |
ASYNC_REPLICATION_DIFF_PER_NODE_TIMEOUT | 定义节点提供比较响应的时间限制(秒)。默认:10 | 字符串 - 数字 | 30 |
ASYNC_REPLICATION_PROPAGATION_TIMEOUT | 定义节点提供传播响应的时间限制(秒)。默认:30 | 字符串 - 数字 | 60 |
ASYNC_REPLICATION_PROPAGATION_LIMIT | 限制在一个异步复制迭代中可以传播的不同步对象的数量。默认:10000,最小值:1,最大值:1000000 | 字符串 - 数字 | 5000 |
ASYNC_REPLICATION_PROPAGATION_DELAY | 设置延迟时间,以允许异步写入操作到达分片/租户中的所有节点,然后再传播新的或更新的对象。默认:30 | 字符串 - 数字 | 40 |
ASYNC_REPLICATION_PROPAGATION_CONCURRENCY | 定义将并发传播一批对象的 worker 数量。默认:5,最小值:1,最大值:20 | 字符串 - 数字 | 10 |
ASYNC_REPLICATION_PROPAGATION_BATCH_SIZE | 设置单个批处理中传播的最大对象数量。默认:100,最小值:1,最大值:1000 | 字符串 - 数字 | 200 |
问题和反馈
如果您有任何问题或反馈,请在 用户论坛 中告诉我们。
