From 7d553124f88e8b6b6fb7dc4a014e281519a0cd6f Mon Sep 17 00:00:00 2001 From: Aolin Date: Thu, 28 Nov 2024 17:07:07 +0800 Subject: [PATCH] tiflash: reformat TiFlash config file Signed-off-by: Aolin --- tiflash/tiflash-configuration.md | 826 ++++++++++++++++++++----------- 1 file changed, 540 insertions(+), 286 deletions(-) diff --git a/tiflash/tiflash-configuration.md b/tiflash/tiflash-configuration.md index 95265d02d891..135bcdaed0ba 100644 --- a/tiflash/tiflash-configuration.md +++ b/tiflash/tiflash-configuration.md @@ -36,246 +36,463 @@ summary: TiFlash 配置参数包括 PD 调度参数和 TiFlash 配置参数。PD ### 配置文件 tiflash.toml -```toml -## TiFlash TCP/HTTP 等辅助服务的监听 host。建议配置成 0.0.0.0,即监听本机所有 IP 地址。 -listen_host = "0.0.0.0" -## TiFlash TCP 服务的端口。TCP 服务为内部测试接口,默认使用 9000 端口。在 TiFlash v7.1.0 之前的版本中,该端口默认开启,但存在安全风险。为了提高安全性,建议对该端口进行访问控制,只允许白名单 IP 访问。从 TiFlash v7.1.0 起,可以通过注释掉该端口的配置避免安全风险。当 TiFlash 配置文件未声明该端口时,该端口也不会开启。 -## 建议在任何 TiFlash 的部署中都不配置该端口。(注: 从 TiFlash v7.1.0 起,由 TiUP >= v1.12.5 或 TiDB Operator >= v1.5.0 部署的 TiFlash 默认为安全版本,即默认未开启该端口) -# tcp_port = 9000 -## 数据块元信息的内存 cache 大小限制,通常不需要修改 -mark_cache_size = 1073741824 -## 数据块 min-max 索引的内存 cache 大小限制,通常不需要修改 -minmax_index_cache_size = 1073741824 -## DeltaIndex 内存 cache 大小限制,默认为 0,代表没有限制 -delta_index_cache_size = 0 - -## TiFlash 数据的存储路径。如果有多个目录,以英文逗号分隔。 -## 从 v4.0.9 版本开始,不推荐使用 path 及 path_realtime_mode 参数。推荐使用 [storage] 下的配置项代替,这样在多盘部署的场景下能更好地利用节点性能。 -## 从 v5.2.0 版本开始,如果要使用配置项 storage.io_rate_limit,需要同时将 TiFlash 的数据存储路径设置为 storage.main.dir。 -## 当 [storage] 配置项存在的情况下,path 和 path_realtime_mode 两个配置会被忽略。 -# path = "/tidb-data/tiflash-9000" -## 或 -# path = "/ssd0/tidb-data/tiflash,/ssd1/tidb-data/tiflash,/ssd2/tidb-data/tiflash" -## 默认为 false。如果设为 true,且 path 配置了多个目录,表示在第一个目录存放最新数据,在其他目录存放较旧的数据。 -# path_realtime_mode = false - -## TiFlash 临时文件的存放路径。默认使用 [`path` 或者 `storage.latest.dir` 的第一个目录] + "/tmp" -# tmp_path = "/tidb-data/tiflash-9000/tmp" - -## 存储路径相关配置,从 v4.0.9 开始生效 -[storage] - - ## DTFile 储存文件格式 - ## * format_version = 2 v6.0.0 以前版本的默认文件格式 - ## * format_version = 3 v6.0.0 及 v6.1.x 版本的默认文件格式,具有更完善的检验功能 - ## * format_version = 4 v6.2.0 ~ v7.3.0 的默认文件格式,优化了写放大问题,同时减少了后台线程消耗。 - ## * format_version = 5 v7.4.0 ~ v8.3.0 的默认文件格式(从 v7.3.0 开始引入),该格式可以合并小文件从而减少了物理文件数量。 - ## * format_version = 6 从 v8.4.0 开始引入,部分支持了向量索引的构建与存储。 - ## * format_version = 7 v8.4.0 及以后版本的默认文件格式 (从 v8.4.0 开始引入),该格式用于支持向量索引的构建与存储。 - # format_version = 7 - - [storage.main] - ## 用于存储主要的数据,该目录列表中的数据占总数据的 90% 以上。 - dir = [ "/tidb-data/tiflash-9000" ] - ## 或 - # dir = [ "/ssd0/tidb-data/tiflash", "/ssd1/tidb-data/tiflash" ] - - ## storage.main.dir 存储目录列表中每个目录的最大可用容量。 - ## * 在未定义配置项,或者列表中全填 0 时,会使用目录所在的硬盘容量 - ## * 以 byte 为单位。目前不支持如 "10GB" 的设置 - ## * capacity 列表的长度应当与 dir 列表长度保持一致 - ## 例如: - # capacity = [ 10737418240, 10737418240 ] - - [storage.latest] - ## 用于存储最新的数据,大约占总数据量的 10% 以内,需要较高的 IOPS。 - ## 默认情况该项可留空。在未配置或者为空列表的情况下,会使用 storage.main.dir 的值。 - # dir = [ ] - ## storage.latest.dir 存储目录列表中,每个目录的最大可用容量。 - # capacity = [ 10737418240, 10737418240 ] - - ## [storage.io_rate_limit] 相关配置从 v5.2.0 开始引入。 - [storage.io_rate_limit] - ## 该配置项是 I/O 限流功能的开关,默认关闭。TiFlash 的 I/O 限流功能适用于磁盘带宽较小且磁盘带宽大小明确的云盘场景。 - ## I/O 限流功能限制下的读写流量总带宽,单位为 Byte,默认值为 0,即默认关闭 I/O 限流功能。 - # max_bytes_per_sec = 0 - ## max_read_bytes_per_sec 和 max_write_bytes_per_sec 的含义和 max_bytes_per_sec 类似,分别指 I/O 限流功能限制下的读流量总带宽和写流量总带宽。 - ## 分别用两个配置项控制读写带宽限制,适用于一些读写带宽限制分开计算的云盘,例如 Google Cloud 上的 persistent disk。 - ## 当 max_bytes_per_sec 配置不为 0 时,优先使用 max_bytes_per_sec。 - # max_read_bytes_per_sec = 0 - # max_write_bytes_per_sec = 0 - - ## 下面的参数用于控制不同 I/O 流量类型分配到的带宽权重,一般不需要调整。 - ## TiFlash 内部将 I/O 请求分成 4 种类型:前台写、后台写、前台读、后台读。 - ## I/O 限流初始化时,TiFlash 会根据下面的权重 (weight) 比例分配带宽。 - ## 以下默认配置表示每一种流量将获得 25 / (25 + 25 + 25 + 25) = 25% 的权重。 - ## 如果将 weight 配置为 0,则对应的 I/O 操作不会被限流。 - # foreground_write_weight = 25 - # background_write_weight = 25 - # foreground_read_weight = 25 - # background_read_weight = 25 - ## TiFlash 支持根据当前的 I/O 负载情况自动调整各种 I/O 类型的限流带宽,有可能会超过设置的权重。 - ## auto_tune_sec 表示自动调整的执行间隔,单位为秒。设为 0 表示关闭自动调整。 - # auto_tune_sec = 5 - - ## 下面的配置只针对存算分离模式生效,详细请参考 TiFlash 存算分离架构与 S3 支持文档 https://docs.pingcap.com/zh/tidb/dev/tiflash-disaggregated-and-s3 - # [storage.s3] - # endpoint: http://s3.{region}.amazonaws.com # S3 的 endpoint 地址 - # bucket: mybucket # TiFlash 的所有数据存储在这个 bucket 中 - # root: /cluster1_data # S3 bucket 中存储数据的根目录 - # access_key_id: {ACCESS_KEY_ID} # 访问 S3 的 ACCESS_KEY_ID - # secret_access_key: {SECRET_ACCESS_KEY} # 访问 S3 的 SECRET_ACCESS_KEY - - # [storage.remote.cache] - # dir: /data1/tiflash/cache # TiFlash Compute Node 的本地数据缓存目录 - # capacity: 858993459200 # 800 GiB - -[flash] - ## TiFlash coprocessor 服务监听地址 - service_addr = "0.0.0.0:3930" - - ## 从 v7.4.0 引入,在当前 Raft 状态机推进的 applied_index 和上次落盘时的 applied_index 的差值高于 compact_log_min_gap 时, - ## TiFlash 将执行来自 TiKV 的 CompactLog 命令,并进行数据落盘。调大该差值可能降低 TiFlash 的落盘频率,从而减少随机写场景下的读延迟,但会增大内存开销。调小该差值可能提升 TiFlash 的落盘频率,从而缓解 TiFlash 内存压力。但无论如何,在目前阶段,TiFlash 的落盘频率不会高于 TiKV,即使设置该差值为 0。 - ## 建议保持默认值。 - # compact_log_min_gap = 200 - ## 从 v5.0 引入,当 TiFlash 缓存的 Region 行数或者大小超过以下任一阈值时,TiFlash 将执行来自 TiKV 的 CompactLog 命令,并进行落盘。 - ## 建议保持默认值。 - # compact_log_min_rows = 40960 # 40k - # compact_log_min_bytes = 33554432 # 32MB - - ## 下面的配置只针对存算分离模式生效,详情请参考 TiFlash 存算分离架构与 S3 支持文档 https://docs.pingcap.com/zh/tidb/dev/tiflash-disaggregated-and-s3 - # disaggregated_mode = tiflash_write # 可选值为 tiflash_write 或者 tiflash_compute - -[flash.proxy] - ## proxy 监听地址,不填则默认是 127.0.0.1:20170 - addr = "127.0.0.1:20170" - ## 外部访问 addr 的地址,不填则默认使用 "addr" 的值 - ## 当集群部署在多个节点时,需要保证 `advertise-addr` 的地址可以从其他节点连接 - advertise-addr = "" - ## 拉取 proxy metrics 或 status 信息的监听地址,不填则默认是 127.0.0.1:20292 - status-addr = "127.0.0.1:20292" - ## 外部访问 status-addr 的地址,不填则默认使用 "status-addr" 的值 - ## 当集群部署在多个节点时,需要保证 `advertise-addr` 的地址可以从其他节点连接 - advertise-status-addr = "" - ## 外部访问 TiFlash coprocessor 服务的地址 - engine-addr = "10.0.1.20:3930" - ## proxy 数据存储路径 - data-dir = "/tidb-data/tiflash-9000/flash" - ## proxy 配置文件路径 - config = "/tidb-deploy/tiflash-9000/conf/tiflash-learner.toml" - ## proxy log 路径 - log-file = "/tidb-deploy/tiflash-9000/log/tiflash_tikv.log" - -[logger] - ## 注意,以下参数只对 tiflash.log、tiflash_error.log 生效。TiFlash Proxy 的日志参数配置需要在 tiflash-learner.toml 中指定。 - - ## log 级别(支持 "trace"、"debug"、"info"、"warn"、"error"),默认是 "info" - level = "info" - ## TiFlash 日志 - log = "/tidb-deploy/tiflash-9000/log/tiflash.log" - ## TiFlash 错误日志。对于 "warn"、"error" 级别的日志,会额外输出到该日志文件中。 - errorlog = "/tidb-deploy/tiflash-9000/log/tiflash_error.log" - ## 单个日志文件的大小,默认是 "100M" - size = "100M" - ## 最多保留日志文件个数,默认是 10。对于 TiFlash 日志和 TiFlash 错误日志各自最多保留 `count` 个日志文件。 - count = 10 - -[raft] - ## PD 服务地址. 多个地址以逗号隔开 - pd_addr = "10.0.1.11:2379,10.0.1.12:2379,10.0.1.13:2379" - -[status] - ## Prometheus 拉取 metrics 信息的端口,默认是 8234 - metrics_port = 8234 - -[profiles] - -[profiles.default] - ## 存储引擎的 segment 分裂是否使用逻辑分裂。使用逻辑分裂可以减小写放大,但是会造成一定程度的硬盘空间回收不及时。默认为 false。 - ## 在 v6.2.0 以及后续版本,强烈建议保留默认值 `false`,不要将其修改为 `true`。具体请参考已知问题 [#5576](https://github.com/pingcap/tiflash/issues/5576)。 - # dt_enable_logical_split = false - - ## `max_threads` 指的是执行一个 MMP Task 的内部线程并发度,默认值为 0。当值为 0 时,TiFlash 执行 MMP Task 的线程并发度为 CPU 核数。 - ## 该参数只有在系统变量 `tidb_max_tiflash_threads` 设置为 -1 时才会生效。 - max_threads = 0 - - ## 单次查询过程中,节点对中间数据的内存限制 - ## 设置为整数时,单位为 byte,比如 34359738368 表示 32 GiB 的内存限制,0 表示无限制 - ## 设置为 [0.0, 1.0) 之间的浮点数时,指节点总内存的比值,比如 0.8 表示总内存的 80%,0.0 表示无限制 - ## 默认值为 0,表示不限制 - ## 当查询试图申请超过限制的内存时,查询终止执行并且报错 - max_memory_usage = 0 - - ## 所有查询过程中,节点对中间数据的内存限制 - ## 设置为整数时,单位为 byte,比如 34359738368 表示 32 GiB 的内存限制,0 表示无限制 - ## 设置为 [0.0, 1.0) 之间的浮点数时,指节点总内存的比值,比如 0.8 表示总内存的 80%,0.0 表示无限制 - ## 默认值为 0.8,表示总内存的 80% - ## 当查询试图申请超过限制的内存时,查询终止执行并且报错 - max_memory_usage_for_all_queries = 0.8 - - ## 从 v5.0 引入,表示 TiFlash Coprocessor 最多同时执行的 cop 请求数量。如果请求数量超过了该配置指定的值,多出的请求会排队等待。如果设为 0 或不设置,则使用默认值,即物理核数的两倍。 - cop_pool_size = 0 - - ## 从 v5.0 引入,表示 TiFlash Coprocessor 最多同时执行的 batch 请求数量。如果请求数量超过了该配置指定的值,多出的请求会排队等待。如果设为 0 或不设置,则使用默认值,即物理核数的两倍。 - batch_cop_pool_size = 0 - - ## 从 v6.1 引入,指定 TiFlash 执行来自 TiDB 的 ALTER TABLE ... COMPACT 请求时,能同时并行处理的请求数量。 - ## 如果这个值没有设置或设为了 0,则会采用默认值(1)。 - manual_compact_pool_size = 1 - - ## 从 v5.4.0 引入,表示是否启用弹性线程池,这项功能可以显著提高 TiFlash 在高并发场景的 CPU 利用率。默认为 true。 - # enable_elastic_threadpool = true - - ## TiFlash 存储引擎的压缩算法,支持 LZ4、zstd 和 LZ4HC,大小写不敏感。默认使用 LZ4 算法。 - dt_compression_method = "LZ4" - - ## TiFlash 存储引擎的压缩级别,默认为 1。 - ## 如果 dt_compression_method 设置为 LZ4,推荐将该值设为 1; - ## 如果 dt_compression_method 设置为 zstd,推荐将该值设为 -1 或 1,设置为 -1 的压缩率更小,但是读性能会更好; - ## 如果 dt_compression_method 设置为 LZ4HC,推荐将该值设为 9。 - dt_compression_level = 1 - - ## 从 v6.2.0 引入,表示 PageStorage 单个数据文件中有效数据的最低比例。当某个数据文件的有效数据比例低于该值时,会触发 GC 对该文件的数据进行整理。默认为 0.5。 - dt_page_gc_threshold = 0.5 - - ## 从 v7.0.0 引入,表示带 group by key 的 HashAggregation 算子在触发 spill 之前的最大可用内存,超过该阈值之后 HashAggregation 会采用 spill to disk 的方式来减小内存使用。默认值为 0,表示内存使用无限制,即不会触发 spill。 - max_bytes_before_external_group_by = 0 - - ## 从 v7.0.0 引入,表示 sort/topN 算子在触发 spill 之前的最大可用内存,超过该阈值之后 sort/TopN 会采用 spill to disk 的方式来减小内存使用。默认值为 0,表示内存使用无限制,即不会触发 spill。 - max_bytes_before_external_sort = 0 - - ## 从 v7.0.0 引入,表示带等值 join 条件的 HashJoin 算子在触发 spill 之前的最大可用内存,超过该阈值之后 HashJoin 算子会采用 spill to disk 的方式来减小内存使用。默认值为 0,表示内存使用无限制,即不会触发 spill。 - max_bytes_before_external_join = 0 - - ## 从 v7.4.0 引入,表示是否开启 TiFlash 资源管控功能。当设置为 true 时,TiFlash 会使用 Pipeline Model 执行模型。 - enable_resource_control = true - - ## 从 v6.0.0 引入,用于 MinTSO 调度器,表示一个资源组中最多可使用的线程数量,默认值为 5000。关于 MinTSO 调度器,详见 https://docs.pingcap.com/zh/tidb/dev/tiflash-mintso-scheduler - task_scheduler_thread_soft_limit = 5000 - - ## 从 v6.0.0 引入,用于 MinTSO 调度器,表示全局最多可使用的线程数量,默认值为 10000。关于 MinTSO 调度器,详见 https://docs.pingcap.com/zh/tidb/dev/tiflash-mintso-scheduler - task_scheduler_thread_hard_limit = 10000 - - ## 从 v6.4.0 引入,用于 MinTSO 调度器,表示一个 TiFlash 实例中最多可同时运行的查询数量,默认值为 0,即两倍的 vCPU 数量。关于 MinTSO 调度器,详见 https://docs.pingcap.com/zh/tidb/dev/tiflash-mintso-scheduler - task_scheduler_active_set_soft_limit = 0 - -## 安全相关配置,从 v4.0.5 开始生效 -[security] - ## 从 v5.0 引入,控制是否开启日志脱敏。可选值为 `true`、`false`、`"on"`、`"off"` 和 `"marker"`。其中,`"on"`、`"off"` 和 `"marker"` 从 v8.2.0 开始支持。 - ## 若设置为 `false` 或 `"off"`,即对用户日志不做处理。 - ## 若设置为 `true` 或 `"on"`,日志中的用户数据会以 `?` 代替显示。 - ## 若设置为 `"marker"`,日志中的用户数据会被标记符号 `‹ ›` 包裹。用户数据中的 `‹` 会转义成 `‹‹`,`›` 会转义成 `››`。基于标记后的日志,你可以在展示日志时决定是否对被标记信息进行脱敏处理。 - ## 默认值为 `false`。 - ## 注意,tiflash-learner 对应的安全配置选项为 `security.redact-info-log`,需要在 tiflash-learner.toml 中另外设置。 - # redact_info_log = false - - ## 包含可信 SSL CA 列表的文件路径。如果你设置了该值,`cert_path` 和 `key_path` 中的路径也需要填写 - # ca_path = "/path/to/ca.pem" - ## 包含 PEM 格式的 X509 certificate 文件路径 - # cert_path = "/path/to/tiflash-server.pem" - ## 包含 PEM 格式的 X509 key 文件路径 - # key_path = "/path/to/tiflash-server-key.pem" -``` +#### `listen_host` + +- TiFlash TCP/HTTP 等辅助服务的监听 host。建议配置成 0.0.0.0,即监听本机所有 IP 地址。 +- 示例值:`"0.0.0.0"` + +#### `tcp_port` + +- TiFlash TCP 服务的端口。TCP 服务为内部测试接口,默认使用 9000 端口。在 TiFlash v7.1.0 之前的版本中,该端口默认开启,但存在安全风险。为了提高安全性,建议对该端口进行访问控制,只允许白名单 IP 访问。从 TiFlash v7.1.0 起,可以通过注释掉该端口的配置避免安全风险。当 TiFlash 配置文件未声明该端口时,该端口也不会开启。 +- 建议在任何 TiFlash 的部署中都不配置该端口。(注: 从 TiFlash v7.1.0 起,由 TiUP >= v1.12.5 或 TiDB Operator >= v1.5.0 部署的 TiFlash 默认为安全版本,即默认未开启该端口) +- 示例值:`9000` + +#### `mark_cache_size` + +- 数据块元信息的内存 cache 大小限制,通常不需要修改 +- 示例值:`1073741824` + +#### `minmax_index_cache_size` + +- 数据块 min-max 索引的内存 cache 大小限制,通常不需要修改 +- 示例值:`1073741824` + +#### `delta_index_cache_size` + +- DeltaIndex 内存 cache 大小限制,默认为 0,代表没有限制 +- 默认值:`0` +- 示例值:`0` + +#### `path` + +- TiFlash 数据的存储路径。如果有多个目录,以英文逗号分隔。 +- 从 v4.0.9 版本开始,不推荐使用 path 及 path_realtime_mode 参数。推荐使用 [storage] 下的配置项代替,这样在多盘部署的场景下能更好地利用节点性能。 +- 从 v5.2.0 版本开始,如果要使用配置项 storage.io_rate_limit,需要同时将 TiFlash 的数据存储路径设置为 storage.main.dir。 +- 当 [storage] 配置项存在的情况下,path 和 path_realtime_mode 两个配置会被忽略。 +- 示例值:`"/ssd0/tidb-data/tiflash,/ssd1/tidb-data/tiflash,/ssd2/tidb-data/tiflash"` + +#### `path_realtime_mode` + +- 默认为 false。如果设为 true,且 path 配置了多个目录,表示在第一个目录存放最新数据,在其他目录存放较旧的数据。 +- 默认值:`false` +- 示例值:`false` + +#### `tmp_path` + +- TiFlash 临时文件的存放路径。默认使用 [`path` 或者 `storage.latest.dir` 的第一个目录] + "/tmp" +- 示例值:`"/tidb-data/tiflash-9000/tmp"` + +#### storage + +存储路径相关配置,从 v4.0.9 开始生效 + +##### `format_version` + +- DTFile 储存文件格式 +- format_version = 2 v6.0.0 以前版本的默认文件格式 +- format_version = 3 v6.0.0 及 v6.1.x 版本的默认文件格式,具有更完善的检验功能 +- format_version = 4 v6.2.0 ~ v7.3.0 的默认文件格式,优化了写放大问题,同时减少了后台线程消耗。 +- format_version = 5 v7.4.0 ~ v8.3.0 的默认文件格式(从 v7.3.0 开始引入),该格式可以合并小文件从而减少了物理文件数量。 +- format_version = 6 从 v8.4.0 开始引入,部分支持了向量索引的构建与存储。 +- format_version = 7 v8.4.0 及以后版本的默认文件格式 (从 v8.4.0 开始引入),该格式用于支持向量索引的构建与存储。 +- 示例值:`7` + +##### storage.main + +###### `dir` + +- 用于存储主要的数据,该目录列表中的数据占总数据的 90% 以上。 +- 示例值:`[ "/tidb-data/tiflash-9000" ]` + +###### `capacity` + +- storage.main.dir 存储目录列表中每个目录的最大可用容量。 +- 在未定义配置项,或者列表中全填 0 时,会使用目录所在的硬盘容量 +- 以 byte 为单位。目前不支持如 "10GB" 的设置 +- capacity 列表的长度应当与 dir 列表长度保持一致 +- 示例值:`[ 10737418240, 10737418240 ]` + +##### storage.latest + +###### `dir` + +- 用于存储最新的数据,大约占总数据量的 10% 以内,需要较高的 IOPS。 +- 默认情况该项可留空。在未配置或者为空列表的情况下,会使用 storage.main.dir 的值。 +- 示例值:`[ ]` + +###### `capacity` + +- storage.latest.dir 存储目录列表中,每个目录的最大可用容量。 +- 示例值:`[ 10737418240, 10737418240 ]` + +##### storage.io_rate_limit + +###### `max_bytes_per_sec` + +- 该配置项是 I/O 限流功能的开关,默认关闭。TiFlash 的 I/O 限流功能适用于磁盘带宽较小且磁盘带宽大小明确的云盘场景。 +- I/O 限流功能限制下的读写流量总带宽,单位为 Byte,默认值为 0,即默认关闭 I/O 限流功能。 +- 默认值:`0` +- 示例值:`0` + +###### `max_read_bytes_per_sec` + +- max_read_bytes_per_sec 和 max_write_bytes_per_sec 的含义和 max_bytes_per_sec 类似,分别指 I/O 限流功能限制下的读流量总带宽和写流量总带宽。 +- 分别用两个配置项控制读写带宽限制,适用于一些读写带宽限制分开计算的云盘,例如 Google Cloud 上的 persistent disk。 +- 当 max_bytes_per_sec 配置不为 0 时,优先使用 max_bytes_per_sec。 +- 默认值:`0` +- 示例值:`0` + +###### `max_write_bytes_per_sec` + +- 指 I/O 限流功能限制下的写流量总带宽 +- 默认值:`0` +- 示例值:`0` + +###### `foreground_write_weight` + +- TiFlash 内部将 I/O 请求分成 4 种类型:前台写、后台写、前台读、后台读。 +- I/O 限流初始化时,TiFlash 会根据下面的权重 (weight) 比例分配带宽。 +- 默认配置表示每一种流量将获得 25 / (25 + 25 + 25 + 25) = 25% 的权重。 +- 如果将 weight 配置为 0,则对应的 I/O 操作不会被限流。 +- 示例值:`25` + +###### `background_write_weight` + +- 后台写操作的带宽权重 +- 示例值:`25` + +###### `foreground_read_weight` + +- 前台读操作的带宽权重 +- 示例值:`25` + +###### `background_read_weight` + +- 后台读操作的带宽权重 +- 示例值:`25` + +###### `auto_tune_sec` + +- TiFlash 支持根据当前的 I/O 负载情况自动调整各种 I/O 类型的限流带宽,有可能会超过设置的权重。 +- auto_tune_sec 表示自动调整的执行间隔,单位为秒。设为 0 表示关闭自动调整。 +- 示例值:`5` + +##### storage.s3 + +###### `endpoint` + +- S3 的 endpoint 地址 +- 示例值:`"http://s3.{region}.amazonaws.com"` + +###### `bucket` + +- TiFlash 的所有数据存储在这个 bucket 中 +- 示例值:`"mybucket"` + +###### `root` + +- S3 bucket 中存储数据的根目录 +- 示例值:`"/cluster1_data"` + +###### `access_key_id` + +- 访问 S3 的 ACCESS_KEY_ID +- 示例值:`"{ACCESS_KEY_ID}"` + +###### `secret_access_key` + +- 访问 S3 的 SECRET_ACCESS_KEY +- 示例值:`"{SECRET_ACCESS_KEY}"` + +##### storage.remote.cache + +###### `dir` + +- TiFlash Compute Node 的本地数据缓存目录 +- 示例值:`"/data1/tiflash/cache"` + +###### `capacity` + +- 缓存容量大小 +- 示例值:`858993459200` + +#### flash + +##### `service_addr` + +- TiFlash coprocessor 服务监听地址 +- 示例值:`"0.0.0.0:3930"` + +##### `compact_log_min_gap` + +- 从 v7.4.0 引入,在当前 Raft 状态机推进的 applied_index 和上次落盘时的 applied_index 的差值高于 compact_log_min_gap 时,TiFlash 将执行来自 TiKV 的 CompactLog 命令,并进行数据落盘。调大该差值可能降低 TiFlash 的落盘频率,从而减少随机写场景下的读延迟,但会增大内存开销。调小该差值可能提升 TiFlash 的落盘频率,从而缓解 TiFlash 内存压力。但无论如何,在目前阶段,TiFlash 的落盘频率不会高于 TiKV,即使设置该差值为 0。 +- 建议保持默认值。 +- 示例值:`200` + +##### `compact_log_min_rows` + +- 从 v5.0 引入,当 TiFlash 缓存的 Region 行数或者大小超过以下任一阈值时,TiFlash 将执行来自 TiKV 的 CompactLog 命令,并进行落盘。 +- 建议保持默认值。 +- 示例值:`40960` + +##### `compact_log_min_bytes` + +- 当 TiFlash 缓存的 Region 大小超过此阈值时触发落盘 +- 示例值:`33554432` + +##### `disaggregated_mode` + +- 下面的配置只针对存算分离模式生效,详情请参考 TiFlash 存算分离架构与 S3 支持文档 +- 可选值:`tiflash_write` 或者 `tiflash_compute` +- 示例值:`"tiflash_write"` + +#### flash.proxy + +##### `addr` + +- proxy 监听地址,不填则默认是 127.0.0.1:20170 +- 示例值:`"127.0.0.1:20170"` + +##### `advertise-addr` + +- 外部访问 addr 的地址,不填则默认使用 "addr" 的值 +- 当集群部署在多个节点时,需要保证 `advertise-addr` 的地址可以从其他节点连接 +- 示例值:`""` + +##### `status-addr` + +- 拉取 proxy metrics 或 status 信息的监听地址,不填则默认是 127.0.0.1:20292 +- 示例值:`"127.0.0.1:20292"` + +##### `advertise-status-addr` + +- 外部访问 status-addr 的地址,不填则默认使用 "status-addr" 的值 +- 当集群部署在多个节点时,需要保证 `advertise-addr` 的地址可以从其他节点连接 +- 示例值:`""` + +##### `engine-addr` + +- 外部访问 TiFlash coprocessor 服务的地址 +- 示例值:`"10.0.1.20:3930"` + +##### `data-dir` + +- proxy 数据存储路径 +- 示例值:`"/tidb-data/tiflash-9000/flash"` + +##### `config` + +- proxy 配置文件路径 +- 示例值:`"/tidb-deploy/tiflash-9000/conf/tiflash-learner.toml"` + +##### `log-file` + +- proxy log 路径 +- 示例值:`"/tidb-deploy/tiflash-9000/log/tiflash_tikv.log"` + +#### logger + +注意,以下参数只对 tiflash.log、tiflash_error.log 生效。TiFlash Proxy 的日志参数配置需要在 tiflash-learner.toml 中指定。 + +##### `level` + +- log 级别(支持 "trace"、"debug"、"info"、"warn"、"error"),默认是 "info" +- 注意,以下参数只对 tiflash.log、tiflash_error.log 生效。TiFlash Proxy 的日志参数配置需要在 tiflash-learner.toml 中指定。 +- 示例值:`"info"` + +##### `log` + +- TiFlash 日志 +- 示例值:`"/tidb-deploy/tiflash-9000/log/tiflash.log"` + +##### `errorlog` + +- TiFlash 错误日志。对于 "warn"、"error" 级别的日志,会额外输出到该日志文件中。 +- 示例值:`"/tidb-deploy/tiflash-9000/log/tiflash_error.log"` + +##### `size` + +- 单个日志文件的大小,默认是 "100M" +- 默认值:`"100M"` +- 示例值:`"100M"` + +##### `count` + +- 最多保留日志文件个数,默认是 10。对于 TiFlash 日志和 TiFlash 错误日志各自最多保留 `count` 个日志文件。 +- 默认值:`10` +- 示例值:`10` + +#### raft + +##### `pd_addr` + +- PD 服务地址. 多个地址以逗号隔开 +- 示例值:`"10.0.1.11:2379,10.0.1.12:2379,10.0.1.13:2379"` + +#### status + +##### `metrics_port` + +- Prometheus 拉取 metrics 信息的端口,默认是 8234 +- 默认值:`8234` +- 示例值:`8234` + +#### profiles + +#### profiles.default + +##### `dt_enable_logical_split` + +- 存储引擎的 segment 分裂是否使用逻辑分裂。使用逻辑分裂可以减小写放大,但是会造成一定程度的硬盘空间回收不及时。默认为 false。 +- 在 v6.2.0 以及后续版本,强烈建议保留默认值 `false`,不要将其修改为 `true`。具体请参考已知问题 [#5576](https://github.com/pingcap/tiflash/issues/5576)。 +- 默认值:`false` +- 示例值:`false` + +##### `max_threads` + +- `max_threads` 指的是执行一个 MMP Task 的内部线程并发度,默认值为 0。当值为 0 时,TiFlash 执行 MMP Task 的线程并发度为 CPU 核数。 +- 该参数只有在系统变量 `tidb_max_tiflash_threads` 设置为 -1 时才会生效。 +- 默认值:`0` +- 示例值:`0` + +##### `max_memory_usage` + +- 单次查询过程中,节点对中间数据的内存限制 +- 设置为整数时,单位为 byte,比如 34359738368 表示 32 GiB 的内存限制,0 表示无限制 +- 设置为 [0.0, 1.0) 之间的浮点数时,指节点总内存的比值,比如 0.8 表示总内存的 80%,0.0 表示无限制 +- 默认值为 0,表示不限制 +- 当查询试图申请超过限制的内存时,查询终止执行并且报错 +- 默认值:`0` +- 示例值:`0` + +##### `max_memory_usage_for_all_queries` + +- 所有查询过程中,节点对中间数据的内存限制 +- 设置为整数时,单位为 byte,比如 34359738368 表示 32 GiB 的内存限制,0 表示无限制 +- 设置为 [0.0, 1.0) 之间的浮点数时,指节点总内存的比值,比如 0.8 表示总内存的 80%,0.0 表示无限制 +- 默认值为 0.8,表示总内存的 80% +- 当查询试图申请超过限制的内存时,查询终止执行并且报错 +- 默认值:`0.8` +- 示例值:`0.8` + +##### `cop_pool_size` + +- 从 v5.0 引入,表示 TiFlash Coprocessor 最多同时执行的 cop 请求数量。如果请求数量超过了该配置指定的值,多出的请求会排队等待。如果设为 0 或不设置,则使用默认值,即物理核数的两倍。 +- 默认值:`0` +- 示例值:`0` + +##### `batch_cop_pool_size` + +- 从 v5.0 引入,表示 TiFlash Coprocessor 最多同时执行的 batch 请求数量。如果请求数量超过了该配置指定的值,多出的请求会排队等待。如果设为 0 或不设置,则使用默认值,即物理核数的两倍。 +- 默认值:`0` +- 示例值:`0` + +##### `manual_compact_pool_size` + +- 从 v6.1 引入,指定 TiFlash 执行来自 TiDB 的 ALTER TABLE ... COMPACT 请求时,能同时并行处理的请求数量。 +- 如果这个值没有设置或设为了 0,则会采用默认值(1)。 +- 默认值:`1` +- 示例值:`1` + +##### `enable_elastic_threadpool` + +- 从 v5.4.0 引入,表示是否启用弹性线程池,这项功能可以显著提高 TiFlash 在高并发场景的 CPU 利用率。默认为 true。 +- 默认值:`true` +- 示例值:`true` + +##### `dt_compression_method` + +- TiFlash 存储引擎的压缩算法,支持 LZ4、zstd 和 LZ4HC,大小写不敏感。默认使用 LZ4 算法。 +- 默认值:`"LZ4"` +- 示例值:`"LZ4"` + +##### `dt_compression_level` + +- TiFlash 存储引擎的压缩级别,默认为 1。 +- 如果 dt_compression_method 设置为 LZ4,推荐将该值设为 1 +- 如果 dt_compression_method 设置为 zstd,推荐将该值设为 -1 或 1,设置为 -1 的压缩率更小,但是读性能会更好 +- 如果 dt_compression_method 设置为 LZ4HC,推荐将该值设为 9 +- 默认值:`1` +- 示例值:`1` + +##### `dt_page_gc_threshold` + +- 从 v6.2.0 引入,表示 PageStorage 单个数据文件中有效数据的最低比例。当某个数据文件的有效数据比例低于该值时,会触发 GC 对该文件的数据进行整理。默认为 0.5。 +- 默认值:`0.5` +- 示例值:`0.5` + +##### `max_bytes_before_external_group_by` + +- 从 v7.0.0 引入,表示带 group by key 的 HashAggregation 算子在触发 spill 之前的最大可用内存,超过该阈值之后 HashAggregation 会采用 spill to disk 的方式来减小内存使用。默认值为 0,表示内存使用无限制,即不会触发 spill。 +- 默认值:`0` +- 示例值:`0` + +##### `max_bytes_before_external_sort` + +- 从 v7.0.0 引入,表示 sort/topN 算子在触发 spill 之前的最大可用内存,超过该阈值之后 sort/TopN 会采用 spill to disk 的方式来减小内存使用。默认值为 0,表示内存使用无限制,即不会触发 spill。 +- 默认值:`0` +- 示例值:`0` + +##### `max_bytes_before_external_join` + +- 从 v7.0.0 引入,表示带等值 join 条件的 HashJoin 算子在触发 spill 之前的最大可用内存,超过该阈值之后 HashJoin 算子会采用 spill to disk 的方式来减小内存使用。默认值为 0,表示内存使用无限制,即不会触发 spill。 +- 默认值:`0` +- 示例值:`0` + +##### `enable_resource_control` + +- 从 v7.4.0 引入,表示是否开启 TiFlash 资源管控功能。当设置为 true 时,TiFlash 会使用 Pipeline Model 执行模型。 +- 默认值:`true` +- 示例值:`true` + +##### `task_scheduler_thread_soft_limit` + +- 从 v6.0.0 引入,用于 MinTSO 调度器,表示一个资源组中最多可使用的线程数量,默认值为 5000。关于 MinTSO 调度器,详见 https://docs.pingcap.com/zh/tidb/dev/tiflash-mintso-scheduler +- 默认值:`5000` +- 示例值:`5000` + +##### `task_scheduler_thread_hard_limit` + +- 从 v6.0.0 引入,用于 MinTSO 调度器,表示全局最多可使用的线程数量,默认值为 10000。关于 MinTSO 调度器,详见 https://docs.pingcap.com/zh/tidb/dev/tiflash-mintso-scheduler +- 默认值:`10000` +- 示例值:`10000` + +##### `task_scheduler_active_set_soft_limit` + +- 从 v6.4.0 引入,用于 MinTSO 调度器,表示一个 TiFlash 实例中最多可同时运行的查询数量,默认值为 0,即两倍的 vCPU 数量。关于 MinTSO 调度器,详见 https://docs.pingcap.com/zh/tidb/dev/tiflash-mintso-scheduler +- 默认值:`0` +- 示例值:`0` + +#### security + +安全相关配置,从 v4.0.5 开始生效 + +##### `redact_info_log` + +- 从 v5.0 引入,控制是否开启日志脱敏。可选值为 `true`、`false`、`"on"`、`"off"` 和 `"marker"`。其中,`"on"`、`"off"` 和 `"marker"` 从 v8.2.0 开始支持。 +- 若设置为 `false` 或 `"off"`,即对用户日志不做处理。 +- 若设置为 `true` 或 `"on"`,日志中的用户数据会以 `?` 代替显示。 +- 若设置为 `"marker"`,日志中的用户数据会被标记符号 `‹ ›` 包裹。用户数据中的 `‹` 会转义成 `‹‹`,`›` 会转义成 `››`。基于标记后的日志,你可以在展示日志时决定是否对被标记信息进行脱敏处理。 +- 默认值为 `false`。 +- 注意,tiflash-learner 对应的安全配置选项为 `security.redact-info-log`,需要在 tiflash-learner.toml 中另外设置。 +- 可选值:`true`、`false`、`"on"`、`"off"`、`"marker"` +- 默认值:`false` +- 示例值:`false` + +##### `ca_path` + +- 包含可信 SSL CA 列表的文件路径。如果你设置了该值,`cert_path` 和 `key_path` 中的路径也需要填写 +- 示例值:`"/path/to/ca.pem"` + +##### `cert_path` + +- 包含 PEM 格式的 X509 certificate 文件路径 +- 示例值:`"/path/to/tiflash-server.pem"` + +##### `key_path` + +- 包含 PEM 格式的 X509 key 文件路径 +- 示例值:`"/path/to/tiflash-server-key.pem"` ### 配置文件 tiflash-learner.toml @@ -284,52 +501,89 @@ delta_index_cache_size = 0 - 相对于 TiKV,TiFlash Proxy 新增了 `raftstore.snap-handle-pool-size` 参数。 - `key` 为 `engine` 的 `label` 是保留项,不可手动配置。 -```toml -[log] - ## TiFlash Proxy 的 log 级别,可选值为 "trace"、"debug"、"info"、"warn"、"error",默认值为 "info"。从 v5.4.0 版本开始引入。 - level = "info" - -[log.file] - ## 可保留的 log 文件的最大数量。从 v5.4.0 版本开始引入。 - ## 如果未设置该参数或把该参数设置为默认值 `0`,TiFlash Proxy 会保存所有的日志文件; - ## 如果把此参数设置为非 `0` 的值,TiFlash Proxy 最多会保留 `max-backups` 中指定数量的旧日志文件。比如,如果该值设置为 `7`,TiFlash Proxy 最多会保留 7 个旧的日志文件。 - max-backups = 0 - ## 保留 log 文件的最长天数。从 v5.4.0 版本开始引入。 - ## 如果未设置本参数或把此参数设置为默认值 `0`,TiFlash Proxy 会保存所有的日志文件。 - ## 如果把此参数设置为非 `0` 的值,在 `max-days` 之后,TiFlash Proxy 会清理过期的日志文件。 - max-days = 0 - -[raftstore] - ## 处理 Raft 数据落盘的线程池中线程的数量 - apply-pool-size = 4 - ## 处理 Raft 的线程池中线程的数量,即 Raftstore 线程池的大小。 - store-pool-size = 4 - ## 控制处理 snapshot 的线程数,默认为 2。设为 0 则关闭多线程优化 - ## TiFlash Proxy 特有参数,从 v4.0.0 版本开始引入。 - snap-handle-pool-size = 2 - -[security] - ## 从 v5.0 引入,控制是否开启日志脱敏。可选值为 `true`、`false`、`"on"`、`"off"` 和 `"marker"`。其中,`"on"`、`"off"` 和 `"marker"` 从 v8.3.0 开始支持。 - ## 若设置为 `false` 或 `"off"`,即对用户日志不做处理。 - ## 若设置为 `true` 或 "on",日志中的用户数据会以 `?` 代替显示。 - ## 若设置为 `"marker"`,日志中的用户数据会被标记符号 `‹ ›` 包裹。用户数据中的 `‹` 会转义成 `‹‹`,`›` 会转义成 `››`。基于标记后的日志,你可以在展示日志时决定是否对被标记信息进行脱敏处理。 - ## 默认值为 `false`。 - # redact-info-log = false - -[security.encryption] - ## 数据文件的加密方法。 - ## 可选值为 "aes128-ctr"、"aes192-ctr"、"aes256-ctr"、"sm4-ctr" (仅 v6.4.0 及之后版本) 和 "plaintext"。 - ## 默认值为 "plaintext",即默认不开启加密功能。选择 "plaintext" 以外的值则表示启用加密功能。此时必须指定主密钥。 - data-encryption-method = "aes128-ctr" - ## 轮换密钥的频率,默认值:`7d`。 - data-key-rotation-period = "168h" # 7 days - -[security.encryption.master-key] - ## 指定启用加密时的主密钥。若要了解如何配置主密钥,可以参考《静态加密 - 配置加密》:https://docs.pingcap.com/zh/tidb/dev/encryption-at-rest#配置加密 - -[security.encryption.previous-master-key] - ## 指定轮换新主密钥时的旧主密钥。旧主密钥的配置格式与主密钥相同。若要了解如何配置主密钥,可以参考《静态加密 - 配置加密》:https://docs.pingcap.com/zh/tidb/dev/encryption-at-rest#配置加密 -``` +#### log + +##### `level` + +- TiFlash Proxy 的 log 级别,可选值为 "trace"、"debug"、"info"、"warn"、"error",默认值为 "info"。从 v5.4.0 版本开始引入。 +- 可选值:`"trace"`、`"debug"`、`"info"`、`"warn"`、`"error"` +- 默认值:`"info"` +- 示例值:`"info"` + +#### log.file + +##### `max-backups` + +- 可保留的 log 文件的最大数量。从 v5.4.0 版本开始引入。 +- 如果未设置该参数或把该参数设置为默认值 `0`,TiFlash Proxy 会保存所有的日志文件 +- 如果把此参数设置为非 `0` 的值,TiFlash Proxy 最多会保留 `max-backups` 中指定数量的旧日志文件。比如,如果该值设置为 `7`,TiFlash Proxy 最多会保留 7 个旧的日志文件。 +- 默认值:`0` +- 示例值:`0` + +##### `max-days` + +- 保留 log 文件的最长天数。从 v5.4.0 版本开始引入。 +- 如果未设置本参数或把此参数设置为默认值 `0`,TiFlash Proxy 会保存所有的日志文件。 +- 如果把此参数设置为非 `0` 的值,在 `max-days` 之后,TiFlash Proxy 会清理过期的日志文件。 +- 默认值:`0` +- 示例值:`0` + +#### raftstore + +##### `apply-pool-size` + +- 处理 Raft 数据落盘的线程池中线程的数量 +- 示例值:`4` + +##### `store-pool-size` + +- 处理 Raft 的线程池中线程的数量,即 Raftstore 线程池的大小。 +- 示例值:`4` + +##### `snap-handle-pool-size` + +- 控制处理 snapshot 的线程数,默认为 2。设为 0 则关闭多线程优化 +- TiFlash Proxy 特有参数,从 v4.0.0 版本开始引入。 +- 默认值:`2` +- 示例值:`2` + +#### security + +##### `redact-info-log` + +- 从 v5.0 引入,控制是否开启日志脱敏。可选值为 `true`、`false`、`"on"`、`"off"` 和 `"marker"`。其中,`"on"`、`"off"` 和 `"marker"` 从 v8.3.0 开始支持。 +- 若设置为 `false` 或 `"off"`,即对用户日志不做处理。 +- 若设置为 `true` 或 "on",日志中的用户数据会以 `?` 代替显示。 +- 若设置为 `"marker"`,日志中的用户数据会被标记符号 `‹ ›` 包裹。用户数据中的 `‹` 会转义成 `‹‹`,`›` 会转义成 `››`。基于标记后的日志,你可以在展示日志时决定是否对被标记信息进行脱敏处理。 +- 默认值为 `false`。 +- 默认值:`false` +- 示例值:`false` +- 可选值:`true`、`false`、`"on"`、`"off"`、`"marker"` + +#### security.encryption + +##### `data-encryption-method` + +- 数据文件的加密方法。 +- 可选值为 "aes128-ctr"、"aes192-ctr"、"aes256-ctr"、"sm4-ctr" (仅 v6.4.0 及之后版本) 和 "plaintext"。 +- 默认值为 "plaintext",即默认不开启加密功能。选择 "plaintext" 以外的值则表示启用加密功能。此时必须指定主密钥。 +- 默认值:`"plaintext"` +- 示例值:`"aes128-ctr"` +- 可选值:`"aes128-ctr"`、`"aes192-ctr"`、`"aes256-ctr"`、`"sm4-ctr"`、`"plaintext"` + +##### `data-key-rotation-period` + +- 轮换密钥的频率,默认值:`7d`。 +- 默认值:`"168h"` +- 示例值:`"168h"` + +#### security.encryption.master-key + +- 指定启用加密时的主密钥。若要了解如何配置主密钥,可以参考《静态加密 - 配置加密》:https://docs.pingcap.com/zh/tidb/dev/encryption-at-rest#配置加密 + +#### security.encryption.previous-master-key + +- 指定轮换新主密钥时的旧主密钥。旧主密钥的配置格式与主密钥相同。若要了解如何配置主密钥,可以参考《静态加密 - 配置加密》:https://docs.pingcap.com/zh/tidb/dev/encryption-at-rest#配置加密 ### 通过拓扑 label 进行副本调度