title | summary |
---|---|
使用资源管控 (Resource Control) 实现资源隔离 |
介绍如何通过资源管控能力来实现对应用资源消耗的控制和有效调度。 |
使用资源管控特性,集群管理员可以定义资源组 (Resource Group),通过资源组限定配额。
TiDB 资源管控特性提供了两层资源管理能力,包括在 TiDB 层的流控能力和 TiKV 层的优先级调度的能力。两个能力可以单独或者同时开启,详情请参见参数组合效果表。将用户绑定到某个资源组后,TiDB 层会根据用户所绑定资源组设定的配额对用户的读写请求做流控,TiKV 层会根据配额映射的优先级来对请求做调度。通过流控和调度这两层控制,可以实现应用的资源隔离,满足服务质量 (QoS) 要求。
- TiDB 流控:TiDB 流控使用令牌桶算法 做流控。如果桶内令牌数不够,而且资源组没有指定
BURSTABLE
特性,属于该资源组的请求会等待令牌桶回填令牌并重试,重试可能会超时失败。 - TiKV 调度:你可以为资源组设置绝对优先级 (
PRIORITY
),不同的资源按照PRIORITY
的设置进行调度,PRIORITY
高的任务会被优先调度。如果没有设置绝对优先级 (PRIORITY
),TiKV 会将资源组的RU_PER_SEC
取值映射成各自资源组读写请求的优先级,并基于各自的优先级在存储层使用优先级队列调度处理请求。
资源管控特性的引入对 TiDB 具有里程碑的意义。它能够将一个分布式数据库集群划分成多个逻辑单元,即使个别单元对资源过度使用,也不会挤占其他单元所需的资源。利用该特性:
- 你可以将多个来自不同系统的中小型应用合入一个 TiDB 集群中,个别应用的负载升高,不会影响其他业务的正常运行。而在系统负载较低的时候,繁忙的应用即使超过设定的读写配额,也仍然可以被分配到所需的系统资源,达到资源的最大化利用。
- 你可以选择将所有测试环境合入一个集群,或者将消耗较大的批量任务编入一个单独的资源组,在保证重要应用获得必要资源的同时,提升硬件利用率,降低运行成本。
- 当系统中存在多种业务负载时,可以将不同的负载分别放入各自的资源组。利用资源管控技术,确保交易类业务的响应时间不受数据分析或批量业务的影响。
- 当集群遇到突发的 SQL 性能问题,可以结合 SQL Binding 和资源组,临时限制某个 SQL 的资源消耗。
此外,合理利用资源管控特性可以减少集群数量,降低运维难度及管理成本。
目前,资源管控特性具有以下限制:
- 只支持对前台客户发起的读写请求做限流和调度,不支持对 DDL 以及 Auto Analyze 等后台任务的限流和调度。
- 资源管控将带来额外的调度开销。因此,开启该特性后,性能可能会有轻微下降。
Request Unit (RU) 是 TiDB 对 CPU、IO 等系统资源的统一抽象的单位, 目前包括 CPU、IOPS 和 IO 带宽三个指标。这三个指标的消耗会按照一定的比例统一到 RU 单位上。
下表是用户请求对 TiKV 存储层 CPU 和 IO 资源的消耗以及对应的 RU 权重:
资源 | RU 权重 |
---|---|
CPU | 1/3 RU / 毫秒 |
读 IO | 1/64 RU / KB |
写 IO | 1 RU / KB |
一次读请求的基本开销 | 0.25 RU |
一次写请求的基本开销 | 1.5 RU |
基于上表,假设某个资源组消耗的 TiKV 时间是 c
毫秒,r1
次请求读取了 r2
KB 数据,w1
次写请求写入了 w2
KB 数据,集群中非 witness TiKV 节点数是 n
,则该资源组消耗的总 RU 的公式如下:
c
* 1/3 + (r1
* 0.25 + r2
* 1/64) + (w1
* 1.5 + w2
* 1 * n
)
资源管控特性引入了两个新的全局开关变量:
- TiDB:通过配置全局变量
tidb_enable_resource_control
控制是否打开资源组流控。 - TiKV:通过配置参数
resource-control.enabled
控制是否使用基于资源组配额的请求调度。
从 v7.0.0 开始,两个开关都被默认打开。这两个参数的组合效果见下表:
resource-control.enabled |
tidb_enable_resource_control = ON |
tidb_enable_resource_control = OFF |
---|---|---|
resource-control.enabled = true |
流控和调度(推荐组合) | 无效配置 |
resource-control.enabled = false |
仅流控(不推荐) | 特性被关闭 |
关于资源管控实现机制及相关参数的详细介绍,请参考 RFC: Global Resource Control in TiDB。
下面介绍如何使用资源管控特性。
在进行资源规划之前,你需要了解集群的整体容量。TiDB 提供了命令 CALIBRATE RESOURCE
用来估算集群容量。目前提供两种估算方式:
可通过 TiDB Dashboard 资源管控页面进行查看。详情请参考 CALIBRATE RESOURCE
预估方式。
创建、修改、删除资源组,需要拥有 SUPER
或者 RESOURCE_GROUP_ADMIN
权限。
你可以通过 CREATE RESOURCE GROUP
在集群中创建资源组。
对于已有的资源组,可以通过 ALTER RESOURCE GROUP
修改资源组的配额,对资源组的配额修改会立即生效。
可以使用 DROP RESOURCE GROUP
删除资源组。
下面举例说明如何创建资源组。
-
创建
rg1
资源组,限额是每秒 500 RU,并且允许这个资源组的应用超额占用资源。CREATE RESOURCE GROUP IF NOT EXISTS rg1 RU_PER_SEC = 500 BURSTABLE;
-
创建
rg2
资源组,RU 的回填速度是每秒 600 RU。在系统资源充足的时候,不允许这个资源组的应用超额占用资源。CREATE RESOURCE GROUP IF NOT EXISTS rg2 RU_PER_SEC = 600;
-
创建
rg3
资源组,设置绝对优先级为HIGH
。绝对优先级目前支持LOW|MEDIUM|HIGH
,资源组的默认绝对优先级为MEDIUM
。CREATE RESOURCE GROUP IF NOT EXISTS rg3 RU_PER_SEC = 100 PRIORITY = HIGH;
TiDB 支持如下三个级别的资源组设置:
- 用户级别。通过
CREATE USER
或ALTER USER
语句将用户绑定到特定的资源组。绑定后,对应的用户新创建的会话会自动绑定对应的资源组。 - 会话级别。通过
SET RESOURCE GROUP
设置当前会话使用的资源组。 - 语句级别。通过
RESOURCE_GROUP()
Optimizer Hint 设置当前语句使用的资源组。
下面的示例创建一个用户 usr1
并将其绑定到资源组 rg1
。其中 rg1
为创建资源组示例中创建的资源组。
CREATE USER 'usr1'@'%' IDENTIFIED BY '123' RESOURCE GROUP rg1;
下面示例使用 ALTER USER
将用户 usr2
绑定到资源组 rg2
。其中 rg2
为创建资源组示例中创建的资源组。
ALTER USER usr2 RESOURCE GROUP rg2;
绑定用户后,用户新建立的会话对资源的占用会受到指定用量 (RU) 的限制。如果系统负载比较高,没有多余的容量,用户 usr2
的资源消耗速度会被严格控制不超过指定用量。由于 usr1
绑定的 rg1
配置了 BURSTABLE
,所以 usr1
消耗速度允许超过指定用量。
如果资源组对应的请求太多导致资源组的资源不足,客户端的请求处理会发生等待。如果等待时间过长,请求会报错。
注意:
- 使用
CREATE USER
或者ALTER USER
将用户绑定到资源组后,只会对该用户新建的会话生效,不会对该用户已有的会话生效。- TiDB 集群在初始化时会自动创建
default
资源组,其RU_PER_SEC
的默认值为UNLIMITED
(等同于INT
类型最大值,即2147483647
),且为BURSTABLE
模式。对于没有绑定资源组的语句会自动绑定至此资源组。此资源组不支持删除,但允许修改其 RU 的配置。
通过把当前会话绑定到资源组,会话对资源的占用会受到指定用量 (RU) 的限制。
下面的示例将当前的会话绑定至资源组 rg1
。
SET RESOURCE GROUP rg1;
通过在 SQL 语句中添加 RESOURCE_GROUP(resource_group_name)
Hint,可以将该语句绑定到指定的资源组。此 Hint 支持 SELECT
、INSERT
、UPDATE
、DELETE
四种语句。
示例:
SELECT /*+ RESOURCE_GROUP(rg1) */ * FROM t limit 10;
警告:
该功能目前为实验特性,不建议在生产环境中使用。该功能可能会在未事先通知的情况下发生变化或删除。如果发现 bug,请在 GitHub 上提 issue 反馈。
Runaway Queries 指那些执行时间或者消耗的资源超出预期的查询。自 v7.2.0 起,TiDB 资源管控引入了对 Runaway Queries 的管理。你可以针对某个资源组设置条件来识别 Runaway Queries,并自动发起应对操作,防止集群资源完全被 Runaway Queries 占用而影响其他正常查询。
你可以通过在 CREATE RESOURCE GROUP
或者 ALTER RESOURCE GROUP
中配置 QUERY_LIMIT
字段,管理资源组的 Runaway Queries。
支持的条件设置:
EXEC_ELAPSED
: 当查询执行的时间超限时,识别为 Runaway Query。
支持的应对操作 (ACTION
):
DRYRUN
:对执行 Query 不做任何操作,仅记录识别的 Runaway Query。主要用于观测设置条件是否合理。COOLDOWN
:将查询的执行优先级降到最低,查询仍旧会以低优先级继续执行,不占用其他操作的资源。KILL
:识别到的查询将被自动终止,报错Query execution was interrupted, identified as runaway query
。
为了避免并发的 Runaway Queries 太多,在被条件识别前就将系统资源耗尽,资源管控引入了一个快速识别的机制。借助子句 WATCH
,当某一个查询被识别为 Runaway Query 之后,在接下来的一段时间里(通过 DURATION
定义) ,当前 TiDB 实例会将匹配到的查询直接标记为 Runaway Query,而不再等待其被条件识别,并按照当前应对操作执行。其中 KILL
操作报错 Quarantined and interrupted because of being in runaway watch list
。
WATCH
有两种匹配方式:
EXACT
表示完全相同的 SQL 才会被快速识别SIMILAR
表示会忽略字面值 (Literal),通过 Plan Digest 匹配所有模式 (Pattern) 相同的 SQL
QUERY_LIMIT
具体格式如下:
参数 | 含义 | 备注 |
---|---|---|
EXEC_ELAPSED |
当查询执行时间超过该值后被识别为 Runaway Query | EXEC_ELAPSED =60s 表示查询的执行时间超过 60 秒则被认为是 Runaway Query。 |
ACTION |
当识别到 Runaway Query 时进行的动作 | 可选值有 DRYRUN ,COOLDOWN ,KILL 。 |
WATCH |
快速匹配已经识别到的 Runaway Query,即在一定时间内再碰到相同或相似查询直接进行相应动作 | 可选项,配置例如 WATCH=SIMILAR DURATION '60s' 、WATCH=EXACT DURATION '1m' 。 |
-
创建
rg1
资源组,限额是每秒 500 RU,并且定义超过 60 秒为 Runaway Query,并对 Runaway Query 降低优先级执行。CREATE RESOURCE GROUP IF NOT EXISTS rg1 RU_PER_SEC = 500 QUERY_LIMIT=(EXEC_ELAPSED='60s', ACTION=COOLDOWN);
-
修改
rg1
资源组,对 Runaway Query 直接终止,并且在接下来的 10 分钟里,把相同模式的查询直接标记为 Runaway Query。ALTER RESOURCE GROUP rg1 QUERY_LIMIT=(EXEC_ELAPSED='60s', ACTION=KILL, WATCH=SIMILAR DURATION='10m');
-
修改
rg1
资源组,取消 Runaway Queries 检查。ALTER RESOURCE GROUP rg1 QUERY_LIMIT=NULL;
可以通过以下系统表获得 Runaway 相关的更多信息:
-
mysql.tidb_runaway_queries
表中包含了过去 7 天内所有识别到的 Runaway Queries 的历史记录。以其中一行为例:MySQL [(none)]> SELECT * FROM mysql.tidb_runaway_queries LIMIT 1\G; *************************** 1. row *************************** resource_group_name: rg1 time: 2023-06-16 17:40:22 match_type: identify action: kill original_sql: select * from sbtest.sbtest1 plan_digest: 5b7d445c5756a16f910192ad449c02348656a5e9d2aa61615e6049afbc4a82e tidb_server: 127.0.0.1:4000
其中,
match_type
为该 Runaway Query 的来源,其值如下:identify
表示命中条件。watch
表示被快速识别机制命中。
-
mysql.tidb_runaway_quarantined_watch
表中包含了 Runaway Queries 的快速识别规则记录。以其中两行为例:MySQL [(none)]> SELECT * FROM mysql.tidb_runaway_quarantined_watch LIMIT 2\G; *************************** 1. row *************************** resource_group_name: rg1 start_time: 2023-06-16 17:40:22 end_time: 2023-06-16 18:10:22 watch: similar watch_text: 5b7d445c5756a16f910192ad449c02348656a5e9d2aa61615e6049afbc4a82e tidb_server: 127.0.0.1:4000 *************************** 2. row *************************** resource_group_name: rg1 start_time: 2023-06-16 17:42:35 end_time: 2023-06-16 18:12:35 watch: exact watch_text: select * from sbtest.sbtest1 tidb_server: 127.0.0.1:4000
其中:
start_time
和end_time
表示该快速识别规则有效的时间范围。watch
表示被快速识别机制命中,其值如下:similar
表示按照 Plan Digest 匹配,此时列watch_text
显示的是 Plan Digest。exact
表示按照 SQL 文本匹配,此时列watch_text
显示的是 SQL 文本。
-
执行以下命令关闭资源管控特性:
SET GLOBAL tidb_enable_resource_control = 'OFF';
-
将 TiKV 参数
resource-control.enabled
设为false
,关闭按照资源组配额调度。
TiDB 会定时采集资源管控的运行时信息,并在 Grafana 的 Resource Control Dashboard 中提供了相关指标的可视化图表,详见 Resource Control 监控指标详解。
TiKV 中也记录了来自于不同资源组的请求 QPS,详见 TiKV 监控指标详解。
TiDB Dashboard 中可以查看当前 RESOURCE_GROUPS
表中资源组的数据。详见 TiDB Dashboard 资源管控页面。
资源管控不影响数据导入导出以及其他同步工具的正常使用,BR、TiDB Lightning、TiCDC 等工具不支持对资源管控相关 DDL 的处理,这些工具的资源消耗也不受资源管控的限制。
-
如果我暂时不想使用资源组对资源进行管控,是否一定要关闭这个特性?
不需要。没有指定任何资源组的用户,将被放入系统预定义的
default
资源组,而default
资源组默认拥有无限用量。当所有用户都属于default
资源组时,资源分配方式与关闭资源管控时相同。 -
一个数据库用户是否可以绑定到不同的资源组?
不能。一个数据库用户只能绑定到一个资源组。但是,在会话运行的过程中,可以通过
SET RESOURCE GROUP
设置当前会话使用的资源组。你也可以通过优化器RESOURCE_GROUP()
Hint 为运行的语句设置资源组。 -
当各个资源组设置的用量 (
RU_PER_SEC
) 总和超出系统容量会发生什么?TiDB 在创建资源组时不会检查容量。只要系统有足够的空闲资源,TiDB 就会满足每个资源组的用量设置。当系统资源超过限制时,TiDB 会优先满足高优先级 (PRIORITY) 资源组的请求。如果同一优先级的请求无法全部满足,TiDB 会根据用量 (
RU_PER_SEC
) 的大小按比例分配。