黄东旭解析 TiDB 的核心优势
459
2024-02-23
PD GRPC Service
目前 PD 对外暴露的接口主要分为两类:
GRPC
HTTP restful API
本文主要介绍 PD 6.0.0 对外暴露的 GRPC 接口信息,通过本文,你可以:
通过接口,全面了解 PD 提供的服务内容
可以作为一个导读入口,开始源码阅读,深入了解某个部分或开启 PD developer 之旅。
接口说明: 该接口主要用于获取当前 PD 的实例信息,包括PD 的 leader 信息、子服务信息。
请求参数:无
请求返回:
Member:当前集群中所有实例的基本信息
etcd_leader: 当前 etcd 集群所在 leader 节点信息。
Leader: 当前 PD 集群的 leader 节点信息。 pd 选 leader 时,只有 etcd 的 leader 参会参与 leader 的竞选,因此该理论上与 pd leader 节点保持一致,但存在极端情况。
tso_allocator_leaders: tso 各个 location 对应的 tso 分配器的 leader 信息
接口说明: 按数据中心获取全局唯一递增时间戳
请求参数:
dc_location 数据中心位置
count 当前想要获取的时间戳个数
请求返回
count 当前给出的时间戳个数
timestamp 时间戳信息
physical 逻辑时间戳
logical 逻辑时间戳
suffix_bits 用于计算 logical 的后缀长度, 主要用作全局区分。
请求说明:同步所有 DC 之间的 MaxTS. 主要实现两个需求:
获取当前系统中最大 localTSO
确保当前系统中的 localTSO 都大于 req.MaxTS
请求参数:
MaxTs 当前要设置的 maxts 值
Skip-check: 是否跳过检查,若为 false, 会
请求返回:
maxLocalTS
如果 skip-check = false, 则尝试获取当前系统最大 TS
如果发现当前系统的 max-ts 大于 req.max-ts, 则不做更新,并获取当前系统最大的 local-max-ts.
否则,尝试将所有 DC 的时间更新到 req.max-ts,若 dc.current-ts > req.max-ts , 则无需更新。
SyncdDcs 数据中心列表
请求说明:获取指定 dc-location 的 信息
请求参数: string dc-location
请求返回:dc-location 基本信息
Suffix int
max_ts timestamp
接口说明:启动当前集群
请求参数:
store:集群中 store 基本信息
region: 集群中 region 基本信息
请求返回
IsBootstrapped接口说明:咨询当前集群是否启动成功
请求参数:
请求返回:当前集群是否已启动成功
请求说明:获取集群基本信息
请求返回:cluster 信息,主要包括
Id 集群唯一 ID
MaxpeerCount 每个 region 最多的 peer 数,不足时会自动 balance
PutClusterConfig请求说明:配置 cluster 的副本数
请求参数:cluster 信息,同 Get 请求的返回值
Question:
这里副本数这个参数看起来外面 tikv 在用?PD 未找到具体使用的地方
处理请求时只对 cluster ID 做了校验,是否需要检查 maxpeercount 是否合理?
接口说明: 创建 store。关键检查条件:
如果当前集群中存在相同 ID 的 store 且状态为已删除,返回失败
如果 placementrule 未打开,但 store 为 tiflash node 失败(使用 tiflash 需要 placement-rule 启用)
如果存在相同 address 但 ID 不同的 store, 返回失败
集群中定义的 location - label 未配置全,返回失败。
请求参数:store 基本信息
请求返回:告知 tikv 当前集群的 replication-mode,目前支持两种模式:
标准模式:MAJORITY
DR_AUTO_SYNC:Replicate logs among 2 DCs.
GetStore接口说明:根据 ID 获取集群中对应 store 的信息
请求参数:store_id
请求返回:
当前 store 基本信息
当前 store 统计信息, 如容量,region 个数,SendingSnapCount,KeysWritten,CpuUsages 等基本信息
GetAllStores接口说明:获取当前系统中的 store 列表
请求参数:exclude_tombstone_stores 是否包含 tombstone 的 store
请求返回: store 的原信息列表,同 GetStore
StoreHeartbeat接口说明:store 日常心跳上报,确保 store 处于活跃状态
请求参数:
StoreStats stats 基本状态,基本信息如 capacity,Available,region_count,sending_snap_count,receiving_snap_count, start_time ...
StoreReport store_report store 当前的副本列表及状态,只有在 unsafe recovery 才会有此项内容
replication_modepb.StoreDRAutoSyncStatus dr_autosync_status 当前系统恢复的状态
请求返回:
replication_status: 当前集群的 replication-mode
cluster_version: 当前集群版本号
require_detailed_report unsafecovery 时返回
recovery_plan,unsaferecovery 时返回
ReportMinResolvedTS请求说明:上报 store 的最小 resolvedTS, 会落到 store 的属性里
请求参数:
storeID
minResolvedTS
接口说明:Region 心跳上报, 同步 region 基本信息(只有 region leader 会上报心跳, stream req, 一次可能上报多个 region 的心跳)
请求参数: Region 基本信息,如:
Region: 基本信息,ID,start_key,end_key,epoch,peers
Leader: region 的 leader 基本信息(ID,storeID,role)
Peer 基本信息,主要分两类
Pending peers 还没到 follower 状态的 peer
DownPeers: leader 认为挂掉的 peer 信息,包括:
Peer 基本信息(ID,storeID,role)
downSeconds
Region 本身的数据写入情况,如
bytes_written/read 当前时间窗口
keys_wrritted/read 当前时间窗口
Approximate size/keys 总
term 当前 raft group 的 term
Replication-status
Cpu-usage
...
请求返回:如果发现当前 region 需要调度,返回对应调度指令, 每个 region 一次只会下发一个 operator
ChangePeer: RemovePeer/AddNode/AddLearnerNode
TransferLeader
Merge
Split-region
ChangePeerV2: replacing peers/demoting voter directly
Region 基本信息读请求 GetRegion/GetPrevRegion接口说明: 获取当前/前一个 region 基本信息、状态、负载情况
请求参数: region-key, 是否需要 buckets 信息
请求返回
Region: 基本信息
Leader
down_peers/pending_peers
buckets(if needed): 按 bucket 为最小单位的负载情况信息(write/read-key/size)
GetRegionByID接口说明:同 GetRegion,区别是通过 region-id 获取
ScanRegions接口说明:根据指定的 key 返回获取 region 列表
请求参数:
start-key/end-key
Limit, 为空时,返回所有
请求返回
Region-metas
Region-leaders
Regions
说明:这里请求返回的组织形式有点奇怪
ReportBuckets请求说明:上报 bucket 基本信息
请求参数(stream):buckets 基本信息
region_id
Keys []string
BucketStats []stat
period_in_ms: 数据采集的间隔
Split Region AskBatchSplit请求说明:发起将 region 切成指定份数的请求,请求返回成功后,最终 split 不一定成功。
请求参数:region 基本信息,split-count
请求返回:预切分好的 region ID 及peer ID 列表:split-ID (peers-ids,region-id) list
ReportBatchSplit请求说明:tikv 汇报 split region 成功,PD 这边打印日志,方便查询 split region 请求是否已经生效成功。
请求参数:regions 被切分的 regions 信息
请求返回:基本认证 header.
SplitRegion请求说明:根据指定 key 列表分裂相关 regions,请求返回时,split 已经物理完成。
请求参数:
splitkeys: 指定 key 列表
retry_limit: 重试次数
请求返回:
regions_id: 新生成的 region 列表
finished_percentage: 完成率
ScatterRegion请求说明:打散 region
请求参数:
Group 组名,如果非空,则会在 group 级别进行打散,不存在,则整个集群级别打散。
regions_id 需要打散的 region 编号
Retry-limit 每个 region 重试次数
Region-id 历史参数,当 regions-id 为空时,当前 region 为需要打散的 region
region,leader :需要打散的 regiion 信息,当 PD 找不到需要打散的 regiion 时(region-id) 使用。举例:PD 尚未收到 regiion 的心跳上报。处理逻辑如下:当 regions-id 为空,region-id 为空时,当前信息组织成新的 region 进行打散。
请求返回:finished-percentage: 请求完成率,成功的 regions 个数/总 regions 个数
SplitAndScatterRegions请求说明:根据指定的 key 切分 region 且打散 SplitRegions+ScatterRegion
请求参数:
splitkeys: 指定需要切分的 key 列表
Group 组名,如果非空,则会在 group 级别进行打散,不存在,则整个集群级别打散。
Retry-limit 重试次数
请求返回
regions_id: 新生成的 region 列表
split_finished-percentage: 请求完成率
scatter_finished-percentage: 请求完成率
SyncRegions(stream)请求说明:向 PD 发起同步 region 信息的请求,一般用于大集群处理, 以及当 pd 中使用 levelDB 替代 ETCD 存储 region 信息时,PD 间 region 信息的同步。无法保证强一致性。
请求返回:各个 region 信息。。同步 region 基本信息
GetOperatorRequest请求说明:获取指定 region 正在执行的 operator 状态
请求参数:region_id
请求返回:当前 operator 的基本信息和状态
region_id
Desc
status(success,timeout,cancel,replace,running)
kind(是否是 admin 发起的,优先级等)
请求说明: 获取当前系统的 gc safepoint, 该值通过接口 UpdateGCSafePoint 接口设置
请求返回:safe-point
UpdateGCSafePoint请求说明:设置 gc safepoint 信息,只有当需要设置的 safepoint 大于当前系统中的 safepoint 时,才会设置成功。
请求参数:
safe_point 当前要设置的 safepoint.
请求返回:
new_safe_point 当前系统中的 safepoint
UpdateServiceGCSafePoint请求说明:为指定 service 存储可安全 gc 的 safepoint. 成功的条件是当前要设置的 safepoint 大于等于 service 中最小的 safepoint
请求参数:
service_id
TTL,TTL 为负数表示删除对应的 safepoint.
safe_point, 表示对 service 来说,当前 safepoint 之前的数据可以 GC 掉
请求返回:当前系统中 safepoint 最小的那个 service 信息, 该 minsafepoint 会永远向前滑动不会回退
service_id
ttl
MinSafepoint
看起来这里是对 ETCD 的简单封装,将需要的配置项放在 /global/config 下面,通过下面三个接口来实现查询、更新及服务发现的功能。
接口定义:存储 key-value 配置项到 PD
参数:items []items,items 内容包括
Key
Value
error(没有使用)
接口定义:获取 /global/config 下指定 keys 对应 的 values
请求参数:
Names []string 需要的 key 的名称
请求返回:当前需要的 keys 对应信息
Key
Value
error(查询该 key 过程中遇到的错误或 NOT found)
请求说明:监听 /global/config 目录
请求返回:当前目录下发生变化的 key-value 信息
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。