PD-Server GRPC 接口全解析

网友投稿 607 2024-03-15

PD GRPC Service

PD GRPC 接口图解

目前 PD 对外暴露的接口主要分为两类：

GRPC

HTTP restful API

本文主要介绍 PD 6.0.0 对外暴露的 GRPC 接口信息，通过本文，你可以：

通过接口，全面了解 PD 提供的服务内容

可以作为一个导读入口，开始源码阅读，深入了解某个部分或开启 PD developer 之旅。

概览

详细接口分类

GetMemebers

接口说明：该接口主要用于获取当前 PD 的实例信息，包括PD 的 leader 信息、子服务信息。

请求参数：无

请求返回：

Member：当前集群中所有实例的基本信息

etcd_leader: 当前 etcd 集群所在 leader 节点信息。

Leader: 当前 PD 集群的 leader 节点信息。 pd 选 leader 时，只有 etcd 的 leader 参会参与 leader 的竞选，因此该理论上与 pd leader 节点保持一致，但存在极端情况。

tso_allocator_leaders: tso 各个 location 对应的 tso 分配器的 leader 信息

TSO

TSO (Get)

接口说明：按数据中心获取全局唯一递增时间戳

请求参数：

dc_location 数据中心位置

count 当前想要获取的时间戳个数

请求返回

count 当前给出的时间戳个数

timestamp 时间戳信息

physical 逻辑时间戳

logical 逻辑时间戳

suffix_bits 用于计算 logical 的后缀长度, 主要用作全局区分。

SyncMaxTs

请求说明：同步所有 DC 之间的 MaxTS. 主要实现两个需求：

获取当前系统中最大 localTSO

确保当前系统中的 localTSO 都大于 req.MaxTS

请求参数：

MaxTs 当前要设置的 maxts 值

Skip-check: 是否跳过检查，若为 false, 会

请求返回：

maxLocalTS

如果 skip-check = false, 则尝试获取当前系统最大 TS

如果发现当前系统的 max-ts 大于 req.max-ts, 则不做更新，并获取当前系统最大的 local-max-ts.

否则，尝试将所有 DC 的时间更新到 req.max-ts,若 dc.current-ts > req.max-ts , 则无需更新。

SyncdDcs 数据中心列表

GetDCLocationInfo

请求说明：获取指定 dc-location 的信息

请求参数： string dc-location

请求返回：dc-location 基本信息

Suffix int

max_ts timestamp

集群管理

启动

Bootstrap

接口说明：启动当前集群

请求参数:

store：集群中 store 基本信息

region: 集群中 region 基本信息

请求返回

IsBootstrapped

接口说明：咨询当前集群是否启动成功

请求参数：

请求返回：当前集群是否已启动成功

Raft Cluster

ClusterConfig

GetClusterConfig

请求说明：获取集群基本信息

请求返回：cluster 信息，主要包括

Id 集群唯一 ID

MaxpeerCount 每个 region 最多的 peer 数，不足时会自动 balance

PutClusterConfig

请求说明：配置 cluster 的副本数

请求参数：cluster 信息，同 Get 请求的返回值

Question：

这里副本数这个参数看起来外面 tikv 在用？PD 未找到具体使用的地方

处理请求时只对 cluster ID 做了校验，是否需要检查 maxpeercount 是否合理？

Stores

PutStore

接口说明：创建 store。关键检查条件：

如果当前集群中存在相同 ID 的 store 且状态为已删除，返回失败

如果 placementrule 未打开，但 store 为 tiflash node 失败（使用 tiflash 需要 placement-rule 启用）

如果存在相同 address 但 ID 不同的 store, 返回失败

集群中定义的 location - label 未配置全，返回失败。

请求参数：store 基本信息

请求返回：告知 tikv 当前集群的 replication-mode，目前支持两种模式：

标准模式：MAJORITY

DR_AUTO_SYNC：Replicate logs among 2 DCs.

GetStore

接口说明：根据 ID 获取集群中对应 store 的信息

请求参数：store_id

请求返回：

当前 store 基本信息

当前 store 统计信息, 如容量，region 个数，SendingSnapCount，KeysWritten，CpuUsages 等基本信息

GetAllStores

接口说明：获取当前系统中的 store 列表

请求参数：exclude_tombstone_stores 是否包含 tombstone 的 store

请求返回: store 的原信息列表，同 GetStore

StoreHeartbeat

接口说明：store 日常心跳上报，确保 store 处于活跃状态

请求参数：

StoreStats stats 基本状态，基本信息如 capacity,Available,region_count,sending_snap_count,receiving_snap_count, start_time ...

StoreReport store_report store 当前的副本列表及状态，只有在 unsafe recovery 才会有此项内容

replication_modepb.StoreDRAutoSyncStatus dr_autosync_status 当前系统恢复的状态

请求返回：

replication_status：当前集群的 replication-mode

cluster_version：当前集群版本号

require_detailed_report unsafecovery 时返回

recovery_plan，unsaferecovery 时返回

ReportMinResolvedTS

请求说明：上报 store 的最小 resolvedTS, 会落到 store 的属性里

请求参数：

storeID

minResolvedTS

Cluster

RegionHeartbeat

接口说明：Region 心跳上报, 同步 region 基本信息(只有 region leader 会上报心跳, stream req, 一次可能上报多个 region 的心跳)

请求参数： Region 基本信息，如：

Region: 基本信息，ID,start_key,end_key,epoch,peers

Leader: region 的 leader 基本信息（ID，storeID,role）

Peer 基本信息，主要分两类

Pending peers 还没到 follower 状态的 peer

DownPeers: leader 认为挂掉的 peer 信息，包括：

Peer 基本信息（ID,storeID,role）

downSeconds

Region 本身的数据写入情况，如

bytes_written/read 当前时间窗口

keys_wrritted/read 当前时间窗口

Approximate size/keys 总

term 当前 raft group 的 term

Replication-status

Cpu-usage

...

请求返回：如果发现当前 region 需要调度，返回对应调度指令, 每个 region 一次只会下发一个 operator

ChangePeer： RemovePeer/AddNode/AddLearnerNode

TransferLeader

Merge

Split-region

ChangePeerV2: replacing peers/demoting voter directly

Region 基本信息读请求 GetRegion/GetPrevRegion

接口说明：获取当前/前一个 region 基本信息、状态、负载情况

请求参数： region-key, 是否需要 buckets 信息

请求返回

Region: 基本信息

Leader

down_peers/pending_peers

buckets(if needed): 按 bucket 为最小单位的负载情况信息（write/read-key/size）

GetRegionByID

接口说明：同 GetRegion，区别是通过 region-id 获取

ScanRegions

接口说明：根据指定的 key 返回获取 region 列表

请求参数：

start-key/end-key

Limit, 为空时，返回所有

请求返回

Region-metas

Region-leaders

Regions

说明：这里请求返回的组织形式有点奇怪

ReportBuckets

请求说明：上报 bucket 基本信息

请求参数（stream）：buckets 基本信息

region_id

Keys []string

BucketStats []stat

period_in_ms: 数据采集的间隔

Split Region AskBatchSplit

请求说明：发起将 region 切成指定份数的请求，请求返回成功后，最终 split 不一定成功。

请求参数：region 基本信息，split-count

请求返回：预切分好的 region ID 及peer ID 列表：split-ID (peers-ids,region-id) list

ReportBatchSplit

请求说明：tikv 汇报 split region 成功，PD 这边打印日志，方便查询 split region 请求是否已经生效成功。

请求参数：regions 被切分的 regions 信息

请求返回：基本认证 header.

SplitRegion

请求说明：根据指定 key 列表分裂相关 regions，请求返回时，split 已经物理完成。

请求参数：

splitkeys: 指定 key 列表

retry_limit: 重试次数

请求返回：

regions_id: 新生成的 region 列表

finished_percentage: 完成率

ScatterRegion

请求说明：打散 region

请求参数：

Group 组名，如果非空，则会在 group 级别进行打散，不存在，则整个集群级别打散。

regions_id 需要打散的 region 编号

Retry-limit 每个 region 重试次数

Region-id 历史参数，当 regions-id 为空时，当前 region 为需要打散的 region

region,leader ：需要打散的 regiion 信息，当 PD 找不到需要打散的 regiion 时（region-id) 使用。举例：PD 尚未收到 regiion 的心跳上报。处理逻辑如下：当 regions-id 为空，region-id 为空时，当前信息组织成新的 region 进行打散。

请求返回：finished-percentage: 请求完成率，成功的 regions 个数/总 regions 个数

SplitAndScatterRegions

请求说明：根据指定的 key 切分 region 且打散 SplitRegions+ScatterRegion

请求参数:

splitkeys: 指定需要切分的 key 列表

Group 组名，如果非空，则会在 group 级别进行打散，不存在，则整个集群级别打散。

Retry-limit 重试次数

请求返回

regions_id: 新生成的 region 列表

split_finished-percentage: 请求完成率

scatter_finished-percentage: 请求完成率

SyncRegions（stream）

请求说明：向 PD 发起同步 region 信息的请求，一般用于大集群处理, 以及当 pd 中使用 levelDB 替代 ETCD 存储 region 信息时，PD 间 region 信息的同步。无法保证强一致性。

请求返回：各个 region 信息。。同步 region 基本信息

GetOperatorRequest

请求说明：获取指定 region 正在执行的 operator 状态

请求参数：region_id

请求返回：当前 operator 的基本信息和状态

region_id

Desc

status(success,timeout,cancel,replace,running)

kind(是否是 admin 发起的，优先级等)

GC

GetGCSafePoint

请求说明：获取当前系统的 gc safepoint, 该值通过接口 UpdateGCSafePoint 接口设置

请求返回：safe-point

UpdateGCSafePoint

请求说明：设置 gc safepoint 信息，只有当需要设置的 safepoint 大于当前系统中的 safepoint 时，才会设置成功。

请求参数：

safe_point 当前要设置的 safepoint.

请求返回：

new_safe_point 当前系统中的 safepoint

UpdateServiceGCSafePoint

请求说明：为指定 service 存储可安全 gc 的 safepoint. 成功的条件是当前要设置的 safepoint 大于等于 service 中最小的 safepoint

请求参数：

service_id

TTL，TTL 为负数表示删除对应的 safepoint.

safe_point, 表示对 service 来说，当前 safepoint 之前的数据可以 GC 掉

请求返回：当前系统中 safepoint 最小的那个 service 信息, 该 minsafepoint 会永远向前滑动不会回退

service_id

ttl

MinSafepoint

GlobalConfig

看起来这里是对 ETCD 的简单封装，将需要的配置项放在 /global/config 下面，通过下面三个接口来实现查询、更新及服务发现的功能。

StoreGlobalConfig

接口定义：存储 key-value 配置项到 PD

参数：items []items,items 内容包括

Key

Value

error(没有使用)

LoadGlobalConfig

接口定义：获取 /global/config 下指定 keys 对应的 values

请求参数：

Names []string 需要的 key 的名称

请求返回：当前需要的 keys 对应信息

Key

Value

error(查询该 key 过程中遇到的错误或 NOT found)

WatchGlobalConfig

请求说明：监听 /global/config 目录

请求返回：当前目录下发生变化的 key-value 信息

PD-Server GRPC 接口全解析

PD GRPC 接口图解

概览

详细接口分类

GetMemebers

TSO

TSO (Get)

SyncMaxTs

GetDCLocationInfo

集群管理

启动

Raft Cluster

ClusterConfig

Stores

Cluster

GC

GlobalConfig

StoreGlobalConfig

LoadGlobalConfig

WatchGlobalConfig

微信扫一扫：分享

推荐文章

友情链接

热评文章