用户挑战
随着 TiDB 在各行业广泛应用,许多企业已经部署了多套 TiDB 集群,不同集群规模各异,从少数几个节点到上千个节点不等。随着系统规模不断扩大,用户在集群部署、性能监控、故障诊断、备份恢复等运维工作上所面临的压力和成本投入也与日俱增。伴随而来的数据安全、兼容性以及合规等问题不断浮现,如何提升管理效率成为重大挑战。
解决方案
TiDB 企业级运维管理平台(TiDB Enterprise Manager,简称 TEM)是一款以 TiDB 为核心的企业级数据库管理平台,兼容 TiDB 所有 LTS 版本。TEM 提供了对 TiDB 集群的全生命周期管理,包括部署、性能诊断、告警监控、备份恢复等功能,帮助用户更加高效地管理 TiDB 集群,降低企业 IT 管理成本,提升管理效率。
TEM 主要特性
集群管理
TEM 提供了覆盖 TiDB 集群全生命周期的管理能力,包括集群的部署、纳管、性能监控、配置修改、扩缩容和删除等功能,满足用户对 TiDB 集群管理的需求。
![集群管理](https://img1.www.pingcap.com/files/2023/12/20231220111519986.png)
告警管理
TEM 提供了广泛的告警管理功能,用户可以根据需要创建自定义的告警规则和相应的告警通道,通过电子邮件方式发送告警消息。同时,TEM 还支持用户对告警事件、告警规则和告警通道进行灵活的管理。
![告警管理](https://img1.www.pingcap.com/files/2023/12/20231220111607835.png)
备份恢复管理
TEM 提供基于策略的备份管理功能,用户可以根据需求创建不同的备份策略,并将其应用到相应的TiDB 集群,以实现对多个 TiDB 集群的备份管理。同时,TEM 还支持用户根据需要对特定的 TiDB 集群进行恢复。
![备份恢复管理](https://img1.www.pingcap.com/files/2023/12/20231220111643565.png)
性能监控与诊断
性能诊断特性以 TiDB 集群为核心,对集群的各种性能相关数据进行不同维度的展示,并且可以根据用户的需求生成相应的性能诊断报告和巡检报告。
用户与角色管理
TEM 采用了基于角色的权限管理,通过角色的方式把 TEM 的各项权限授权给用户。当前版本的 TEM 提供了多个内置角色,并支持在创建用户时选择相应的角色。当然,TEM 也支持对用户的创建、修改和删除。
![用户与角色管理](https://img1.www.pingcap.com/files/2023/12/20231220111715588.png)
应用场景
集群部署
为了满足用户不同的应用场景, TEM 目前支持多种 TiDB 集群部署方式,包括通常用于测试的独占模式和共享模式,用户手动上传 YAML 文件并进行编辑的高级模式,以及用户根据需要在 TEM 上手动编辑集群拓扑文件的 YAML 模式。 另外,为了提升用户创建集群的成功率,TEM 支持用户在多台主机上运行自定义的脚本。
用户可以在主机管理菜单中批量添加主机,并运行脚本来完成部署前的准备工作。
![集群部署](https://img1.www.pingcap.com/files/2023/12/20231220111758660.png)
之后,通过集群管理中的新建集群页面来创建集群。
![新建集群](https://img1.www.pingcap.com/files/2023/12/20231220111817927.png)
性能监控与诊断
当某个 TiDB 集群出现性能问题时,用户可以使用 TEM 提供的多维度监控指标和性能诊断信息来对性能问题进行诊断。
![性能监控](https://img1.www.pingcap.com/files/2023/12/20231220111836791.png)
同时,如果性能问题是由于慢 SQL 导致的,TEM 还可以展示 SQL 语句的统计信息、执行计划等诊断信息,帮助用户定位 SQL 语句的性能问题。
![性能诊断](https://img1.www.pingcap.com/files/2023/12/20231220111852765.png)
备份恢复
TEM 支持用户根据需要创建不同的备份策略,并对不同的集群应用不同的备份策略。后续,可以根据需要将不同的备份策略应用到不同的集群上。
![备份恢复](https://img1.www.pingcap.com/files/2023/12/20231220111912295.png)
方案优势
1. 多集群统一管理
提供 TiDB 集群的创建、纳管、监控、性能诊断、参数等全生命周期管理和 TiDB 集群所在主机的监控服务。
2. 告警管理
提供丰富的内置告警规则、告警通道和集中式的告警展示,用户可以根据需要自定义告警规则和通道。
3. SQL 编辑器
提供便捷的数据库对象管理功能,以及 SQL 语句运行、优化环境和常见结果集的管理能力。