TiDB Operator 在 K8S 集群环境配置指南

网友投稿 240 2024-03-19



在通过TiDB Operator进行退TiDB集群管理时,需要对K8S集群做软硬件环境的相关配置,保证TiDB集群在容器环境下发挥更好的性能,减少一些不必要的错误,保障服务的稳定性。

TiDB Operator 在 K8S 集群环境配置指南

软件版本要求

软件名称版本DockerDocker CE 18.09.6Kubernetesv1.12.5+CentOSCentOS 7.6,内核要求为 3.10.0-957 或之后版本Helmv3.0.0+

防火墙配置

建议关闭防火墙

systemctl stop firewalld systemctl disable firewalld

若无法关闭 firewalld 服务,需打开以下端口:

在Master节点上firewall-cmd --permanent --add-port=6443/tcp firewall-cmd --permanent --add-port=2379-2380/tcp firewall-cmd --permanent --add-port=10250/tcp firewall-cmd --permanent --add-port=10251/tcp firewall-cmd --permanent --add-port=10252/tcp firewall-cmd --permanent --add-port=10255/tcp firewall-cmd --permanent --add-port=8472/udp firewall-cmd --add-masquerade --permanent # 当需要在 Master 节点上暴露 NodePort 时候设置 firewall-cmd --permanent --add-port=30000-32767/tcp systemctl restart firewalld在计算节点上firewall-cmd --permanent --add-port=10250/tcp firewall-cmd --permanent --add-port=10255/tcp firewall-cmd --permanent --add-port=8472/udp firewall-cmd --permanent --add-port=30000-32767/tcp firewall-cmd --add-masquerade --permanent systemctl restart firewalld

配置 Iptables

FORWARD 链默认配置成 ACCEPT,并将其设置到开机启动脚本里:

iptables -P FORWARD ACCEPT

禁用 SELinux

setenforce 0 sed -i s/^SELINUX=enforcing$/SELINUX=permissive/ /etc/selinux/config

关闭 Swap

swapoff -a sed -i s/^\(.*swap.*\)$/#\1/ /etc/fstab

内核参数设置

modprobe br_netfiltercat <<EOF > /etc/sysctl.d/k8s.confnet.bridge.bridge-nf-call-ip6tables = 1 net.bridge.bridge-nf-call-iptables = 1 net.bridge.bridge-nf-call-arptables = 1 net.core.somaxconn = 32768 vm.swappiness = 0 net.ipv4.tcp_syncookies = 0 net.ipv4.ip_forward = 1 fs.file-max = 1000000 fs.inotify.max_user_watches = 1048576 fs.inotify.max_user_instances = 1024 net.ipv4.conf.all.rp_filter = 1 net.ipv4.neigh.default.gc_thresh1 = 80000 net.ipv4.neigh.default.gc_thresh2 = 90000 net.ipv4.neigh.default.gc_thresh3 = 100000 EOF sysctl --system

配置 Irqbalance 服务

Irqbalance 服务可以将各个设备对应的中断号分别绑定到不同的 CPU 上,以防止所有中断请求都落在同一个 CPU 上而引发性能瓶颈。

systemctl enable irqbalance systemctl start irqbalance

CPUfreq 调节器模式设置

为了让 CPU 发挥最大性能,请将 CPUfreq 调节器模式设置为 performance 模式。详细参考在部署目标机器上配置 CPUfreq 调节器模式

cpupower frequency-set --governor performance

Ulimit 设置

cat <<EOF >> /etc/security/limits.confroot soft nofile 1048576 root hard nofile 1048576 root soft stack 10240 EOF sysctl --system

Docker 服务

Docker 的数据目录设置,--data-root通过来设置

cat > /etc/docker/daemon.json <<EOF { "exec-opts": ["native.cgroupdriver=systemd"], "log-driver": "json-file", "log-opts": { "max-size": "100m" }, "storage-driver": "overlay2", "storage-opts": [ "overlay2.override_kernel_check=true" ], "data-root": "/data1/docker" } EOF

设置 Docker daemon 的 ulimit。

创建 docker service 的 systemd drop-in 目录 /etc/systemd/system/docker.service.d

mkdir -p /etc/systemd/system/docker.service.d

创建 /etc/systemd/system/docker.service.d/limit-nofile.conf 文件,并配置 LimitNOFILE 参数的值,取值范围为大于等于 1048576的数字即可

cat > /etc/systemd/system/docker.service.d/limit-nofile.conf <<EOF [Service] LimitNOFILE=1048576 EOF

重新加载配置

systemctl daemon-reload && systemctl restart docker

Kubernetes 服务

修改kubelet的数据目录

echo "KUBELET_EXTRA_ARGS=--root-dir=/data1/kubelet" >/etc/sysconfig/kubelet systemctl restart kubelet

通过 kubelet 设置预留资源

保证机器上的系统进程以及 Kubernetes 的核心进程在工作负载很高的情况下仍然有足够的资源来运行,从而保证整个系统的稳定。

--system-reserved=cpu=200m,memory=1Gi,ephemeral-storage=5Gi \ --eviction-hard=memory.available<2Gi,nodefs.available<1Gi,imagefs.available<1Gi \--eviction-minimum-reclaim=memory.available=1Gi,nodefs.available=500Mi,imagefs.available=1Gi \ --node-status-update-frequency=10s --eviction-pressure-transition-period=30s"

TiDB 集群资源需求

请根据服务器建议配置来规划机器的配置。

TiDB存储类型推荐

TiKV存储推荐

TiKV 自身借助 Raft 实现了数据复制,出现节点故障后,PD 会自动进行数据调度补齐缺失的数据副本,同时 TiKV 要求存储有较低的读写延迟,所以生产环境强烈推荐使用本地 *** 存储。

PD存储推荐

PD 同样借助 Raft 实现了数据复制,但作为存储集群元信息的数据库,并不是 IO 密集型应用,所以一般本地普通 SAS 盘或网络 *** 存储(例如 AWS 上 gp2 类型的 EBS 存储卷,GCP 上的持久化 *** 盘)就可以满足要求。

监控和其他组件

监控组件以及 TiDB Binlog、备份等工具,由于自身没有做多副本冗余,所以为保证可用性,推荐用网络存储。其中 TiDB Binlog 的 pump 和 drainer 组件属于 IO 密集型应用,需要较低的读写延迟,所以推荐用高性能的网络存储(例如 AWS 上的 io1 类型的 EBS 存储卷,GCP 上的持久化 *** 盘)。

在利用 TiDB Operator 部署 TiDB 集群或者备份工具的时候,需要持久化存储的组件都可以通过 values.yaml 配置文件中对应的storageClassName 设置存储类型。不设置时默认都使用 local-storage

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:TiDB Operator 升级指南
下一篇:TiDB Operator 实现集群备份到 NFS 持久卷操作指南
相关文章