什么是TiDB Lightning？

why 857 2023-06-25

本文关于（什么是TiDB Lightning？及其整体架构）。

TiDB Lightning 简介

TiDB Lightning 是用于从静态文件导入 TB 级数据到 TiDB 集群的工具，常用于 TiDB 集群的初始化数据导入。

TiDB Lightning 支持以下文件类型：

Dumpling 生成的文件
CSV 文件
Amazon Aurora 生成的 Apache Parquet 文件

TiDB Lightning 支持从以下位置读取：

本地
Amazon S3
Google GCS

TiDB Lightning 整体架构

TiDB Lightning 目前支持两种导入方式，通过 backend 配置区分。不同的模式决定 TiDB Lightning 如何将数据导入到目标 TiDB 集群。

物理导入模式：TiDB Lightning 首先将数据编码成键值对并排序存储在本地临时目录，然后将这些键值对上传到各个 TiKV 节点，最后调用 TiKV Ingest 接口将数据插入到 TiKV 的 RocksDB 中。如果用于初始化导入，请优先考虑使用物理导入模式，其拥有较高的导入速度。物理导入模式对应的后端模式为 local。
逻辑导入模式：TiDB Lightning 先将数据编码成 SQL，然后直接运行这些 SQL 语句进行数据导入。如果需要导入的集群为生产环境线上集群，或需要导入的目标表中已包含有数据，则应使用逻辑导入模式。逻辑导入模式对应的后端模式为 tidb。

导入模式	物理导入模式	逻辑导入模式
后端	`local`	`tidb`
速度	快 (100 ~ 500 GiB/小时)	慢 (10 ~ 50 GiB/小时)
资源使用率	高	低
占用网络带宽	高	低
导入时是否满足 ACID	否	是
目标表	必须为空	可以不为空
支持 TiDB 集群版本	>= v4.0.0	全部
导入期间是否允许 TiDB 对外提供服务	受限制	是

注意

以上性能数据用于对比两种模式的导入性能差异，实际导入速度受硬件配置、表结构、索引数量等多方面因素影响。

上述就是小编为大家整理的（什么是TiDB Lightning？及其整体架构）
***

标签：TiDB pingcap ACID

黄东旭解析 TiDB 的核心优势

857 2023-06-25

黄东旭关于基础软件产品价值的思考

857 2023-06-25

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

857 2023-06-25

什么是TiDB Lightning？

TiDB Lightning 简介

TiDB Lightning 整体架构

黄东旭解析 TiDB 的核心优势

黄东旭关于基础软件产品价值的思考

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

什么是TiDB Lightning？

TiDB Lightning 简介

TiDB Lightning 整体架构

微信扫一扫：分享

推荐文章

友情链接

热评文章