五分钟爆改，把你的JSON/CSV文件打造成MySQL数据库-PingCAP

五分钟爆改，把你的JSON/CSV文件打造成MySQL数据库

网友投稿 690 2023-05-24

五分钟爆改，把你的JSON/CSV文件打造成MySQL数据库

生活中，你我一定都看到过这种「xx元爆改出租屋」，「爆改小汽车」之类的文章，做为IT人，折腾的劲头一点也不差。

软件开发过程中，你是否有时候，会拿着业务提供的一个个CSV或者JSON的数据文件，写个解析程序，把它们存到数据库里，再在自己的程序里通过数据库读出来?

其实不用这么麻烦，还绕了一个大圈。

今天，我们一起来「爆改」JSON/CSV这类文件，把它们打造成 MySQL一样的关系型数据库，一套SQL查询走天下。:-)

第一步：代码里加入Maven依赖

org.apache.calcite calcite-file 1.21.0

通过这一步，你大概就看出来，咱们今天的爆改，主要依赖 Calcite，这个Apache的顶级项目。

来张官网截图感受下：

简单介绍的话，它是个数据库查询和优化的引擎，不负责具体的存储。

所以介绍里人家自己也说了，是你高性能数据库的地基。许多的开源项目是基于它做的，比如大名鼎鼎的这些：

第二步：添加配置文件

配置的JSON 文件，一般是下面这样子：

改造的配置文件，就像行军打仗的地图一样，来告诉我们往哪走，这里的配置文件，对应到关系型数据库里，就像是哪个库，哪些表一样。

{ "version": "1.0", "defaultSchema": "SALES", "schemas": [ { "name": "SALES", "type": "custom", "factory": "org.apache.calcite.adapter.file.FileSchemaFactory", "operand": { "directory": "sales" } } ] }

其中schemas 表示都有哪些数据库， defaultSchema 当然是默认数据库了。factory 表示当前的数据文件，我们使用哪种Schema的形式进行解析。因为 Calcite 可以支持多种数据格式，通过这个图你也能感受到几分吧。

第三步：JDBC Style

public class Demo { public static void main(String[] args) throws SQLException, ClassNotFoundException { Class.forName("org.apache.calcite.jdbc.Driver"); Properties config = new Properties(); config.put("model", "./src/main/resources/model.json"); String sql = "select * from hello"; try (Connection con = DriverManager.getConnection("jdbc:calcite:", config)) { try (Statement stmt = con.createStatement()) { ResultSet rs = stmt.executeQuery(sql); while (rs.next()) { System.out.println(rs.getString(2)); } } } } }

其中SQL 语句，可以支持条件过滤，join 等所有的标准SQL。

整体项目结构如下：

PS: 忘了提一句，对于CSV文件，第一行需要将各列列名和类型加上，表示数据库表里定义的列。

你说我很忙，不想啰哩啰嗦再写个Java程序，办法也还有。有个程序叫 sqlline，可以方便你在命令行里执行，一个脚本连接到对应的文件数据库之后，就开始你飞一般的SQL表演吧。

sqlline> !connect jdbc:calcite:model=src/main/resources/model.json admin admin

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

690 2023-05-24

五分钟爆改，把你的JSON/CSV文件打造成MySQL数据库

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20