黄东旭解析 TiDB 的核心优势
615
2023-04-25
不超过百行的SQL文件提取器
数据是互联网的灵魂、没有数据互联网就是一个无用的空壳子,像人工智能、大数据、智能算法等。都是需要基础数据来验证模型是否是可用的,来进行调参矫正算法的可用性、帮助算法的落地,对算法起到最关键的作用。所以数据的获取以及对数据的处理就是非常重要的。
通常的数据格式是txt、sql、excel以及word,其中最重要的还是SQL中的数据、SQL数据包括MySQL、SQLServer、SQLite、***等,导出的数据格式。 常用的数据处理语言是Python、因为Python是个胶水语言,没有Python搞不定的事。 Python比较适合做些快速、时间紧、参与人员较少,切性能要求不高的项目,而且Python成熟的库很多、这也是它 被称为 胶水语言的原因 。
技术要求需要懂得python3的基础语法以及对正则表达式有基础了解。
实现步骤
1.读取SQL文件中的数据、去除多余的内容并提取需要的数据、追加到集合中;
2.将集合中的数据转成json格式;
3.定义转换后的文件地址并写入文件中
jsonArray = json.dumps(jsonList)jsonOpen = open("./data/areaToJson.txt", "w")jsonOpen.writelines(str(jsonArray))opens.close()jsonOpen.close()
所有代码:
实现的结果:
细微思路的发现、并将该思维实现产品中逐渐放大化,最终实现体系走向产品运营。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。