黄东旭解析 TiDB 的核心优势
708
2024-03-03
我们公司是做SAAS的,具体的说是企业信息系统。
信息系统的特点,是数据量不算很大,但表特别多,并发很小,但查询逻辑非常复杂。
目前我们大概有几十亿条数据,3000多张表,TP+AP的并发不到100。
三年多以前,我们刚创业,做数据库选型时,跟东旭聊过,考察过TIDB。当时还没有TiFlash,TIDB的AP性能不够用,最后选了hadoop体系下的impala+kudu的方案。当时东旭跟我说,要做列存,做了列存AP就快了,超过impala那都不叫事。
impala+kudu的方案没有多行事务支持,我们在业务层做了很糙的事务处理,勉强支撑到现在。但这不是长久之计,而且国产化也是趋势,所以我又再次考虑数据库选型的问题。
三年多了,东旭吹过的牛B圆上了没,我们拭目以待。
OLTP的性能,我不打算测,我们这点并发,哪怕是单机mysql都绰绰有余,所以只考察OLAP能力。
考察OLAP,我们会从很多角度,大部分是跟我们业务相关的,没有通用性,所以不在此赘述。
在这里只对比标准数据集tpcds下的性能。
由于我们是小数据量的场景,所以只使用50G的数据进行测试。
更大数据量的测试,以我的经验来看,只要硬件不出现瓶颈,对比结果不会相差很大。
测试用到的数据和脚本:
https://github.com/huaj1101/tpcds-tidb-impala
测试使用的集群配置及部署情况:
tidb version:5.4
impala version:3.2 (版本较老,是目前我们在用版本)
节点配置数量tidb部署内容hadoop部署内容16c 64g 150G ssd云盘3pd * 3 tidb * 3 monitor * 1master * 316c 64g 500G ssd云盘3tikv * 3 tiflash * 3data * 3tidb
impala
TIDB 5.4现在的OLAP性能已经跟上,综合性能比impala 3.2高15%左右,东旭吹过的牛B圆的很好。
TIDB 跑OLAP时的资源占用还有很大的优化空间,CPU和网络IO比impala高一倍以上。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。