麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践
755
2023-04-06
分布式数据库sort那些事儿
概述
topn-sort
介绍
分布式的多路归并排序merge-sort
- 需要全排序的情况,分区有序,算法复杂度由NLOGN降到NLOGK, K指分区表的数量;分区无序,由NLOGN到KLOGN/K+NLOGK。上层有limit n时,只需要迭代n次就可以。- 所有的数据都会在rowstore中存储,所以处理过程中不需要深拷贝,与全排序相比,少了N行深拷贝的时间。- 没有merge-sort时,做order by的下压是没有意义的,实现merge-sort之后,可以将order by以及limit+order by下压到每个分区去做,某些场景大大减少了数据的拉取和处理。
总结 优化无止境,性能对数据库来讲至关重要,不放过每一个可以优化的性能点,精益求精。路漫漫其修远兮,吾将上下而求索~
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。