分布式数据库sort那些事儿

网友投稿 694 2023-04-06

分布式数据库sort那些事儿

分布式数据库sort那些事儿

概述

topn-sort

介绍

分布式的多路归并排序merge-sort

- 需要全排序的情况,分区有序,算法复杂度由NLOGN降到NLOGK, K指分区表的数量;分区无序,由NLOGN到KLOGN/K+NLOGK。上层有limit n时,只需要迭代n次就可以。- 所有的数据都会在rowstore中存储,所以处理过程中不需要深拷贝,与全排序相比,少了N行深拷贝的时间。- 没有merge-sort时,做order by的下压是没有意义的,实现merge-sort之后,可以将order by以及limit+order by下压到每个分区去做,某些场景大大减少了数据的拉取和处理。​​

总结 优化无止境,性能对数据库来讲至关重要,不放过每一个可以优化的性能点,精益求精。路漫漫其修远兮,吾将上下而求索~

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:TiDB Operator扩缩容和集群的管理
下一篇:分布式数据库数据一致性的原理、与技术实现方案
相关文章