麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践
1076
2023-05-10
***迁移到MySQL,必须要搞明白这几个问题
从***迁移到MySQL需要考虑的事情其实远比我们要理清数据类型转换这些技术细节要多,也更重要。
有两个问题需要前置考虑:
为什么要从***迁移出去?
为什么要迁移到MySQL
如果解答了上述的两个问题,也就基本理顺了整个事情的脉络,我会本着基本客观的态度来说明。
问题1:为什么要从***迁移出去?
这件事情从行业的实践来看(主要是说互联网行业),绝对不是先从技术可行性触发,而是从业务可行性来入手,归根结底,主要的出发点就两个字:成本。
MySQL开源免费,更重要的是行业实践验证充分,所以它具有得天独厚的优势。阿里多年前的去IOE风风火火,俨然成为了行业的标杆。
成本的事情很微妙,三言两语说不清。举例来说,你可以使用Office来办公,当然你可能考虑买授权或者绿色版激活,但是如果使用WPS就是名正言顺的事情,当然功能上是和Office有一些差距,但是不会存在一些模糊的边界。
从业务的另一个维度来看,试想我们所接触的互联网行业,很多业务除了充值和钱相关的业务,其实对于数据完整性一致性的要求就会降低一个维度,很多时候钱能解决的问题都不是问题,比钱更重要的是什么,我觉得应该是安全,安全包括生命安全,行业安全,系统安全,这些绝对不允许出一些重大问题的,这些影响面太大,比如医院医生给患者开药的数据,这些影响面是很大的,一旦出问题很容易成为公众事件。而以金融级业务作为一个分界点,之上的是安全领域,之下的领域其实就是一些可选择的空间了,这些空间很大。选择商业的一个原因也在此,有技术兜底,这些成本对企业来说也是需要和厂商的绑定关系。稀里糊涂硬上,出了问题找不到专业的快速支持,那就悲剧了。
然后是开源定制,其实很多开源技术的开源协议是有差别的,我们采用开源技术也需要考虑这些协议的边界和适用范围。
所以到此需要明确的是:
1.成本因素需要权衡,绝对不是非黑即白的事情
2.迁移到MySQL其实不是***解决方案,只是一种可选的方案
3.对开源技术积累足够,技术把控能力要强
4.迁移的本质是找到最适合的业务场景,而不是为了技术实现而实现
对于第4点,举个例子,***从性能上是毫无疑问的,但是如果有海量的读请求,其实就不适合***来扛了,当然也不适合用MySQL,可能Redis的方案会更好一些。
问题2:为什么要迁移到MySQL
要回答这个问题,其实我们的主线就是MySQL可以做什么。
***还是成本,开源免费,方便定制,MySQL的可选方案可绝对不只有社区版,还有一系列的分支,比如Percona分支,MariaDB分支,存储引擎InnoDB,MyRocks等统统都是免费可选。
第二是MySQL效率高,足够轻量级。MySQL的效率从使用上来说,学习周期会很短,容易上手,而且对于系统的资源要求不高。
第三是水平扩展能力,把***比作地铁,MySQL比作公交车会更容易理解,我们可以很轻松的加开公交专线,但是加开地铁线路那就完全不同了。我觉得这是迁移到MySQL的一个核心点,这也就是为什么很多互联网的MySQL规模动辄几百几千了,爆发式增长的业务,MySQL扩展能力了不是体现在MySQL数据库本身,而是对于架构的扩展性上,而这也就是为什么很多MySQL DBA比较贵的一个原因。
第四是复制,这是MySQL相比***的一个亮点,如果需要做跨数据中心的复制,允许存在一定的延迟,使用MySQL原生的复制方案是一件很容易的事情,MySQL支持很多不同维度的复制方案。
第五是业务轻依赖,这个可以分为两个维度来说。一个是功能限制,一个是性能限制。这本身是MySQL功能和性能上的缺失,但是反而是一个优点因为要支撑分布式需求,需要业务对数据库的依赖要更轻巧一些,原本支持不好的存储过程就可以很自然的弱化了。
第六是开源带来的生态体系,开源红利带给企业的是很多的技术方案选择,让原本需要花钱买的事情变成了我们干我们用。
问题3:从***迁移到MySQL需要考虑的事情
首先是架构的差异,在***和MySQL里面的差异还是比较大的,当然***里面也是可以使用同义词的架构来实现类似MySQL的访问模型的。
数据类型的差异其实是比较具体的技术细节,我举一些补充的。
***里面的Null和空串都可以按照null来处理,但是MySQL里两者是不同的。
***表名,用户名都是有长度限制,在30个字符以内,在MySQL里长度要大得多,尤其是表名就需要注意了。
***里会默认统一按照大写来处理,MySQL里面默认是大小写敏感的。
对于MySQL类型在MySQL里需要考虑的细节较多,比如数值型,***里面number搞定,MySQL有一系列的数值类型可以选择,不建议大一统的big int适配所有需求。
要更清晰的回答注意事项,可以归类为一个问题:MySQL相比***少了些什么?
性能上肯定有差异,我们主要理一理功能上的。比较的原则不是说***有一定要MySQL有,而是从一些使用场景上来说更好的使用特性。
存储过程支持有限,这是很多企业的技术债,处理好了是坦途,处理不好是大坑。比如存储过程,硬要用存储过程调用来对接,后期后患无穷。没有同义词没有db link,这个特性MySQL里不支持其实是件好事,杜绝了那种跨库关联的需求。没有sequence,这个MySQL的自增列完全可以弥补。没有物化视图,难以实现增量刷新的需求。分区表有,但是很少用优化器薄弱,多表关联,Hash Join在MySQL里还是一个弱项。索引的差异,覆盖索引的实现两者差异也很大。绑定变量的性能差异不大,***里面敏感的绑定变量问题在MySQL里不是问题。性能工具,MySQL里面的性能工具还是比较少的,而且粒度和效果有限。
小结一下:
迁移的本质是找到最适合的业务场景,而不是为了技术实现而实现。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。