数据库统计信息的自动挖掘与维护 & What's New in TiDB | Meetup 回顾

网友投稿 421 2018-11-27

内容来源:http://mp.weixin.qq.com/s?__biz=MzI3NDIxNTQyOQ==&mid=2247487226&idx=2&sn=002b323c1ac976dff61295d044c6eba1&chksm=eb162990dc61a0869b739bb11affcbe7531b17c255a5d4723948a20ebcfe6cab73edaa9ef108#rd


上海社区小伙伴们又相聚啦!在上周六举办的 Infra Meetup No.82 上,我司 TiDB 核心开发工程师韩飞、技术 VP 申砾为大家带来了干货分享,以下是现场视频&文字回顾,enjoy~


数据库统计信息的自动挖掘与维护


“韩老师硬核数学课”名不虚传

欢迎大家下次来现场听(看)Talk(白板)


韩飞老师首先介绍了查询优化器的基本架构与执行流程,并重点介绍了统计信息模块在基于代价的优化(CBO)中的重要作用。在谓词选择率估计(Selectivity Estimation)中,常用的属性独立假设(attribute value independence assumption)在列相关(Column Correlation)的场景下会产生较大误差。

在此次分享上,韩飞老师重点介绍了贝叶斯网络(Bayesian Networks)的解决方案,针对互相依赖的列,使用贝叶斯模型估计依赖关系,并建立多维直方图是一种非常有效的解决方案。另一个影响选择率估计的因素是统计信息的过期问题,根据查询结果的反馈更新直方图信息是一种行之有效的解决方案,但是通常会引入较大误差。通过引入最大熵原则(Max Entropy Principle)可以相对准确的解决直方图更新的问题,这种方法应用在 Informix 商业数据库中。


What's New in TiDB



申砾老师介绍了 TiDB 2.1 版本的重要 Feature,包括这些 Feature 所解决的问题、背后的原理、达到的效果,特别是 TiDB 在优化器、计算引擎、存储引擎方面的改进,使得 2.1 版本成为更智能、更迅速、更稳定的数据库。接着,申砾老师展示了部分 Benchmark 结果,分别从 OLAP、OLTP 两个场景表明 TiDB 的性能提升。最后介绍了下一步工作的展望,让大家了解 TiDB 的演进方向。


* 后台回复“82”获取本期 PPT 


PingCAP Infra Meetup


作为一个基础架构领域的前沿技术公司,PingCAP 希望能为国内真正关注技术本身的 Hackers 打造一个自由分享的平台。自 2016 年 3 月 5 日开始,我们定期在周末举办 Infra Meetup,与大家深度探讨基础架构领域的前瞻性技术思考与经验,目前已在北京、上海、广州、成都、杭州等地举办。在这里,我们希望提供一个高水准的前沿技术讨论空间,让大家真正感受到自由的开源精神魅力。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:捕获和增强原生系统的可观测性来发现错误
下一篇:TiDB Hackathon 的神秘评审团都是何方神圣?
相关文章