黄东旭解析 TiDB 的核心优势
447
2019-04-03
内容来源:http://mp.weixin.qq.com/s?__biz=MzI3NDIxNTQyOQ==&mid=2247488247&idx=2&sn=13a6c78580b666a4dff0b9cd278c0ddb&chksm=eb16359ddc61bc8b6490ff4cc0da52b5e86f63840ac5d32a1d5c693bbd1e73ea243ba8b1140b#rd
上周六,我们在上海、成都举办了两场 Infra Meetup:
在上海 · Infra Meetup No.94 上,我司核心开发工程师孙若曦为大家分享了 HTAP 平台的价值与挑战以及 TiFlash 的技术细节;eBay 大数据工程师王刚老师则为大家分享了 eBay 在 Spark SQL 上的探索和优化。
在成都 · Infra Meetup No.95 上,我司 TiDB SQL Engine 开发工程师姚珂男为大家介绍 TiDB SQL 层的技术原理。
以下是视频&文字回顾,enjoy~
PingCAP · 上海
Infra Meetup No.94
01. TiDB 与 TiFlash 扩展 - 向真 HTAP 平台前进
孙若曦,PingCAP 核心开发工程师
本次分享的内容主要包括以下三个方面:
1. HTAP 的核心价值:能够解决当前各类数据平台上广泛存在的工具链过于复杂,运维成本高,数据实效性和一致性等问题。
2. HTAP 面临的技术挑战:OLTP 场景通常使用行存,而 OLAP 场景通常使用列存;另外,OLAP 任务因为对系统资源占用较多,也会严重影响 OLTP 业务。
3. TiFlash 是如何解决这些问题的:
使用列存及向量化计算来满足 OLAP 业务;
数据使用 Raft Learner 机制同步到列存;
拥有与 TiDB 相同的 Scalability;
OLTP 与 OLAP 的物理资源完全隔离,避免互相干扰;
TiDB/TiSpark 能够同时访问行存和列存副本,通过 CBO 选取最优化的访问方式;
为 TiFlash 引入 MPP 能力。
02. eBay 在 Spark SQL 的性能优化
王刚,eBay 大数据工程师
本次 Topic 主要分享了 eBay 在 Spark SQL 上所做的一系列探索与优化工作。其中包括我们在 index 上所尝试 Bloom filter index,还有我们为了解决大表与大表 join 所做的一些方案,bucket join 和 range partition。MV 是我们在 Cache 上做的探索。新的 CBO 弥补了部分现有 Spark CBO 的缺陷,提供了更强大的 cost based optimize 的能力。
* 后台回复“94”获取本期 PPT 链接
PingCAP · 成都
Infra Meetup No.95
Introduction of TiDB SQL Layer
姚珂男,TiDB SQL Engine 开发工程师
本次分享主要介绍 TiDB SQL 层的三个组件:优化器,统计信息和执行引擎。
优化器部分主要举例介绍了逻辑优化规则和物理优化框架;
统计信息部分主要介绍直方图,CMSketch 以及使用方法;
执行引擎部分以两种 join 方式为例介绍了我们在执行引擎实现中用到的一些优化方法。
* 后台回复“95”获取本期 PPT 链接
PingCAP Infra Meetup
作为一个基础架构领域的前沿技术公司,PingCAP 希望能为国内真正关注技术本身的 Hackers 打造一个自由分享的平台。自 2016 年 3 月 5 日开始,我们定期在周末举办 Infra Meetup,与大家深度探讨基础架构领域的前瞻性技术思考与经验,目前已在北京、上海、广州、成都、杭州等地举办。在这里,我们希望提供一个高水准的前沿技术讨论空间,让大家真正感受到自由的开源精神魅力。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。