TiFlash、Spark SQL、TiDB SQL Layer | Meetup No.94 & 95 回顾

网友投稿 321 2019-04-03

内容来源:http://mp.weixin.qq.com/s?__biz=MzI3NDIxNTQyOQ==&mid=2247488247&idx=2&sn=13a6c78580b666a4dff0b9cd278c0ddb&chksm=eb16359ddc61bc8b6490ff4cc0da52b5e86f63840ac5d32a1d5c693bbd1e73ea243ba8b1140b#rd


上周六,我们在上海、成都举办了两场 Infra Meetup:

  • 上海 · Infra Meetup No.94 上,我司核心开发工程师孙若曦为大家分享了 HTAP 平台的价值与挑战以及 TiFlash 的技术细节;eBay 大数据工程师王刚老师则为大家分享了 eBay 在 Spark SQL 上的探索和优化。

  • 成都 · Infra Meetup No.95 上,我司 TiDB SQL Engine 开发工程师姚珂男为大家介绍 TiDB SQL 层的技术原理。

以下是视频&文字回顾,enjoy~


PingCAP · 上海

 Infra Meetup No.94


01. TiDB 与 TiFlash 扩展 - 向真 HTAP 平台前进



孙若曦,PingCAP 核心开发工程师


本次分享的内容主要包括以下三个方面:

1. HTAP 的核心价值:能够解决当前各类数据平台上广泛存在的工具链过于复杂,运维成本高,数据实效性和一致性等问题。

2. HTAP 面临的技术挑战:OLTP 场景通常使用行存,而 OLAP 场景通常使用列存;另外,OLAP 任务因为对系统资源占用较多,也会严重影响 OLTP 业务。

3. TiFlash 是如何解决这些问题的:

  • 使用列存及向量化计算来满足 OLAP 业务;

  • 数据使用 Raft Learner 机制同步到列存;

  • 拥有与 TiDB 相同的 Scalability

  • OLTP 与 OLAP 的物理资源完全隔离,避免互相干扰;

  • TiDB/TiSpark 能够同时访问行存和列存副本,通过 CBO 选取最优化的访问方式;

  • 为 TiFlash 引入 MPP 能力。


02. eBay 在 Spark SQL 的性能优化



王刚,eBay 大数据工程师

本次 Topic 主要分享了 eBay 在 Spark SQL 上所做的一系列探索与优化工作。其中包括我们在 index 上所尝试 Bloom filter index,还有我们为了解决大表与大表 join 所做的一些方案,bucket join 和 range partition。MV 是我们在 Cache 上做的探索。新的 CBO 弥补了部分现有 Spark CBO 的缺陷,提供了更强大的 cost based optimize 的能力。


* 后台回复“94”获取本期 PPT 链接


PingCAP · 成都

 Infra Meetup No.95


Introduction of TiDB SQL Layer



姚珂男,TiDB SQL Engine 开发工程师

本次分享主要介绍 TiDB SQL 层的三个组件:优化器,统计信息和执行引擎。

  • 优化器部分主要举例介绍了逻辑优化规则和物理优化框架;

  • 统计信息部分主要介绍直方图,CMSketch 以及使用方法;

  • 执行引擎部分以两种 join 方式为例介绍了我们在执行引擎实现中用到的一些优化方法。


* 后台回复“95”获取本期 PPT 链接

PingCAP Infra Meetup


作为一个基础架构领域的前沿技术公司,PingCAP 希望能为国内真正关注技术本身的 Hackers 打造一个自由分享的平台。自 2016 年 3 月 5 日开始,我们定期在周末举办 Infra Meetup,与大家深度探讨基础架构领域的前瞻性技术思考与经验,目前已在北京、上海、广州、成都、杭州等地举办。在这里,我们希望提供一个高水准的前沿技术讨论空间,让大家真正感受到自由的开源精神魅力。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Kubernetes 中如何保证优雅地停止 Pod
下一篇:北京 Meetup 预告 | Introduction to Titan
相关文章