TiFlash、Spark SQL、TiDB SQL Layer | Meetup No.94 & 95 回顾-PingCAP

TiFlash、Spark SQL、TiDB SQL Layer | Meetup No.94 & 95 回顾

网友投稿 581 2019-04-03

内容来源：http://mp.weixin.qq.com/s?__biz=MzI3NDIxNTQyOQ==&mid=2247488247&idx=2&sn=13a6c78580b666a4dff0b9cd278c0ddb&chksm=eb16359ddc61bc8b6490ff4cc0da52b5e86f63840ac5d32a1d5c693bbd1e73ea243ba8b1140b#rd

上周六，我们在上海、成都举办了两场 Infra Meetup：

在上海 · Infra Meetup No.94 上，我司核心开发工程师孙若曦为大家分享了 HTAP 平台的价值与挑战以及 TiFlash 的技术细节；eBay 大数据工程师王刚老师则为大家分享了 eBay 在 Spark SQL 上的探索和优化。
在成都 · Infra Meetup No.95 上，我司 TiDB SQL Engine 开发工程师姚珂男为大家介绍 TiDB SQL 层的技术原理。

以下是视频&文字回顾，enjoy~

PingCAP · 上海

Infra Meetup No.94

01. TiDB 与 TiFlash 扩展 - 向真 HTAP 平台前进

孙若曦，PingCAP 核心开发工程师

本次分享的内容主要包括以下三个方面：

1. HTAP 的核心价值：能够解决当前各类数据平台上广泛存在的工具链过于复杂，运维成本高，数据实效性和一致性等问题。

2. HTAP 面临的技术挑战：OLTP 场景通常使用行存，而 OLAP 场景通常使用列存；另外，OLAP 任务因为对系统资源占用较多，也会严重影响 OLTP 业务。

3. TiFlash 是如何解决这些问题的：

使用列存及向量化计算来满足 OLAP 业务；
数据使用 Raft Learner 机制同步到列存；
拥有与 TiDB 相同的 Scalability；
OLTP 与 OLAP 的物理资源完全隔离，避免互相干扰；
TiDB/TiSpark 能够同时访问行存和列存副本，通过 CBO 选取最优化的访问方式；
为 TiFlash 引入 MPP 能力。

02. eBay 在 Spark SQL 的性能优化

王刚，eBay 大数据工程师

本次 Topic 主要分享了 eBay 在 Spark SQL 上所做的一系列探索与优化工作。其中包括我们在 index 上所尝试 Bloom filter index，还有我们为了解决大表与大表 join 所做的一些方案，bucket join 和 range partition。MV 是我们在 Cache 上做的探索。新的 CBO 弥补了部分现有 Spark CBO 的缺陷，提供了更强大的 cost based optimize 的能力。

* 后台回复“94”获取本期 PPT 链接

PingCAP · 成都

Infra Meetup No.95

Introduction of TiDB SQL Layer

姚珂男，TiDB SQL Engine 开发工程师

本次分享主要介绍 TiDB SQL 层的三个组件：优化器，统计信息和执行引擎。

优化器部分主要举例介绍了逻辑优化规则和物理优化框架；
统计信息部分主要介绍直方图，CMSketch 以及使用方法；
执行引擎部分以两种 join 方式为例介绍了我们在执行引擎实现中用到的一些优化方法。

* 后台回复“95”获取本期 PPT 链接

PingCAP Infra Meetup

作为一个基础架构领域的前沿技术公司，PingCAP 希望能为国内真正关注技术本身的 Hackers 打造一个自由分享的平台。自 2016 年 3 月 5 日开始，我们定期在周末举办 Infra Meetup，与大家深度探讨基础架构领域的前瞻性技术思考与经验，目前已在北京、上海、广州、成都、杭州等地举办。在这里，我们希望提供一个高水准的前沿技术讨论空间，让大家真正感受到自由的开源精神魅力。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

581 2019-04-03

TiFlash、Spark SQL、TiDB SQL Layer | Meetup No.94 & 95 回顾

黄东旭解析 TiDB 的核心优势

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

TiFlash、Spark SQL、TiDB SQL Layer | Meetup No.94 & 95 回顾

微信扫一扫：分享

推荐文章

友情链接

热评文章