行业挑战
金融行业传统数据服务按面向的群体划分为客户服务、运营管理两个维度。对客户服务部分通过 OLTP 类关系型数据库承载高并发、低延时特性的实时交易场景;对于运营管理类需求,通常基于文件交换或 ETL 技术,将对客部分的 OLTP 数据离线同步到下游的 OLAP 类分析型数据库,并通过面向主题的数据仓库模式,采用批处理对大数据集进行复杂计算,将结果应用于报表分析、监管报送、财务/风险管理等面向经营分析的场景。
传统模式的特征是数据产生到处理时效性差、数据附加值低,难以应对移动互联网、场景金融时代对于数据实时应用能力的诉求。数字化转型对数据服务模式带来的挑战包括:
- 多源/多分片的数据实时汇聚能力;
- 基于持续变化数据的管理模式;
- 持续/及时/高效获取“新鲜数据”;
- 多场景/多维度的灵活数据计算能力;
- 动态的数据加工与更新;
- T + 0 实时数据服务化能力。
解决方案
基于 TiDB 的综合数据服务平台架构
- 平台由数据采集、数据预处理、实时/离线数据存储、数据服务等功能组件,以及资产管理等运营组件构成;
- 支持多种采集方式,包括 CDC、消息中间件+流式计算框架的实时方式,以及与离线数仓/大数据平台交互的 ETL 方式;
- 基于 TiDB 的弹性扩展、HTAP 能力实现实时数据的集中存储和混合式处理,并与离线数仓形成有益的互补;
- 数据服务可基于 TiDB 实现基于标准 SQL、无需考虑分片键的扩展性设计能力;
- 简化传统实时分析领域的技术栈、运维复杂性。
上述解决方案能够解决海量行为数据的实时汇聚、流式计算,并提供兼顾高并发访问、交互式分析、功能灵活扩展的数据快速变现能力,弥补传统分析领域在实时处理方面的不足。
方案优势
- 在线水平扩展和弹性伸缩能力;
- 微服务/单元化架构下的数据实时汇聚和消费能力;
- HTAP 架构兼顾实时分析领域的高并发访问和交互式分析诉求。