金融数据架构设计观,数字金融时代央行数据架构分析

4747 949 2023-06-05

本文讲述了金融数据架构设计观,数字金融时代央行数据架构分析

如果一个城市缺少对道路交通、水电管网等基础设施的统一规划设计,住宅、商区等建设不能良好融入全市基础设施标准,那么这个城市将面临管理混乱和潜在风险,一场突来的自然灾害会使城市陷入危险之中难以应对。
如果把一个金融企业比喻为一座城市,那么企业内各领域业务系统就是城里分工协作的功能区,而在这些业务系统底部永远默默流动的数据就是支撑金融城市有序运转的基础设施。
早先时代金融城市规模小,只注重功能发展而忽略基础设施统一建设不会有大问题。而今大不相同,几乎所有业务都搬到线上运行,各系统交互协同,数据量和复杂度日益剧增。数据治理、数据使用、数据监管等工作面临巨大难度和挑战。为此,对一个金融企业的数据层进行统一规划设计变得尤为重要。

监管要求

一座繁华大城市的基础设施缺陷可能因为一场暴雨而付出惨重代价,甚至陷入瘫痪。一家大型金融企业的底层数据关系堪比一座现代城市的复杂管网线路,如果因为数据架设缺陷而引发问题,其危害程度也是难以估量和承受的。
金融监管的主要目的之一是提前发现和消除各类系统性隐患,避免金融企业陷入各种危机。找出隐患最快速有效的方法是剥开表层繁华业务,直接深入到系统底层数据,通过各角度逻辑检查与核对而发现金融业务可能存在的缺陷与风险。因此,制定监管数据标准、提出数据报送要求、督促企业合规整改是金融监管的主要手段。
这如同考察万顷良田,关注点不在于庄稼的品种和长势,而是俯身到株苗底部,观察是否有齐整的株距、通顺的畦垄,从而判断是否具有坚实的水利规划设计和安全的抗旱排涝能力。
金融监管不是暴风雨,但形同一场暴风雨测试。对于数据架构与建设存在缺陷的企业,会面临巨大压力。压力也是动力,数据治理是每个金融企业的必经之路。
如今金融企业之间的竞争不再只是业务领域一城一地的得失,完善的数据架构与建设、强大的数据治理能力正逐渐成为证明企业实力和发展潜能的重要方面。

源数据治理

金融企业随着辖内各领域业务的发展延伸,表层业务流程不断交叉渗透,甚至整合重建;底层数据关系和数据流程也必然随之相应整改和疏通。
不同业务领域之间有隐形的边界,各领域内自然是根据业务分工和职责范围而考虑和安排自己的系统建设;但是底部的数据层却不适合由各部门甚至具体应用系统实行划疆而治。
这如同各省区内建设与全国航空线、铁路网建设的关系,大共享资源必须站在全辖角度进行整体统筹、尽早规划,并自成体系、独立管理,而不能由各省根据自身参差不齐的经济状态、发展需要而各自规划实施。可以想象,假如是那种割裂自治的局面,全国交通运输该是多么低效和混乱。令人头疼的省区边界断头路、造成巨大浪费的重建项目等等,都是没有一体化规划建设的苦果。
企业源源不断产出的业务数据,应是全辖共建共享的资源,须满足内部管理、监管报送等全局性需要,同样应该由专职部门进行统一规划、独立管理,保证全辖数据统一标准、统一质量,避免数据孤立、断裂、臃肿、堵塞等问题。
实际上由于业务系统发展进度不齐、早期缺少统一规划设计等历史原因,很多金融企业的数据状况不容乐观。而迫于内部管理和外部监管压力,以及加强数据自身建设的需要,数据治理势在必行。
数据一体化治理牵扯到相关业务系统各个角落,而业务系统自身还忙着日常的改造提高,在发展中整改,如同旧城改造,难度很大。数据治理的问题不在于具体应用系统的整改,而在于统一规划管理和协同改造实施,必须有正确的策略和方法。否则付出巨大精力和代价,补标准,补制度,补了一层又一层,结果可能是治标不治本,痼疾难改,陷入重复老路的无效循环中。
数据治理是一项独立性和专业性都很强的工作,应由专职数据管理部门牵头负责,统一规划实施。业务人员只要集中精力负责提出和验收自己的业务需求,不需关心潜藏在系统底层的具体数据标准、数据设计等问题;开发人员只要负责具体应用系统的功能实现,在进行数据设计时要遵照统一数据规范和接口要求;专职数据管理人员则需要基于宏观角度分析,及本企业的业务结构,制定全辖数据架构、数据流图和各类业务公共数据标准等。只有经过以上合理分工、协作配合,数据治理工作才能取得突破性进展和成效。

数据提取使用

源数据治理是长期校正的过程,而数据使用的高标准要求刻不容缓,特别是严格的监管数据报送,不会因为企业的数据质量差而降低标准。因此如何在现有源数据状况下提取和加工出高质量的结果数据,也是一个重要问题。
数据服务需求源源不断而且越来越具有综合性和复杂度,然而可能面临以下困难。首先可能没有数据地图和索引指南,来指导如何从庞大的数据源中定位所需数据;其二可能找到多份相似数据源而难以抉择,或者遭遇数据缺失;其三每次数据分析路径因人而异,映射逻辑不标准,造成数据质量不稳定甚至严重误差;其四是数据服务过程,重复原始投入,产出十分低效。
以上数据使用问题也存在与源数据治理相似的原因,首先是没有统一管理,或大或小的数据服务需求各自竖井式实施,每次临时组队应战,基本依靠个人能力和经验的发挥,而没有组织级的映射知识和经验积累来保证质量;再就是对于疑难和缺口数据没有组织级的统一研究和解决方案;然后是没有统一的数据加工线,没有统一的数据验证规则保证一致口径的数据输出,等等。
数据提取使用直接面对和承接源数据质量的现实压力。在源头数据治理不能全面快速见效的情况下,可以通过有效的后线数据使用策略,达到较理想的应用目标。总体策略可以参照生活中超市的模式进行后线数据服务架构设计。首先要有统一的数据仓库并配有加工车间和专职数据服务人员。服务人员对全辖入库源数据进行分门别类的上架、贴签,并建立数据索引图,提供给业务和开发等数据需求人员使用。超市除提供贴源和基础数据,还可提供粗加工、半成品甚至全成品的加工服务。所有数据需求都能轻松找到合适的服务窗口,不用再各自去纷繁的源数据中海选、甄别和提取,而只需要在数据超市导航员的指导下把数据需求描述清楚,即可立等获取所需数据。

金融数据架构设计观

金融企业数据管理是全局一体的系统工程,必须由独立于业务领域的专职部门统筹规划设计和落地实施。缺乏全局视野的片面数据治理可能陷入责任边界不清、管理举步维艰的境地。可以说,有整体则有成功,无整体则无成功。在此给出一种金融企业整体数据架构设计观点(如下图),并进行讨论。


数据从产生到使用的管理工作可分三个层次,即源数据层、基础数据层和数据服务层。源数据层的主要参与者是系统开发人员和数据管理人员,业务人员配合。数据人员为各业务系统需要进入全辖仓库的数据制定接口,开发人员根据业务需求和数据接入要求自行设计系统内功能。并不是所有源数据都需要入仓,只有对全辖有贡献价值的必要数据才纳入全局视图,只用于系统自身的细枝末叶数据不纳入整体管理。
基础数据层工作主要由数据管理人员承担。经过数据接口进来的数据本来就符合整体架构定位和质量要求,入仓后各就各位。在此阶段将从多个视角来审查和整理数据,首先是全局平面视角,所需数据都应该齐备,缺失的数据应补录完整;然后为满足一些专项业务需要,可能需要加工轻度汇总或少量冗余数据。在基础数据对外提供之前,要使用统一数据验证规则对整体数据进行全方位校验,保证出仓数据达到一致的质量要求。
基础层数据主要输出给数据集市,如风险集市、监管集市、管理信息等,并有必要建一个公共集市,以服务较零散的小数据需求。数据在集市内再面向具体应用进一步加工而满足应用。数据服务层的主角是后线系统开发人员,数据人员提供数据映射支持。比较紧急或者特别简单的数据需求,可以走绿色通道直接提取;一般指标项通常会拆成适当零件,放到集市层或仓库层数据车间的适当流水线上加工。这些零部件可能是面向全辖应用的标准件,也可能是面向独特需求的定制件。最后将零部件经过简单组装就可以完成数据服务任务。

数据架设实施方略

将千头万绪、繁生不止的数据疏通好、管理好、利用好,架设出完整贯通的数据动脉,让重要业务数据都有序接入,让所有数据需求都获得高效保质服务,是一项艰巨的工作,下面这些策略方法有助于获得成功:
首先强调设立专职数据管理实体部门,负责数据架构建设、数据流程梳理、数据字典编制、数据规范和数据主干接口制定、数据使用指导和数据映射支持,以及相关组织动员和全局协调等日常工作。企业有哪些数据,分布在哪里,数据间的关系,如何使用,存在的问题等等,都由该部门负责汇报。
然后是尽早梳理出全辖数据流程和数据字典,最实用的办法是综合分析研究几大监管机构的报送数据要求,并结合企业自身的核算体系和业务主线,以及参考同业经验,进行综合分析设计;还要对数据字典制定配套的数据验证规则和数据索引地图,并保持对数据字典的持续更新。数据字典的使用可能是企业所有人员,但字典编纂和维护工作一定是归专业数据人员。
注重数据分析人员培养,提高数据架构设计能力,保证数据管理水平与业务系统建设并驾齐驱。金融业不断有新业务产生,业务在变,监管也在变,局部数据逻辑常出现较大变化,因此数据管理人员必须紧跟业务发展,保持数据架构和数据字典的有效和实用。数据管理人员需要大概了解所有金融业务,精通关键数据关系,保证新业务延伸不脱轨全局数据脉络,保证旧系统改造符合数据治理要求。业务人员和系统开发人员的工作是局部的,而专职数据人员一定要站在全辖角度,对整体数据工作胸有成竹。
数据架设与数据管理是金融企业的基础工作,不显山露水,不直接带来经济效益,但是必不可缺。需要所有部门在工作中多承担一些配合,多付出一份牺牲。为了在数字金融潮头筑牢根基,稳操胜券,这点代价无疑是值得的。数据工作不是一场轰轰烈烈的战役,而是需要紧抓不懈、贯彻始终的日常。

一、引言

党的十八大以来,以习为核心的党中央把创新摆在国家发展全局的核心位置,大力实施创新驱动发展战略,开创了新时代经济社会发展新局面。在此背景下,金融科技方兴未艾,推动金融业态进行深刻变革,央行出台金融科技发展规划,推动构建金融与科技深度融合、协调发展的新生态。金融机构也加速金融科技统筹布局,通过设立子公司、混合所有制、股权期权等手段推进组织架构重塑,把科技元素注入业务全流程,显著提升金融服务质效。目前,已有11家全国性银行成立金融科技子公司,金融业科技“含金量”进一步提升,创新活力得到充分释放,为应对突如其来的疫情,人民银行等五部委联合推出三十大举措支持金融防疫,不仅满足了人民群众正常的金融服务需求,而且为打赢疫情防控阳击战、维护经济稳定发展提供了强有力的支持。金融机构也纷纷推出各种“非接触式”服务,加码拓展线上业务,推动金融与衣食住行、医疗教育等场景深度耦合,提升金融服务的可得性。截至2020年底,全国银行业离柜率近90%,疫情期间社会公众足不出户便能办理金融业务,数字金融日新月异的发展会对金融行业产生哪些影响,央行的数据架构现状如何,是否符合业务发展趋势,能否跟上监管科技应用的步伐并引导金融机构业务数字化健康发展本文将深入探讨。

二、数字金融发展对金融行业的影响分析

黄益平等认为"数字金融泛指传统金融机构与互联网公司利用数字技术实现融资、支付、投资和其他新型金融业务模笔者认为,数字金融是指将互联网及信息技术手段与传统金融服务相结合的新一代金融服务,比互联网金融、式"金融科技的内涵更加广泛,其主要特征是对海量数据的综合分析和再利用,实现利益最大化。我国数字金融的发展源于互联网企业,随后扩展到传统金融机构,并催生大量P2P网贷平台,整个金融行业呈现百花齐放的态势。(一)有效推进普惠金融发展。我国政府自2006年起大力推动普惠金融发展,采取了诸如成立小额信贷公司、在金融机构成立"普惠金融业务部”以及在农村进行“两权抵押试点”等举措。但这些措施收效并不明显。随着信息技术的快速发展,移动互联网克服了地域、时间的限制,其与金融的整合,为推动普惠金融发展提供充足动力。《中国普惠金融指标分析报告(2019年)》显示,全国使用电子支付的成年人比例为85.37%,比上年高2.98个百分点:农村地区使用电子支付的成年人比例为76.21%,比上年高4.06个百分点,电子支付使用普及率持续提升,城多差距进一步缩小。在人均银行网点数、ATM机具、POS机具数有所下降的情况下,边远地区金融服务可得性不断改善,数字渠道在增强可得性方面愈加重要。另外,金融机构借助大数据、人工智能、区块链等技术重构传统信贷业务流程,优化供应链资金供给,引导金融资源配置到经济社会发展的关键领域和薄弱环节,推动实现小微企业融资服务增量扩面、提质增效,利用数据挖掘、情景感知等手段,推动金融与衣食住行、医疗教育等场景深度融合,实现主要民生领域金融服务广看盖,进一步推动金融事民利企。截至2020年12月末,普事小微贷款余额15.3万亿元,同比增长30.9%,较好地实现了金融活水向小微企业精准式滴灌。 (二)提高金融运营效率。业界普遍认为,中国数字金融的开端是支付宝的上线,并随着其业务的不断扩大而逐步发展壮大。特别是2013年余额宝上线后,互联网金融遍地开花,各种网贷平台层出不穷,使得传统金融机构感受到巨大压力,纷纷投入对数字金融的研究与应用中。经过多年发展,国内各金融机构已经利用信息技术实现数字经济转型。即通过大数据、云计算、区块链及人工智能等技术,对大量数据进行挖掘和利用,实现客户画像、产品设计、精准营销、风险管理等多场景应用,不仅让机构在产品定价上更加科学合理,也使其对客户具有更加清晰的了解,有利用降低运营成本和风险控制。(三)大幅增加监管难度,数字金融的大背景下,金融混业经营更加普遍,创新金融产品往往融合多种业务甚至多人行业,其相互关联渗透,跨界混业更加明显,单个市场风险可能沿着资金链、担保链扩散到多个市场。而监管机构在对这些金融产品进行监管的过程中,显得行动迟缓、力不从心。金融科技的应用使得金融主体与监管机构之间产生严重的信息不对称性。通过传统的监管方式难以及时获取最新的金融行业数据,而数据的缺乏,导致无法就当前的形势作出准备的判断和监管决策,而且,金融科技的应用还让"持牌经营”的底线受到挑战,绕开监管的现象频繁出现,如P2P、现金贷和ICO等。

三、央行数据架构的基本情况

(一)央行业务信息化已经基本实现。经过20余年的建设,根据数据集中与资源整合的原则,央行稳健落实“两级数据中心”的总体布局,业务与技术进一步融合。目前已建立起看盖各业务条线的应用系统,包括国库、货币发行、支付清算、账户、征信、会计核算、外汇管理等。据统计,截至2019年末,在人民银行系统内,总行共推广全国通用性业务系统82个,各省级分支机构根据各地业务特色和需要,自建信息系统并在辖内地市分支机构推广使用。截至2020年一季度,成都分行辖内在用自建业务信息系统93个,其中省数据中心集中运行的55个,地市一级部署运行的38人这些系统的推广使用为央行及分支机构执行货币政策、维护金融稳定、提供金融服务的职能提供了坚实的技术基础。(二)数据架构维形初步实现。通过大量信息系统的建设,当前人民银行基本实现了关键业务数据的集中存情,部分应用系统已积累了海量业务数据。这些数据为大数据技术在央行业务发展和深度应用方面奠定了一定基础。央行各应用系统的数据架构设计虽各有特色,但均设计有数据接口层和数据存储层。数据接口层负责将不同来源、不同格式的数据入库落地。该层数据存储的时候,会依据数据对接的方式以及增量或者全量报送模式,采取相应的分区或分目录来存储报送的内容。数据存储层是所有后期分析的数据基础,存放与源系统基本一致的所有明细数据。如调查统计业务,央行制定统一的数据报送标准和要求,金融机构通过接口、报文、手工等多种方式报送数据,业务系统通过数据接口层对机构报送的数据进行统一的数据校验和格式转换等操作,校验通过后再将数据存储到后台数据库,即数据存诸层,用于业务处理分析等后续工作。(三) 央行数据治理架构基本成型。在参照金融业数据治理实践经验的基础上,结合央行实际特点和需求,将数据治理框架体系的设计分为两个部分,一是数据治理的核心领域,二是数据治理的保境机制,数据治理核心领域是指教据治理的目标对象,句括数据的标准、质景,元数据,安全,生命周期等用绕数据的8人核心领域,明确了数据治理工作需要管控的对象,数据治理保机制是指保障各人核心领域的内容有效落地执行的管理机制,包括数据治理的组织、制度、流程以及技术支撑4个方面,确保管控对象始终保持完整性和准确性。两个领域的内容共同形成央行“八横四纵”的数据治理矩阵结构。

四、央行数据架构方面存在的问题

一)数字治理标准参差不齐。人民银行总行、分行及地市一级建设的众多信息系统中,绝大部分开发较早、业务系统架构不统一,即便是同一部门的不同系统数据也不能互联互通,数据共享整合难度较大,而且在各业务系统建设过程中,仍然以业务条线为主导,在数据资源管理上基本采用“数据跟着系统走”的做法,由各业务系统对自身的数据资源进行管理。在数据的治理和应用中,仍然存在数据存储和使用不规范等现象,内部不同业务条线存在数据标准不统一、数据应用存在重复交叉、几余数据较多、数据缺乏一致性、数据质量要求不一、缺乏统一的组织管理等问题从而产生数据冲突,对高效精准履职产生消极影响。 (二)数据利用不充分。近年来,随着“两级数据中心”总体布局的落地实施,各级数据中心已经收集存储了大量的业务数据。但各业务系统相互独立,对这些数据的分析利用,仍然局限于各业务系统或业务条线内,数据孤岛问题突出,严重阻碍了数据的分享和利用。同时,不同业务条线存在重复收集数据的现象,不仅增加了金融机构的负担,降低工作效率,而且难以保证数据的一致性。随着“数字央行”建设进程的不断推进,越来越多金融机构的数据汇聚到央行大数据平台。这些海量的金融市场数据、客户交易数据和个人行为数据,具有极大的分析和利用价值。 (三) 数据安全管理有待进一步加强。当今社会,数据已经成为社会经济发展的关键生产要素和基础性战略资源,需要高度重视数据安全问题,在数据采集、传输、使用以及销毁等数据全生命周期中,均存在数据安全相关风险。当前央行“两级数据中心”采取的数据安全防控措施相对较散,部署的入侵检测、防火墙、一体化等主要针对网络和终端层面的攻击检测,缺乏应用安全、内容安全和高级威胁检测的能力和措施,未形成以数据安全防护为核心的安全保障体系,无法有效识别隐藏在业务内部的风险,导致数据在流转过程中做不到可见、可控,防范数据滥用和数据泄露的手段相对匮乏。 (四)对新业态的监管滞后。我国金融监管体系主要是对银行、证券和保险等传统金融机构的分业监管。虽然在2018年4月成立了中国银行保险监督管理委员会,负责依照法律法规统一监督管理银行业和保验业,维护银行业和保险业合法、稳健运行,但仍夫从根本上改变分业监管的格局,在分业监管模式下,监管主体的监管行动是根据细分的金融市场和金融业务来确定的,不同的监管机构只针对在其职责范围内的金融业务和产品的风险加以规范和管理。而数字金融是多领域混业经营,具有明显的跨界特征,需要多部门综合监管,传统金融监管无法对其下常发挥作用。另一方面,各监管机构在数据分析成果共享、监管协同方面沟通协调不够,导致对跨行业金融行为监管缺失或不足。

五、对数据架构改进的建议

(一)建立统一的数据治理标准,奠定数据应用基础。一是细分账户体系粒度,完善金融元数据建设,央行已经了有关二三类账户的规则设定,客户账户是客户金融能力和行为的基本体现,二、三类账户丰富了金融应用场景。应反洗钱要求,KYC (KnowYourCustomer) 原则促使银行等金融机构对账户使用者的基础信息进行可信的维度扩展。账户的多维度建设使金融元数据标准化,可信、可分类、可聚合,形成金融物联网中的数据节点基础库。二是建立对银行机构的数据治理监督评估体系。银行机构的数据质量直接影响央行的数据治理应用效果,应设立金融数据标准化和过滤规则,汇聚金融数据池。三是规划全局数据架构,建立跨部门、跨机构、跨领域的数据共享与融合应用机制,打破数据壁垒。央行通过各经济活动、金融业务的数字化规范,精准对接备金融机构生产数据,包括信贷数据、消费数据、产业供应链数据等,形成央行金融数据池,有关金融和经济的上下文数据流形成闭环金融数据池生态圈,并不断迭代更新、进化。(二)建立数据共享机制,深挖数据价值。一是内部数据的共享。以“数字央行”建设为契机,深入推进数据治理工作,制定统一的数据标准、数据模型和数据架构,推动各类数据的融合应用。摸清数据资产状况全面梳理央行拥有的数据资源清单,并持续进行维护,形成动态管理的数据资源目录。在央行内部各业务条线之间各级分支机构之间建立一套切实可行的数据共享机制,搭建数据共享平台,让数据能够在各部门之间、各层级之间高效流动,同时保证数据的一致性和准确性,实现数据一次采集,多系统共享,减少重复收集数据的工作量,提高金融监管效率。二是外部机构之间的数据共享。对外构建央行与政府及行业相关部门、金融机构间的数据共享机制,目前部分机构已就欺诈管理、数据风控等特定模块进行开放。分析消费金融就是通过分析客户的资产数据、金融产品、风控3类资源的分布情况,对消费金融进行引导,并把数据分析结果共享给金融机构,调整金融服务和产品策略制定。将用户金融行为分析的各行业发展数据,应用于政府其他部门进行产业调节等,不断以数据驱动的方式进行模式发现、反馈、共享,关注经济活动和金融行为数据流指向的业务途径和用户意向,建设央行数据计算平台,为深入挖掘数据价值提供支撑。(三)深入挖掘数据资源,提升监管效能。建立数字化监管规则库、监管知识图谱和智能化数字监管平台,实现监管规则形式化处理、数字化转译和程序化服务,提升金融监管的智能化水平。建设多方联动的风险态势感知平台,通过复杂网络、深度学习等手段,建立健全金融风险监测预警和早期干预机制,早识别、早预警、早发现、早处置,切实增强防范化解金融风险的能力。例如,央行制定的反洗钱实施细则等有关金融合法合规性的要求定程度上需要依靠人的经验、数据后期的分析结果来进行事后审查,如果对金融行为数据模式进行匹配,做到KYD(KnowYourData),充分挖掘数据隐含的信息,实现内控规则、风控模型与交易流程的有机融合,则可以在非法金融行为(如洗钱、地下钱庄、涉恐等) 进行的路径中进行截断、裁第。 (四)加强数据安全管理,防范隐私泄露。完善配套的数据安全防护和数据分级保护技术手段,规范引导建立金融业数据市场,及时制止金融业数据违规流通行为。设计安全的数据采集应用规则,排除数据滥用和个人金融行为隐私泄露风险。各行业机构生产消费、个人消费涉及多个金融机构以及各行各业,每个机构拥有部分数据,央行在采集后形成全量数据,对行业机构和个人的经济、金融样貌进行真实刻画。央行采集存储的数据应是安全可信的,数据分析后的结果应用于各行业机构雾隐去明细和不相关的特征,留下个人金融行为黑盒子金融特征输出和鲜明、准确的统计数据散列,并避免反推原始数据明细样貌.

上文就是小编为大家整理的金融数据架构设计观,数字金融时代央行数据架构分析。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:用MySQL实现分布式锁,你听过吗?
下一篇:SQL Server优化:SQL Server中Nolock关键字的用法
相关文章