MongoDB的数据建模-PingCAP

MongoDB的数据建模

网友投稿 566 2023-04-28

***的数据建模

***是一种面向Document的NoSQL数据库，如果我们还是按照RDB的方式来思考***的数据建模，则不能有效地利用***的优势;然而，我们也不能因为Document的灵活性，就可以在设计之初放任自流。

适度的建模是非常有必要的，尤其对于相对复杂的关联关系。因为在***中，处理这种关联关系既可以使用Link，也可以使用Embedded。

我们要评价一种决策，不能将其与具体的上下文割裂开来做判断，那种单纯说A技术要比B技术好的做法，就像小孩子看卡通片里的人物只知道说谁是好人谁是坏人一般的幼稚。世界上没有一种***至善的技术，关键还是要结合场景来看使用是否得法。

例如使用Embedded方式，就各有优缺点。举例来说，倘若我们采用Embedded方式将Addresses作为Person对象内部的数组：

{ name: 'Kate Monster', ssn: '123-456-7890', addresses : [ { street: '123 Sesame St', city: 'Anytown', cc: 'USA' }, { street: '123 Avenue Q', city: 'New York', cc: 'USA' } ] }

当我们在查询Person的信息时，要获取其内嵌的属性细节，我们无需再执行多次查询。倘若我们改变一下领域场景，需要开发一个任务跟踪系统。如果我们将Tasks的信息嵌入到Person对象中，当我们面对以下需求：

显示所有明天到期的任务显示所有未完成的任务

采用这种Embedded就不那么令人愉快了。

如果采用Link方式，情况就完全不同了：

//Tasks [ { _id: ObjectID('AAAA'), task_number: 1234, taks_name: 'Prepare *** environment', due_date: '2017-01-15' }, { _id: ObjectID('BBBB'), task_number: 1235, taks_name: 'Import Test Data', due_date: '2017-02-15' }, ] //Persons { name: 'Kate Monster', role: 'Manager', tasks : [ ObjectID('AAAA'), ObjectID('BBBB') ] }

有得必有失，当我们需要查询Person承担的Tasks时，采用这种方式，就需要采用application-level join方式执行两次查询。

这种建模方式还带来另一种可能，就是原本Person->Tasks的one-to-N关系就可以变为N-to-N关系，因为一个Task可以被多个Person所拥有。如果采用Embedded方式，则会导致Task数据的冗余。

在文章 6 Rules of Thumb for *** Schema Design中，作者将这种1对N关联实现的判断依据划分为三种形式：

one-to-fewone-to-manyone-to-squillions

但我认为该怎么实现关联，应该从Entity之间的领域关系来判断，我们可以引入DDD的Aggregation设计概念作为建模的依据。简单来说，如果使用Embedded，可以认为该Entity处于Aggregation边界之内，对外应该通过Aggregation Root来访问。文章 6 Rules of Thumb for *** Schema Design的说法就是：

Will the entities on the “N” side of the One-to-N ever need to stand alone?

如果是Stand Alone，就意味着该Entity可以成为一个独立的Aggregation，然后再通过ID与另外一个Aggregate关联。

在SegmentFault上则有人做了如此总结：

FirstClass (比如“User”这种) 应该用独立的Collection"条目类型"的，应该 embedded两个模型之间如果是包含关系，用 embedded多对多关系，用 link(类似sql里面的foregin key)如果一个模型，其可能存的对象很少，那么就用独立的collection，这样有助于mongodb server做缓存embedded方式不利于做复杂的关联，复杂的查询embedded方式性能很有优势，如果你有“性能”方面的要求，可以考虑用embbed

戳这里，看该作者更多好文

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

566 2023-04-28

MongoDB的数据建模

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20