MongoDB、Hbase、Redis等NoSQL优劣势、应用场景-PingCAP

MongoDB、Hbase、Redis等NoSQL优劣势、应用场景

网友投稿 1227 2023-05-08

***、Hbase、Redis等NoSQL优劣势、应用场景

NoSQL的四大种类

NoSQL数据库在整个数据库领域的江湖地位已经不言而喻。在大数据时代，虽然RDBMS很优秀，但是面对快速增长的数据规模和日渐复杂的数据模型，RDBMS渐渐力不从心，无法应对很多数据库处理任务，这时NoSQL凭借易扩展、大数据量和高性能以及灵活的数据模型成功的在数据库领域站稳了脚跟。

目前大家基本认同将NoSQL数据库分为四大类：键值存储数据库，文档型数据库，列存储数据库和图形数据库，其中每一种类型的数据库都能够解决关系型数据不能解决的问题。在实际应用中，NoSQL数据库的分类界限其实没有那么明显，往往会是多种类型的组合体。

主流nosql的详解：***、Hbase、Redis

***

*** 是一个高性能，开源，无模式的文档型数据库，开发语言是C++。它在许多场景下可用于替代统的关系型数据库或键/值存储方式。

1.***特点

所用语言：C++ 特点：保留了SQL一些友好的特性（查询，索引）。使用许可： AGPL（发起者： Apache）协议： Custom, binary（ BSON） Master/slave复制（支持自动错误恢复，使用 sets 复制）内建分片机制支持 javascript表达式查询可在服务器端执行任意的 javascript函数 update-in-place支持比CouchDB更好在数据存储时采用内存到文件映射对性能的关注超过对功能的要求建议***打开日志功能（参数 --journal）在32位操作系统上，数据库大小限制在约2.5Gb 空数据库大约占 192Mb 采用 GridFS存储大数据或元数据（不是真正的文件系统）

2.***优点：

1）更高的写负载，***拥有更高的插入速度。

2）处理很大的规模的单表，当数据表太大的时候可以很容易的分割表。

3）高可用性，设置M-S不仅方便而且很快，***还可以快速、安全及自动化的实现节点（数据中心）故障转移。

4）快速的查询，***支持二维空间索引，比如管道，因此可以快速及精确的从指定位置获取数据。***在启动后会将数据库中的数据以文件映射的方式加载到内存中。如果内存资源相当丰富的话，这将极大地提高数据库的查询速度。

5）非结构化数据的爆发增长，增加列在有些情况下可能锁定整个数据库，或者增加负载从而导致性能下降，由于***的弱数据结构模式，添加1个新字段不会对旧表格有任何影响，整个过程会非常快速。

3.***缺点：

1）不支持事务。

2）***占用空间过大。

3）***没有成熟的维护工具。

4.***应用场景

1.）适用于实时的插入、更新与查询的需求，并具备应用程序实时数据存储所需的复制及高度伸缩性；

2）非常适合文档化格式的存储及查询；

3.）高伸缩性的场景：*** 非常适合由数十或者数百台服务器组成的数据库。

4.）对性能的关注超过对功能的要求。

***

*** 是 Apache Hadoop 中的一个子项目，属于 bigtable 的开源版本，所实现的语言为Java（故依赖 Java SDK）。*** 依托于 Hadoop 的 HDFS（分布式文件系统）作为最基本存储基础单元。

1.*** 特点：

所用语言： Java 特点：支持数十亿行X上百万列使用许可： Apache 协议：HTTP/REST （支持 Thrift，见编注4）在 BigTable之后建模采用分布式架构 Map/reduce 对实时查询进行优化高性能 Thrift网关通过在server端扫描及过滤实现对查询操作预判支持 XML, Protobuf, 和binary的HTTP Cascading, hive, and pig source and sink modules 基于 Jruby（ JIRB）的shell 对配置改变和较小的升级都会重新回滚不会出现单点故障堪比MySQL的随机访问性能

3. *** 优点

1）存储容量大，一个表可以容纳上亿行，上百万列；

2.）可通过版本进行检索，能搜到所需的历史版本数据；

3.）负载高时，可通过简单的添加机器来实现水平切分扩展，跟Hadoop的无缝集成保障了其数据可靠性（HDFS）和海量数据分析的高性能（MapReduce）；

4.）在第3点的基础上可有效避免单点故障的发生。

4.*** 缺点

1. 基于Java语言实现及Hadoop架构意味着其API更适用于Java项目；

2. node开发环境下所需依赖项较多、配置麻烦（或不知如何配置，如持久化配置），缺乏文档；

3. 占用内存很大，且鉴于建立在为批量分析而优化的HDFS上，导致读取性能不高；

4. API相比其它 NoSql 的相对笨拙。

5.*** 适用场景

1）bigtable类型的数据存储；

2）对数据有版本查询需求；

3）应对超大数据量要求扩展简单的需求。

Redis

Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。

1.Redis 特点：

所用语言：C/C++ 特点：运行异常快使用许可： BSD 协议：类 Telnet 有硬盘存储支持的内存数据库，但自2.0版本以后可以将数据交换到硬盘（注意， 2.4以后版本不支持该特性！） Master-slave复制（见编注3）虽然采用简单数据或以键值索引的哈希表，但也支持复杂操作，例如 ZREVRANGEBYSCORE。 INCR & co （适合计算极限值或统计数据）支持 sets（同时也支持 union/diff/inter）支持列表（同时也支持队列；阻塞式 pop操作）支持哈希表（带有多个域的对象）支持排序 sets（高得分表，适用于范围查询） Redis支持事务支持将数据设置成过期数据（类似快速缓冲区设计） Pub/Sub允许用户实现消息机制

2. Redis 优势

1）非常丰富的数据结构；

2.）Redis提供了事务的功能，可以保证一串命令的原子性，中间不会被任何操作打断；

3.）数据存在内存中，读写非常的高速，可以达到10w/s的频率。

3.Redis 缺点

1） Redis3.0后才出来官方的集群方案，但仍存在一些架构上的问题；

2.）持久化功能体验不佳——通过快照方法实现的话，需要每隔一段时间将整个数据库的数据写到磁盘上，代价非常高；而aof方法只追踪变化的数据，类似于mysql的binlog方法，但追加log可能过大，同时所有操作均要重新执行一遍，恢复速度慢；

3）由于是内存数据库，所以，单台机器，存储的数据量，跟机器本身的内存大小。虽然redis本身有key过期策略，但是还是需要提前预估和节约内存。如果内存增长过快，需要定期删除数据。

4.Redis 应用场景：

***应用场景：适用于数据变化快且数据库大小可遇见（适合内存容量）的应用程序。

例如：微博、数据分析、实时数据搜集、实时通讯等。

资源池化多租户与数据库整合的解决方案

1227 2023-05-08

MongoDB、Hbase、Redis等NoSQL优劣势、应用场景

资源池化多租户与数据库整合的解决方案

生产环境 TiDB 集群混合部署的实践经验

深度剖析 TiCDC 源码之 TiKV CDC 模块

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20