SQL Server表分区的NULL值问题-PingCAP

SQL Server表分区的NULL值问题

网友投稿 610 2023-04-28

***表分区的NULL值问题

***表分区只支持range分区这一种类型，往往会被大家吐槽

人家MySQL支持四种类型：RANGE分区、LIST分区、HASH分区、KEY分区

共同点是MySQL跟***也有分区对齐的问题，都是水平切分，大家都允许分区列存在NULL值

这次我们测试***表分区的分区列的NULL值，究竟NULL值是被存放在哪个区间，以前一直没有注意

测试脚本

--1.创建文件组 ALTER DATABASE [sss] ADD FILEGROUP [FG_TinyBlog_Id_01] ALTER DATABASE [sss] ADD FILEGROUP [FG_TinyBlog_Id_02] ALTER DATABASE [sss] ADD FILEGROUP [FG_TinyBlog_Id_03] ALTER DATABASE [sss] ADD FILEGROUP [FG_TinyBlog_Id_04] ALTER DATABASE [sss] ADD FILEGROUP [FG_TinyBlog_Id_05] --2.创建文件 ALTER DATABASE [sss] ADD FILE (NAME = N'FG_TinyBlog_Id_01_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_01_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) TO FILEGROUP [FG_TinyBlog_Id_01]; ALTER DATABASE [sss] ADD FILE (NAME = N'FG_TinyBlog_Id_02_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_02_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) TO FILEGROUP [FG_TinyBlog_Id_02]; ALTER DATABASE [sss] ADD FILE (NAME = N'FG_TinyBlog_Id_03_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_03_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) TO FILEGROUP [FG_TinyBlog_Id_03]; ALTER DATABASE [sss] ADD FILE (NAME = N'FG_TinyBlog_Id_04_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_04_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) TO FILEGROUP [FG_TinyBlog_Id_04]; ALTER DATABASE [sss] ADD FILE (NAME = N'FG_TinyBlog_Id_05_data',FILENAME = N'E:\DataBase\sss\FG_TinyBlog_Id_05_data.ndf',SIZE = 96MB, FILEGROWTH = 24MB ) TO FILEGROUP [FG_TinyBlog_Id_05]; --3.创建分区函数 CREATE PARTITION FUNCTION Fun_TinyBlog_Id(INT) AS RANGE LEFT FOR VALUES(-10,0,1,6) --4.创建分区方案 CREATE PARTITION SCHEME [Sch_TinyBlog_Id] AS PARTITION [Fun_TinyBlog_Id] TO([FG_TinyBlog_Id_01],[FG_TinyBlog_Id_02],[FG_TinyBlog_Id_03],[FG_TinyBlog_Id_04],[FG_TinyBlog_Id_05])

插入测试数据

USE [sss] CREATE TABLE TinyBlog(id INT NULL,NAME VARCHAR(100)) ON [Sch_TinyBlog_Id](id) SELECT * FROM TinyBlog ORDER BY id INSERT INTO [dbo].[TinyBlog] ( [id], [NAME] ) VALUES ( NULL, -- id - int '3232' -- NAME - varchar(100) ) INSERT INTO [dbo].[TinyBlog] ( [id], [NAME] ) VALUES ( -2, -- id - int '-2' -- NAME - varchar(100) ) INSERT INTO [dbo].[TinyBlog] ( [id], [NAME] ) VALUES ( 66, -- id - int '66' -- NAME - varchar(100) ) INSERT INTO [dbo].[TinyBlog] ( [id], [NAME] ) VALUES ( 0, -- id - int '0' -- NAME - varchar(100) ) INSERT INTO [dbo].[TinyBlog] ( [id], [NAME] ) VALUES ( -30, -- id - int '-30' -- NAME - varchar(100) )

表数据如下

SELECT * FROM TinyBlog ORDER BY id

分区分布

--查看分区架构文件组分布 SELECT CONVERT(VARCHAR(MAX), ps.name) AS partition_scheme , p.partition_number , CONVERT(VARCHAR(MAX), ds2.name) AS filegroup , CONVERT(VARCHAR(MAX), ISNULL(v.value, ''), 120) AS range_boundary , STR(p.rows, 9) AS rows FROM sys.indexes i JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id JOIN sys.destination_data_spaces dds ON ps.data_space_id = dds.partition_scheme_id JOIN sys.data_spaces ds2 ON dds.data_space_id = ds2.data_space_id JOIN sys.partitions p ON dds.destination_id = p.partition_number AND p.object_id = i.object_id AND p.index_id = i.index_id JOIN sys.partition_functions pf ON ps.function_id = pf.function_id LEFT JOIN sys.Partition_Range_values v ON pf.function_id = v.function_id AND v.boundary_id = p.partition_number - pf.boundary_value_on_right WHERE i.object_id = OBJECT_ID('TinyBlog') AND i.index_id IN ( 0, 1 ) ORDER BY p.partition_number --分区区间 --SELECT * FROM sys.partition_range_values

分区情况

--分区情况 SELECT c.* , b.[groupname] AS '分区方案对应的文件组名称' , d.name '当前分区函数对应的分区方案' FROM sys.destination_data_spaces AS a INNER JOIN sysfilegroups AS b ON a.[data_space_id] = b.[groupid] INNER JOIN ( SELECT $PARTITION.Fun_TinyBlog_Id(id) AS 分区编号 , MIN(id) AS Min_value , MAX(id) AS Max_value , COUNT(id) AS 记录数 FROM [dbo].[TinyBlog] GROUP BY $PARTITION.Fun_TinyBlog_Id(id) ) AS c ON c.[分区编号] = a.[destination_id] INNER JOIN sys.partition_schemes AS d ON a.[partition_scheme_id] = d.data_space_id ORDER BY c.[分区编号]

第二个视图直接把NULL值忽略了

根据***个视图，我们画出一个总结图

分析一下

总结

结论其实很清晰，分区列不要允许NULL，如果允许列，那么我们交换分区归档数据的时候就会有麻烦了，因为无法判断分区列是NULL值的那些数据行是老数据还是新数据。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

610 2023-04-28

SQL Server表分区的NULL值问题

黄东旭解析 TiDB 的核心优势

黄东旭关于基础软件产品价值的思考

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20