SQL Server数据表压缩
概述
SQL Server的主要性能取决于磁盘I/O效率,SQL Server 。
2008提供了数据压缩功能来提高磁盘I/O效率。
表压缩意味着减小数据的磁盘占有量,所以压缩可以用在堆表、聚集索引的表、非聚集索引的表、索引视图、分区表上。
可压缩的数据类型
smallint、int、Bigint、decimal、numeric、real、float、money、smallmoeny、bit、datetime、datetime2、datetimeoffset、char、nchar、binary、rowversion。
SQLServer中有两种压缩类型:数据与备份
行压缩
压缩会改变数据的物理存储方式,但不需要对代码做任何修改。
行压缩流程:首先识别表中每一列的数据类型,然后转换为可变长度,最后将存储空间的请求总量减少到实际需求量。
如:固定长度的类型int、char、nchar等,在数据页中以不定长度的方式存储(存储真实数据长度)。
1、SSMS行压缩
表->右键->存储->管理压缩->对所有分区使用相同压缩类型->右侧 选择row->立即执行->完成。
ALTER TABLE [dbo].[AnnexFileList] REBUILD PARTITION = ALL WITH ( DATA_COMPRESSION = ROW );
在压缩堆表或聚集索引时并不同时包含非聚集索引,因此需要另外单独对非聚集索引进行操作。
索引->右键->存储->管理压缩->对所有分区使用相同压缩类型->右侧 选择row->立即执行->完成。
ALTER INDEX [PK_ANNEXFILELIST] ON [dbo].[AnnexFileList] REBUILD PARTITION = ALL WITH ( DATA_COMPRESSION = ROW );
2、T-SQL行压缩
--在现有表进行压缩 --聚集 alter table ceshi rebuild with(data_compression=row) --非聚集 alter index new_name on ceshi rebuild with(data_compression=row) --在创建表时进行压缩 create table yasuo ( id int primary key, name varchar(50), mail varchar(50) ) with (data_compression=row)
创建时指定行压缩方式,这时并未发生改变。只要数据插入表中,该行即被压缩。
页压缩
页压缩通过执行额外的一些步骤增强了行压缩的功能。
页压缩步骤:行压缩、前缀压缩、字典压缩。
首先对于每一列将确定一个值,此值可以减少每一列中值的存储空间。一旦确定该值后,每一列的前缀值的行将被存储在页头中。所有的信息称为压缩信息,存储在页头之下。标识的值(前缀值)位于没列中,将由指向压缩信息部分中对应值的引用进行替换。
下一步字典压缩,搜索整个页面而非单个列,重复值被移动到页头的压缩信息部分,取而代之的是指向该值的引用。
在SSMS中页压缩步骤与行压缩步骤一致,只是选择压缩方式为Page。T-SQL中将row改成page即可。
需要注意
1、如果保留在内存中的数据是压缩的,一旦被选中,则必须先进行解压缩。
2、在插入新行时,数据也是行或页压缩的。
3、当更新或删除时,行压缩对象保留当前的压缩级别。但是页压缩可能需要重新计算,取决于发生变化的数据量。
用哪种压缩
- 需要频繁更新的对象应该使用行压缩。
- 只是执行读取操作的应该使用页压缩。