Aug 23

Oracle的数据段压缩技术

Oracle数据库

1 引言
  作为DBA,空间的紧张是常遇到的一个问题,有时一个大的表就会占用几十GB及至上百GB的空间,存储历史数据的表常常都是这样,特别是数据仓库型应用(如经营分析应用)的数据库这样的问题就更加突出。如今,在计算机技术中数据压缩技术已经十分广泛和成熟了。在windows系统中有winrar、winzip,7-zip等等这样的软件,UNIX操作系统中相应的也有compress、gzip这样的压缩命令及软件。这些压缩工具的使用使我们节约了很多的空间,在ORACLE 9i之前的版本我有时在想,ORACLE什么时候也有类似的功能可以节约空间,提高单位空间的使用价值。期待之余,ORACLE从9i开始羞羞答答的引入表段级压缩;10g在部分压缩功能略有增强,例如DataPump源数据的压缩、Rman备份的压缩等,并无本质的改观;Oracle11g才大张旗鼓的推出相应Compression组件,支持全方面的压缩。本文将立足于ORACLE9/10g这样的实际应用最多的版本探讨一下ORACLE的压缩技术,并简单介绍一下ORACLE 11g的压缩方面的新特征。
  2 数据段压缩实现原理
  2.1 原理简单描述
  ORACLE的数据段压缩技术可以理解为“数据块”级压缩技术,也就是说是针对Block级别的数据压缩。它是在Block中引入记号表(symbol表),Block中的重复数据在symbol中用一个项(指针)表示,即块中相同的ROW只存储一条,从而节约了空间。
  2.2 压缩数据块的存储结构
  2.2.1 建一张包含28672行数据的表T_ 28672
SQL> show user
USER is "SCOTT"
SQL>
SQL> select count(*) from t_28672;
 
 COUNT(*)
----------
    28672

2.2.2 T_ 28672压缩前与压缩后段统计
  压缩前:
SQL> select owner,segment_name,file_id,block_id,blocks                
 2  from dba_extents
 3 where wner='SCOTT'          
 4   and segment_name='T_28672'
 5  order by block_id
 6 /
 
OWNER SEGMENT_NAME           FILE_ID  BLOCK_ID    BLOCKS
----- -------------------- ---------- ---------- ----------
SCOTT T_28672                      4      3729         8
SCOTT T_28672                      4      3737         8
SCOTT T_28672                      4      3745         8
SCOTT T_28672                      4      3753         8
SCOTT T_28672                      4      3761         8
SCOTT T_28672                      4      3769         8
SCOTT T_28672                      4      3777         8
SCOTT T_28672                      4      3785         8
SCOTT T_28672                      4      3793         8
SCOTT T_28672                      4      3801         8
SCOTT T_28672                      4      3809         8
SCOTT T_28672                      4      3817         8
SCOTT T_28672                      4      3825         8
SCOTT T_28672                      4      3833         8
SCOTT T_28672                      4      3841         8
SCOTT T_28672                      4      3849         8
SCOTT T_28672                      4      3977       128
 
17 rows selected.
 
SQL>
 

 执行表压缩:
  SQL> alter table T_28672 move COMPRESS;
  Table altered.
  压缩后:
SQL> select owner,segment_name,file_id,block_id,blocks
 2  from dba_extents
 3 where wner='SCOTT'
 4   and segment_name='T_28672'
 5 order by block_id
 6 /
 
OWNER SEGMENT_NAME           FILE_ID  BLOCK_ID    BLOCKS
----- -------------------- ---------- ---------- ----------
SCOTT T_28672                      4      3857         8
SCOTT T_28672                      4      3865         8
SCOTT T_28672                      4      3873         8
SCOTT T_28672                      4      3881         8
SCOTT T_28672                      4      3889         8
SCOTT T_28672                      4      3897         8
 
6 rows selected.
 
SQL>
简单总结:
  从压缩前后段的数量上看,压缩还是相当节约空间的,17个区压缩成6个区,2倍的压缩比。
  2.2.3 dump出file 4 block 3860块
  SQL> alter system dump datafile 4 block 3860;
  System altered.
  2.2.4 结构分析
  需要说明的是,如下的内容为完整.trc的节选,有关于block dump内容更详细的解释可以参照“DSI402e Data Types and Block Structures”,本文只关注与压缩有关的部分。


原载:顾利斌的容灾备份博客
原文链接:Oracle的数据段压缩技术
本站原创@版权所有 | 如近日有雷同文章无本站版权链接现象必究
tags:Oracle  数据库  

to "Oracle的数据段压缩技术 "

Leave a Reply