如何在不影响Oracle生产库性能情况下，评估整库大小？| 运维进阶_云计算

发布时间:2024-07-11 19:55

阅读量:13

【作者】杨磊，某金融公司、数据库架构师，在数据库领域坚持耕耘10+年，从事数据架构设计和部署，对开源数据库、国产数据库、NoSQL、NewSQL、大数据、云计算、云原生等新技术有持续关注和极大兴趣。擅长领域：数据库、架构设计、信创改造。

最近碰到一个小问题：一TB级的 Oracle生产库，因为要走数据迁移，需要先行评估整个库的迁移数据量大小，但又不得影响生产库运行性能。如何搞？大家都知道， expdp 数据泵有两个很好用的参数 ESTIMATE 和 ESTIMATE_ONLY ，此两个参数可以保证在不真正发起逻辑备份的情况下评估整个迁移生产库的大小。今天念叨下这个小问题。

这里使用$ expdp -help先看 expdp 的 ESTIMATE 和 ESTIMATE_ONLY 两个参数的介绍：

ESTIMATECalculate job estimates.Valid keyword values are: [BLOCKS] and STATISTICS.
ESTIMATE_ONLYCalculate job estimates without performing the export.

ESTIMATE

默认：blocks

指定计算每张表使用磁盘空间的方法

ESTIMATE=[BLOCKS | STATISTICS]

1.BLOCKS - 通过块数和块大小计算

2. STATISTICS - 每张表的统计信息计算

Expdp 可计算导出数据大小容量，一种是通过数据块数量、一种是通过统计信息中记录的内容估算。通过 expdp 的参数 ESTIMATE_ONLY 和 ESTIMATE 来评估导出的性能， ESTIMATE_ONLY 仅作评估不会导出数据，通过 ESTIMATE 参数指定 statistics 和 blocks 参数来测试两者的差异。

以下是 Oracle 11.2.0.4 中的测试数据输出，在此版本中，我们来看下 ESTIMATE 的 statistics 和 blocks 两个参数各自评估大小和用时。

两条命令如下：

$expdp \'/ as sysdba\' ESTIMATE_ONLY=y FULL=y ESTIMATE=blocks$expdp \'/ as sysdba\' ESTIMATE_ONLY=y FULL=y ESTIMATE=statistics

具体执行如下：

如上可以看出，使用 ESTIMATE=blocks 评估出来的大小为 2599. GB，耗时：00:02:50；

接下来再看 ESTIMATE=statistics 方式。命令如下：

如上，使用ESTIMATE=STATISTICS 评估出来的大小为 2132. GB，耗时：00:04:40；

可以看出，两种方式统计的大小不一样，为啥？

分析推断：

ESTIMATE的默认方式是 blocks 。个人理解为：Oracle 的块大小默认为 8KB ，直接对库使用的块数计算使用量，简单明了，但考虑到块有高水位线、碎片等因素，故统计不精确。而 STATISTICS 方式因计算的是对每张表的实际使用情况，故更为精确。

但STATISTICS 的方式也非很精确，原因为：1. 该方式只是对表做统计，没有对索引、列、系统做统计， 2. 一个表中被修改的行数超过 stale_percent( 缺省值 10%) 时才会认为这个表的统计数据过时，需要重新搜集。

注意：

如果压缩了表，那么使用 ESTIMATE=BLOCKS 计算的值时不准确的，这个时候就应该使用 ESTIMATE=STATISTICS 。

支持

资讯

如何在不影响Oracle生产库性能情况下，评估整库大小？| 运维进阶

相关阅读

广告一刻