一次数据文件误删除故障案例分享

来源:这里教程网 时间:2026-03-03 21:44:13 作者:

一、案例概述

  某医疗机构在进行例行数据库维护时,意外地在 `SYSTEM` 表空间添加了一个新的数据文件。然而,操作系统管理员将此新增的 `SYSTEM` 数据文件删除,致使数据库宕机。由于该数据库处于非归档模式,数据恢复变得更加复杂和紧迫。  

二、故障原因分析

  `SYSTEM` 表空间是Oracle数据库中最为核心的表空间,所有数据文件必须处于 `ONLINE` 状态以确保数据库正常运行。然而,删除了新增的 `SYSTEM` 数据文件后,致使数据库无法正常打开,因为数据库需要所有的 `SYSTEM` 表空间数据文件来维持其一致性和完整性。  

三、紧急处理方法

  在接到故障 通知 后,我们迅速采取了一系列措施,成功恢复了数据库功能。以下是详细的恢复步骤:   1. 挂载数据库:     首先,我们将数据库挂载,以便进行进一步的恢复操作。    ```sql    ALTER DATABASE MOUNT;    ```   2. 创建缺失的数据文件:     接着,我们使用 `ALTER DATABASE CREATE DATAFILE` 命令重新创建了丢失的 `SYSTEM` 数据文件。    ```sql    ALTER DATABASE CREATE DATAFILE 9;    ```   3. 恢复数据文件:     使用 `RECOVER DATAFILE` 命令对新的数据文件进行恢复操作。    ```sql    RECOVER DATAFILE 9;    ```   4. 打开数据库:     最后,通过 `ALTER DATABASE OPEN` 命令成功打开数据库。    ```sql    ALTER DATABASE OPEN;    ```   成功恢复的原因   我们之所以能够成功恢复数据库,主要是因为从9号文件被创建到出现故障这段时间的 `REDO` 日志没有被覆盖。这意味着创建出的文件的 `SCN` 是正确的,数据文件中的内容也都完整无误。

 

四、内容扩展

  在处理过程中,我们发现了两种复杂情况,这些情况需要不同的处理方法。     问题一: `REDO` 日志有缺失   如果在故障发生期间,关键的 `REDO` 日志已经被覆盖,我们可以使用 `BBED` 工具对比其他文件的 `SCN` 以恢复数据文件。     使用 `BBED` 工具进行恢复   `BBED`是一个强大的工具,可以直接编辑Oracle数据块。使用它可以恢复错误的 `SCN` 和 `DBA` 数据。   1. 设置 `DBA`:    ```sql    BBED> set dba 2,1           DBA 0x00800001 (8388609 2,1)    ```   2. 转储偏移量并提取 `SCN` 信息:    ```sql    BBED> dump offset 484 count 10    File: /u01/app/oradata/localdb/sysaux01.dbf (2)    Block: 1 Offsets: 484 to 493 Dba:0x00800001    -------------------------------------------------------    6dd15100 00007009 5c1a        BBED> dump offset 500 count 10    File: /u01/app/oradata/localdb/sysaux01.dbf (2)    Block: 1 Offsets: 500 to 509 Dba:0x00800001    -------------------------------------------------------    d7000000 02000000 1000    ```   3. 设置新的 `DBA` 并修改偏移量:    ```sql    BBED> set dba 9,1           DBA 0x02400001 (37748737 9,1)    BBED> m /x 6dd15100 offset 484    Warning: contents of previous BIFILE will be lost. Proceed? (Y/N) Y    File: /u01/app/oradata/localdb/system02.dbf (9)    Block: 1 Offsets: 484 to 493 Dba:0x02400001    -------------------------------------------------------      6dd15100 00000000 4a15    BBED> m /x d7 offset 500    File: /u01/app/oradata/localdb/system02.dbf (9)    Block: 1 Offsets: 500 to 509 Dba:0x02400001    -------------------------------------------------------      d7000000 02000000 0000    ```   4. 应用校验:    ```sql    BBED> sum apply    Check value for File 9, Block 1:    current = 0x4bb6, required = 0x4bb6    ```   通过以上步骤,我们成功恢复了丢失的 `SCN` 信息,使得数据文件能够再次被识别。     问题二:新添加的数据文件中有对象创建   如果在故障 之前 ,有新对象在被删除的数据文件中创建,我们可以通过手动清理基表或使用 `DBMS_SPACE_ADMIN` 包进行恢复。     手动清理基表   1. 删除 `tab$` 表中的记录:    ```sql    SQL> delete from tab$ where file=9;    1 row deleted.    ```   2. 删除 `seg$` 表中的记录:    ```sql    SQL> delete from seg$ where file=9;    0 rows deleted.    ```   3. 删除 `ind$` 表中的记录:    ```sql    SQL> delete from ind$ where file=9;    1 row deleted.    ```   4. 删除 `obj$` 表中的记录:    ```sql    SQL> delete from obj$ where owner=9;    2 rows deleted.    ```   5. 提交更改:    ```sql    SQL> commit;    Commit complete.    ```     使用 `DBMS_SPACE_ADMIN` 包处理   1. 查询 `seg$` 表:    ```sql    SQL> select file,block,type,ts from seg$ where file=9;    FILE     BLOCK      TYPE        TS    ---------- ---------- ---------- ----------    9         10          5          7    9         18          6          7    ```   2. 标记和删除损坏的段:    ```sql    exec dbms_space_admin.segment_corrupt('<TSNAME>', <FILE_ID>, <BLOCK_ID>, DBMS_SPACE_ADMIN.SEGMENT_MARK_CORRUPT);    exec dbms_space_admin.segment_drop_corrupt('<TSNAME>', <FILE_ID>, <BLOCK_ID>);    exec dbms_space_admin.tablespace_rebuild_bitmaps('<TSNAME>');    ```   3. 重启数据库。  

五、结论

  通过上述详细的恢复步骤和解决方法,我们成功地解决了因为 `SYSTEM` 表空间数据文件删除引起的数据库故障问题。这次事件不仅展示了我们在处理紧急情况时的技术能力和应变能力,也强调了数据库维护过程中每一步操作的重要性。我们的经验表明,在面对数据库故障时,理解 `SCN` 和 `REDO` 日志的作用,灵活运用各种数据库管理工具,是确保数据完整性和快速恢复的关键。未来,我们将继续提升数据库管理和维护的能力,确保业务系统的稳定运行。  

相关推荐