实例恢复相关原理精简总结

也可访问贴子地址

http://www.itpub.net/forum.php?mod=viewthread&tid=1761630

第一部分 相关基础知识——脏链、CKPT

*************************************************************************************************************

一、 CKPTQ脏链(按照访问顺序进入CKPTQ)

=检查点队列

=包含所有脏块

=任何块一变脏一定立即进入

=脏块第一次进入ckptq就决定了其顺序

=与接脏块的buffer header关联

=块改多次关联redo buffer中多个rba:心跳将第一次的lrba写到控制文件,不写hrba

================================================

各数据块在被读入buffer cache时,会先在buffer cache中构造一个buffer header,buffer header与数据块一一对应。buffer header包含的主要信息有:

a)该数据块在buffer cache中实际的内存地址。

b)该buffer header所在的LRU、LRUW、CKPTQ等链表。

c)正在等待该buffer header的进程列表(waiter list)和正在使用该buffer header的进程列表(user list)。

*******************************************************

二、LRUW脏链(按照访问频率进入LRUW)

=只包含一部分脏块

=挂在LRU链上的脏块在被写回磁盘前,它是不能被新读入的块覆盖的。经过一定算法会把一部分脏块转到脏LRU链(即LRUW链)中。

=挂在LRUW链中的块被dbwn写入dbfile后自动从ckptq队列中摘除

*******************************************************

三、 CKPT发送CHECKPOINT信号的触发条件

1. log_checkpoint_timeout时间达到

2.当前redo日志已经写够log_checkpoint_internavl操作系统块大小

3. redo log switch :日志文件满或alter  system  switch  logfile

4. 手工检查点操作:alter system checkpoint

5. alter tablespace XXX begin backup,end backup时

6. alter tablespace , datafile offline,

7.关闭实例(SHUTDOWN ABORT除外)。

8.direct path read时(11g全表扫描);

四、 增量检查点

增量检查点并不会去更新数据文件头,而只是每3秒由CKPT进程去更新控制文件中的LRBA和SCN(日志切换检查点、完全检查点时写数据文件头及数据文件头)。

1.增量检查点主要包含以下步骤

①亲自物理写

CKPT每3秒心跳一次记录检查点位置的工作(更新RBA至控制文件)

②指挥别人写

CKPT定期触发DBWn去写checkpoint queue中的脏数据

2.增量检查点的意义有以下两个:

①减少发生完全检查点时DBWn进程的工作负担

②提高实例恢复的速度

*******************************************************

五、检查点心跳原理、检查点队列原理

检查点发生后,触发dbwr,CKPT获取发生检查点时对应的SCN,通知DBWr要写到这个SCN为止。

dbwr 根据 buffer 在被首次修改的时候的时间的顺序批量地写出dirty buffer到datafile。

checkpoint 发生时:

一方面通知dbwr进行下一批写操作。

另一方面,oracle 采用了一个心跳的概念,以3秒的频率将dbwr 写的进度反应到控制文件中,也就是把dbwr当前刚写完的dirty buffer对应的scn和lrba写入数据文件头和控制文件,这就是检查点scn。

3秒只是在控制文件中,ckpt 进程去更新当前dbwr写到哪里了,这个对于ckpt 进程来说叫 heartbeat ,heartbeat是3秒一次:  3秒可以看作不停的检查并记录检查点执行情况(DBWR的写进度)。

检查点发生之后数据库的数据文件、控制文件处于一致状态的含义是不需要进行介质恢复,只表示数据文件头一致,但是并不表示数据文件内容一致,因为数据文件内容可能在没有发生检查点的其他情况下的dbwr写数据文件,这样数据文件内容就不一致,若掉电需要进行崩溃恢复(前滚+回滚)。

*******************************************************

第二部分 相关基础知识——Block Address

*************************************************************************************************************

一、block address(ondisk rba在9.2后作废)

1.uba=Undofile BA

2.dba=Datafile BA=dbfile文件号、块号、行号

rdba=tablespace Relative Database BA

3.rba=Redofile BA=logfile 序列号,logfile 块号,偏移长度

*******************************************************

二、low cache rba与low rba

1.low cache rba

=检查点位置

=就是CKPT记录的DBWR写的进度

=low cache rba 以前的更前的已经写入数据文件

2. 当前redo logfile的low scn(first_change#)

SQL> select sequence#,status,first_change# from v$log;

SEQUENCE# STATUS           FIRST_CHANGE#

---------- ---------------- -------------

         5 INACTIVE                566751

         6 CURRENT                 589819

         4 INACTIVE                531541

first_change#表示当前redo log的low scn,

实例恢复只会用到当前redo log file(原因:日志切换时触发CKPT写了脏块)

3.补充知识:

next_change#表示当前redo log的high scn

select sequence#,first_change# from v$log;

select sequence#,first_change from  v$log_history;

Redo log会顺序纪录数据库的各个变化。一组redo log文件写满后,会自动切换到下一组redo log文件。则上一组redo log的high scn就是下一组redo log的low scn。

第三部分 相关基础知识——scn

*******************************************************

一、计数器

1.scn计数器(未保存)

=是不断向前累加的的,系统当前的逻辑时钟

=数据库越忙变化越快

=可与时间相互转换

=select CURRENT_SCN from v$database;

2.检查点scn时间点(已保存的)

=已提交到数据文件头或控制文件中的scn值

=有end scn,start scn,system scn等很多种

=保存在数据块头中、控制文件头中、数据文件头中等很多位置

3.为什么用scn而不用时间来界定呢?

在9:00的时执行一条DML语句,

然后修改机器上的时间为8:00,再执行一条DML语句。

机器上的时间区分的话,Oracle区分不出来这两条DML语句的执行顺序

——所以它采用自己产生的SCN计数来区分所有操作的先后顺序。

*******************************************************

二、全局SCN/局部SCN(保存在控制文件中)

1.全局SCN(系统检查点SCN)

=控制文件中自身的SCN

=select checkpoint_change# from v$database;

2.局部SCN(有些表空间的是只读的,故与全局SCN不同)

=控制文件中各文件的SCN

=select name,checkpoint_change# from v$datafile;

*******************************************************

四、控制文件头中数据文件stop scn和数据文件头中的start scn

1.end scn

=在控制文件中

=正常关闭数据库或正常将表空间置为read only或offline时将修改的

=select name,last_change# from v$datafile;

2.start scn

=在数据文件头中

=select checkpoint_change# from v$datafile_header     

================================================

重要说明:

a.正常关机时(Normal或Immediate)

发出完全检查点,这将为各数据文件设置控制文件中的结束SCN,使其等于数据文件头中对应的开始SCN。

b.异常关机

控制文件中的数据文件头信息(ckpt cnt)与数据文件头一致(ckpt cnt),所以不需要介质恢复,数据文件和控制文件一致。

此时控制文件中的数据文件stop scn=null,与数据文件头中的start scn不相等,说明数据文件和日志文件不一致,所以需要进行实例恢复。

第四部分 启动过程中的一致性检查

1.对比start scn与checkpoint scn

2.对比start scn与end scn

*******************************************************

一、第一次检查是决定是否做media recover(难点)

1.对比控制文件中记录的数据库全局检查点Checkpoint SCN

数据文件头部所记录的数据文件的Start SCN 是否相等,从而确定是否需要进行介质恢复。

两者不相等需介质恢复时,

介质恢复的起始点是各数据文件头部所记录的Start SCN对应的RBA

终点是控制文件中记录的数据库全局检查点Checkpoint SCN对应的RBA

2.两者若相等则进行第二次检查是决定是否做instance recover

================================================

补充知识:日志切换检查点

在控制文件中,只记录日志切换时的SCN,不记录RBA.

日志切换时,被写进数据文件头的并不只有SCN信息,还有RBA信息.这个RBA是新的连机重做日志文件第一条重做记录的RBA.

*******************************************************

二、第二次检查是决定是否做instance recover

对每个数据文件都作这样的检查,然后打开数据库:

1.检查对数据文件头中的中对应文件的Start SCN

控制文件中对应文件的end SCN

2.分两种情况

a.如果end SCN等于start SCN,则不需要对那个文件进行redo恢复。

b.如果上次数据库用ABORT等非正常关闭的,数据库没进行检查点处理,而结束SCN仍然为无穷大或null。

在下次启动期间,发现开始SCN和结束SCN不同,需要进行实例恢复:

前滚,online,后滚

3.作为打开过程的一部分,要将结束SCN重新设置为无穷大或null。

*******************************************************

三、只读表空间的问题

1.alter tablespace tbs1 read only;此信息会存到控制文件中

此表空间的数据文件包括数据文件头中及控制文件中的scn等信息被冻结

2. shutdown immediate;所有read write的数据文件对应scn,rba等更新一致

3.实例启动时仅对在控制文件中标记为read write的表空间做一致性检查

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容

  • 作者信息:周玉其 8年以上数据库开发、运维经验。思维敏捷,曾在电信、物流行业从事数据库开发、运维工作,擅长PL/...
    千幻流光阅读 1,062评论 1 1
  • 事务隔离 ITL ITL: Interested Transaction List,也叫事务槽,它位于BLOCK ...
    eric_gao阅读 937评论 0 0
  • 一、源题QUESTION 36Your database is open and the LISTENER lis...
    猫猫_tomluo阅读 1,209评论 0 2
  • 离开学还有几日,女儿也该定下心学学东西了,今日从描画开始,从一开始不乐意,胡乱涂抹,到后来的涂画的越发精细,今天任...
    一只会跳跃的松鼠阅读 185评论 0 0
  • 二零一九年二月二十日。 依旧是寒冷的一天,雨似乎缓和了一点,没有下一整天。过了春节,也没有暖和起来,说倒春寒,我不...
    且听风吟_b7f3阅读 111评论 0 1