Hadoop 文件写入 && 一致模型

Key Words: DistributedFileSystem, FSDataOutputStream, Pipeline, Coherency model

Hadoop 文件写入

具体步骤如下:

1.客户端通过对 DistributedFileSystem 对象调用 create() 来新建文件

2.DistributedFileSystem 对 namenode 创建一个 RPC 调用,在文件系统的命名空间中创建一个文件,尽管此时还没有相应的数据块
namenode 执行各种不同的检查以确保这个文件不存在以及客户端有新建该文件的权限。
DistributedFileSystem 向客户端返回一个 FSDataOutputStream 对象(封装了 DFSOutputStream)

3.客户端写入数据,DFSOutputStream 将数据分割成一个个数据包,并写入内部队列,称为“数据队列(data queue)”。DataStreamer 处理数据队列,负责挑选出适合存储数据副本的一组 datanode,并据此来要求 namenode 分配新的数据块。
这一组 datanode 构成一个管线(pipeline)

4.DataStreamer 将数据包流式传输到管线中的第 1 个 datanode,该 datanode 存储数据包并将它发送到管线中的第 2 个 datanode。同样,第 2 个 datanode 存储该数据包并发送给管线中的第 3 个

5.DFSOutputStream 维护一个内部数据包队列等到 datanode 的收到确认回执,称为“确认队列(ack queue)”。收到管线中所有datanode 确认信息后,该数据包才会从确认队列删除

6.客户端完成数据的写入后,对数据流调用 close() 方法。该操作将剩余的所有数据包写入 datanode 管线

7.在连接 namenode 来发送文件已经完成的信号之前就等待确认(waits for acknowledgments before contacting the namenode to signal that the file is complete),namenode 知道文件由哪些块组成,所以它在返回成功前只需等待数据块进行最小量的复制

异常情况

在数据被写入的过程中,如果任何 datanode 损坏,将会有如下的一些动作,当然这对于客户端是透明的

1.首先管线被关闭,在确认队列(ack queue)中的数据包被添加到数据队列(data queue),以至于下游的 datanodes 不会丢失任何数据包

2.当前写入失败的数据包,在好的 datanodes 中添加一个标识,通知 namenode,以便于写入错误的 datanode 在稍后恢复时,其他的数据块能够被删除

3.失败的 datanode 从管线中被移除,新的管线从剩下的两个好的 datanodes 中构建

4.身下的块数据被写入管线中好的数据块

5.namenode 注意到块副本不足,会在其他的节点上安排一个副本

6.后续的数据块接受正常的处理

副本安置策略(replica placement)

需要对可靠性、写入带宽和读取带宽进行权衡

hadoop 的默认布局策略是在运行客户端的节点上放置第一个副本(如果客户端运行在集群之外,就随机选择一个节点,系统会避免挑选哪些存储太慢或太忙的节点)。第二个副本放在与第一个不同且随机选择的机架中节点上(不同机架)。第三个副本与第二个副本放在同一个机架上,且随机选择另一个节点。其他部分放在急群众随机选择的节点上,不过系统会尽量避免在同一个机架上放太多的副本

一旦选定副本的放置位置,就根据网络拓扑创建一个管线,如下是副本数为 3 的管线示意图

一致模型(Coherency model)

文件系统的一致模型描述了读/写的数据可见性。HDFS 为了性能牺牲了一些 Posix 要求,也就是默认情况下,写入文件的内容并不保证能立即可见,及时数据流已经刷新(调用 flush() 方法)并存储。

当写入的数据超过一个块后,第一个数据块对新的 reader 可见。当前正在写入的块对其他 reader 不可见

HDFS 提供了一种强行将所有缓存刷新到 datanode 中的手段,即调用 hflush() 方法。当 hflush() 方法返回成功后,对所有新的 reader 而言,HDFS 能保证文件中到目前为止写入的数据均达到所有 datanode 的写入管道并且对所有新的 reader 可见

hflush() 不保证数据写入磁盘,为了确保数据写入磁盘,可以使用 hsync()

选择 hflush(), hsync() 合适的调用频率

并行复制(distcp)

hadoop fs -cp 和 hadoop distcp 等效

注意 distcp 的主要参数:

-overwrite:保持同样的目录结构的同时强制覆盖原有文件
-update:仅跟新发生变化的文件
-delete:可以删除目标路径中任意没在源路径中出现的文件或目录
-p:意味着文件状态属性如权限、块大小和副本数被保留

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335