[关闭]
@songlaf 2016-04-22T08:24:25.000000Z 字数 437 阅读 510

作业三、HDFS相关概念

北风网大数据培训

一)NameNode的启动流程

  1. 载入最新的fsimage到内存
  2. 重放编辑日志edits
  3. 创建一个新的fsimage
  4. 生成一个空的edits文件
  5. 从DataNode接受最新的数据信息
    启动的过程中,namenode是保护模式。

二)目录配置

配置文件hdfs-site.xml
dfs.name.dir 元信息保存在什么目录下
dfs.data.dir 文件系统的数据保存在什么目录下

三)HDFS如何保证数据的安全

1)数据存储成多份,通过对比可以查找到有问题的数据,然后从正确的节点复制过去。
2)设置心跳时间,datanode星期向namenode发送信息,如果namenode没有接收到,
就会踢掉有问题的datanode,重新生成一个datanode,并且把数据也重新生成一份。
3)设置SecondaryName,如果NameNode出现问题,可以用SecondaryName中的数据。
4)机器重新启动,进入保护模式,数据不可以修改,当启动完成后才可以修改。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注