HDFS基本概念

大数据学习笔记

HDFS基本概念

2018/10/28 21:11:48

HDFS体系结构


基本知识点:

  • HDFS是以块为基本的存储单位,块的大小为64MB,块是整个文件存储处理的逻辑单位
  • 每个数据块都有三份,两个放在机架1,第三个放在机架二,防止硬件设备的故障导致数据块的损失
  • HDFS包含两类节点,分别为NameNode和DataNode
  • NameNode是管理节点,存放元数据,元数据包含两个部分,分别是文件与数据块的映射表(可通过映射表找到具体的数据块)
  • DataNode是数据节点,存放数据块
  • Secondary NameNode是备份管理节点,当NameNode出现问题后,备份管理节点将会代替原先NameNode的位置工作

工作流程:

查询流程:

客户端通过命令行或者程序输入查询语句,访问到管理节点,管理节点返回元数据给客户端,客户端再通过其中的映射表读取到数据块

插入流程:

客户端发出插入请求,NameNode找到空的可用的数据块将数据插入,然后数据块以流水线的形式将其复制两份放入指定的的位置

本文标题:HDFS基本概念

文章作者:Cello

发布时间:2018年10月29日 - 10:10

最后更新:2018年10月29日 - 10:10

原始链接:https://littlexy.git.io/2018/10/29/HDFS基本概念/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

坚持原创技术分享,您的支持将鼓励我继续创作!