在hdfs上创建文件夹出错 HDFS架构_获嘉县白起网络有限公司

创建测试文件夹Hadoop fsmkdir/测试视图文件夹Hadoop fsls/测试删除文件夹命令rmr，删除文件命令rm。如何在hadoop中创建文件夹？如何从fsls列出的文件在HDFS文件系统的根目录下创建一个递归目录，这个文件夹/user/root/input是root用户创建的，文件系统命名空间层次结构类似于大多数现有的文件系统；您可以创建和删除文件，将文件从一个目录移动到另一个目录，或者重命名文件。

hdfs创建文件

1、HDFS架构

HDFS中的文件以块的形式存储。默认情况下，最基本的存储单元是128MB的块(Hadoop1.x是64MB)。换句话说，存储在HDFS的文件将被分成128MB的块进行存储。如果文件本身小于一个块的大小，就按照实际大小存储，不会占用整个块空间。HDFS的数据块设置得如此之大的原因是为了减少寻址开销。

当然也不会太大。MapReduce中的地图任务通常一次只处理一个块中的数据。如果任务数量过少，作业的运行速度会变慢。默认情况下，HDFS的每个数据块有三个副本，存储在不同的DataNode中，以实现容错。因此，如果数据块的副本丢失，不会影响对数据块的访问。可以在配置文件中更改块大小和副本数量。NameNode是HDFS中存储元数据(如文件名、大小和位置)的地方。它将所有文件和文件夹的元数据保存在文件系统目录树中，元数据信息的任何更改都将被NameNode记录下来。

2、Hadoop系列之HDFS架构

本文翻译了Hadoop系列下的This架构。原文经作者翻译后，约6000字。之后，作者对内容进行了简化和压缩，以便作者和其他读者在阅读本文时能够更高效、更快速地学习或复习Hadoop。本文主要介绍Hadoop的整体架构，包括但不限于节点概念、命名空间、数据容错机制、数据管理方法、简单脚本命令和垃圾收集概念。

HadoopDistributed(HDFS)是一种高容错、高吞吐量的分布式文件系统，用于处理海量数据。HDFS一般由数百台机器组成，每台机器存储整个数据集的一部分。快速发现和恢复机器故障是HDFS的核心目标。HDFS接口的核心目标是高吞吐量而不是低延迟。HDFS支持海量数据收集，一个集群一般可以支持几千万个文件。

3、怎么在HDFS文件系统的根目录下创建递归目录

根据fsls列出的文件，这个文件夹/user/root/input是由root创建的。它显示了当您将输入目录从本地文件系统复制到hdfs系统时，您使用的是root用户而不是hadoop用户执行的copy命令。您可能会忘记切换用户。可以删除当前输入目录(使用root用户运行hadoop delete命令，或者不删除也没关系)，重用hadoop用户将输入导入hdfs系统进行试用。

4、hdfs的设计目标是什么

HDFS支持传统的分层文件组织。用户或应用程序可以创建目录并将文件存储在这些目录中。文件系统命名空间层次结构类似于大多数现有的文件系统；您可以创建和删除文件，将文件从一个目录移动到另一个目录，或者重命名文件。HDFS支持用户配额和访问权限。HDFS不支持硬链接或软链接。然而，HDFS架构并不排除这些功能的实现。NameNode维护文件系统名称空间。

应用程序可以指定HDFS应该维护的文件副本的数量。文件的拷贝数称为文件的复制因子。该信息由NameNode存储。HDFS被设计成在跨机器的大型集群中可靠地存储非常大的文件。它将每个文件存储为一系列块。复制文件块是为了容错。每个文件都可以配置块大小和复制因子。除了最后一个块，文件中的所有块都具有相同的大小，用户可以在append和hsync中添加对变长块的支持后开始一个新的块，而无需将最后一个块填充到配置的块大小。

5、分布式文件系统hdfs主要由哪些功能模块构成

HDFS命名空间使用分层结构来存储文件和目录。文件和目录由NameNode上的inodes表示。Inode记录权限、修改和访问时间、名称空间、磁盘容量和其他属性。文件内容将被分成不同的“块”(典型的块策略是每个块128M，但用户可以选择每个文件的块大小)。NameNode负责维护命名空间树以及与DataNode上的文件块的映射关系。

6、hadoop中怎么创建文件夹?

创建测试文件夹Hadoop fsmkdir/测试视图文件夹Hadoop fsls/测试删除文件夹命令rmr，删除文件命令rm。根据fsls列出的文件，此文件夹/用户/根目录/输入是由root用户创建的，它显示了当您将输入目录从本地文件系统复制到hdfs系统时，您使用的是root用户而不是hadoop用户执行的copy命令。您可能会忘记切换用户，可以删除当前输入目录(使用root用户运行hadoop delete命令，或者不删除也没关系)，重用hadoop用户将输入导入hdfs系统进行试用。

白起网络

在hdfs上创建文件夹出错 HDFS架构

相关阅读

在线评论