Hadoop3.x版本的新特性有哪些

本篇内容介绍了“Hadoop3.x版本的新特性有哪些”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

公司主营业务：做网站、成都网站设计、移动网站开发等业务。帮助企业客户真正实现互联网宣传，提高企业的竞争能力。成都创新互联是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化，感谢他们对我们的高要求，感谢他们从不同领域给我们带来的挑战，让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。成都创新互联推出比如免费做网站回馈大家。

Apache Hadoop 3.x

Apache Hadoop 3.x在以前的主要发行版本（hadoop-2.x）上进行了许多重大改进。

1. 最低要求的Java版本从Java 7增加到Java 8

现在，已针对Java 8的运行时版本编译了所有Hadoop JAR。仍在使用Java 7或更低版本的用户必须升级到Java 8。

2. 支持HDFS中的纠删码

纠删码是一种持久存储数据的方法，可节省大量空间。与标准HDFS副本机制的3倍开销相比，像Reed-Solomon(10,4) 这样的标准编码的空间开销是1.4倍。

由于纠删码在重建期间会带来额外的开销，并且大多数情况下会执行远程读取，因此传统上已将其用于存储较冷，访问频率较低的数据。

在部署此功能时应考虑纠删码机制的网络和CPU开销。

关于HDFS中纠删码更详细的介绍，可查看我之前写的这篇文章：深入剖析 HDFS 3.x 新特性-纠删码

3. Shell脚本重写

Hadoop Shell脚本已被重写，以修复许多长期存在的错误并包括一些新功能。Hadoop的开发人员尽管一直在寻求兼容性，但是某些更改可能会破坏现有的安装。

4. MapReduce 任务本地优化

MapReduce 增加了对 map 输出收集器的本地执行的支持，对于 shuffle 密集型工作，这可以使性能提高30％或更多。

5. 支持两个以上的 NameNode

在之前的版本中，HDFS的高可用最多支持两个NameNode。在HDFS 3.x 版本中，通过将编辑复制到法定数量的三个JournalNode，该体系结构能够容忍系统中任何一个节点的故障。

但是，某些部署需要更高的容错度。这个新特性启用了这一点，该功能允许用户运行多个备用NameNode。例如，通过配置三个NameNode和五个JournalNode，群集可以忍受两个节点的故障，而不仅仅是一个节点的故障。

6. 多个服务的默认端口已更改

以前，多个Hadoop服务的默认端口在Linux临时端口范围内（32768-61000）。这意味着在启动时，服务有时会由于与另一个应用程序的冲突而无法绑定到端口。

这些冲突的端口已移出临时范围，具体的端口更改如下：

NameNode 的端口: 50070 --> 9870, 8020 --> 9820, 50470 --> 9871;
Secondary NameNode 的端口: 50091 --> 9869, 50090 --> 9868;
DataNode 的端口: 50020 --> 9867, 50010 --> 9866, 50475 --> 9865, 50075 --> 9864;
Hadoop KMS 的端口: 16000 --> 9600（HBase的HMaster端口号与Hadoop KMS端口号冲突。两者都使用16000，因此 Hadoop KMS 更改为9600）。

7. 支持Microsoft Azure数据湖和阿里云对象存储系统文件系统连接器

Hadoop现在支持与Microsoft Azure数据湖和Aliyun对象存储系统集成，作为与Hadoop兼容的替代文件系统。

8. 数据内节点平衡器

单个DataNode可管理多个磁盘。在正常的写操作过程中，磁盘将被均匀填充。但是，添加或替换磁盘可能会导致DataNode内部出现严重偏差。原有的HDFS平衡器无法处理这种情况。新版本的HDFS中有平衡功能处理，该功能通过hdfs diskbalancer CLI调用。

9. 基于HDFS路由器的联合

基于HDFS路由器的联合添加了一个RPC路由层，该层提供了多个HDFS名称空间的联合视图。这简化了现有HDFS客户端对联合群集的访问。

10. YARN资源类型

YARN资源模型已被通用化，以支持用户定义的CPU和内存以外的可计数资源类型。例如，集群管理员可以定义资源，例如GPU，软件许可证或本地连接的存储。然后可以根据这些资源的可用性来调度YARN任务。

“Hadoop3.x版本的新特性有哪些”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站，小编将为大家输出更多高质量的实用文章！

标题名称：Hadoop3.x版本的新特性有哪些
网址分享：http://chengdu.cdxwcx.cn/article/igechs.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

Hadoop3.x版本的新特性有哪些

Apache Hadoop 3.x

1. 最低要求的Java版本从Java 7增加到Java 8

2. 支持HDFS中的纠删码

3. Shell脚本重写

4. MapReduce 任务本地优化

5. 支持两个以上的 NameNode

6. 多个服务的默认端口已更改

7. 支持Microsoft Azure数据湖和阿里云对象存储系统文件系统连接器

8. 数据内节点平衡器

9. 基于HDFS路由器的联合

10. YARN资源类型

其他资讯

Linux服务器重启技巧：如何正确重新启动（如何重启linux服务器）

香港免实名云服务器租用怎么选择

深入学习CSS网页布局中字体样式

域名赎回期多久删除?（域名赎回期多久删除一次)

释放Redis集群查询结果验证（redis集群查询后释放）

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

Hadoop3.x版本的新特性有哪些

Apache Hadoop 3.x

1. 最低要求的Java版本从Java 7增加到Java 8

2. 支持HDFS中的纠删码

3. Shell脚本重写

4. MapReduce 任务本地优化

5. 支持两个以上的 NameNode

6. 多个服务的默认端口已更改

7. 支持Microsoft Azure数据湖和阿里云对象存储系统文件系统连接器

8. 数据内节点平衡器

9. 基于HDFS路由器的联合

10. YARN资源类型

其他资讯

Linux服务器重启技巧：如何正确重新启动（如何重启linux服务器）

香港免实名云服务器租用怎么选择

深入学习CSS网页布局中字体样式

域名赎回期多久删除?（域名赎回期多久删除一次)

释放Redis集群查询结果验证（redis集群查询后释放）

成都网站建设设计将想法与焦点和您一起共享