大数据频道 频道

Hadoop 2.9新增资源估算器等五大亮点!

  【IT168 资讯】Apache已经发布了包含YARN federation ,基于HDFS路由器集合和资源估算器等新功能的Hadoop 2.9。

  Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单台服务器扩展到数千台机器,每台机器提供本地计算和存储。YARN是作业调度和集群资源管理的框架,对HDFS文件系统高可用。

Hadoop 2.9新增资源估算器等五大亮点!

  YARN federation意味着可以通过联合多个YARN子集群将单个YARN集群扩展到成千上万个节点。所提出的方法是将一个大的(10-100k个节点)簇划分成子簇的较小单元,每个簇具有其自己的YARN资源管理器和计算节点。系统将这些子联合在一起,作为一个大的YARN集群出现在应用程序中,新版本还更新了YARN Web UI。

  基于路由器的集合也被添加到HDFS。到目前为止,HDFS支持分区联合,文件系统被分割成更小的子集群,但这给出了子集群拆分问题的解决方案,这意味着用户必须连接到多个子集群并管理文件夹和文件分配各种子集群。基于路由器的联合会添加一层负责联合名称空间的软件,这意味着子集群独立管理自己的块池。具有与NameNode相同接口的路由器组件,并将客户端请求转发给正确的子集群。

  资源估算器根据大部分工作(超过60%)是重复性工作的事实给出了对工作资源需求的估计,因此可以用于根据工作历史运行自动估计工作资源需求。

  这个版本的另一个改进是增加机会容器。与仅存在未分配资源的情况下在节点中调度的现有YARN容器不同,即使在该节点上的执行不能立即启动,也可以将机会容器分派给节点管理器。容器将在该节点管理器中排队,直到资源可用。

  Hadoop 2.9的最后一个主要变化是增加了一个用于CapacityScheduler的Scheduler Queue(Re-)配置API。

0
相关文章