公众号
关注微信公众号
移动端
创头条企服版APP

入门大数据必知:Hadoop的优点和缺点是什么?

5310
搜狐财经 2019-09-20 11:54 抢发第一评

原标题:入门大数据必知:Hadoop的优点和缺点是什么?

Hadoop的优点

(1)Hadoop具有按位存储和处理数据能力的高可靠性。

(2)Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具有高扩展性。

(3)Hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度非常快,具有高效性。

(4)Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具有高容错性。

Hadoop的缺点

(1)Hadoop不适用于低延迟数据访问。

(2)Hadoop不能高效存储大量小文件。

(3)Hadoop不支持多用户写入并任意修改文件。

Hadoop的核心组件

Hadoop自诞生以来,主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。

HDFS和MapReduce是Hadoop1的核心组件,Hadoop生态圈里的很多组件都是基于HDFS和MapReduce发展出来的。在继Hadoop1之后出现了Hadoop2,Hadoop2在Hadoop1的基础上做了改进。

相比Hadoop1,Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2,本书使用的是Hadoop2.7.3这一版本。

Hadoop2的一个公共模块和三大核心组件组成了四个模块,简介如下。

(1)HadoopCommon:为其他Hadoop模块提供基础设施。

(2)HDFS:具有高可靠性、高吞吐量的分布式文件系统。

(3)MapReduce:基于Yarn系统,分布式离线并行计算框架。

(4)Yarn:负责作业调度与集群资源管理的框架。返回搜狐,查看更多

责任编辑:

声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
您阅读这篇文章花了0
转发这篇文章只需要1秒钟
喜欢这篇 0
评论一下 0
凯派尔知识产权全新业务全面上线
相关文章
评论
试试以这些内容开始评论吧
登录后发表评论
凯派尔知识产权全新业务全面上线
宁波城市站
金华城市站
×
#热门搜索#
精选双创服务
历史搜索 清空

Tel:18514777506

关注微信公众号

创头条企服版APP