欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 资讯 > 二、Hadoop

二、Hadoop

2024/12/22 0:23:53 来源:https://blog.csdn.net/Burn_/article/details/144323675  浏览:    关键词:二、Hadoop

Hadoop

  • 二、Hadoop
    • 2.1Hadoop 生态圈
    • 2.2Hadoop版本演进
    • 2.3Hadoop 发行版本
    • 2.4Hadoop集群搭建

二、Hadoop

Hadoop 是一种分析和处理大数据的软件平台,是一个用 Java 语言实现的 Apache 的开源软件框架,在大量计组成的集群中实现了对海量数据的分布式计算。(hadoop之父 Doug Cutting)
Hadoop:它是数据处理平台,所有数据都是围绕它展开,帮助我们进行数据方面的计算机集群的搭建

2.1Hadoop 生态圈

Hadoop 生态圈包括以下主要组件。
Hadoop Common,adoop序列化类,PC通信,缩算法
1)HDFS(Hadoop分布式文件系统)
HDFS是一种数据分布式保存机制,数据被保存在计算机集群上。数据写入一次,读取多次。HDFS 为HBase等工具提供了基础。
2)MapReduce(分布式计算框架)
MapReduce是一种分布式计算模型,用以进行大数据量的计算,是一种离线计算框架。
这个 MapReduce 的计算过程简而言之,就是将大数据集分解为成若干个小数据集,每个(或若干个)数据集分别由集群中的一个结点(一般就是一台主机)进行处理并生成中间结果,然后将每个结点的中间结果进行合并, 形成最终结果。
3)HBASE(分布式列存数据库)
HBase是一个建立在HDFS之上,面向列的NoSQL数据库,用于快速读/写大量数据。HBase使用Zookeeper进行管理,

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com