可按Ctrl+D收藏 蚂蚁资源网

蚂蚁资源网

hadoop生态系统(hadoop生态圈图)

  • 全部评论(3)
  • 111
  • (1) CDH对Hadoop版本的划分非常清晰,只有两个系列的版本,分别是cdh3和cdh4,分别对应第一代Hadoop(Hadoop 1.0)和第二代Hadoop(Hadoop 2.0),相比而言,Apache版本则混乱得多;比Apache hadoop在兼容性,安全性,稳定性上有增强。(2)CDH3版本是基于Apache hadoop 0.20.2改进的,并融入了最新的patch,CDH4版本是基于Apache hadoop 2.X改进的,CDH总是并应用了最新Bug签名系统修复或者Feature的Patch,并比Apache hadoop同功能版本提早发布,更新速度比Apache官方快。(3)安全 CDH支持Kerberos安全认证,apache hadoop则使用简陋的用户名匹配认证(4)CDH文档清晰,很多采用Apache版本的用户都会阅读CDH提供的文档,包括安装文档、升级文档等。(5)CDH支持Yum/Apt包,Tar包,RPM包,Cloudera Manager四种方式安装,Apache hadoop只支持Tar包安装。注:CDH使用推荐的Yum/Apt包安装时,有以下几个好处:1、联网安装、升级,非常方便2、自动下载依赖软件包3、Hadoop生态系统包自动匹配,不需要你寻找与当前Hadoop匹配的Hbase,Flume,Hive等软件,Yum/Apt会根据当前安装Hadoop版本自动寻找匹配版本的软件包,并保证兼容性。4、自动创建相关目录并软链到合适的地方(如conf和logs等目录);自动创建hdfs, mapred用户,hdfs用户是HDFS的最高权限用户,mapred用户则负责mapreduce执行过程中相关目录的权限。
  • 2021-12-23 03:05:48
  • dafvzzz9
  • 提供大规模的数据存储ZD和计算。Java语言基础是必需的.Hadoop实现了分布式ZD文件系统(Hadoop分布式文件系统),称为HDFS.HERE是一个高容量到错误的特性,旨在部署在低成本硬件上;它提供专门的吞吐量来访问应用程序的数据,这适用于具有大数据集的应用程序(大数据集)程序.HDoop的框架是:HDFS和MapReduce.hdfs为大规模数据提供存储,而MapReduce提供了属于大规模的计算数据。
  • 2021-12-23 03:04:44
  • 网站快速搭建
  • 麻烦问一下Cloudera和Hadoop是什么关系越详细越好,行业内人员回答就更好了,谢谢!,由于Hadoop深受客户欢迎,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中,规模最大、知名度最高的公司则是Cloudera。Cloudera正在努力为开源Hadoop,提供支持,同时将数据处理框架延伸到一个全面的“企业数据中心”范畴,这个数据中心可以作为首选目标和管理企业所有数据的中心点。Hadoop可以作为目标数据仓库,高效的数据平台,或现有数据仓库的ETL来源。企业规模可以用作集成Hadoop与传统数据仓库的基础。 Cloudera致力于成为数据管理的“重心”。
  • 2021-12-23 03:04:44
  • 商品推荐