https://www.myziyuan.com/
- hz
- 1.导入查看hadoop源码 (1)选择Existing Projects into Workspace (2)选择源码路径 (3)查看源码 这样我们就完成了全部的内容。 2.阅读hadoop源码 其中比较常用的 Open Call Hierarchy: 用Open Call Hierarchy可以查看方法的调用层次。
- 2021-02-25 17:55:20
- 阿里
- 这个就比较负责了,可以用hadoop+hbase+spark/storm进行平台构建,spark用于数据分析和处理、hbase用于将处理后的数据保存、hadoop用于离线分析和原始数据存储,具体的还得结合应用场景
- 2021-02-12 02:10:37
- 郭大帅
- hadoop就是什么问题的一种开源实现,hadoop主要实现了两部分,一是分布式存储系统,也就是HDFS,可以让你把东西存储到多台机器上,而你却感觉在使用一台机器一样,二是分布式计算框架MapReduce(第二代为YARN),也可以让你很简单的编写出并行运行的代码。因为hadoop之前的大多数离线计算是基本sql的,所以会sql的比会编程的多,所以facebook在mapreduce的基础上包装了一层框架,可以用sql的形式在hadoop上进行离线计算,框架会把sql转化成mapreduce任务去执行,这个框架叫hive。hive默认分析的是hdfs上的文件,所以特点的太慢,可以考虑使用基于hdfs的一种分布式nosql数据库,叫hbase,让hive分析hbase里的数据,会快点。另外hive还有很多替代品
- 2021-02-12 02:10:37