A.复杂的批量数据处理:MapReduce
B.基于历史数据的交互式查询:Impala
C.基于实时数据流的数据处理:Storm
D.图结构数据的计算:Hive
A.海量数据的存储要考虑不同的数据格式、数据体量和访问要求。存储策略的选择要重点考虑性价比。
B.计算密集型:南北向高带宽
C.存储密集型的典型应用场景包括:实时数据处理,科学计算
D.计算存储双密集型:东西向和南北向均要求高带宽
A.YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架
B.YARN的体系结构包含三个组件:Resource Manager,Node Manager,Application Master
C.YARN既是资源管理调度框架,也是一个计算框架
D.MapReduce2.0是运行在YARN之上的计算框架,由YARN来为Map Reduce提供资源管理调度服务