A.Spark是一个基于内存迭代的框架
B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.Spark可以采用多种编程语言进行开发,比如Scal
D.Java
E.Spark计算过程中,数据不会落地到磁盘
A.RDD具有血统机制(Lineage)
B.RDD默认存储在磁盘
C.RDD是一个只读的,可分区的分布式数据集
D.RDD是Spark对基础数据的抽象
A.MR框架过多的磁盘操作,缺乏对分布式内存的支持
B.MR框架无法高效地支持迭代式计算
C.MR框架无法高效地支持交互式数据挖掘任务
D.MR框架无法进行分析性计算任务
A.对各种数据计算模型的统一抽象
B.RDD是一个读、写、分区记录的集合
C.Spark的计算过程主要是RDD的迭代计算过程
D.一个存储数据的数据结构
A.YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架
B.YARN的体系结构包含三个组件:Resource Manager,Node Manager,Application Master
C.YARN既是资源管理调度框架,也是一个计算框架
D.MapReduce2.0是运行在YARN之上的计算框架,由YARN来为Map Reduce提供资源管理调度服务