下列关于MapReduce说法不正确的是()。
A.MapReduce程序只能用Java写
B.MapReduce是一种计算框架
C.MapReduce来源于google的学术论文
D.MapReduce隐藏了并行计算的细节,方便使用
A.MapReduce程序只能用Java写
B.MapReduce是一种计算框架
C.MapReduce来源于google的学术论文
D.MapReduce隐藏了并行计算的细节,方便使用
A.MapReduce是一种分布式计算框架
B.MapReduce来源于学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了计算细节
关于 mapreduce框架中一个作业的 reduce 任务的数目, 下列说法正确的是()
A、由自定义的 Partitioner 来确定
B、是分块的总数目一半
C、可以由用户来自定义,通过 JobConf.setNumReducetTask(int) 来设定一个作业中 reduce 的任务数目
D、由 MapReduce随机确定其数目
A.JobServer 是用户作业和 JobTracker 交互的主要接口
B.JobClient 为用户提供提交作业功能
C.JobClient 提供访问子任务报告和日志功能
D.JobClient 提供获取 MapReduce集群状态信息功能
A.前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好
B.前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好
C.前者相比后者学习起来更难
D.前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型
A.FSDataInputStream扩展了DataInputStream以支持随机读
B.为实现细粒度并行,输入分片(Input Split)应该越小越好
C.一台机器可能被指派从输入文件的任意位置开始处理一个分片
D.输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割