在hadoop中定义的主要公用InputFormats中,哪一个是默认值?()
A.TextInputFormat
B.KeyValueInputFormat
C.SequenceFileInputFormat
D.以上都不对
A.TextInputFormat
B.KeyValueInputFormat
C.SequenceFileInputFormat
D.以上都不对
A.Shell 类是一个继承类
B.Shell 类定义了如何在当前文件系统环境中,通过命令进行交互
C.Shell 类定义了静态的字符串命令
D.Shell 类定义了与实现命令的执行相关的属性
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高
B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类
C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写
D.Spark把中间数据放到内存中,迭代运算效率高
A.1.7PB
B.3.9PB
C.5.0PB
D.2.8PB
A.conf-site.xml
B.mapred-site.xml
C.core-site.xml
D.hdfs-site.xml
A.Common Hive HDFS
B.Common MapReduce Pig
C.HDFS MapReduceHBase
D.HDFS Avro HBase