A.安装Hadoopà安装JDKà配置SSHà配置HAdoop的环境à格式化HDFS文件系统à启动Hadoopà运行程序测试à查看集群状态
B.安装Hadoopà安装JDKà配置HAdoop的环境à格式化HDFS文件系统à配置SSHà启动Hadoopà运行程序测试à查看集群状态
C.安装JDKà安装Hadoopà配置SSHà配置HAdoop的环境à启动Hadoopà格式化HDFS文件系统à运行程序测试à查看集群状态
D.安装JDKà安装Hadoopà配置SSHà配置HAdoop的环境à格式化HDFS文件系统à启动Hadoopà运行程序测试à查看集群状态
A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高
B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类
C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写
D.Spark把中间数据放到内存中,迭代运算效率高
A.copy()
B.copyFromStdin()
C.printToStdout()
D.copyFromLocal()
A.利用MapReduce计算模型
B.基于Hadoop集群
C.实现了一批开源的挖掘方法
D.采用了DFS分布式文件系统
A.HDFS采用了 Master/Slave 的架构模型
B.Namenode负责维护文件系统的命名空间
C.Datanode 执行比如打开、关闭、重命名文件操作
D.HDFS暴露了文件系统的命名空间,允许用户以文件的形式在上面存储数据
A.一个分布式文件系统和并行执行环境
B.让用户便捷的处理海量数据
C.优势在于处理数据少计算量高的任务
D.Apache软件基金会下面的一个开源项目
A.Hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是jav
E.io.DataInputStream的子类
A.hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是java、io、DataInputStream的子类
A.Shell 类是一个继承类
B.Shell 类定义了如何在当前文件系统环境中,通过命令进行交互
C.Shell 类定义了静态的字符串命令
D.Shell 类定义了与实现命令的执行相关的属性