题目内容
(请给出正确答案)
[单选题]
数栖平台的数据同步任务,是基于()框架封装而来
A.datax
B.sqoop
C.python
D.kettle
答案
D、kettle
如果结果不匹配,请 联系老师 获取答案
A.datax
B.sqoop
C.python
D.kettle
D、kettle
A.基于云平台的PASS框架,加快各种智能矿山应用开发,方便业务管理
B.基于大数据技术,提供海量数据的流转、汇聚、融合、存储等
C.基于人工智能技术,提供各种生产业务的数字化、智能化服务
B.大规模并行计算:在分布式并行环境中将一个任务分解成更多份细粒度的子任务,这些子任务在空闲的处理节点之间被调度和快速处理之后,最终通过特定的规则进行合并生成最终的结果。典型技术为MapReduce
C.结构化分布式数据存储:类似文件系统采用数据库来存储结构化数据,云计算也需要采用特殊技术实现结构化数据存储,典型技术为BigTable/Dynamo等
D.分布式文件系统:可扩展的支持海量数据的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能(通常保留数据的3份拷贝),典型技术为GFS/HDFS/KFS等
A.复杂的批量数据处理:MapReduce
B.基于历史数据的交互式查询:Impala
C.基于实时数据流的数据处理:Storm
D.图结构数据的计算:Hive
A.Spark是一个基于内存迭代的框架
B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.Spark可以采用多种编程语言进行开发,比如Scal
D.Java
E.Spark计算过程中,数据不会落地到磁盘
A.商务数据分析是对业务的理解,是构建解决问题的假设和分析框架
B.数据分析是通过各种统计方法发现和解释数据的内在规律
C.企业可以基于商务数据分析提出优化方案
D.只有业务部门才能运用商务数据分析解决经营痛点