首页 > 考试题库
题目内容 (请给出正确答案)
[多选题]

大数据计算服务(MaxCompute,原ODPS)中的MapReduce是一种编程模型,用于大规模数据集的并行运算,它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。其中,两个主要阶段Map和Reduce相互配合,可以完成对海量数据的处理。关于这两个阶段的关系,说法正确的有:()。

A.一个reduce的输入数据可能来自于多个map的输出

B.一个MR处理可以不包括任何map

C.一个MR处理可以不包括任何reduce

D.一个map的输出结果可能会被分配到多个reduce上去

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“大数据计算服务(MaxCompute,原ODPS)中的Map…”相关的问题
第1题
大数据计算服务(MaxCompute,原ODPS)的MapReduce由多个步骤组成,以下()步骤不是必须的。

A.combine

B.shuffle

C.map

D.reduce

点击查看答案
第2题
大数据计算服务(MaxCompute,原ODPS)提供了MapReduce编程接口,用户可以使用MapReduce提供的SDK编写程序处理大数据计算服务的中的数据。目前提供了()语言的SDK。

A.Perl

B.C++

C.Python

D.Java

点击查看答案
第3题
大数据计算服务(MaxCompute,原ODPS)中的客户表customer是一张非分区表,现在想要清空表的内容然后重新上传数据,可以通过()将数据清空。

A.deletefromcustomer

B.insertoverwritetablecustomerselect*fromcustomer

C.truncatetablecustomer

D.droptablecustomer

点击查看答案
第4题
运营人员为了搞促销,需要找出目标客户名单,这批客户的信息存储在大数据计算服务(MaxCompute,原ODPS)的user表中,并且用户名字段username中包含“vip”字样,通过执行SQL语句()可以找出这批客户。

A.select*fromuserwhereusernamecontains(‘vip’)

B.select*fromuserwhereusername=’vip’

C.select*fromuserwhereusernamelike‘*vip*’

D.select*fromuserwhereusernamelike’%vip%’

点击查看答案
第5题
DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源之间的高效数据同步。使用DataX将存储在对象存储OSS中的数据同步至阿里云端大数据计算服务(MaxCompute,原ODPS)时,以()为粒度进行切分实现并发处理。

A.没有任何切分

B.OSS的object

C.OSS的endpoint

D.OSS的Bucket

点击查看答案
第6题
在大数据计算服务(MaxCompute,原ODPS)的数据仓库中的订单表fact_order,建表语句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)paititionedby(dtstring);此表中的数据是从ods_order加工而来,ods_order建表语句如下:createtableods_order(order_idstring.order_amtbigint,order_dtstring);ods_order中有一条记录数据值是order_idorder_amtorder_dt000110020160301运行SQL语句将数据从ods_order加载到fact_order中:insertoverwritetablefact_orderpartition(dt=’20160301’)select*fromods_order;对此语句的执行结果描述正确的是:()。

A.语句可以执行,但是这条数据会被当作脏数据丢弃

B.目标表与源表中的数据类型不一致,执行出错

C.提交SQL时会报语法错误

D.语句可以执行,order_amt的值会被自动的转为double类型

点击查看答案
第7题
在大数据计算服务(MaxCompute,原ODPS)中,使用MapReduce开发一个分词程序,即输入为保存在表中的多篇文章(每篇文章一行纪录),参考一个字典文件(该文件会经常更新)进行分词。简而言之,在执行该程序的时候,既需要输入待分词的文章(已经保存在表中了),又需要输入字典(为经常变动的本地文件),以下最合理的解决方案为:()。

A.将这个字典与源代码一起进行打包,直接执行即可

B.每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访问

C.将字典打包jar包,使用jar命令执行MR程序时,通过resources参数指定该jar包

D.将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现

点击查看答案
第8题
大数据计算服务(MaxCompute,原ODPS)提供了客户端odpscmd,支持Windows、Linux或者OSX等操作系统。在执行前需要对odpscmd的配置文件odps_config.ini中的某些参数进行设定,包括用于鉴权的access_id/access_key,指定服务地址的end_point,以及tunnel的服务地址tunnel_endpoint等。其中有一项参数为:project_name,关于这个参数的说法,正确的是:()。

A.指定的项目必须存在,否则连接过程中会报错

B.如果给该值指定了恰当的project名字,连接成功后,会自动进入该project

C.如果不指定该值,连接成功后会自动进入上次退出时所在的project

D.如果不指定该值,且帐户下就一个project的话,连接成功后会自动进入该project

点击查看答案
第9题
某电商的大数据理平台(DMP)拥有千亿级的商业数据信息,帮助商家进行精准营销。通过已有的商业数据,快速匹配广告客户的目标人群,在线推送营销信息。该匹配场景可以选用()实现。

A.云数据库RDS

B.分析型数据库AnalyticDB

C.大数据计算服务MaxCompute

D.表格存储TableStore

点击查看答案
第10题
大数据计算服务的开发人员创建了日志表,并且导入了历史数据后发现表的一个字段命名拼写有错误,可以采用()更正此问题成本最低。

A.将原表重命名,然后建张正确的表,再导入历史数据

B.在表的末尾新添加一个字段

C.删除表后重建,然后重新导入历史数据

D.通过alter命令重新命令该字段

点击查看答案
第11题
云计算和大数据技术在公共服务领域方面发挥着重要的作用。()

云计算和大数据技术在公共服务领域方面发挥着重要的作用。()

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改