首页 > 继续教育
题目内容 (请给出正确答案)
[多选题]

在大数据计算服务SQL中使用distributeby和sortby可以对数据进行局部排序,以下对distributeby、sortby的用法描述正确的有:()。

A.数据会按照distributeby指定的列进行分片,hash值相同的数据会在一个分片中

B.使用sortby子句时,必须有distributeby子句

C.sortby和orderby的用法没有区别

D.在一个分片中,数据会按照sortby指定的列进行局部排序

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“在大数据计算服务SQL中使用distributeby和sor…”相关的问题
第1题
运营人员为了搞促销,需要找出目标客户名单,这批客户的信息存储在大数据计算服务(MaxCompute,原ODPS)的user表中,并且用户名字段username中包含“vip”字样,通过执行SQL语句()可以找出这批客户。

A.select*fromuserwhereusernamecontains(‘vip’)

B.select*fromuserwhereusername=’vip’

C.select*fromuserwhereusernamelike‘*vip*’

D.select*fromuserwhereusernamelike’%vip%’

点击查看答案
第2题
在大数据计算服务(MaxCompute,原ODPS)的数据仓库中的订单表fact_order,建表语句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)paititionedby(dtstring);此表中的数据是从ods_order加工而来,ods_order建表语句如下:createtableods_order(order_idstring.order_amtbigint,order_dtstring);ods_order中有一条记录数据值是order_idorder_amtorder_dt000110020160301运行SQL语句将数据从ods_order加载到fact_order中:insertoverwritetablefact_orderpartition(dt=’20160301’)select*fromods_order;对此语句的执行结果描述正确的是:()。

A.语句可以执行,但是这条数据会被当作脏数据丢弃

B.目标表与源表中的数据类型不一致,执行出错

C.提交SQL时会报语法错误

D.语句可以执行,order_amt的值会被自动的转为double类型

点击查看答案
第3题
大数据计算服务(MaxCompute,原ODPS)提供了MapReduce编程接口,用户可以使用MapReduce提供的SDK编写程序处理大数据计算服务的中的数据。目前提供了()语言的SDK。

A.Perl

B.C++

C.Python

D.Java

点击查看答案
第4题
DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源之间的高效数据同步。使用DataX将存储在对象存储OSS中的数据同步至阿里云端大数据计算服务(MaxCompute,原ODPS)时,以()为粒度进行切分实现并发处理。

A.没有任何切分

B.OSS的object

C.OSS的endpoint

D.OSS的Bucket

点击查看答案
第5题
在大数据计算服务(MaxCompute,原ODPS)中,使用MapReduce开发一个分词程序,即输入为保存在表中的多篇文章(每篇文章一行纪录),参考一个字典文件(该文件会经常更新)进行分词。简而言之,在执行该程序的时候,既需要输入待分词的文章(已经保存在表中了),又需要输入字典(为经常变动的本地文件),以下最合理的解决方案为:()。

A.将这个字典与源代码一起进行打包,直接执行即可

B.每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访问

C.将字典打包jar包,使用jar命令执行MR程序时,通过resources参数指定该jar包

D.将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现

点击查看答案
第6题
大数据计算服务中,临时数据表tmp_item是一张非分区表,开发人员在建表时指定了lifecycle属性为30,且使用一次后未再进行任何操作和访问。30天后这张表会()。

A.tmp_item会被自动重命名为tmp_item.deleted

B.tmp_item表会被自动删除掉

C.不会任何变更

D.tmp_item中的数据会被清空,表结构仍存在

点击查看答案
第7题
使用大数据计算服务tunnel命令上传数据文件data.csv到表t_data成功后,不小心又之行了一次该上传命令,以下说法中正确的是:()。

A.最后一次上传的数据会追加插入到表t_data中去

B.最后一次上传的数据会覆盖插入到表t_data中去

C.记录重复会报错退出

D.最后一次上传的数据会把t_data中已存在的相关记录更新

点击查看答案
第8题
云计算和大数据技术在公共服务领域方面发挥着重要的作用。()

云计算和大数据技术在公共服务领域方面发挥着重要的作用。()

点击查看答案
第9题
华为云EI服务中,具有全栈大数据能力的是什么服务()

A.CDM云数据迁移服务

B.CloudStream实时流计算服务

C.DWS数据仓库服务

D.MRSMapReduce服务

点击查看答案
第10题
在MaCompute中,通常使用SQL DML中的UPDATE更新Max Compute 表或者分区中的数据。()
点击查看答案
第11题
Max Compute 适用于离线数据的处理、分析或挖掘,它同时提供存储和计算两种能力,支持SQL 和编程(Map/Reduce框架)等多种使用方式。()
点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改