在大数据计算服务SQL中使用distributeby和sortby可以对数据进行局部排序,以下对distributeby、sortby的用法描述正确的有:()。
A.数据会按照distributeby指定的列进行分片,hash值相同的数据会在一个分片中
B.使用sortby子句时,必须有distributeby子句
C.sortby和orderby的用法没有区别
D.在一个分片中,数据会按照sortby指定的列进行局部排序
A.数据会按照distributeby指定的列进行分片,hash值相同的数据会在一个分片中
B.使用sortby子句时,必须有distributeby子句
C.sortby和orderby的用法没有区别
D.在一个分片中,数据会按照sortby指定的列进行局部排序
A.select*fromuserwhereusernamecontains(‘vip’)
B.select*fromuserwhereusername=’vip’
C.select*fromuserwhereusernamelike‘*vip*’
D.select*fromuserwhereusernamelike’%vip%’
A.语句可以执行,但是这条数据会被当作脏数据丢弃
B.目标表与源表中的数据类型不一致,执行出错
C.提交SQL时会报语法错误
D.语句可以执行,order_amt的值会被自动的转为double类型
A.Perl
B.C++
C.Python
D.Java
A.没有任何切分
B.OSS的object
C.OSS的endpoint
D.OSS的Bucket
A.将这个字典与源代码一起进行打包,直接执行即可
B.每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访问
C.将字典打包jar包,使用jar命令执行MR程序时,通过resources参数指定该jar包
D.将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现
A.tmp_item会被自动重命名为tmp_item.deleted
B.tmp_item表会被自动删除掉
C.不会任何变更
D.tmp_item中的数据会被清空,表结构仍存在
A.最后一次上传的数据会追加插入到表t_data中去
B.最后一次上传的数据会覆盖插入到表t_data中去
C.记录重复会报错退出
D.最后一次上传的数据会把t_data中已存在的相关记录更新