有关Hive的INNERJOIN,以下哪些选项是正确的?()
A.多张表进行INNERJOIN操作时,只有所有表中与on条件中相匹配的数据才会显示在不加任何限制条件,直接使用join关键词进行关联时,Hive默认使用INNERJOINHive在做JOIN时仅支持等值连接,不支持非等值连接
B.在做join时,使用别名可以简化查询,提高执行效率
A.多张表进行INNERJOIN操作时,只有所有表中与on条件中相匹配的数据才会显示在不加任何限制条件,直接使用join关键词进行关联时,Hive默认使用INNERJOINHive在做JOIN时仅支持等值连接,不支持非等值连接
B.在做join时,使用别名可以简化查询,提高执行效率
A.SELECT学生.学号,姓名,选课.课程号FROM学生INNERJOIN选课WHERE学生.学号=选课.学号AND选课.成绩ISNULL
B.SELECT学生.学号,姓名,选课.课程号FROM学生JOIN选课WHERE学生.学号=选课.学号AND选课.成绩=NULL
C.SELECT学生.学号,姓名,选课.课程号FROM学生INNERJOIN选课ON学生.学号=选课.学号WHERE选课.成绩ISNULL
D.SELECT学生.学号,姓名,选课.课程号FROM学生INNERJOIN选课ON学生.学号=选课.学号WHERE选课.成绩=NULL
A.数据加载时,overwrite关键字是必须的
B.删除表时,表中的数据可以同时删除掉
C.hive的内表和外表都可以修改location属性
D.Hive是在数据查询时进行模式验证,而不是加载的时候验证
A.加载数据到Hive时数据必须是HDFS的一个路径
B.创建外部表必须要指定location信息
C.创建外部表使用external关键字,创建普通表需要指定internal关键字
D.创建表时可以指定列分隔符
A.冷数据一般而言指的是百TB级别或以上、不更新、偶尔访问的数据,如大量历史详单数据
B.通常近期业务访问的HDFS数据目录、Hive表的近期分区目录以及HBase活动表目录下最可能是热数据
C.通常HDFS上的归档业务数据、Hive历史表/历史分区数据、HBase历史表数据最可能是冷数据
D.实时数据,通常是实时上报到Hive或写入MySQL且不需要实时访问或处理的业务数据
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
A.Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文本映射为一张数据库表,并提供简单的SQL查询功能
B.Hive可以直接使用SQL语句进行相关操作
C.Hive能够在大规模数据集上实现低延迟快速的查询
D.Hivez在加载数据过程中不会对数据进行任何的修改,只是将数据移动到HDFS中Hive设定的目录下
A.一旦表建好,不可再修改表名
B.一旦表建好,不可再增加新列
C.创建外表时需要指定external关键字
D.一旦表建好,不可再修改列名
A.以上B选项和C选项都对
B.可以先选定一张或多张连续的工作表,然后加以删除
C.只能先选定一张工作表,然后加以删除
D.可以先选定若干张不连续的工作表,然后加以删除