在有指导的数据挖掘中,有关测试集的说法正确的是()。
A.测试集和训练集是相互联系的
B.测试集是用以测试模型的数据集
C.通常测试集大约占总样本的三分之一
D.K-次交叉验证中,测试集只有1个,训练集有K-1个
A.测试集和训练集是相互联系的
B.测试集是用以测试模型的数据集
C.通常测试集大约占总样本的三分之一
D.K-次交叉验证中,测试集只有1个,训练集有K-1个
A.有效的手段将更多流量从落地页引至你的网站、从现有访客挖掘更多销售线索
B.在落地页做一些小调整一般不会显著影响销售线索数量
C.通过广告投放测试,得到并比较这两个版本之间你所关心的数据(转化率,跳出率等),最后选择效果最好的版本
D.确定唯一自变量,观察在各个测试组中因变量效果差异,从而科学的得出影响转化的因素
此题为判断题(对,错)。
A.Tableau是广义数据挖掘中可视化工具
B.Orange可通过Java编程和命令行来调用其分析组件
C.OracleDarwin是企业数据挖据工具
D.Weka是机器学习或数据挖掘的库与工具
A.政务部门应当建立政务数据资源共享、开放安全预警机制,对涉密数据和敏感数据泄漏等异常情况进行监测和预警
B.政务部门发生重大政务数据资源安全事故时,应当立即启动应急预案,并按照规定向有关主管部门报告
C.市网信、公安等部门应当会同其他具有网络安全管理职能的部门建立政务数据资源共享、开放的安全管理体系,制定完善政务数据资源共享、开放安全管理制度,协调处理政务数据资源共享、开放重大安全事件,指导政务部门制定本部门的安全管理规定
D.政务部门应当建立本部门政务数据资源安全管理制度,明确安全管理负责人
A.中国一东盟信息港的服务范围越来越宽泛,集政府、企业和社会大众之需求
B.建设内容从简单的通信基础设施逐步发展到信息数据资源的共享和深层次的挖掘及利用
C.涵盖中国与东盟信息化、数字化合作的诸多方面,涉及的范围广、领域宽,其建设内容种类繁多
D.构建形成以广东为支点的中国一东盟信息枢纽,加快大数据、数字经济、智慧城市等新业态、新模式集聚,推动中国与东盟国家经贸服务、人文交流、技术合作
A.自连接就是自然连接
B.两个表的左外连接和右外连接都不是交叉连接的子集
C.自然连接是等值连接的一种,等值连接又是内连接的一种
D.内连接查询,返回的结果集是两个表中所有相匹配的数据,而舍弃不匹配的数据
A) ETL由三个子过程构成:数据抽取、数据转换和数据加载。
B) ETL又可以扩展为可以分为4个步骤:数据抽取、数据清洗、数据转换和数据加载,即ETCL。C) ETL设计涉及到错误恢复过程设计、归档转储过程设计、作业调度过程设计等内容
D) 根据选用的数据仓库工具将数据从数据源抽取到数据库,然后根据业务规则转换和集成为数据仓库中需要的数据格式,最后将转换的结果装入数据仓库。