首页 > 公需科目
题目内容 (请给出正确答案)
[单选题]

假如我们建立一个60000个特征,1000万数据集的机器学习模型,我们怎么有效的应对这样的大规模数据的训练()。

A.对样本进行抽样,在经过抽样的样本上训练

B.应用PCA算法降维,减少特征数量

C.根据重要性对特征进行筛选

D.以上所有

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“假如我们建立一个60000个特征,1000万数据集的机器学习…”相关的问题
第1题

A公司维修部门在不同维修水平下的维修费用资料如下:

维修工时在50000小时的水平下,维修费用可以分解如下:

问题:建立维修部门工资费用的成本性态模型,并估计维修部门工作60000个小时的维修费用。

点击查看答案
第2题
假如我们设定hdfs块的大小是128M,那么,一个大小为500M的数据文件,将会被拆分成()个分片。

A.4

B.3

C.2

D.5

点击查看答案
第3题
假如一个制造商能向用户提供10种不同的发动机、30种颜色、4种车身、2种车架组装成的汽车,那么就应该为每一个最终产品分别建立一个独立的BOM。()
点击查看答案
第4题
所谓多媒体技术是指计算机交互式综合处理多种媒体信息——文本、图形、图像和声音,是将多种信息建立逻辑连接,集成为一个系统并具有交互性的技术。从中我们也能总结出多媒体技术的特征有()

A.数字化、集成性、多样性、交互性、非线性

B.数字化、分散性、交互性、多样性、非线性

C.数字化、分散性、逻辑性、交互性、线性

D.数字化、集成性、多样性、交互性、线性

点击查看答案
第5题
假如一个电子订单的收货地址被改写,我们就说破坏了()

A.数据的及时性

B.数据的不可抵赖性

C.数据的完整性

D.数据的一致性

点击查看答案
第6题
假设我们有一个使用ReLU激活函数的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数吗?()

A.可以

B.不好说

C.不一定

D.不能

点击查看答案
第7题
假如我们希望通过一个统计表就能较方便地了解处于某个分数以下的人数,这时可编制一个()。

A.绝对次数分布表

B.相对次数分布表

C.累积次数分布表

D.累积相对次数分布表

点击查看答案
第8题
机组在30000£­£­60000个工作小时之间应()。

A.轴承检查

B.发动机上部大修

C.在机架上大修

D.更换冷却液

点击查看答案
第9题
面对饮用水水源污染的问题,我们可采取下列哪种措施来应对?()

A.加强水质基础数据调查工作,为制定饮用水标准、确保饮用水安全提供科学依据

B.加强饮用水水源地管理,建立饮用水保护区,进行水源地生态修复

C.加强适应水质特征的技术集成研究,形成不同污染特征的饮用水安全保障技术

D.以上均正确

点击查看答案
第10题
我们想要减少数据集中的特征数,即降维.选择以下适合的方案:()。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征

D.查看相关性表,去除相关性最高的一些特征

点击查看答案
第11题
成矿作用是一个动态过程,我们对某个矿床的成矿流体的特征研究只是某个时刻的特征,而不是全部特征()
点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改