关于混合模型聚类算法的优缺点,下面说法正确的是()。
A.当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。
B.混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布。
C.混合模型很难发现不同大小和椭球形状的簇。
D.混合模型在有噪声和离群点时不会存在问题
A.当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。
B.混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布。
C.混合模型很难发现不同大小和椭球形状的簇。
D.混合模型在有噪声和离群点时不会存在问题
A.数据集成是将数据由多个数据源合并成一个一致的数据存储(如数据仓库)
B.数据变换可以通过如聚集、删除冗余特征或聚类等方法来降低数据的规模
C.数据归约可以用来把数据压缩到较小的区间(如0.0-1.0),提高了涉及距离度量挖掘算法的准确率和效率
D.数据清理可以用来清除数据中的噪声,纠正不一致
A.聚类的目的是根据人们所关心的相似关系,寻找数据中潜在的自然分组结构
B.依据被研究对象的不同,聚类算法能够被划分为Q型聚类和R型聚类
C.依据算法结构的不同,聚类算法能够被划分为自下而上与自上而下
D.使用聚类算法时一定需要每个样本的标签
A.如果样本集较大时,聚类收敛时间较长
B.聚类结果可能有偏倚
C.调羲相对复杂,不同的参数组合对最后的聚类效果有较大影响
D.如果样本集的密度不均匀、聚类间距差相差很大时,聚类质量较差
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理
A.ID3算法要求特征必须离散化
B.信息增益可以用熵,而不是GINI系数来计算
C.选取信息增益最大的特征,作为树的根节点
D.ID3算法是一个二叉树模型,即每个节点最多有两个分支
A.数据分析需要借助数据挖掘和机器学习的相关算法
B.数据分析不需要用到大数据处理技术
C.数据分析需要构建统计模型
D.利用数据可视化技术可以将数据分析的结果更清晰地展示
A.BP神经网络是前馈神经网络
B.BP神经网络的参数权重值是由反向传播学习算法进行调整的
C.BP神经网络模型拓扑结构包括输入层、隐层和输出层
D.BP神经网络利用激活函数来实现从输出到输入的非线性映射