请列举数据挖掘应用常见的数据源。(或者说,我们都在什么样的数据上进行数据挖掘)()
请列举数据挖掘应用常见的数据源。(或者说,我们都在什么样的数据上进行数据挖掘)()
请列举数据挖掘应用常见的数据源。(或者说,我们都在什么样的数据上进行数据挖掘)()
A.数据挖掘就是对观测到的庞大的数据集进行分析
B.数据挖掘的目的是发现未知的关系和以数据拥有者可以理解的且对其有价值的新颖方式来总结数据
C.数据挖掘是从一个数据库中自动地发现相关模式
D.数据挖掘的数据源包括数据库、数据仓库、Web其他信息存储库或动态流入系统的数据
A.数据源必须是真实的、大量的、无噪声的
B.发现的知识是可接受、可理解、可运用的
C.发现的是用户感兴趣的知识
D.核心任务是对数据关系和特征进行探索
E.并不要求发现放之四海而皆准的知识
A.数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含其内的、人们实现所不知的,但又是有潜在价值的信息和知识的过程
B.挖掘知识的方法可以是数学的方法,也可以是非数学的方法;可以是演绎的方法,也可以是归纳的方法
C.数据源可以是虚构的或真实的、大量的、含有噪声的、用户感兴趣的数据
D.数据挖掘涉及数据融合、数据分析和决策支持等内容
A.数据集成是将数据由多个数据源合并成一个一致的数据存储(如数据仓库)
B.数据变换可以通过如聚集、删除冗余特征或聚类等方法来降低数据的规模
C.数据归约可以用来把数据压缩到较小的区间(如0.0-1.0),提高了涉及距离度量挖掘算法的准确率和效率
D.数据清理可以用来清除数据中的噪声,纠正不一致
A.Thrift,Avro,Syslog,Kafka等数据源上收集数据
B.本地文件数据采集
C.应用系统产生的日志采集
D.大量数据的实时数据采集