数据挖掘在大数据时代下的应用

【摘要】 数据挖掘一直是各个行业的关注的重点。近几年,数据挖掘伴随着大数据的火热开始迎来更大的机遇。本文介绍了数据挖掘相关的概念,一些常用的数据挖掘的分析方法,最后介绍了数据挖掘技术几个常见的应用领域。

【关键词】 数据挖掘 分析方法 应用

一、基本概念介绍

1、大数据。2011 年5 月,麦肯锡全球研究院在《大数据:创新、竞争和生产力的下一个新领域》中指出,大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产要素;而人们对于大数据的运用预示着新一波生产率增长和消费者盈余浪潮的到来。据估计,在未来,数据将至少保持每年50%的增长速度。

2、数据挖掘。数据挖掘是一门新兴的学科,它诞生于20 世纪80 年代,主要面向商业应用的人工智能研究领域.从技术角度看,数据挖掘就是从大量的、复杂的、不规则的、随机的、模糊的数据中获取隐含的、人们事先没有发觉的、有潜在价值的信息和知识的过程.从商业角度来说,数据挖掘就是从庞大的数据库中抽取、转换、分析一些潜在规律和价值,从中获取辅助商业决策的关键信息和有用知识。

二、数据挖掘的基本分析方法

分析方法是数据挖掘的核心工作,通过科学可靠的算法才能实现数据的挖掘,找出数据中潜在的规律。通过不同的分析方法,将解决不同类型的问题,在现实中针对不同的分析目标,找出相对应的方法。目前常用的分析方法主要有聚类分析、分类和预测、关联分析等。

1、聚类分析 。聚类分析就是将物理或抽象对象的集合进行分组,然后组成为由类似或相似的对象组成的多个分类的分析过程,其目的就是通过相似的方法来收集数据分类。它是一种无先前知识,无监督的学习过程,从数据对象中找出有意义的数据,然后将其划分在一个未知的类。这不同于分类,因为它无法获知对象的属性。“物以类聚,人以群分”,通过聚类来分析事物之间类聚的潜在规律。聚类分析广泛运用于心理学、统计学、医学、生物学、市场销售、数据识别、机器智能学习等领域。 聚类分析根据隶属度的取值范可分为硬聚类和模糊聚类两种方法。硬聚类就是将对象划分到距离最近聚类的类,非此即彼,也就是说属于一类,就必然不属于另一类。模糊聚类就是根据隶属度的取值范围的大小差异来划分类。一个样本可能属于多个类。常见的聚类算法主要有密度聚类算法、层次聚类算法、划分聚类算法、网格聚类算法、模型聚类算法等。

2、分类和预测 。分类和数值预测是问题预测的两种主要类型。分类是预测分类(离散、无序的)标号,而预测则是建立连续值函数模型。分类是数据挖掘的重要基础,它是对已知的训练数据集表现出来的特性,获得每个类别的描述或属性来构造相应的分类器或者分类。分类是一种有监督的学习过程,它是根据训练数据集发现准确描述来划分类别。常见的分类算法主要有决策树、粗糙集、贝叶斯、遗传算法、神经网路等。预测就是根据分类和回归来预测将来的规律。常见的预测方法主要有局势外推法、时间序列法和回归分析法。

3、关联分析 。在自然界,事物之间存在着千丝万缕的联系,当某一事件发生时,可能会带动其它事件的发生。关联分析就是利用事物之间存在的依赖或关联知识来发现事物之间存在的规律性,然后通过这种规律性进行预测。如经典实例购物篮分析,就是通过分析顾客购物篮中物品的管理规律,来分析顾客的购物心理和习惯,然后根据这种规律来帮助营销人员制定营销策略。

三、大数据时代的数据挖掘的应用领域

1、科学研究。在科学研究中,经常需要分析各种大量的实验和观测数据,并找出相关的规律和知识.这些数据分析和挖掘都需要一定的算法,利用数据挖掘技术能科学的找出数据之间的规律以及找出我们未发现的知识.例如,对外空星体的探索、对DNA 数据的分析等等.

2、制造业。在制造业领域,通过对零部件生产的各种数据分析,来提高生产效率和提高良品率,如分析造成产品缺陷的环节及数据,找出生产过程影响生产率的因素,暴露制造和装配操作过程中变化情况等各种因素,从而通过重点改进相关环节及工艺,来提高企业的生产效率及利益.

3、电信业。近些年,随着电信业的蓬勃发展,电信业的技术和服务已经成为一个非常庞大的混合载体,它不仅关系市场,也关系到技术及服务.在将企业有效资源整合,实现无缝连接的过程中,将产生大量的复杂数据集合,如何从庞杂的数据中找寻出规律和知识,已成为电信业的重要问题。通过数据挖掘的运用,能很好的解决上述问题,为行业的发展起到很好的作用,如系统负载、数据通信速率和容量、用户行为、利润率等;采用孤立点分析和聚类方法,查找出盗用模式和异常状态;利用关联和序列模式,找出影响电信发展的相关因素,更好的推动电信业务的发展。

参 考 文 献

[1]胡天状.数据挖掘技术在教育决策支持系统中的应用[D].杭州:浙江师范大学,2002.

[2]刘华婷,郭仁祥,姜浩.关联规则挖掘Apriori算法的研究与改进[J].计算机应用与软件,2009(1):146-149.

转载请注明出处学文网 » 数据挖掘在大数据时代下的应用

学习

石中瑰宝昌化石

阅读(30)

本文为您介绍石中瑰宝昌化石,内容包括化石中的奇石,远古时期奇石石刻的价值。昌化位于浙江省西北部山区临安市境内。从临安市区向西驱车50余公里就到昌化镇。昌化总面积232.63平方公里,地域内以山地为主,山地占1.9万公顷。总人口大约2.2万

学习

中医中药

阅读(67)

本文为您介绍中医中药,内容包括中医中药大全全套,中医常用中药解释。中药之“六陈”

学习

艺术心理学论文范文精选

阅读(31)

本文为您介绍艺术心理学论文范文精选,内容包括艺术心理学论文范文,艺术心理教育论文2000字。艺术心理学论文篇1摘要:"师者,传道受业解或也"这是历史对老师职业的解读。实质上,教师还肩负着培养人的道德、思想、人格、品德的责任,也担负着传

学习

浅论生物中的转基因技术的应用

阅读(30)

本文为您介绍浅论生物中的转基因技术的应用,内容包括农业转基因生物安全评价管理办法,转基因技术的利与弊摘要。【摘要】转基因技术在植物、动物上都有广阔的应用前景,本文简要介绍转基因技术在各方面的应用。

学习

“双反”中国策

阅读(29)

本文为您介绍“双反”中国策,内容包括双反人员指什么,双反指的是什么。美国发起的此次“双反”调查,不仅是中国光伏行业,也是中国新能源领域首次遭遇的“双反”调查。

学习

顾源·柯震东

阅读(23)

本文为您介绍顾源·柯震东,内容包括顾源柯震东剪辑,顾源柯震东发型。但我却只想陪在她的身边。

学习

奥巴马开学演讲稿

阅读(46)

本文为您介绍奥巴马开学演讲稿,内容包括奥巴马开学演讲完整版,奥巴马开学第一课演讲稿全文。开学在即,很多地方已经陆陆续续开学了,面对新学期新气象,校长领导也已经做好演讲的准备了,一起来看看奥巴马为学子的演讲稿吧。

学习

集中供热系统换热站设计之浅见

阅读(75)

本文为您介绍集中供热系统换热站设计之浅见,内容包括集中供热换热站运行调节方案课件,供热系统换热站设计。【摘要】换热站设计是一个复杂的过程,因此对这里未能叙述的问题也应该按照相关的设计规范进行设计,这样才能保证整个热网系统运行

学习

浅谈对药学服务的认识

阅读(61)

本文为您介绍浅谈对药学服务的认识,内容包括浅谈对中医药学的认识,浅谈药学服务与应对策略。【摘要】尽管以目前我国医疗机构药事管理的现状来看,建立以药学服务为中心的工作模式尚可面临诸多困难,但把合理用药同改善病人生存质量这一终极

学习

多媒体课件与课堂教学

阅读(23)

本文为您介绍多媒体课件与课堂教学,内容包括课堂教学多媒体课件制作说明,课堂多媒体游戏课件怎么制作。【摘要】本文就多媒体在现代课堂教学中的优点与存在的问题进行了剖析,全文共分两部分,第一部分着重论述了多媒体的特点以及它在教学中

学习

产业同构的测度方法

阅读(28)

本文为您介绍产业同构的测度方法,内容包括产业同构系数,产业同构测度。摘要:产业同构的测度是一个复杂的问题,需要综合使用各种测度方法进行比较全面的分析。关于产业同构程度的测度方法,在许多著作和文献中已有涉及,但不是太全面,文章介绍了

学习

引领时代还是被时代引领

阅读(25)

本文为您介绍引领时代还是被时代引领,内容包括什么引领时代方向,什么时代把握时代引领时代。放下昨天已有的东西,才能有新的机会。

学习

民主与科学的时代内涵

阅读(22)

1946年5月4日通过的九三学社《成立宣言》明确提出:本社同人,愿本“五四”的精神,为民主与科学之实现而努力,始终不懈,谨此宣言。《成立宣言》全文一共99个字,就有3次提到“五四”,3次提到“民主、科学”。由此可见,九三学社的缘起与密不可分,与民

学习

全球进入反恐时代

阅读(21)

本文为您介绍全球进入反恐时代,内容包括全球反恐纪实纪录片,全球反恐并肩同行。“9・11”后,恐怖主义在全球范围内愈演愈烈,世界正在步入反恐时代。

学习

数字摄影的时代意义

阅读(37)

本文为您介绍数字摄影的时代意义,内容包括数字摄影的实践的目的和意义,数字摄影的发展给影像带来了什么。摘要:数字摄影短短的几十年发展迅速,在数字和传统并进的时代下,数字摄影显示着独特的艺术魅力,想要进一步了解数字摄影就要对传统摄影

学习

通用数据录入系统的设计与实现

阅读(24)

本文为您介绍通用数据录入系统的设计与实现,内容包括数据录入系统制作,数据录入程序。摘要:本文通过开发实例,阐述了基于XML、WebService等核心开发技术、模型驱动的软件架构,结合录入界面动态生成以及数据质量约束方法,实现面向业务、

学习

函数数据分析

阅读(17)

本文为您介绍函数数据分析,内容包括常用数据分析函数,函数数据分析方法实操。【摘要】近几年来,函数数据分析方法正处于迅猛发展阶段,国内已有一些学者将其应用到拍卖,股票等方面。它的出现带来了统计学分析方法上的一次变革。本文简要介绍

学习

新书推荐:《小时代》

阅读(28)

本文为您介绍新书推荐:《小时代》,内容包括小说小时代全文,小时代小说推荐。新书推荐