基于粗糙集的数据挖掘技术在电子商务中的应用

点赞:19680 浏览:84648 近期更新时间:2024-03-05 作者:网友分享原创网站原创

摘 要 数据挖掘技术应用于电子商务,高效组织利用大量的数据信息,再把粗糙集的基本思想应用于电子商务,创新了一种利用数据挖掘技术的关于客户数据库的方法,以它的高效性再次使电子商务技术得到了发展.

关 键 词 数据挖掘;电子商务;粗糙集;聚类分析

中图分类号TP392 文献标识码A 文章编号 1674-6708(2012)77-0226-02

粗糙集是一种由波兰科学家Pawlak创立数据分析处理理论,最开始只是研究语言问题,后来才进入数学及计算机领域;数据挖掘技术则是一种对事物分类处理,更是对数据的深度处理的方式,可以应用于数学、商业等等领域.但是当粗糙集理论和数据挖掘技术相结合运用于电子商务的管理和进程,将会产生一种意想不到的高效及便捷.

基于粗糙集的数据挖掘技术在电子商务中的应用参考属性评定
有关论文范文主题研究: 关于属性的论文范文集 大学生适用: 本科毕业论文、学术论文
相关参考文献下载数量: 35 写作解决问题: 怎么写
毕业论文开题报告: 论文提纲、论文前言 职称论文适用: 期刊目录、职称评中级
所属大学生专业类别: 怎么写 论文题目推荐度: 免费选题

1.粗糙集的基本思想和背景

针对所讨论的论域中的任意一个对象,都会有一些被我们获得的知识去解释和描述它,这就是粗糙集的理论出发点.

1.1 知识的约简

知识的约简是粗糙集理论的核心之一,是粗糙集在应用中的关键.知识的约简分为属性约简和属性值约简.对于信息系统,大量的属性并不是具有等同地位的,甚者有些属性是负赘的.因此,首要目的是维护信息系统的划分类别的职能不变的情况下进行删减冗余属性,这也是属性约简的任务.

1.2 粗糙集理论的特点

决策表是粗糙集理论最主要的研究对象.对决策表进行分析是有决策的分析,对于有决策的分析,包括属性约简以及属性值约简这两个步骤,然而对无决策的分析,只进行属性约简即可.

然而对于有决策的分析,最终的目的不仅仅是通过属性约简去掉冗余属性,用户希望得到的是决策规则.只依靠属性约简是不可能达到目的的,只有通过属性值的约简才可以实现.

粗糙集理论具有以下特点:

1)粗糙集理论不需要依赖先验知识;

2)粗糙集理论能够进行高效的数据分析;

3)粗糙集理论能够关系型数据库里的关系转化成决策表,这就是为什么粗糙集理论被广泛应用的重要原因.粗糙集理论提取的规则更加容易被检测;

4)粗糙集理论可以和模糊集相互补充,更好的完善了对信息的描述.

2.基于粗糙集的数据挖掘技术运用于电子商务

下面是基于粗糙集的数据挖掘技术运用于电子商务的一个实例.一个论域U等于{0,1,2,3,4,5,6}是一个电子商务公司的怎么写作人群.满足的条件属性A等于{u,v,m,n}等于{年龄,性别,学历,收入},决策属性B等于{购写次数}等于{f}.u表示客户的年龄,0代表年龄在18~25之间,1代表年龄在26~35之间,2代表年龄在35~45之间;v表示客户的性别,0和2分别代表男和女;m表示学历,0代表高中及以下,1代表本专科,2代表硕士及以上;n表示收入,0代表2000~5000,1代表低于2000,2代表高于5000;f表示客户购写次数,0表示未购写,1表示购写次数小于5次,2表示购写次数大于5次.


接下来对属性进行约简,去掉冗余属性.

因此属性c是不必要的,所以可以得出性别对顾客的购写行为没有影响.然而u,n,m是必要的,这样可得到C的一个约简{u,n ,m},也是C的D核.约简后得出表二,对象5和6重复,所以删除对象6.

之后再对每一个对象进行简化属性值.对于规则1:,考虑集合族F:{}等于{{1,2,4,5},{1,2,3},{1,4}}, 等于{1},Y1等于[f]1等于{1,2},满足.现从F1中去掉每一个属性值,观察其余属性值的交集是不是在决策属性值子集里,如果在,则构成值约减.通过计算,规则1有两种约减形式,,并且这两种形式是规则1的最简形式,F1的核是{[n]0}. 同理,可求出其他规则的核以及最简形式,见表3和表4.

本例中选取其中一个对应于表五,可表示为以下规则:

具体有如下特征:

1)高中以下学历,2000元以下收入,表示26~35岁的顾客群体,从未购写;

2)本科学历,收入在2000~5000元的群体或本科学历,年龄在18~25岁的顾客群体,购写5次以下;

3)硕士及以上学历或年龄31~45岁的顾客群体,购写5次以上.

3.结论

基于粗糙集的数据挖掘技术对于电子商务领域的应用是高效的,从上述文本即可看出,这一理论是有实效性的,未来应该做的是努力的把粗糙集和数据挖掘技术结合得天衣无缝,以促进电子商务快速而迅猛的发展.