欢迎光临112期刊网!
网站首页 > 论文范文 > 计算机论文 > 计算机应用 > 用数据挖掘算法实现企业异常客户分析

用数据挖掘算法实现企业异常客户分析

日期:2023-01-24 阅读量:0 所属栏目:计算机应用


[摘 要] 企业异常客户的性质分析在目标销售中具有重要意义。本文利用最小二乘法作为分析工具,建立异常客户挖掘模型,以基于其拟合直线中的斜率来识别异常客户的性质:消极客户或积极客户。
  [关键词] 最小二乘法拟合直线 斜率 异常客户性质
  
  一、引言
  异常客户是在一段考察时期内与客户的一般行为模式不一致的对象,它们往往被称为孤立点。异常客户分析(即孤立点挖掘)具有重要的现实意义,对于一个企业来说,这些数据往往比常规的客户模型信息更有价值。本文针对销售企业,假设已经用一定的方法探测到了孤立点,接下来采用最小二乘法拟合直线中的斜率分析其性质,从而确定是积极的客户还是消极的客户。
  二、最小二乘法拟合直线
  最小二乘法是一种数学优化技术。它以某一社会、经济或自然现象为对象,寻找一拟合曲线,以满足给定对象系统的一组观测数据。通常要求选择的拟合曲线会使各观测数据到拟合曲线的误差的平方和最小。
  本文研究销售企业(如商场)异常客户的性质。设一段时期内客户的累计消费金额为y,对应的消费时期为x。假定测得客户的n个数据(x1,y1),…,(xn,yn),则在xoy平面上可以得到n个实验点:pi(xi,yi)(i=1,…n),这种图形称为“散点图”(如图1,图2)。在利用最小二乘法进行分析时,各种非线性关系的拟合曲线均可线性化,因此此处选择直线y=ax+b作为拟合直线,寻求x与y之间近似线性关系时的经验公式。其中a为直线的斜率,b为直线在y轴上的截距。www.lw881.com
  如果pi(i=1,…n)全部位于同一条直线上,则可认为变量之间的关系为y=ax+b,但一般情况下不会如此。记估计值=axi+b,则各实验点与拟合直线之间的误差为εi=-yi=(axi+b)-yi,它反映了用直线y=ax+b来描述(xi,yi)时,估计值与观测值yi之间的偏差大小。则有:


  
  要求偏差越小越好。但由于εi可正可负,简单求和可能将很大的误差抵消掉,只有平方和才能反映二者在总体上的接近程度,这就是最小二乘原则。于是问题归结为根据这一要求来确定y=ax+b中的a和b,使得最小。因为f(a,b)是关于a、b的二次函数并且非负,所以其极小值总是存在的。根据罗彼塔法则,f取最小值时,有:


  
  于是得到了符合最小二乘原则的相应解:


  
  三、基于斜率的异常客户挖掘算法
  1.问题描述
  本文的目的是研究某一消费时期内,异常客户的消费倾向。取异常客户一年内各月份的累计消费金额为参考,记录的数据如下(表1,表2)。根据其散点图(图1,图2)可以看出,客户的累计消费金额随时间都呈上升趋势,所以难以观察出该客户是否对商场保持持久的忠诚度,是否有转向竞争对手的可能。基于斜率的异常客户挖掘算法正是要解决识别客户性质这一问题。


  2.算法描述
  算法:outlier_analysis。根据输出的a值来判断异常客户的性质:积极的或消极的。
  输入:客户数据,即参考点,由有序点对(xi,yi)表示;参考点的个数n。
  输出:a(直线的斜率),b(直线在y轴上的截距)。
  方法:
  (1)初始化a、b。
  (2)对客户的n个观测数据(即n个记录点)进行相关数据计算:
  
  (3)if a <0 then
  客户购买金额呈减少趋势,为消极客户
  else
  客户购买金额呈上升趋势,为积极客户
  四、结论
  把客户在一段时间内(可按年进行纵向比较,也可按月、季度等进行横向比较)的购买总金额作为参考点,取连续的n个参考点,根据最小二乘法原来对它们做直线拟和。取阈值为0,根据直线性质,如果拟合直线的斜率小于这个阈值,则这个客户在这段时间内对该企业的购买金额持续减少,并且斜率的绝对值越大,客户的购买金额持续减少的越厉害。反之,若斜率大于这个阈值,则这个客户在这段时间内对该企业的购买金额持续增加,并且斜率越大,客户的购买金额持续增加的越厉害。根据这一分析结果,商场可有效识别异常客户的性质,从而有针对性地进行目标营销——采取有效策略加强与消极客户的沟通,以改善客户对商场的已有认知;继续保持与积极客户的良好关系,以提升其生命周期价值。
  参考文献:
  [1]alex berson等著 贺奇等译:构建面向crm的数据挖掘应用.人们邮电出版社,2001
  [2]jiawei han等著 范明等译:数据挖掘概念与技术.机械工业出版社,2004
  [3]

本文链接:http://www.qk112.com/lwfw/jsjlw/jisuanjiyingyong/244492.html

论文中心更多

发表指导
期刊知识
职称指导
论文百科
写作指导
论文指导
论文格式 论文题目 论文开题 参考文献 论文致谢 论文前言
教育论文
美术教育 小学教育 学前教育 高等教育 职业教育 体育教育 英语教育 数学教育 初等教育 音乐教育 幼儿园教育 中教教育 教育理论 教育管理 中等教育 教育教学 成人教育 艺术教育 影视教育 特殊教育 心理学教育 师范教育 语文教育 研究生论文 化学教育 图书馆论文 文教资料 其他教育
医学论文
医学护理 医学检验 药学论文 畜牧兽医 中医学 临床医学 外科学 内科学 生物制药 基础医学 预防卫生 肿瘤论文 儿科学论文 妇产科 遗传学 其他医学
经济论文
国际贸易 市场营销 财政金融 农业经济 工业经济 财务审计 产业经济 交通运输 房地产经济 微观经济学 政治经济学 宏观经济学 西方经济学 其他经济 发展战略论文 国际经济 行业经济 证券投资论文 保险经济论文
法学论文
民法 国际法 刑法 行政法 经济法 宪法 司法制度 法学理论 其他法学
计算机论文
计算机网络 软件技术 计算机应用 信息安全 信息管理 智能科技 应用电子技术 通讯论文
会计论文
预算会计 财务会计 成本会计 会计电算化 管理会计 国际会计 会计理论 会计控制 审计会计
文学论文
中国哲学 艺术理论 心理学 伦理学 新闻 美学 逻辑学 音乐舞蹈 喜剧表演 广告学 电视电影 哲学理论 世界哲学 文史论文 美术论文
管理论文
行政管理论文 工商管理论文 市场营销论文 企业管理论文 成本管理论文 人力资源论文 项目管理论文 旅游管理论文 电子商务管理论文 公共管理论文 质量管理论文 物流管理论文 经济管理论文 财务管理论文 管理学论文 秘书文秘 档案管理
社科论文
三农问题 环境保护 伦理道德 城镇建设 人口生育 资本主义 科技论文 社会论文 工程论文 环境科学