
数事载本与变用
基于虚拟技术中logistic
回归模型在睡眠客户预测中的应用
陈宝华柳炳祥万川南
(景德镇陶瓷学院信息工程学院江西景德镇333000)
应用研究
摘要企业的客户关系管理工作好坏,直接影响到企业的核心竞争力,发现一个潜在的客户,往往比接部一个客户所花费的成本要大的多,园此,发境险职用户,并做好相应的客户关怀接留住即将流失的客户,就得非常重要。论文利用1stc回归模型,建立客户路职客户的预测模型建模步骤分为变量分析、变量变换、模型建立评估。从实验分析和结果上看,模型效果拟合较好,评价logistic回归模型结果好坏的ROC、KS曲线验证了该方法的可行性和有效性,为睡眠用户的预测提供了一种分析的恶路和方法。
关键词:睡眠客户预测模型logistic回归模型
中图分类号:F123.9 1引言
文献标识码:A
睡眠用户的定义和模型目标变量的选定息息相关,而目标变量是用模型确定业务间题的模型解释,这个过程本身就是业务问间愿转化统计模型问题过程。鉴于睡眠用户定义的重要性,睡眠用户的直接表现是停止交易,所以最后一次交易到无交易的时间是一个比较合理定义,为此从统计用户两次之间交易间隔来确定睡眠用户的定义。统计用户的最大交易间隔天数分布情况,从图1中可以看出,到当用户最大交易间隔天数在90天后,用户的最大交易间隔分布下降平缓,而且70%以上的用户的最大交易间隔小于等于90天。
发现睡眠客户对于企业的客户管理工作非常重要,论文采用 logistic回归模型对睡眠客户进行分析,发现睡眠客户的特征,进而
预数计数 250 200
150 100 50
0
o 1.00 0.75
度
敏0.50 灵
0.25 0.00
50
100
150
interval
图1用户最大交易间隔图选定模型下的ROC曲线统下的面积-0.8376
0.00
收稿日期:201606-24
0.25
0.50
1-特异度
0.75
图2ROC曲线
200
1.00
250
文章编号:1007-9416(2016)08-0069-02
改善客户关系管理工作,提升客户价值, 2数据处理
2.1数据来源
论文数据来自于某第三方支付平台历史交易数据,对一些涉及商业机密的数据,如交易金额等进行线性变换,对用户个人隐私信息进行剔除。
2.2数据预处理
在建立模型之前,对重复数据进行了预处理。首先从业务的角度上,对用户的交易是主动性交易与被动性交易进行整理,从业务的角度上理解主动交易更能反映用户的行为,所以数据删除被动交易记录。对文本字段转换成数值字段,时间字段转换成标准时闻格式,即数据处理中截取、清洗、转换。
2.3确定高价值客户
从业务的角度上,历史活跃度很低的用户,对企业的认可度可能更小,对这样的用户营销收益不高。所以建立模型时,要考虑确定什么样的用户是高价值用户。高价值的用户有一定的活跃度,而活跃度主要表现在交易次数上。面为了确定有价值用户的规则,筛选出在历史交易时期没有睡眠的用户,计算这些用户在6个月中的历史交易情况,并对整体用户的分布趋势进行汇总统计分析,数据处理结果如表1所示。
3logistic回归模型在睡眠客户预测中的应用与分析
3.1变量选取
对于本次建立的睡眠用户,预测模型的变量选取,主要是客户属性变量与客户交易行为变量。其中客户属性变量有:
1.0 0.8 y 0.6 0.4 0.2 0.0
0.0
以下ste的分布:pred
> s<
0.2
.0.4 做出概家 sleeg
图3KS曲线
0.6
0.8
作者简介:陈宝华(1994一).男,江西崇仁人,录德镇陶资大学信息工程学院项士研究生,主要研究方向:数据挖据与群驾能算法
69
万方数据