CDP中的数据建模需求(1):用户评级模型及潜在线索预测


           CDP的建设,从大的方面讲,可以划分为两个阶段,第一个阶段是数据资产管理,第二个阶段是数据建模及应用。我们一直的主张是从第二个阶段的需求来规划整个CDP的建设。

           最近沟通了一个汽车销售企业,企业有众多的经销商分销渠道,各分销渠道拥有各自的保客数据。保客数据包括了客户信息、金融、保险、维保、购车等维度的数据。企业的需求是,通过保客数据,及可能的第三方数据,使用机器学习,建立增换购用户评级模型,挖掘增换购线索。

           我们发现,这个需求和上次我们提的客户通过电话号码想要实现的需求,希望达成的结果是类似的,都是通过评级模型挖掘潜在客户。只是因为数据源的不同,后者难以落地,而今天讲的这个需求是可以实现的。原因就在于数据维度的丰富程度。如果仅仅是电话号码,第三方数据的匹配和富化,会非常稀疏,而且要花费很长周期。而本项目的需求,因为有详尽的第一方数据,第三方数据只是补充,就使得建模和评估都能实际落地。因此,对于数据建模需求,首要条件是第一方数据的详尽,既有静态的特征数据,又有动态的行为数据,然后再寻求可能存在的第三方数据进行补充和优化。

           回到这个需求,我们的做法分为三个阶段:

           第一阶段是DEMO搭建和演示。1)首先,获取相关的样本数据,将样本数据划分为训练集和测试集;2)利用智数云对训练集建立分类和预测模型,用于客户评级和预测;3)在测试集上评估和优化模型。通过这三个步骤搭建符合要求的DEMO。

           第二个阶段根据DEMO和客户一起调研和评估需求,不断调整DEMO以适应客户的优化要求。

           第三个阶段是数据模型的部署和实施,并做好模型维护和更新。