MarTech时代,客户数据平台CDP应该包含哪些功能?(一)

根据研究机构MarketsandMarkets的调查,未来几年客户数据平台(CDP)的规模将以29.3%的年均复合增长率不断扩大。在《到底什么是CDP?》一文中,我们从各方的定义中总结得到了CDP的关键特性。而CDP具体应该包含哪些功能,其实也没有统一的标准。

2019年3月,CDP Institute发布了《CDP Vendor Comparison》,同年6月,纷析智库发布《2019年中国企业私域数据与DMP/CDP白皮书》,两篇文档都对CDP的功能有所定义。智子云以此为参考,并结合自身在企业中的实战经验,将CDP的功能分为数据采集与加工、数据管理、ID集成、数据分析和应用、数据服务、定制能力六大板块。


在本篇中,智子云将先详细解析前三个板块:数据采集与加工、数据管理和ID集成。


1 数据采集与加工 

1.1 多渠道采集

在新技术的推动下,企业与客户的触点日趋多样化,与之服务的系统和平台种类也日益增多。全面的数据采集能力已经成为企业积累数据资产的重要保障。目前,企业的客户数据来源包括但不限于官网、APP、微信公众号、微信小程序、H5、广告等线上渠道,以及ERP、门店、IOT、监控等线下渠道。

一般来讲,CDP支持采集的渠道/触点越多,最终能采集到的客户数据就越多,企业可以挖掘的数据价值也会越大。

1.2 非结构化/半结构化数据采集

随着技术的演进,非结构化/半结构化数据(如Web日志,社交媒体评论,语音,视频等)的种类越来越多,且正在扮演越来越重要的角色。

传统情况下,会以预置的格式从这类数据中提取结构化数据,但这会导致原始数据的丢失。随着数据湖等技术的发展,企业已经可以实现数据的大规模存取。为了最大程度地保留原始数据,在应对非结构化/半结构化数据时,CDP应采取先存储,后分析(应用)的方法,即先导入并存储非结构化/半结构化数据,按需再从中提取结构化数据,这将有效降低数据整合和维护的成本。

1.3 数据清洗(ETL)

现实世界的数据总不是完美的,企业采集到的客户数据往往存在数据格式错误、缺失、异常、重复等情况,这会影响后续的数据应用。CDP应提供一些列的工具,支持通过一定的业务规则过滤不符合要求的数据,修正错误数据,补全缺失数据、筛选重复数据,实现对客户数据的清洗。


2 数据管理

2.1 保留原始细节&长久保持

传统情况下,企业会以预置的格式从数据源提取、转换得到需要的数据,而新的业务可能要求从数据源重新采集数据,这会导致数据利用效率低下。

为了提升数据利用效率,CDP应采取先存储,后分析(应用)的方式,保留所有数据(如交易记录,促销历史,Web浏览日志,个人数据更改等)的原始细节。而且,数据导入至CDP后,应该长久保持,用户可以随时从CDP查询导入的所有原始数据。

2.2 数据资产目录

数据资产目录可以帮助企业对客户数据的存储情况有整体的认知,包括数据量的统计以及每个数据列的数据分布统计、数据类型、目录管理等功能。同时,企业可以基于当前的数据情况,有针对性的对CDP的分析和应用进行定制,实现数据驱动企业的目标。

2.3 数据安全

    对企业而言,数据的安全管理应该是多方面的。未经身份验证的人员,应被禁止操作CDP的功能(包括前端操作和API验证)。此外,CDP应具备设置操作权限、控制数据实体等功能。同时,CDP应提供统一的安全管理控制台,管理员应可以监控所有的安全策略,查阅所有的安全控制日志。


3 ID集成

通过ID集成统一用户(客户)标识, 是打通不同来源的客户数据的关键技术。也是CDP不可或缺的关键功能。

在企业中,客户数据往往分布在不同部门的不同系统,各系统间数据互不相通,容易形成数据孤岛,这严重影响了企业对客户数据价值的挖掘。而客户数据中存在各类标识用户的ID或者虚拟的ID(如邮箱、IMEI、Cookie等),通过ID集成把数据中存在关联的ID,按照规则集成起来,建立ID之间的关联关系,赋予用户统一的标识,可以集成客户在全渠道的触点数据,为后续的数据加工提供完整的ID映射关系。

而在B2B的场景中,CDP在管理个体数据的同时,还应支持以企业为中心集 成所有个体数据,并以企业-部门-员工的多层级形式展现。这也意味着,在对数据的分析与应用中,可以组合来自企业和个体两个级别的数据。因此,对于toB的企业而言,支持toB的ID集成将是CDP的必备功能。

从数据采集到ID集成,CDP完成了企业的客户数据从分散到统一的处理流程,这为之后的分析与应用、服务和定制提供了数据基础。


在下一篇中,我们将继续解析CDP的数据分析与应用、数据服务、定制能力三大板块,敬请期待。