什么是Identity Service
Adobe对Identity Service是基于知识图谱和机器学习,将各种ID映射到一个唯一ID上,构建身份图,使得各个来源的数据实现数据的融通,无论用户登录与否,都能够识别到,从而全面了解客户及其行为。
其实Identity Service在Adobe CDP是起到ID Mapping的作用。
如下图,用户未登录匿名信息(Anonymous Identities)、登录信息(Know Identities)和线下信息都能够通过Identity Service打通:
那么ID是如何实现映射的呢?
身份图是基于确定性算法和概率性算法:
- 确定性算法:通过强映射关系,比如一个用户访问www.ichdata.com,会生成一个匿名的ID去标识用户,如果这个用户登录,登录账号为haran.huang@gmail.com,那么匿名ID就和登录账号映射。
- 概率性算法:基于机器学习/Adobe Sensi,利用IP和时态数据找到关系,比如一个IP不同设备在规律的时间访问www.ichdata.com,那么这个可能是同一个人。目前概率算法只支持共享图(Co-op Graph),将于2023年支持私有图(Private Graph)。
国内有的叫精确匹配和模糊匹配。
用户的识别:身份命名空间
Identity Service里引入了身份命名空间去标识用户,通过这个身份命名空间可以识别到特定的个体。
(新产品,从引入各种概念/术语,比如Google Analytics 4也引入身份空间的概念)
可以将身份命名空间理解为各种ID。
身份命名空间的分类
身份空间可以分为标准命名空间和自定义命名空间。
- 标准命名空间:就是内置的身份命名空间,如ECID、电子邮件、GAID、IDFA、Phone等
- 自定义命名空间:你自己创建的身份命名空间,如CRM ID,POS ID
身份空间的组成
身份命名空间由命名空间和ID值组成。
命名空间(Identity namespace)可以理解为什么ID,比如GAID、IDFA就是命名空间:
ID值(Identity value)就是具体的值:
以IDFA为例,命名空间就是IDFA,ID值就是AA-BB-CCC-111-2,只有命名空间和ID值组合在一起,是个整体,才能定位到个体。
为了进一步方便管理身份命名空间,对命名空间做不同的分类,叫身份类型,比如IDFA就叫设备类型,身份类型有如下几类:
- Cookie,Cookie ID可识别Web浏览器。 这些身份对于扩展至关重要,并且构成了身份图的大多数。 但是,从本质上讲,它们会迅速衰减,并随着时间的推移而失去价值
- 跨设备ID,跨设备ID可识别个人ID,并且通常会将其他ID绑定在一起。 示例包括登录ID、CRM ID和忠诚度ID。 这表示 Identity Service 以灵敏地处理这个值。
- 设备ID,设备ID可识别硬件设备,如IDFA(iPhone和iPad)、GAID(Android)和RIDA(Roku),并可由家庭中的多人共享。
- 电子邮件,电子邮件地址通常与单个人员关联,因此可用于在不同渠道中识别该人员。 此类型的身份包括个人身份信息(PII)。 这表示 Identity Service 以灵敏地处理这个值。
- 非人员标识,非人员ID用于存储需要命名空间但未连接到人员群集的标识符。 例如,产品SKU、与产品、组织或商店相关的数据。
- 电话号码,电话号码通常与单个人员关联,因此可用于在不同渠道中识别该人员。 此类型的身份包括PII。 这表示 Identity Service 以灵敏地处理这个值
- Display name:就是命名空间
- Identity Symbol:具体ID的类型
- Type:就是身份类型
它们的关系如下:
ID值 | 身份空间 | 身份类型 | 身份命名空间 |
AA-BB-CCC-111-2 | IDFA | 设备ID | IDFA |
58882046176540 | IMEI | 设备ID | IMEI |
haran.huang | gmail.com | 用户邮箱 | |
Asdfasfdasfadfafd | ichdata.com | Cookie | Cookie ID |
Adobe将ID作为一种数据类型,它除了包含有5个参数,除了身份空间和ID之外,还有xid。
实现方式:身份图
身份图是不同身份之间关系的映射:
xid
所有的ID都会映射到一个唯一ID。
国内叫这个ID为One ID,Adobe里是叫xid,中文叫跨命名空间标识符,如果存在,在不同的命名空间里都是唯一。
需要注意,Adobe CDP里还有一个Profile ID,它是Real-time Customer Profile 里的,而 Real-time Customer Profile 会使用Identity Service里的数据,所以我理解Profile ID就是唯一ID。
比如Sarah Rose这个人的Profile ID是GmTQpEFhNjA,如B2BPerson、CRMID、ECID,Email和电话号都是和Profile映射,但Profile ID并没有出现在上图的可视化的身份图里。
所有的ID都在Linded identities,在这里,其他ID变成Profile ID的属性。
Identity Service以近乎实时的方式集体管理和更新,比如用户更换一个设备访问,登录www.ichdata.com,会生成一个新的ECID,这个ECID几乎实时就出现在身份图里。
身份图的分类
Identity Service中支持三类身份图:
- Private Graph :私有图,就是你自己创建的身份图,仅限于自己账号内使用。
- Co-op Graph:共享图,Adobe有一个产品/组织,所有加入这个产品的公司会构建一个专用的共享图,目前贡共享包含17 亿台设备和 3 亿人集群,主要在北美。Co-op Graph 的ID映射由 76% 的确定性算法和 24% 的概率算法组成。
- Third Party Graph:第三方图,Identity Service也支持第三方公司的身份图,国外有公司专门提供身份图服务的,如LiveRamp 和 TapAd这是一个很细分的领域。
如何使用
在体验数据模型XDM导入数据的时候就可以设置ID的映射和优先级,这个操作过程在XDM中叫标识字段。剩下的都交给Identity Service去处理,Identity Service就会摄取这个标识字段去构建身份图。
比如我现在通过XDM导入用户个人信息,里面有一个id是Emai,点击这个ID,在它的右下角就可以看到Identity:
点击它,就可以设置优先级和命名空间:
命名空间将其设置为Email。
设置好后,就可以在左侧Identites里看到有数据,而这个ID会前面会有指纹图标,表示是标识字段,其实就是身份命名空间:
现在这种设置就是强映射关系,是确定性算法。