更新时间:2024年10月2号
在Google Analytics 4 会使用不同类型的标识符识别用户,将其整合到统一的跨设备用户行为历程中,这些标识符统称为“身份空间”。
身份空间
GA4中引入一个身份空间的概念,事件和用户的相关联是使用所有可用的身份空间来处理的,可以理解为身份空间就是标识符,它包含User ID、用户提供的数据、设备ID,后面又增加“建模”。
User ID
就是你自己的ID体系,前提是需要布署才可以使用,是最准确的。
User ID的配置方式,请看:Google Analytics 4 中设置User ID
需要注意,如果使用Users ID,不要同时将Users ID设置为事件参数,这会导致转化都划分为直接渠道。官方在2024年9月25号公告,这个bug已经修复。
用户提供的数据
用户提供的数据就是用户同意了收集的一些数据,但没有收集User ID的时候,会将用户提供的数据视作用户识别的ID。
用户提供的数据的优先级是:邮件、电话号码、名字和地址。
注意:目前这个功能有bug,会导致New Users数值为0
设备ID
代表单个匿名的网站用户或移动应用用户的基于浏览器或移动应用的标识符。
- 在网站上,设备 ID 从
_ga
Cookie 的客户端 ID 属性中获取值,其实就是Client ID。 - 对于APP,GA4会自动为应用的每个实例生成并分配一个应用实例 ID。该 ID 用于在整个分析中计算用户指标。 设备 ID 通过应用实例 ID 获取值。
还是跟以前的定义是一样,在BigQuery里就是user_pseudo_id字段。
建模
当用户在Consent Mode拒绝跟踪的时候,GA4不能使用cookie发送数据,但会发送不使用Cookie的ping,收集非个人信息,这些区分不了用户,比如发送10个页面,你是不知道这是1个用户产生的,还是10个用户产生的,谷歌用于数据建模,补充数据。
延伸阅读:Google Tag Manager里的Consent Mode v2意见征求模式
- 混合:优先级顺序是用户 ID>设备 ID>建模。如果已收集,则使用用户 ID。如果未收集任何用户 ID,则 Analytics 使用设备 ID。如果没有可用的标识符,Analytics 将使用建模。
- 观察:优先级顺序是用户 ID>设备 ID。如果已收集,则使用用户 ID。如果未收集任何用户 ID,则 Analytics 使用设备 ID。
- 基于设备:仅使用设备 ID 并忽略收集的所有其他任何 ID。
该选择哪个呢?
- 如果你有开启Consent Mode,那么使用“混合”,这样利用GA4里的混合数据找回六七成的丢失的数据。
- 如果你有部署Users ID,那么选择“观察”,这样能将用户的行为流关联起来,实现跨设备跟踪
- 如果没使用Consent Mode和Users ID,直接用“基于设备”,这里一般建议设置为“基于设备”,这样能够避免阈值问题,
注意:您选择哪个选项都不会影响数据的收集或处理。您可以随时在上述选项之间切换,而不会对数据造成任何永久性影响。
有关用户的指标
在GA4里侧重“活跃用户数”,有关用户的指标定义如下:
- 新用户数:有first_visit/first_open的用户
- 活跃用户数:活跃用户是指进行过感兴趣的会话的用户
- 总用户数:基于Client ID去重