更新时间:2024年7月26号
免费的Google Analytics 4还是逃不过数据抽样的命运,Google Analytics 4也是会有抽样。
什么是抽样
数据抽样是指选择部分数据进行分析的数据分析做法,以便从更大的数据集中发掘出有意义的信息,这种做法可让你更快地检索数据,同时最大限度地减少对数据质量的影响。
对于GA4而言,计算资源是有效的,为了减少计算资源的消耗,所以GA4的一些报告会抽样。
抽样的限额
抽样的限额,就是超过多少才会抽样:
- 免费版:1000万事件
- 付费版:默认是1亿,可以通过数据质量图标,在“探索”中选择“结果更详细”来提高抽样上限,最高是10亿
哪些数据会抽样
Google Analytics 4 中数据可能会抽样:
- 报表:固定报告,里面的数据可能抽样
- 探索:自定义报告,里面的数据可能抽样
- 广告:外部导入数据,里面的数据不抽样
如何判断报告是否抽样
报告
在报告名称右侧看到:
探索
或在探索的右上角的图标,抽样的时候有个三角形感叹号的图标:
没有抽样的时候是一个圆形的打钩图标:
抽样的阈值或规则
数据抽样有两个条件,以为免费版为例,两个同时满足才抽样:
- 所选时间范围内的事件数超过1000万
- 所选维度和指标不是固定报告的结构
如果你探索里使用的维度和指标是固定报告(也就是报告功能)里的结构,那么不会抽样,可以超过1000万,如:
所选时间范围超过事件数1400万,没有抽样,其实,这个数据你可以直接在报告里看。
如果你探索里使用的维度和指标不是固定报告(也就是报告功能)里的结构,超过1000万一定抽样。还是上面的这个报告,我在列中添加“设备类型”,立刻就变成抽样的了:
比如你的媒体资源一个月的事件数量是超过1000万,那么你在探索里面使用的维度和指标不是固定报告,那你选择的时间范围超过1个月就抽样,你都做不了长时间范围的深入分析,这个就是很大的限制了,这个阈值使得GA4收集数据不限制的黯然失色。
如何解决抽样
- 做好规划,做事件跟踪的时候节制一点,使得探索里能够尽量选择长的时间去分析数据。
- 与BigQuery关联,BigQuery 允许你导出未经抽样的原始数据,但BigQuery的使用是需要付费的,延伸阅读:Google Analytics 4 关联BigQuery入门指引
- 使用付费版的GA4,这个限额就提升到10亿,你还可以未抽样数据探索,最高是150亿,好像调整到500亿了,而未抽样数据探索是有限额的,延伸阅读:国内如何购买Google Analytics 360?
- 使用其他产品,如Adobe Analytics或Matomo,延伸阅读:替代Google Analytics 4 的几个工具