更新时间:2023年3月3号
数据驱动归因,英文是Data-Driven Attribution,简称DDA,或数据驱动归因模型,英文是Data-Driven Attribution Models,简称DDAM,也叫算法归因。
自Google 宣布即将推出归因模型以来,广告主对新的数据驱动模型表现出很大兴趣。Google于2013年推出了Google Analytics Premium的数据驱动归因模型,并于2014年在AdWords中发布了该模型。
数据驱动归因是一种基于机器学习的归因模型,与基于规则的归因模型不同,数据驱动归因使用所有可用的路径数据,包括路径长度,曝光顺序和广告素材,来了解特定营销接触点的存在如何影响用户转化的可能性以更好地将功劳分配给任何接触点。
数据驱动归因是基于算法的,要想使用数据驱动归因,数据量需要积累到一定的规模才可以使用,目前数据驱动归因可在Google营销体系中的多个平台上使用:Google Attribution 360,Google Analytics 360,DoubleClick和AdWords,不同平台对数据量的要求是不一样的,具体如下:
算法或机器学习中有两大类算法:分类和回归,转化可以用0和1来表示,这类算法归因实际是一个分类问题,理论上能用于分类的算法都可以用于算法归因的。实际常用的算法有马尔科夫链、沙普利值、生存分析和Harsanyi Dividend。
前面三个算法在学精算的有涉及到,马尔科夫链是随机过程,沙普利值是计算投资组合,生存分析是寿险精算,但都只记得个名字了?♀️
具体的算法原理和实现过程有兴趣自己去谷歌一下吧。
Markov Chain:马尔科夫链
Shapley Value:沙普利值
Shapley Value是由经济学诺贝尔奖获得者Lloyd S. Shapley开发的,它是一种在团队成员之间公平分配团队产出的方法。对于以数据为依据的归因,要分析的“团队”具有营销接触点(例如自然搜索,展示和电子邮件)作为“团队成员”,而团队的“输出”就是转化。数据驱动的归因算法计算每个营销接触点的反事实收益,即,将暴露于这些接触点的相似用户的转换概率与路径中未出现接触点之一的概率进行比较。
Survival Analysis:生存分析
生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。是将事件的结果和出现这一结果所经历的时间结合起来分析的一种统计分析方法,目前在多个方面都有应用。
Harsanyi Dividend
Harsanyi Dividend是沙普利值的延伸。可能只有Adobe使用,网络上的信息非常少,Adobe也只是文档放了两个原文链接。
请参阅原文:
- Shapley, Lloyd S. (1953). A value for n-person games. Contributions to the Theory of Games, 2(28) , 307-317.
- Harsanyi, John C. (1963). A simplified bargaining model for the n-person cooperative game. International Economic Review 4(2) , 194-220
目前是Adobe Analytics的Ultimate才支持,如果你用的是Prime 或Select版本,是不支持的。
业界使用情况
参考内容
- https://docs.adobe.com/content/help/en/analytics/analyze/analysis-workspace/panels/attribution/algorithmic.html
- https://maxket.com/attribution-shapley-value-vs-markov-chain/
- https://www.merkleinc.com/emea/blog/data-driven-attribution-models-across-google-platforms