识别原理:基于浏览器的Referral
1.桌面端的流量精准识别
网站分析工具之所以能够区分不同的流量来源,是因为在不同站点跳转的时候浏览器会传递Referral参数,也就是上一级的来源,网站分析工具的精准识别就是通过Referral来划分流量的来源。
比如,如果您直接在浏览器上输入http://www.ichdata.com打开页面,然后再输入JavaScript:alert(document.referrer)就可以看到如图4-1所示的提示框:
可以看到提示框为空,表示是直接访问,以下几种类型表示是直接访问:
- 手机应用不会发送Referral,用户单击APP上的链接跳转到浏览器打开
- Word/PDF不会发送Referral。
- 302的重定向有时候会导致Referral被删除。
- 有时浏览器不传递Referral
- http重定向成https时,Referral不会传递,主要是因为安全因素。
- 用户输入网址直接访问。
- 通过浏览器的最热预览直接访问。
以上的这几种情况所产生的Referral都是空的,所以都是直接访问。在此可以假设,如果上述几种类型还能传递其他的一些技术参数,那在原理上是可以将其继续划分的。
如果通过搜索引擎自然搜索进来,比如百度搜索进入会看到如图4-2所示:
可以看到有一大串的网址,这个就是表明从百度的,网站分析工具就会自动划分,可以看到wd的参数为空的,这个表示的是搜索关键字,不同搜索引擎为了建立自己的商业壁垒,不会把搜索关键字传递出去的,而且上面有很多的加密信息,包含如搜索关键字,广告系列和广告组等级的信息。目前必应和搜狗的搜索还是有传递搜索关键字的。
如果是引荐流量来源,比如,我在别人的博客单击友链访问我自己的站点,用JavaScript:alert(document.referrer)去查看,可以看到的如图4-3所示:
直接就显示是一个站点名字,通常表示是从第三方网站过来的,不同站点之间的跳转,通常会是这种类型。
浏览器传递Referral这种流量识别技术是精准的,但人为的因素会影响正确划分与否,部分站点为了保护用户隐私或由于其他原因会传递经过随机转化后的Referral参数给下一个站点,比如Facebook,所以从Facebook过来的流量,您可能会看到多个“来源”,不要惊讶,这个是Facebook保护用户隐私的一个举措。
移动端的流量精准识别
Wap的流量识别与Web的原理是一致的,而且Wap上带的参数更丰富,比如我在百度的移动端搜索“GA小站”,然后在浏览器中输入JavaScript:alert(document.referrer),会看到下图4-4所示:
可以看到后面带了一大串字符,主要是多了很多设备的信息在里面,网站分析工具中的报告部分数据就来自于URL中的信息,其他的传递与Web端的一致。
流量的标记就是通过Referral传递的参数来识别的。
付费搜索的识别方式:UTM
付费搜索的识别通常会采用添加UTM的形式,如果是投放Baidu、Bing、搜狗这类搜索平台的广告,那么一定要加UTM区分,如果没有添加,从上述广告平台过来的流量都会被GA归类到自然搜索里面,详细的内容可以看前面的付费流量标记。这里再次做强调:
- UTM必须使用三个参数:来源、媒介和广告系列。
- 如果前面没有“?”,那么先添加“?”,再添加UTM参数;如果前面已经有“?”,那么就用“#”,然后才添加UTM参数。
- 由于“?”和“#”是UTM使用的字符,所以在URL里面不要使用到这两个字符,避免参数被截断。
- UTM参数是大小写敏感的,比如Baidu和baidu会被区分为两个不同的流量来源,所以设置的时候需要注意。
- UTM中只有utm_term能直接输入中文,其他变量直接用中文会乱码,需要先转码才可以使用。
Adwords的识别方式:gclid
对于在Adwords投放的广告,可以开启Adowrds里面的自动标记功能,这样用户单击广告后跳转到您的网站的URL会产生一个gclid的字段(百度统计也有类似的一个机制,这个机制是将搜索关键字和着陆页关联起来的,需要付费才能够使用,详细的可以看第四章第三节的关键字获取那一节),这个自动标记参数是一个编码哈希值,与特定 AdWords 单击相对应(实际上就是单击 ID)。只有GA能够对这个单击 ID 值进行解码,并将其解析为实用信息。使用自动标记,可以看到几个其他维度的数据,其中包括:
- 查询匹配类型(您的关键字与搜索查询的实际匹配情况)
- 广告组(与关键字/广告素材和单击相关联的广告组)
- 最终到达网址(AdWords最终到达网址)
- 广告格式(文字广告、展示广告和视频广告)
- 广告投放网络(Google搜索网络)
- 展示位置网域(展示广告网络中用于展示您的广告的网域)
- AdWords 客户ID(分配给您的 AdWords 账户的由3 个部分组成的唯一号码)
如果使用自动标记,可以通过以下报告获得比人工标记更丰富的数据:
- 日期+时间
- 展示位置(展示广告网络中用于展示您的广告的位置)
- 关键字排名(您的广告在 Google搜索网络中展示时的排名)
- 展示广告网络定位
- 视频广告系列
- 购物广告系列
此外,将来提供的任何报告功能和广告单元将仅在使用自动标记时可用。
所以在Adwords上投放广告,推荐是采用自动标记的方式去在GA中跟踪数据,设置的话需要在Adwords中开启自动标记功能,同时将GA和Adwords关联,这样可以获取包含关键字在内的详细报告。
注意:Adwords与GA的时候需要两个产品都是同一个管理员账号,而且GA要具备编辑的权限才能够关联;且GA可以关联到多个Adwords ID。
识别不到/错误的几种情况
通常来说通过Referral和添加UTM可以将流量精准的识别和归因,但是在实际的场景中,还是有几种情况会导致识别错误或识别不到的情况,有些是可以避免,有些是不可避免的。
1.第三方登录
如果用户通过第三方登录模块,那么这个用户就被归类到直接访问的渠道去,不管之前是通过PPC还是CPC,所有广告参数都作废了,这个是不可避免的,特别对于拉新过度依赖第三方登录的,这个会是一个难题。
虽然不能够将注册用户正确的归因,但是还是可以用统计学上一些方法去评估广告投放的成效,做法参考“联动式营销的跟踪评估”。
2.Referral
这种通常会出现在电商网站,部分销售归因到了第三方支付站点,之所有出现这种情况是因为新的Referral覆盖掉旧的广告参数,例如用户下单后跳转到第三方支付,但是支付失败了返回到电商网站,这时候这个用户所带的广告系类参数就变成第三方支付站点了,后续所产生的销售就归因到第三方支付站点。
这对于销售的划分是不合理的,可以通过设置避免这种情况出现,在GA中选择“管理”→“跟踪信息”→“排除引荐列表”添加上第三方支付的站点就可以,用户从第三方站点返回站点的时候还是继续之前的会话。
3.同一个gclid情况
用户 A 单击某个广告后抵达您的网站。假设该网站已启用自动标记,那么目标网址可能会如下所示:http://www.ichdata.com/?gclid=TeSt123Abc,其中 gclid 参数就是自动标记参数。
然后,用户 A 将这条网址(包含自动标记参数)复制并发布到另一位置(例如公共论坛或社交网络)或是将其通过电子邮件或聊天窗口发送给其他人。
接着,用户 B 单击了这条链接(包含 gclid 值)并抵达了网站。虽然用户 B 从未访问过网站,但系统会将该用户的第一次会话归因至最初分配给用户 A 的那个单击 ID (gclid) 值。
在这种情况下,就会看到旧有广告系列的新会话次数(来源于用户 B)。
类似的情况还有将包含gclid的链接放在收藏夹,都会是数据有异常,但这是不可避免的。
4.direct不能细分
从前面知道直接访问包含了至少有7种情况,很多不能够识别的都划分到direct去了。
知道上述的异常情况有助于在更好的解读数据的信息,或是在出现异常的时候能够快速的排除。