Update:2020-04-24
写在前面,本文是根据触脉的公开课目录按照本人理解写的,如果有理解错误的,还请指出。
网站分析的起点
管理网站分析项目的完整流程
从项目管理的角度上:获取需求-明确需求-建立分析方法/模型-建立时间表和日志记录-实施-总结,具体包括以下流程:
一.让需求方畅所欲言,罗列出所有的需求
二.透过现象分析潜在的需求
三.利用自然的语言描述项目模型
四.建立时间表,工作日志
五.本阶段重点工作内容,实施
六.总结
案例分析:商业目标的数据需求过程
这里主要介绍需求与实际需求的转化,如:
想知道有多少人点击商桥的咨询:商桥的点击人数和次数的跟踪,进一步可以跟踪从在浏览哪些页面时候点击,可以知道用户对什么内容感兴趣才点击
想知道各个渠道的情况:渠道划分,根据业务对Default Channel Grouping做详细划分
想知道有多少人打开邮件:用MP协议对EDM做跟踪,页面的用UTM
想知道注册表单各个步骤的转化:注册表单优化
…………
选择网站分析工具的方法和心得
在选择工具的时候我会主要考虑到功能,费用与行业人才储备,当然还有其他的公司信誉,技术等,虽然有墙的存在,但是在Ga强大功能和免费的作用下,国内还是有不少公司都在用的,如豆瓣,知乎,其中不乏涌现出一些专业的第三方咨询公司。
合格的网站分析师需要具备什么能力
我觉得一个合格的网站分析师应该具备以下几个条件:
熟练使用相关网站分析工具,了解其原理
熟悉业务,业务是分析的基础
数据敏感
思维清晰
了解相关营销知识
Google Analytics的起点
了解GA的工作原理
Google Analytics是Google的一款免费的分析服务(网站+APP),自从其诞生以来,即广受好评。Google Analytics功能非常强大,只要在网站的页面上加入一段代码,就可以提供的丰富详尽的图表式报告。
原理:Google Analytics通过在网页中嵌入一段GA的JS代码,然后这段GA的JS代码会收集相关信息通过1像素的gif图片来发送相关的信息给Google的服务器,以完成数据统计。
一般来说,Google Analytics(分析)跟踪代码 (GATC/ga.js) 会在以下情况下提取网页数据:
1.浏览器请求的网页包含跟踪代码。
2.创建了一个名为 _gaq 的 JavaScript 数组,且跟踪命令被推送至该数组。
3.创建并启用了一个 <script> 元素,以便进行异步载入(在后台载入)。
4.获取了 ga.js 跟踪代码,且自动检测到了适当的协议。获取并载入代码之后,执行了针对 _gaq 数组的命令,且该数组被传输至跟踪对象。后续跟踪调用直接针对 Google Analytics(分析)进行。
5.向 DOM 加载脚本元素。
6.在跟踪代码收集数据之后,GIF 请求被发送至 Google Analytics(分析)数据库,以便进行记录和后处理。
在Chrome打开任意部署了GA的站点,按F12,打开调试窗口,选择Network后按F5刷新,在找出向google发送数据的URL,如下图,URL后面的一大堆参数就是向谷歌服务器发送的数据,形式是1像素gif的形式。目前市面上存在新旧版本,旧版本v*.*的还可以看得到url中带“_UTM.gif” ,新版本走MP格式协议,不显示gif,带collect字段.
<span style="font-size: 12pt;">https://www.google-analytics.com/__utm.gif?utmwv=5.6.7&utms=2&utmn=594850897&utmhn=ichdata.com&utmcs=UTF-8&utmsr=320x568&utmvp=980x1739&utmsc=24-bit&utmul=en-us&utmje=0&utmfl=-&utmdt=Haran%20-%20ichdata&utmhid=825183211&utmr=-&utmp=%2F&utmht=1466060230740&utmac=UA-699883**-1&%3D252190481.1157261441.1464162601.1465975935.1466060219.9%3B%2B__utmz%3D252190481.1464162601.1.1.utmcsr%3Dgoogle%7Cutmccn%3D(organic)%7Cutmcmd%3Dorganic%7Cutmctr%3D(not%2520provided)%3B&utmjid=&utmu=qAAAAAAAAAAAAAAAAAAAAAAE~ </span>
<span style="font-size: 12pt;">https://www.google-analytics.com/collect?v=1&_v=j47&a=223781241&t=pageview&_s=1&dl=https%3A%2F%2Fwww.ppmoney.com%2F&ul=en-us&de=UTF-8&dt=PPmoney%E4%B8%87%E6%83%A0_%E4%B8%8A%E5%B8%82%E7%B3%BBA%2B%E7%BA%A7%E6%99%BA%E8%83%BD%E6%8A%95%E8%B5%84%E7%90%86%E8%B4%A2%E5%B9%B3%E5%8F%B0%20-%20PPmoney&sd=24-bit&sr=1680x1050&vp=1663x920&je=0&fl=23.0%20r0&_u=ACCAgEAB~&jid=&cid=386508397.1476667584&tid=UA-59232800-1&z=810184108 </span>
通过 GIF 请求传递的许多参数的列表,如上面那段。每次执行跟踪代码时并非都会传递所有参数,因为某些参数仅适用于特定情况,如广告系列引荐或购物车,且每次打开时候传递的次数是不等的。下面是参数的最常用变量。
现场实战:从零开始搭建合理的GA账户结构
在GA创建一个视图获取GA tracking code,由于GA的代码要在网站的每一页都有,所以一般加在网站的header位置,保证每一个页面都会尽快加载到,代码一般放在</header>前面即可:
保存退出后,可以直接打开你自己的网站,然后看Google Analytics是否出现数据:
以上就完成GA基础代码部署,但还需要对GA做优化调整,详细的请看:GA部署与调优
现场实战:按企业需求配置GA账户的最佳方案
对于企业级使用,建议采用MCC管理,统一管理账号管理所有的view.
认识并熟练驾驭GA的操作界面
1、导航区
Home:返回到GA账户界面
Reporting:标准报告,数据为非抽样,次日GA会计算出昨天的准确值,保存在内部(注:是非抽样数据)
Customization:自定义报告(非标准报告),数据可能因为session数量而抽样,每次打开时都重新计算
Admin:Account、Property和Views设置相关
2、菜单栏
Dashboards:报告界面,来源可以是标准报告和自定义报告,可以共享出去
Shortcuts:报告快捷键,来源主要是标准报告和自定义报告,不能分享
Intelligence Events:智能事件,主要用于异常监控,同时可以定位异常源
Real-Time:实时,主要是目前访客所在地区,页面,来源,事件等,主要用于事件测试
Audience:受众,主要是受众属性
Acquisition:获取来源,主要是渠道来源相关
Behavior:用户行为,用户在网站的行为,事件记录
Conversions:转化相关,主要是目标,电商,多渠道转化相关
3、报告区
主要报告展示区
4、其他
右上角:
时间筛选:可以筛选不同事件长度和对比
抽样比例:调整抽样比例和计算精度
右下角:
报告生成时间:报告生成的时间
5、细分
做过滤和分类对比,最多能够加4个,加越多会越卡
GA标准报告结构与数据归类逻辑
报告分为标准报告和非标准报告:标准报告是GA次日生成的非抽样数据,只能按不同时间长度查询;非标准报告包含自定义报告和添加二次维度时候的报告,实时生成,是抽样报告,可能每次运行数据都不同
报告的结构都是一样的,包含图标和原始数据展示,图表左上方可以选择不同的字段展示,也可以对比,字段只能来源于原始数据的字段;右上方有不同事件周期的选择,一般有日,月,年,图形有堆积图和原型散点图。原始数据区主要包含原始数据,而已在二级维度添加其他字段做交叉查询,可以将不同的行plot rows到图表去展示,有上角有不同的展示数据方式选择。
认识Cookie的工作方式和主要作用
Cookies是web站点放置到你的硬盘上的程序。它们驻留在你的计算机上收集关于你在因特网上所做的一切事情的信息,并且web站点可以在任何时候读取到Cookies收集到的所有信息。ga通过 Cookie 来执行以下操作:
区分唯一身份用户
ga的cookie会生成clientid,这是有一段随机数和日期加登录次数构成的数字,当用户换不同的设备浏览器登录的时候,会重新生成,new user会计1,cookie的有效期是2年
限制请求率
ga里面有两个库会使用cookie,不同的库功能稍微有点差异
ga里面不提供用户的ip的,实际可以通过写入cookie的形式拿到用户的ip,不过不建议使用~
GA中的核心指标计算逻辑详解
Session:会话是指在指定的时间段内在您的网站上发生的一系列互动,默认会话是30min,一个会话结束开始新的回话通常有三种情况:超过30min产生新会话;午夜过12点产生新会话;用户通过一个广告系列来到网站,随后离开,然后通过另一个广告系列返回网站,会产生新会话。
超过30min产生新会话
午夜过12点产生新会话
广告系列变更
这种情况通常会改变用户的sources/medium等字段,也就是会产生一个用户对应多个source的情况
Users:“用户数”指标会显示有多少用户浏览了您的网站/应用或与其进行了互动。不同地方的用户数可能会不一致,这是因为用户数有两种计算方法
1、预算计算的数据
数据GA可以参考表格以快速检索并在报告中提供这些数据,包括更改日期范围,属于标准报告,这里报告只涉及Reporting里标准报告,仅可以按照时间维度查询,不能用二级维度交叉,这是提供的数据是准确的。
2、实时计算的数据
自定义报告中山会用任意维度的“用户数”或二级维度做交叉时候的“用户数”都会是非标准报告,需要实时计算
Pageviews:网页浏览是指浏览器加载(或重新加载)网页的实例。网页浏览量可以定义为网页浏览总次数的指标。
Bounce Rate:“跳出率”是单页会话(即用户从入口页离开网站而未与该网页互动的会话)所占的百分比。简单理解就是只在该页面就离开的比例。单页应用不适用这个指标,应该改用事件跟踪,对应单页应用还有PWA技术,文档位置:https://developers.google.com/web/progressive-web-apps/
% New Sessions:第一次访问的百分比。
Active Users:期间内网站或应用上发起会话的唯一身份用户数
New visitor:基于clientID计算,跟cookie相关,不同设备,浏览器都会生成一个新的,也就是new user会计算1
Return visitor:回访用户,时间区间内第二次回访就算回访用户,应该有个时间间隔才生效的
“会话次数”与“用户数”
Analytics(分析)对帐户中的“会话次数”和“用户数”均进行统计。“会话次数”表示您网站的所有用户发起的具体会话次数。如果某用户在您网站上处于非活动状态的时间达到或超过 30 分钟,那么任何进一步的活动都会被归入新会话。如果用户在离开您网站后 30 分钟内返回,则之后的活动仍将被计为初次会话的一部分。
系统会将用户在任何指定日期范围内发起的初次会话视为另一次会话和另一位用户。同一用户在选定时间段内发起的所有后续会话都会被视为另一次会话,但不会被视为另一个用户。
“会话次数”与“进入次数”
“会话次数”会从每次会话产生第一次匹配后开始增加,“进入次数”则是从每次会话产生第一次网页浏览时开始增加。如果会话的首次匹配不是网页浏览,会话次数和进入次数就可能会有差异。
“网页浏览量”与“唯一身份网页浏览量”
“网页浏览量”定义为对 Analytics(分析)跟踪代码跟踪的网站网页的一次浏览。如果用户到达此网页后点击重新加载,则会被算做另一次浏览。如果用户转到其他网页后返回原始网页,也会被记录为另一次网页浏览。
“唯一身份网页浏览量”(如“内容概览”报告中所示)会汇总由同一用户在同一会话期间生成的网页浏览量。“唯一身份网页浏览量”表示该网页被浏览(一次或多次)期间的会话次数。
受众群体识别与用户画像
用户数据的层次与常见需求
用户数用户我认为最重要的有两点,一是用于市场推广,定位潜在用户;二是用户的行为,用于运营策略和产品优化
推断用户的人口统计学属性与目标用户重合度分析
GA里的用户属性和自己后台的属性是否重合吻合:数据的准确度,确定这个对否符合自己的实际用户群的特征
GA现有用户属性和推广带来的访客属性是否一直:用于推广策略调整
推断用户的上网兴趣与迎合策略
(空)
了解受众的访问行为特征确定运营倾向性
比如:什么时间访问多,通过什么渠道,关注点是什么,在去核心页面的的路径等都可以对运营做策略的依据。
用户交互设备的属性特及对网站设计的价值
1、Web,Wap和APP的用户分布:这是运营和产品更迭的侧重点,是否符合预期,还是完全是反预期的,需要深究原因做调整
2、移动端使用的设备,浏览器类型主要分布,那么测试的时候肯定要覆盖这些类型
3、Web的高分辨屏倾向:如果你的用户中有越来越多的用户是使用高分辨屏幕,那么web就要做一些调整,普通的网站在没做高分辨屏适应的时候,整体显示会缩小,视觉,用户操作都会很不便。
用户移动设备的识别方式和数据分析
用户的移动设备的识别方式还是通过1像素的gif传递数据的,详情看GA的工作原理。W
AP分普通WAP和单页应用形式,普通WAP参照web,单页应用需要转变成事件跟踪,GA也提供了PWA
APP:直接嵌入SDK,会自动给收集数据
移动设备的类型,系统版本等都是在做测试和系统兼容时候需要考虑的
实战现场:用户画像的最佳实践
主要关注四个点:是什么时候,什么人,通过什么,关注什么
什么时候就是用户使用的时间
什么人就是用户的基本属性,比如年龄,地域,性别,爱好
通过什么就是通过什么终端和渠道访问,终端的话包括Web,wAP和APP,渠道的是邮件,主动,搜索~
关注什么:用户使用我们产品的什么功能
通过这些定位出用户的具体画像
流量识别与管理策略
GA识别不同渠道流量的原理
简单说GA的渠道流量识别具有一定的顺序和优先级,整体的顺序是:
1、ADwords/DoubleClick/广告参数
2、UTM参数
3、自然搜索
4、社交流量
5、推荐流量
6、直接流量
7、其他
详细资料请参考:https://support.google.com/analytics/answer/6205762?hl=zh-Hans
GA中该对流量分类及规则详解
默认的系统渠道定义反映出构成“默认渠道分组”中每个渠道的 Google Analytics(分析)当前数据视图。当前GA的定义规则如下:
这些渠道定区分大小写。手动标记网址时,请使用小写形式的标记,以确保 Google Analytics(分析)能够对会话进行正确分类。例如,标记为“Email”的电子邮件广告系列与“Email”渠道的系统定义不符。
并非所有维度都允许 Google Analytics(分析)查询相关费用数据。如果在渠道分组对象中使用了这类维度,则无法获取该渠道分组的费用数据。
GA中标准流量报表的正确使用方式
通常情况下GA默认的渠道分组是不适用于自己的,因为大部分流量都是归类到referral,完全没有指导意义,在这种情况下GA提供了两种方式能够修改或创建属于自己的渠道分组:
1、Cumtoms Channel Groupings
这里是创建新的Channel
2、Channel Settings
这里是对Default Channel Grouping做修改调整,修改生效后,默认分组就变成自己定义的了。
原理:要准确划分各个渠道,需要对GA的原理较为熟悉,GA的Channel的与Landing Page的数据是一致的,这里面有个关联关系,也就是每个用户第一次进来就会被记录,与广告参数绑定,这里就是Cumtoms Channel Groupings,但如果用户第二次是通过其他带参数的广告系列进来,新的渠道参数就会覆盖旧的,也就是新的Campaign参数会覆盖旧的,这种情况就会造成,一段时间内,同一个userid会对应多个Channel的情况出现,这个广告参数的有效期是半年,可以在Session Settings调整有效期,知道了这个就可以依据自己的业务规则对广告参数(Source、Medium…)和Landing page做划分。
这里还有个需要注意的,在设置渠道分组的时候,里面的规则遵循的是逐步剥离,也就是渠道里面的第一个分组就把属于这个规则的流量剥离出来,后面的规则是对剩余的流量逐步做剥离,这就不会造成交叉的情况出现。
现场实战:广告系列识别的最佳实践
我已经根据业务规则和上面的原理实现所有渠道划分:邮件,PPC,AFF,SNS,SEO,SEM,直接访问等渠道,目前我们付费推广渠道还带上多个自己的广告参数,转成Ga里面的维度,可以在二级维度做交叉查询精确定位到投放在哪个站点,哪个Banner,哪个关键字,可以知道哪个渠道带来多少流量,注册了多少个用户,跟自己后台记录的广告渠道转化的差异在个位数。
在网站中的完整行为分析
网站页面的追踪原理与分析方法
网站网页的跟踪原理是在页面加入一段异步加载的跟踪js,就是ga代码,网页打开的时候,js加载,向ga服务器发送数据,载体是1像素的图片。
现场实战:着陆页的质量评估与优思路
着陆页的质量评估主要有两种方式:
1、现有的会话数,跳出率,会话时长等
2、页面交互情况,这个需要用事件跟踪,特别是着着陆页包含注册表单的,可以看:Google Tag Manager实战指南:注册表单优化
用户退出网站的相关数据与分析策略
明确的用户退出网站的页面,再找上一级页面,将该页面点击到退去页面的相关设计弱化,强化引导到其他的页面的点击
网站停留时间的计算方式
要了解网站停留时间的计算方式,要先了解GA传输数据的类型和如何记录时间,Ga传输的数据一共有5种,在每一个传输数据的过程中都包含一个时间戳的参数,还记得前面讲ga原理的吗,gif后面的参数里面有一个_utma,是一个数组,包含clientid和时间戳,可以包含唯一用户标识,这里计算时间就是用到里面的时间戳数据,5种类型分别是:
1、Pageview hits
2、Interactive event hits
3、Ecommerce transaction hits
4、Ecommerce transaction item hits
5、Social plugin hits
网站的停留时间就是以最后一个hits的时间减去第一个hits的时间,例如:
网站停留时间就是2:38,页面停留时间分别是0:10,1:15,1:13
站内搜索数据的抓取与分析策略
站内搜索主要是使用site Search Setting,在OverView settings下面,能匹配5个关键字,在用户点击搜索的时候该URL包好这里设定参数且加等号,就可以再Behavior中的site Search中查看先关报告
这个可以知道用户对什么感兴趣,可以调整站内banner或推荐列表,用这种方法也可以检测站内banner的点击情况
追踪用户访问目标达成情况
现场实战:用户访问目标的类型与追踪
目标是在数据视图一级配置的,可以应用到用户访问的特定页面或屏幕,用于跟踪用户在会话中查看的页面或屏幕数、在网站或应用上停留的时间,以及他们在停留期间触发的事件。可以为每个目标指定货币价值,以评估相应转化给您的业务带来的价值。通过为目标指定价值,您可以重点关注价值最高的转化,例如达到最低交易额的交易。
当网站的访问者或您应用的用户执行某项被定义为目标的操作时,Analytics(分析)就会记录一次转化。
现场实战:转化通道可视化的配置技巧
1、可以将:Google Tag Manager实战指南:注册表单优化 里面采集的每一步的点击用目标里面的funnel功能,就可以知道有多少用户走完整个注册流程,可以看到一个倒三角的注册流失图
2、可以将注册后的页面作为注册成功的目标,在channel可以使用该目标,可以知道不同渠道的注册了多少用户
案例分析:某知名电商的目标设置策略
电商对目标的应用还是可以很多的,如注册,购物差,下单,特定页面停留时间等,都可以对运营有非常重要的参考作用
传统电子商务的追踪和实施方式
增强型电子商务的功能优势与数据分析
用博客模拟部署增强型电子商务
用Google Tag Manager部署增强型电子商务模块指南
最全面的增强型电子商务部署讲解教程