谷歌分析实战指南-F

⌘K
  1. 主页
  2. 文档
  3. 谷歌分析实战指南-F...
  4. 第1章 Google Analytics基础知识...
  5. 1.5、网站分析的数据来源与划分

1.5、网站分析的数据来源与划分

在这里,将网站分析的数据分成两个大类,一个是内部数据,另一个是第三方数据,如图1-3所示。1.5、网站分析的数据来源与划分

图1-3 网站分析的数据来源结构

1.内部数据:包含数据库和服务器日志

(1)数据库上的数据包括并不局限于用户的资料,网站内容,订单数据和用户行为,主要是以post或get的形式抛出的数据,让后台程序接收后在数据库记录,通常是记录一些涉及站点内容或重要程度较高的数据,比如交易金额这些,一定要保存在自己的数据库里面。

(2)服务器日志是一些原始的访客访问服务器产品的记录,日志是记录Web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件,确切的讲,应该是服务器日志。网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录。通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了您网站的哪个页面,是否访问成功。

如图1-4所示,就是一个站点的日志信息,可以从框里面知道这个访客的IP,时间戳,相对路径,Referral信息,浏览器的类型,内核等信息。1.5、网站分析的数据来源与划分

图1-4 服务器日志记录

从上面可以知道这个是一个百度爬虫来的,什么时间点通过什么途径用什么浏览器访问什么页面。

基于时间戳,可以对访客做行为分析,少量的日志可以通过excel做分列处理,大量的就要程序。

除了上面的信息,服务器日志还可以增加定制信息,比如域名和Cookie等,以便更好的做数据采集和用户识别。

对于企业,一般将日志的信息通过ETL(Extraction-Transformation-Loading,数据提取转换和加载)入库,普遍来说,数据库数据和日志数据主要用于BI的建设,如果开发和数据团队足够强,会做一些机器学习和深度学习方面的工作。

2.第三方数据:网站分析工具和第三方评估数据

(1)网站分析工具,如GA、Adobe Analytics、百度统计等,通常这类工具只需要在页面加一段跟踪代码就可以提供详尽的分析报告了,也是很多中小企业使用的方案。

以GA为例,原理是跟踪JavaScript在页面加载的时候就会收集相关的数据,并将数据以虚拟一像素的图片的形式推送GA服务器,如图1-5所示,就是GA收集的信息1.5、网站分析的数据来源与划分

图1-5 向GA发放的数据

然后GA在对上面的数据做分割处理形成报告,传递参数的解释将在后面的章节中详细讲解。

(2)第三方评估数据:如Alexa,SimilarWeb等,能够用户评估自己网站现状,或分析竞争对手的数据,通常这类数据都是抽样的,经过算法处理后得到的,只能做为参考,如果您的站点排名越后面,误差会越大的,参考的价值就比较低了。

一般来说,如果是流量数据,以网站分析工具的为主,如果订单数据,以自己的BI为主,当然GA的数据和自己BI的数据通过User ID打通的了,还可以做其他的一些分析工作。

当前网站分析的数据采集主要是两个方向:服务器日志技术和页面标签技术,页面标签技术就是对应前面的网站分析工具了,现在主流的是采用页面标签技术,可以看到现在盛行的GA、百度统计、CNZZ、Adobe Analytics等都是采用这一模式。盛行的主要原因是:在技术上,页面分析技术更容易实现;另一方面是,近几年的云计算大力发展,存储成本极大降低,计算能力提高,采集到的数据都是在第三方服务器存储和计算,因此,数据的维护成本也极大降低。

服务器日志技术和页面标签技术这两种方法各有优缺点,在数据准确度上都不可能保证完全精确,而且对于分析而言,并没有那么高的精度要求,我们只是需要准确的数据,然后查看趋势,通过数据趋势判断问题,定位原因就足够了。如表1-1所列就是上述两种方法的优缺点。

表1-1 服务器日志技术和页面标签技术优缺点对比1.5、网站分析的数据来源与划分


如有疑问,可以在文章底部留言或邮件(haran.huang@ichdata.com) 我~

我们要如何帮助您?

发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址