数据导入就是将外部数据导入到GA,与GA内部数据整合,能更好的衡量您的网站的运营和表现情况。
1.为什么要导入
GA虽然能够收集线上的很多数据,但是存在部分数据是GA采集不到,而且这部分数据对运营和决策很重要,所以需要导入,这类数据包括:线下数据,第三方广告平台广告投放数据,CRM数据(Customer RelationshIP Management,客户关系管理)等。
2.数据导入的原理
把GA的数据看做是一张表A,把导入的数据看做另一张表B,两张表要关联只能通过外键,也就是表A和表B共有一个字段,另外,表B导入的数据字段是需要字段,使用模板的用到的是内置字段或自定义维度去存储导入的信息。
3.导入数据的类型
借助数据导入功能,可以导入三种类型的数据,这三个大类的是根据数据收集和处理的逻辑来划分的,具体类型如表2-19所列:
表2-19 导入数据的类型
4.数据导入的局限性
数据导入的功能也是有一定的限制的,下面我主要介绍几条比较重要的限制,还有其他一些限制,但是对您没影响的,就不在下面列出来:
- 每个媒体资源最多能够建立50个导入配置
- 每天,每个媒体资源能够导入50次数据
- 上传文件最大为1G
- 涉及ga:dat的数据,每天限额100M
5.注意点
- 原则上不准导入用户个人身份信息
- 导入的字段如果为空,在报告中的显示为not set
6.数据的删除
单击对应需要上传文件的“管理上传”,然后将需要删除的文件勾选,就可以看到“删除所选文件”的按钮,如图2-60所示:
下面介绍几种导入的方法,分别是直接导入,Google Sheet导入,还有API导入
7.直接导入
直接导入就是在GA的界面上直接操作将数据导入,这里有两个注意点:一是导入的数据必须保存在csv格式文件中,二是文件的编码格式必须为utf-8,简单一句就是UTF-8的csv。这里以导入广告消费数据为例子,下面一起来看一下具体的设置和导入过程:
1、数据导入是媒体资源级别的,所以入口在媒体资源下面,在GA中选择“管理”→“数据导入”→“新建”,可以看到如图2-61所示的界面:
2、新建数据集
这里有很多种格式可以选择,不同格式表示导入数据的不同类型,如图2-62所示,GA已经内置了多种格式,详细的各个数据类型的解释看表2-19所列“导入数据的类型”,我们在这里选择“费用数据”:
3、自定义数据集命名后,选择对应导入进入的视图,如图2-63所示,导入的数据是视图级别的,需要选择导入到哪个视图去。
4、数据集架构, 这里的字段有三种类型:必须提供的字段,这里的是日期,媒介和来源,这个一般作为外键使用;然后是必须提供下列中至少一列,这个就是您需要的导入数据,这个位置是必选的,根据不同的数据集类型,GA会提供不同的字段给您选择;可以提供任意数量的以下列:这个是根据您自己需要可选,选择越多,导入的数据能匹配越细。
注意
需要注意的是导入行为那里有两个选项,一般默认选择汇总,不要选择覆盖,覆盖配置后是不可修改的,鉴于导入数量有限额,需谨慎使用。
配置完后保存,然后保存整个配置,如图2-64。
5、然后就可以在数据导入的操作界面看到新增了一个导入配置,如图2-65所示,名称就是前面数据详细信息中的名称“导入消费数据”,类型是导入数据的类型,数据集ID整个是数据集ID,主要是用于使用API导入的时候需要使用的,“操作”下的“管理上传”就导入的入口了。
6、在GA中选择“管理”→“数据导入”→“管理上传”→“上传文件”→“选择文件”,如图2-66,选择预先准备的csv文件就可以导入
7、鉴于导入的时候需要utf-8的csv,所以我们通常采用的做法是直接下载GA提供的文件模板,然后复制相关数据进入,再上传,下载模板的位置是,单击数据上传中的需要获取模板的配置的名字,这里是“导入消费数据”,如图2-67所示:
然后可以看到如下界面,如图2-68所示,直接单击“获取架构”→“下载架构模板”就可以下载一个utf-8的csv模板
下载的模板如图2-69所示:
可以看到字段都是带有“ga:”,如果您是自己新建csv的形式,名字要按照上面的名字命名,对应字段的写法可以去官方文档找,建议采用下载模板的方法,不容易出错。
8、将需要导入的数据复制到模板后,按照步骤4的方法上传数据,如果成功会显示如图2-70所示:
这样就表示数据已经成功上传,官方说数据会24小时内出现,实际上,一般2小时左右就可以在GA看到相关的数据的。
如果报错的话,在“状态”会有相关提示的,根据相关提示去定位问题。
8.用Google Sheet导入数据
接下来介绍用Google Sheet知道导入数据的方法,这个要用到前面的数据集ID了,其实这个方法并没有比直接导入的方法方便,在这里作为一种拓展方法介绍给大家。
1、在这里我已经默认您知道导入数据的逻辑和已经新建了一个数据集(数据集就只指导入配置),在数据导入的控制面板可以看到数据集ID(这里用test2的数据集作为例子,如图2-71所示)
2、然后在Google Sheet里面新建一个表格,将要导入数据的字段如ga:userid,ga:dimension6输入,然后复制要导入的数据,如图2-72所示:
3、然后在Google Sheet中选择“工具”→“脚本编辑器”,将以下代码复制进入(完整代码访问http://www.ichdata.com/book.html获取),如图2-73:
注意
要将红框标记的改为您自己的,最下面一个就是前面要用到的customDataSoureId就是数据集ID。
4、然后单击“资源”→“Google高级服务”,如图2-74所示,选择GA API开启,同时要确保Google API后台也做了权限的开放,如果您不确定,就进去单击开启吧。
5、然后单击运行了即可。
可以看到如图2-75的uploading OK就表示已经上传成功了
6、如果要做定时的话,可以单击触发器做些设置,如图2-76所示,就可以定时导入数据到GA
上图比较模糊,放大就是如图2-77所示:
可以看到这个做法也只能是半自动的吧,如果您的服务器是在Google上面的,那就可以无缝运行了。