1. 主页
  2. 文档
  3. Adobe Analytics for dummi...
  4. 第4章 可视化数据揭示价值所在(进行中)...
  5. 15、利用数据科学识别未知情况

15、利用数据科学识别未知情况

在这一章当中

  • 检测异常
  • 识别Adobe Analytics中的异常
  • 将贡献分析应用于异常
  • 应用细分比较

adobe致力于将人工驱动的AI辅助分析纳入Analysis Workspace内置的多个功能中。 每个功能都结合了数据科学,人工智能和机器学习功能,可帮助你更快地生成分析和见解。 所有这些工具都可以执行你设置任务,但是Adobe会大规模执行此任务,以减少你最平凡的活动并增强查找有趣和有价值的数据的能力。

本章介绍的三个功能是异常检测,贡献分析和细分比较。 作为智能分析的一部分,Adobe将前两个功能和警报进行了分类。 我们认为这种品牌宣传是合适的,因为智能分析可以充当从未离开办公室的专家分析师,智能分析体现了Adobe机器学习支持的能力。

检测异常

异常(偏离规范或预期结果的事物)会影响并在理解各种现象中发挥关键作用。 这适用于分析营销数据。 为什么即使产品相似,一种产品还是可以通过特定的营销渠道比其他产品卖得更好? 人们为什么在本月的第一个星期二购买更多的产品? 回答这些谜团将可以成功打开营销的大门?

Adobe Analytics提供了功能强大且直观的工具,可以在Analysis Workspace中根据上下文查看和分析数据异常。 例如,Analysis Workspace的异常检测算法包括以下内容:

  • 除了现有的每日粒度外,还支持每小时,每周和每月粒度
  • 意识到季节性(例如“黑色星期五”)和节假日

让我们来看一下异常检测为何如此重要,为何起作用以及如何起作用。 然后,你可以缩小一点以查看如何使用异常检测产生的数据。

对KPI使用异常检测

通过查看异常检测如何帮助你理解关键性能指标(KPI)指标,你可以开始探索异常检测。 例如,假设你的公司销售自行车和配件。 将异常检测应用于表或折线图可能会显示以下内容:

  • 平均订单价值大幅下降
  • 到达网页浏览量明显下降
  • 视频比特率低时波动很大
  • 低收入订单激增
  • 视频缓冲区事件中出现尖峰
  • 试用注册数量激增或下降

这些不是不重要的事件! 这些可能并不能一下子就看出来,但“异常检测”将这些检测出来。

但是在这里,我们要介绍异常检测中的另一个关键因素:使用考虑假日和其他重要日历事件的规则和公式。 例如,在这个大多数或许多人庆祝圣诞节的国家/地区,订单急剧下降,着陆页浏览量显着下降或试用注册数量激增,在这个国家,大多数人都会庆祝圣诞节,这时候是不需要设置预警的。仅当急剧下降,明显下降或峰值在统计上不同(肉眼无法辨别)时,Adobe的“异常检测”功能才会发出警报。Adobe Analytics对此进行了介绍, 正如本章不久将介绍异常检测背后的基本算法时所见,。

15、利用数据科学识别未知情况

 

在撰写本文时,Adobe Analytics Select和Adobe Analytics Foundation客户只能访问Workspace中的每日粒度异常检测。 如果不确定是否可以访问其他功能,请与管理员联系,管理员可以通过登录Adobe Analytics管理控制台并选择“公司设置”>“查看功能访问级别”来进行查找。

了解异常检测的工作原理

异常检测提供了一种统计方法,可以确定给定指标的变化相对于以前的数据是否在统计上有意义。 借助“异常检测”,你可以主动获悉数据中的峰值或下降,这些峰值或下降可能看起来不像峰值或下降,因为简单地,你的速度不如计算机,更不用说众多有Adobe算法的服务器。 异常检测可以帮助你确定哪些波动很重要,哪些波动无关紧要。

例如,假设一家企业的每周节奏很简单-周一至周四的销售额增长,而周五至周日的销售额下降。 看起来足够简单,可以用人眼识别吗? 我们同意。 但是,要说出过去一个星期一的销售量是否比正常增长(超过上周,上个月和去年)还容易呢?

也许像你这样的优秀分析师会比其他分析师更快地应用计算出的指标来识别这一点,但是你可能不会在执行的每个分析中都这样做。 这就是Adobe异常检测发挥作用的地方-你趋向的每一个指标都会自动通过Adobe的算法运行,以帮助你识别异常。 用于检测异常的Adobe Analytics计算是超快速且超级智能的。

了解异常检测背后的逻辑和数学

Adobe在定义算法以检测异常方面进行了大量研究。 对于我们中的某些人来说,这就是我们需要知道的全部-我们相信扎实的逻辑和数学是我们的后盾,并且不会被视为异常。 如果你处于“只是告诉我如何检测异常”模式,请随时跳到下一部分。 (我们将在这里提供有关异常检测如何以及为何起作用的更多说明。)

在与Adobe Analytics建立关系的某个时刻,值得花一些时间来探究如何识别异常的数学和逻辑。 隐藏的内容将帮助你理解和欣赏所揭示内容的价值和有效性。

识别异常检测背后的统计方法和规则

工作区中的异常检测使用一系列统计技术来确定是否应将观察结果视为异常。 这些技术中有些是复杂的,而另一些则是基本且显而易见的。

后者的示例:重大假期(例如美国假期感恩节)被纳入“异常检测”方程式中。 例如,如果在一个重大假期的下午销售直线下降,则应在Adobe Analytics发出警报并错误识别异常之前予以考虑。

以下是撰写本文时Adobe已将其应用于异常检测算法的完整假期清单:

  • 纪念日
  • 七月四日
  • 感恩
  • 黑色星期五
  • 网络星期一
  • 圣诞
  • 圣诞节前后的一天
  • 除夕之日
  • 元旦

这些假期是根据对许多客户数据点进行的广泛统计分析选择的,以确定对客户趋势影响最大的假期。 尽管该列表当然不能完全涵盖所有客户或业务周期,但Adobe发现利用这些假期可以显着提高几乎所有客户数据集的整体算法性能。

异常检测的深度观察

Adobe的算法应用了包含误差,趋势,季节性(ETS)模型的时间序列模型进行分析。 ETS是指数平滑的一种应用,自1950年代以来,数据分析人员就一直在使用这种方法来处理数据的高峰和下降并将其关联起来。 在过去的几十年中,这种方法一直在发展。如果您对平滑模型的开发方式感兴趣,则可以阅读Rob Hyndman,Anne B.Koehle,Keith Ord和Ralph D撰写的《用指数平滑进行预测》一书。 斯奈德。 该书包括一个部分,说明趋势季节性(ETS)模型可帮助构建Adobe Analytics中异常检测背后的复杂数学。

高级Adobe客户经常询问是否可以调整“异常检测”规则和算法。 不幸的是,简短的答案是“否”。 检测或过滤掉可能表明异常的数据的规则是Adobe员工进行大量研究的结果。 这些检测算法以以下方式应用异常检测:对所有公司都应该有价值。 例如,如果您的公司销售滑雪板,滑雪板,水上摩托艇和冬季天气装备,则无法将Adobe Analytics配置为在7月(北半球)的销售折让。 你可以建立这种类型的季节性报表中添加变体,但您无法为此任务自定义“异常检测”。

Adobe可以(也许有一天会)允许用户自定义异常检测规则。 同时,Adobe Analytics当前已修复异常检测规则这一事实凸显了这样一个事实,即数据分析中总会有独特的因素需要人类分析方面的批判性思考。

 

在基于日期的自由格式表中查看异常

我们希望你现在就坐到位,等待学习如何将异常检测应用于您的Workspace项目。 你可以通过几种方式快速访问Analysis Workspace中的“异常检测”。 通常,我们已经在自由格式表格中分析了一组趋势数据,希望自动通知异常。 请按照以下步骤在使用日期(例如天,小时或月)作为单独维度的表中查看异常:

  1. 从面板中的自由格式表开始,时间范围设置为最近的一段时间15、利用数据科学识别未知情况
  2. 将指标(例如页面浏览量)拖到自由格式表中,方法是将其拖动到第一列标题,这将自动将day添加为维度。15、利用数据科学识别未知情况
    如上图中的按日浏览量表是一个简单的示例,到目前为止,你可能已经建立了数十次。
  3. 在自由格式表中,请注意右上方显示的“搜索新异常”消息。15、利用数据科学识别未知情况
    Adobe Analytics正在执行您在本章前面探讨的计算,以自动跟踪和识别异常。
    在几秒钟之内,Adobe应该完成对异常的搜索。 现在,如果检测到异常,每个行将自动在右上角标记为三角形。
  4. 将鼠标悬停在三角形上,如图所示。15、利用数据科学识别未知情况
    你会看到异常值与预期值的差异程度,异常值也在表格的单元格中直观地表示,绿色阴影部分表示实际值与预期值之间的差距。 在图所示,你可以看到第一行中的阴影区域比其右侧的竖线要早得多,因此异常中的结果低于预期。同样,阴影区域超出了竖线,表示数据出现异常峰值。

如果这些步骤没有导致任何异常,请不要怪我们! 这可能意味着你在所选月份内选择的指标没有任何异常-祝贺你获得稳定的数据! 但是,没有异常也可能意味着你无权使用异常检测。 尝试更改日期范围和指标;如果仍然看不到异常,请与管理员确认你确实有权使用此功能。

通过趋势线图查看没有日期维度的异常

如本章前面所述,创建自由格式表时,异常检测通常会自动启动。 但这并非总是如此。

例如,如果你使用非日期的维度(例如营销渠道,页面类型或产品)创建自由格式表格,则不会看到已识别的异常。 但是,如果你想查看已发现的异常怎么办? 例如,即使你的表格设置为比较不同的营销渠道,你也可能希望确定响应电子邮件活动的峰值。

要发现没有日期维度的异常,请按照以下步骤学习如何创建已应用异常检测的趋势折线图:

  1. 使用不是日期(例如营销渠道)和任何指标(例如网页浏览量)的维度来创建自由格式表格。15、利用数据科学识别未知情况请注意,因为维度不是日期(例如天或月),所以Adobe如何不搜索异常。
  2. 将鼠标悬停在任何维度上,然后单击出现的“可视化”按钮,如图所示。15、利用数据科学识别未知情况搜索异常几秒钟后,折线图显示一个浅绿色的阴影置信带和一条虚线,指示Adobe的预测。 异常(如果有)在趋势线上显示为超大数据点,并且会在绿色阴影区域之外存在。
  3. 要查看有关异常的更多详细信息,请将鼠标悬停在异常数据点上15、利用数据科学识别未知情况

数据点显示异常的日期,原始值和与预期值的百分比差异。 如果你看到分析异常的链接,则还可以触发贡献分析。 暂时不要单击它,因为你们公司对此功能的访问权限可能有限。 另外,你也不想破坏本章后面的内容,

Adobe对Analysis Workspace中的每个趋势指标运行“异常检测”。 如果你创建了功能强大的计算指标并应用了多个细分, 趋势分析将运行“异常检测”。 如果你运用路径分析,分析到了第19部, 趋势分析将运行“异常检测”。 你很快会惊讶于Adobe多久通知你一些你本来不会想要的东西-这就是异常检测的魔力。

关闭异常检测

我们在本章的开头讨论了“异常检测”的价值,并成功地激发了你对Analysis Workspace中该功能的普遍性的胃口。 也就是说,“异常检测”内置于Workspace中,以至于在你处理数据的大多数情况下都会发生。 但是有时你不想在表格和折线图中显示异常。

为什么不检测异常? 好吧,通常出于视觉目的严格关闭“异常检测”。 我们一直在与倾向于提出错误问题的高管开会。 如果他们在我们本来很完美的Workspace项目杰作中看到一个过大的数据点,我们将不得不花10分钟的时间来解释它是什么,向他们保证我们已经研究过它,并重申这不是此目的。 开会。 为了避免这些麻烦,Adobe使你可以在图表和表格中关闭“异常检测”。

要在自由格式表中的度量级别上关闭“异常检测”,请通过单击列标题中的齿轮图标转到“列设置”,然后取消选择“异常”。此设置将删除出现异常的三角形和用于指定期望值的竖线 。

15、利用数据科学识别未知情况

 

如果你需要一次编辑多个指标的列设置,请使用Shift,⌘或Ctrl键盘快捷键选择多个列标题。 你对列设置所做的任何更改都将应用于所有选定的列。

要关闭图表中的“异常检测”,请通过单击右上角的齿轮图标,然后取消选择“显示异常”来转到图表的设置。 如果置信带的阴影超出了y轴,请选择“允许异常检测缩放Y轴”选项,这将增加该轴,足以为度量标准的预测腾出空间。

 

发现贡献分析

如你所知,“异常检测”会根据时间在工作区的任何表或折线图中自动进行。 使用此功能,你现在可以知道数据中发生的异常。

但是下一个问题是为什么! Adobe Analytics提供了一种利用数据科学来隔离异常发生原因的功能。 哪些事件可能是一个促成因素? 特定的浏览器是否影响了异常? 异常是否集中在特定的营销渠道上? Adobe Analytics的贡献分析将有助于追踪发现异常的原因。

15、利用数据科学识别未知情况

根据你的合同,Workspace中的贡献分析仅限于Adobe Analytics客户。 每个Adobe客户都有一定数量的令牌,公司可以在其中运行贡献分析。 在运行贡献分析进行培训之前,请与管理员联系以了解贵公司可以访问多少令牌。 通过选择公司设置Console查看功能访问级别,可以在管理控制台中获取此信息。

 

要实施贡献分析,请按照下列步骤操作:

  1. 将光标悬停在趋势表或折线图中的异常上,然后单击显示的弹出窗口中的分析,如趋势线图所示:15、利用数据科学识别未知情况你可以将鼠标悬停在表示异常的三角形上,然后单击“分析”,从趋势自由格式表中的异常开始“贡献分析”。“贡献分析”面板将打开,其中包含一些用于添加或删除被排除的维的选项。
  2. 将你不想通过贡献分析进行分析的维度拖到“排除的维度”框中15、利用数据科学识别未知情况默认情况下,会自动从贡献分析中排除数十个维度,因为它们经常显示出误报或错误的结果。 默认列表很有用,但是我们经常添加针对移动设备的维度,例如移动DRM和移动Java VM,这在我们的分析中很少使用。最初几次运行“贡献分析”时,你可能会因显而易见的答案,误报或发现无用的维度而感到沮丧。 别沮丧-继续磨练你对该功能的使用。 凭借经验和反复试验,你将更快地确定要排除的维度。 通过将排除的维度拖到“排除的维度”框中,然后单击“设为默认值”按钮,可以教会Adobe记住这些维度。如果需要从排除列表中删除维度,请单击面板中的“维度”按钮,然后通过单击相应的X取消选择项目。
  3. 单击蓝色的运行贡献分析按钮15、利用数据科学识别未知情况我们这里不做维度的排除,直接运行,贡献分析通常需要半分钟到两分钟才能运行,具体取决于报表套件中的数据量。
  4. 检查结果可视化15、利用数据科学识别未知情况让我们从上到下,从左到右一起查看它们。 遵循图中的步骤,以可视方式获得贡献分析结果样本:
  • 首先,您会看到运行贡献分析的指标摘要
  • 接下来是指标的趋势,以深色的绿色圆圈突出显示你运行“贡献分析”的日期。
  • 第一个表是贡献分析的最有价值的结果,贡献分析是Adobe数据科学提供的异常发生原因的答案。该表列出了所有维度(当然,除了那些被排除在外的维度)的维度项目以及贡献分数 。 贡献分数(介于0和1之间的数字)表示维度项目的重要性-得分越高,重要性越高。但是,每个项目在统计上都是有意义的,因此值得对其进行全部检查。最后两列 在此表中显示用于贡献分析的指标和唯一身份访问者。
  • 该表是功能齐全的自由格式表,因此我们强烈建议分解维项目,应用细分并添加计算的指标。 如果这样做,请注意贡献分数不会更新。
  • 结果中的最后一个表格显示Adobe基于返回的维项目的群集创建的细分的列表。 将这些视为Adobe创建的预设定细分,可帮助你从结果中获得更快的价值。

充分利用贡献分析

我们探索了贡献分析的性质,该性质适用于检测到的异常。 我们还介绍了如何配置“贡献分析”,以专注于与以下方面最相关的特定维度:深入了解为什么销售量下降或飙升,页面浏览量下降或达到顶峰,为什么收入突然上升或下降

我们为工作区贡献分析的新用户提供一些建议:

  • 与管理员合作,以确保你能从贡献分析令牌中获得最大收益。 如前所述,你的公司每个月只能运行有限数量的令牌来进行贡献分析。 但是,如果你运行保存在Workspace项目中的分析,则重新打开以前运行的Contribution Analysis时,Adobe将不收取第二个令牌的费用。
  • 贡献分析的目的是减少你手动花一个维度到另一个维度来查看它是否对异常有影响的时间。 不要担心机器学习将很快取代你的工作! 贡献分析功能可加快你获得见解的速度,而不是取代你。如果发现异常,请应用一些你喜欢的维度进行分析(也许是营销渠道,设备类型和地理位置),如果空手而归,请考虑贡献分析。 此功能的优点是可以帮助你按比例识别维度,找出影响的所在!
  • 当功能为你提供结果时,不要只是停止分析。 贡献分析的结果仅讲述了故事的一部分。 你可以自行决定分解维度,应用细分以及创建新的计算指标来讲述数据的故事。

使用数据科学比较细分

Analysis Workspace中第三个受数据科学影响的功能称为细分比较。 这是Adobe最强大的功能之一,因为它可以帮助你根据访问者的行为轻松区分两组访问者。 在第13节中,我们回顾了创建维恩图的步骤,这是细分比较结果中最简单的部分。

你最近查看过维恩图,并想知道以下几点吗?

  • 有哪些指标可以区分我的细分受众群? 例如,你可能会发现登录的访问者细分与博客文章的视图之间存在关联。
  • 有哪些维度可以区分我的细分受众群? 例如,你可能会发现iOS设备类型占转换访客的很大一部分。
  • 哪些其他细分可以应用于我的细分以区别它们? 例如,你可能会发现从付费搜索中引荐的访问者更有可能属于你创建的首次访问产品页面的首次访问者的自定义细分中。

如果是这样,那么你来对地方了! 这些问题是细分比较旨在通过使用机器学习的每一步来回答的问题! 首先,我们为你提供比较已创建的两个细分的步骤:iOS设备和购买者。 然后,我们将深入探讨其他有用的细分比较示例,以进行尝试。

调用细分比较

要比较细分,请按照以下步骤操作:

  1. 使用左导轨选择器将左导轨的视图更改为面板。
  2. 将细分比较面板拖动到工作区中,如下所示
    15、利用数据科学识别未知情况
  3. 将一个细分拉倒对应区域中,如图所示15、利用数据科学识别未知情况除了细分,你还可以将维度,维度项目,指标和时间范围拖到框中。 在我们的示例中,我们拖动一个已经创建的,专注于iOS设备的细分。 如果你想在此工作流程中创建细分,请将鼠标悬停在“添加细分”框上,然后点击显示的加号。
  4. 将第二个细分(或任何其他组件)拖到“与…比较”框中15、利用数据科学识别未知情况默认情况下,如果你只想将细分与其相反的细分进行比较,拉多一个细分过去做对比。如上图,我们将“购买者”细分添加到“与…进行比较”框中。 基于某些iOS设备上的访问者已经购物的假设,我们可以预期这两个细分受众群之间会有一些重叠。
  5. 单击显示高级链接15、利用数据科学识别未知情况如果你还记得贡献分析的“排除的维度”框,则出现的框应该看起来很熟悉。 如图所示,您可以选择从细分比较的分析和结果中排除维度,指标和细分。 就像在“贡献分析”中一样,排除维度的原因是为了避免烦人的结果,这些结果可能是准确的,但无法执行。 由于细分受众群比较还分析指标和细分受众群,因此它们被添加为排除选项。
  6. 单击蓝色的“构建”按钮,并通常在不到一分钟的时间内检查显示的结果15、利用数据科学识别未知情况如你在上图所见,Segment Comparison返回了大量可视化结果。

 

让我们从上到下,从左到右查看它们:

  • “大小和重叠”可视化是一个维恩图,你可以根据两个细分和不重复访问者的指标轻松构建该维恩图。 要了解如何创建这种可视化并与之交互,请转到第13节。
  • 接下来的三个摘要可视化显示每个细分的唯一身份访问者数量以及它们之间的重叠。 在执行分析时,这些摘要可视化效果可能是很好的参考。
  • 结果第二行中的两个可视化是实时链接的,这意味着当你单击左侧表中的值时,右侧图将更新。 左侧的表格显示了区分两个选定细分的最高指标。 差异得分列会按统计指标的显着性水平对每个指标进行排序,就像贡献分析的贡献得分一样。 您会很高兴看到Adobe也对右侧折线图中趋势显示的所有指标运行“异常检测”! 如你在图的表的第三行中所见,购买者最终观看的媒体数量远高于iOS访问者
  • 第三行显示了另外两个实时链接的可视化效果:维项目左侧的表格(用于区分你的两个细分),以及条形图(右侧),用于显示将两个细分中的每一个应用于维项目时的明显差异。 差异分数再次应用于这些可视化
  • 细分比较结果的第四行也是最后一行使用你自己的数据来帮助你区分要比较的细分。 Adobe将分析你有权访问或创建的所有细分,以便可以提供差异细分的最终列表。 自由格式表将差异化细分实时链接到右侧的维恩图,这使你可以快速找到三个不同细分之间的重叠。

Adobe的细分比较工具是一种神奇且快速的方法,可让你更多地了解访问者, 如果你无权访问,请与管理员联系以了解原因。

头脑风暴细分比较用例

如果你的大脑还没有创造性地思考如何使用细分比较功能,那么让我们开始吧。 我们的第一个建议是从你的网站的细分开始。

提醒一下,进行转化的人不一定意味着他或她已经购买了。 对于不销售商品的网站和应用,转化可能意味着注册,视频观看或内容唯一观看阈值。无论您进行了哪种转化,都必须根据完成访问的访客创建细分。

运行的最基本比较是转化与非转换。 最初,“细分受众群比较”很可能会告诉你已经知道的事情,如最佳的营销渠道,影响成功的微转化,或哪个国家或地区更成功的。 在此类使用案例中,细分比较结果中的细分集群可能会派上用场。 Adobe建议复查这些维度的异常组合, 如果Adobe为你提供了包含非典型维度组合的任何细分,请从此处开始分析。

对于确实有购买渠道的人们,考虑为渠道的每个关键步骤创建细分-进入产品页面但未添加到购物车的访问者; 添加到购物车但未进入结帐页面的访问者; 到达结帐页面但未购买的访问者; 和购买者。 在“细分受众群比较”中试用每个细分,以了解有关将一个细分与另一个细分区分开的更多信息。 由于你可以无限制地使用细分比较工具,因此不妨尝试一下!

最后,当然也并非最不重要,请尝试混合使用营销渠道和帐户购买状态。 例如,对通过最成功的营销渠道访问你的网站的访问者进行细分,并将其与购买的访问者进行比较。 然后将其与不购买的访客进行比较。

细分受众群比较通常可以帮助你发现指标,维度和细分受众群,从而区分你之前从未考虑过进行比较的细分受众群。 理想情况下,这些新发现的信息将有助于提高你的数据好奇心。


如有疑问,可以在文章底部留言或邮件(haran.huang@ichdata.com) 我~

我们要如何帮助您?

发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
(2)个小伙伴在吐槽
  1. 测试12
    GA小站2019-11-26 14:12 回复 Mac OS X | Chrome 78.0.3904.108
  2. 测试
    GA小站2019-11-26 14:12 回复 Mac OS X | Chrome 78.0.3904.108