ASO 中的 A/b 测试:基础知识及其他

Elizabeth Devine 作者 
应用 增长顾问

2 分钟阅读

订阅我们的每月简报

如果 A/B 测试正确应用于您的 应用商店 优化 (ASO) 工作,它可以使您的 转化率 提升两位数,从而帮助您将更多的 应用商店 页面访问者转化为安装。然而,许多营销人员对 A/B 测试感到沮丧,因为他们没有正确的实践基础。

在本博客中,我们将回顾 ASO 的 A/B 测试基础知识,然后深入探讨我在游戏行业担任 ASO 经理多年来开发的顶级策略这些都是我在最新的网络研讨会 about 超越 A/B 测试中分享的技巧。作为奖励,您会找到一个可下载的 A/B 测试清单,以确保您的下一次测试能够推动结果。

主要要点

  • A/B 测试比较您的 应用商店 资产的变体,以提高安装量。
  • 测试点击前(图标、标题)和点击后(屏幕截图、视频)元素。
  • 每次测试侧重于一项更改,并将其与明确的用户行为假设联系起来。
  • 至少运行 7 天的测试,以获得可靠的、跨越一周的 数据。
  • 混合付费流量和自然流量可能会歪曲 A/B 测试结果。
  • 达到统计显著性,以了解您的测试结果是否可靠。
  • 使用 AppTweak 预览测试并监控 竞争对手 A/B 策略。

什么是 ASO 的 a/b 测试?

ASO 的 A/B 测试是测试您的 应用 页面上的一个元素的两个(或更多)版本,例如不同的屏幕截图或图标,以查看哪个版本最吸引商店访问者。

您可以控制您的商店流量中有多少人看到您的每个测试版本,但您无法选择包含哪些类型的用户,例如访问者意图或年龄或性别等人口统计因素。

通过比较测试结果,您可以确定哪个版本最有可能增加您的 应用 安装量。

可以看到您的 A/B 测试的商店流量包括:

  • 在“探索”(Google Play) 或“浏览”(App Store) 选项卡中浏览的访问者。
  • 通过 搜索 结果找到您的 应用 的访问者。
  • 在测试期间访问您的 应用页面 的任何访问者。

为什么 a/b 测试对 ASO 很重要?

进行 A/B 测试可以让您做出明智的、数据 驱动的决策,而不是猜测。即使是 3-5% 的 转化率 提升也可能在大规模情况下产生重大影响。

A/B 测试可帮助您提高 应用 的 转化率,这可以通过提高安装速度来间接提高您的自然可见性。这也是测试新功能或创意的好方法。许多 ASO 经理使用它来了解用户如何响应用户界面更新或季节性创意,以及在大型发布之前验证创意更改。

简而言之,针对您的移动 应用 的 ASO 的 A/B 测试应该可以提高性能或揭示重要的经验教训,从而消除猜测。

伊丽莎白·德瓦恩 (Elizabeth Devine) 谈论 about A/B 测试如何验证想法的引言卡片。

在 ASO 中要进行哪些 a/b 测试?

在 App Store 和 Google Play 上,您都可以通过测试用户在点击以了解更多 about 您的 应用 之前看到的元素来增强 应用 的第一印象。

要测试的点击前元素:

  • 应用图标:形状、颜色、视觉风格、品牌强调
  • 应用标题/名称和副标题:长度、清晰度、关键字包含(仅在 Google Play 上通过 自定义 商店列表)
  • 屏幕截图:文本叠加、背景颜色、顺序、布局。
  • 宣传视频:缩略图、节奏、文本叠加和视觉风格

由于这些元素出现在 搜索 结果中,它们会影响用户是否点击查看您的 应用商店 列表,并且对点击率 (TTR) 和 转化率 (CVR) 产生最大的影响。

要测试的点击后(页面)元素:
(大多数可通过 Google Play 上的商店列表实验进行测试)

  • 屏幕截图:顺序、布局、文本叠加、背景颜色
  • Long 描述:消息传递结构、关键字密度、功能顺序(Google Play)
  • 功能图形:背景颜色/对比度、文本与无文本、消息传递、CTA(仅限 Google Play)
  • 宣传视频/预览:缩略图、长度、消息传递、功能顺序、CTA

这些元素会影响页面上的 转化率 (CVR),这意味着它们可能是用户下载您的 应用 的最终 “推动力”。您需要确保这些元素与您的 应用 将提供的功能保持一致,因为这将影响用户的期望,并最终影响保留率。

耐克的屏幕截图 A/B 测试显示,明亮的背景颜色比浅色背景颜色表现更好。
耐克对其屏幕截图背景进行了 A/B 测试,发现高对比度背景效果更好。

例如,耐克测试了其屏幕截图的背景颜色,发现亮蓝色背景比浅色背景效果更好。

可能的假设如果我们在屏幕截图中使用更明亮、高对比度的背景,访问者将更好地与页面互动,并且更有可能下载 应用

测试的变量:屏幕截图的背景颜色

为什么要测试这个? 具有视觉吸引力的设计可以吸引注意力,更好地突出核心功能,并引导用户进行 转化。

a/b 测试您的 ASO 工作的最佳实践

A/B 测试应该教会您一些东西或提高性能。即使是 ASO 专业人士也可能会犯一些小错误,导致他们的测试不可靠。以下关键原则可确保您的下一次 A/B 测试更值得信赖。

一次测试一个变量

选择一个元素——应用 标题、描述、屏幕截图、定价等——并假设当您对该变量进行单一更改时,用户行为会发生什么变化。

当您测试多个元素时,可能会导致对实际导致结果的原因感到困惑 about,从而无法得出明确的结论。您希望通过进行一项明确的更改并隔离其影响,使此测试易于复制或从中学习。

有一个与用户行为相关的明确假设

当涉及到 A/B 测试时,科学方法仍然有效. 首先要有一个明确的理论 about,说明您所做的更改应该如何影响用户行为. 否则,您就处于 “试验和 错误” 领域。

让我们回到耐克的示例假设:如果我们在屏幕截图中使用更明亮的背景,用户将更有可能在 搜索 结果中注意到 应用,从而带来更多的安装。

像上面这样的好假设应该解释您期望发生的事情(更多安装)以及这说明了about您的受众(他们被更高对比度的屏幕截图所吸引)。这样,即使测试失败,您仍然可以学到一些东西。

牢记您的目标受众

您的测试受众越广泛,您的创意更改就必须具有更大的大众吸引力才能击败基线。如果您将范围限制在特定语言、国家或流量细分市场,则可以更有效地进行测试

例如,我们有一个 AppTweak 客户,其大胆且文本繁重的屏幕截图在西方市场表现良好,但在日本表现不佳。日本用户往往更喜欢干净、简约的设计。

显示西方市场与日本的屏幕截图差异,揭示本地化屏幕截图的重要性。
通过为日本市场本地化他们的屏幕截图,AppTweak 的客户看到了 转化 的提升。

因此,我们建议他们为日本市场本地化他们的屏幕截图,使其设计简单,并侧重于每张图像的一个清晰信息。因此,他们看到了 转化 的显着提升。因此,不要忽视本地化您的创意以符合文化期望。

至少运行七天的测试

用户行为在工作日和周末之间有所不同。在两三天后过早结束测试可能会因流量、安装或 转化 模式的暂时波动而导致误导性结果。

我们已经看到,运行少于七天的测试通常会显示 “早期获胜者”,这些获胜者会在整整一周的 数据 后逆转。因此,我们建议至少运行七天的测试,理想情况下是 14 天(如果您有流量)。确保测试持续时间在不同变体中保持一致。但最重要的是,即使一个变体在两天后似乎 “获胜”,也不要过早停止。

不要期望在 应用 商店中获得相同的结果

Google Play 上的 应用 页面外观与 App Store 上的外观不同,商店流量的行为也不同。因此,如果不考虑用户界面或流量的差异,就认为在一个商店中观察到的所有发现都适用于两个商店,这是一个错误。

为了获得可靠的结果,在 App Store 和 Google Play 上测试资产,除非您有充分的理由相信结果应该直接应用于两个商店。

注意您的流量来源

不同的流量来源可能具有非常不同的行为模式。如果您在测试时运行付费用户获取活动,则此流量的行为可能与自然用户不同。

例如,付费用户通常会带着不同的期望或动机到达。在您的测试组中混合两者可能会导致结果偏差或误导性结论。如果可能,细分您的测试或隔离付费和自然流量,以确保您的发现反映真实世界的表现。

专家提示

即使进行了结构良好的测试,也很难隔离 ASO 更改的真正影响。这就是增量分析的用武之地。它可以帮助您了解性能提升是否实际上是由您的 A/B 测试引起的,或者付费 UA、季节性或其他营销活动是否发挥了更大的作用。了解更多 about ASO 和 UA 中的增量

使用统计置信度

达到统计显著性是了解您的结果是否可靠或只是随机噪声的关键。

Google Play 默认为 90% 的置信度,这对于低风险实验来说是可以的。但是,如果您正在测试一项可能对性能产生重大影响的更改(例如新图标或功能图形),请以 95% 甚至 98% 的置信度为目标。

更高的阈值降低了误报的风险,并让您更有信心大规模应用获胜的变体。有关提高可靠性的更多提示,请阅读如何在 Google Play 上改进 A/B 测试

您觉得这些 A/B 测试最佳实践有帮助吗?如果是这样,您可以通过下载我们的ASO 的 A/B 测试:基本清单来随身携带它们。

发布您的第一个 a/b 测试(App Store 和 Google Play)

一旦您确定了您的假设,关注 这些简单的步骤:

  1. 转到您的商店 管理中心 并找到其 A/B 测试选项卡或页面(Google Play 的 “商店列表实验” 页面或 App Store 的 “产品页面优化” 选项卡)。
  2. 单击 “创建测试/实验” 并 关注 这些说明。

在发布测试之前,系统会要求您设置一些参数。以下是最重要的参数:

  • 选择流量比例 (%),该比例将看到您的一个变体而不是原始页面。在 AppTweak,我们建议在原始页面和不同的变体之间平均分配流量,以获得最准确的结果。
  • 估计您的测试持续时间。 此指示性设置允许您估计您认为您的 A/B 测试何时会提供结论性结果,以便您了解您的期望是否现实。达到估计的测试持续时间结束时不会结束 A/B 测试。
  • 选择您要测试的资产。 如前所述,最好一次侧重于一个元素,以便更好地衡量测试的影响。
来自 Apple 的示例 about 如何在 App Store 控制台中设置 A/B 测试。
在 App Store Connect 的产品页面优化中设置 A/B 测试的示例。来源:Apple

Google Play 上的商店列表实验

商店列表实验是 Google Play 上 ASO 最广泛使用的 A/B 测试工具之一。它允许您使用真实流量测试您的 应用商店 资产的不同版本,以衡量哪个版本驱动最高的 转化率。

在您的商店列表的“实验”部分中运行您的 A/B 测试。来源:Google Play控制台
在您的商店列表的 “实验” 部分中运行您的 A/B 测试。来源:Google Play控制台

在 Google Play控制台 中,转到您的商店列表部分,然后单击 “实验” 以创建新测试。您可以针对您当前的默认列表测试最多三个变体,并根据需要运行实验,没有固定的结束日期,除非您选择一个。

注意:商店列表实验仅适用于您的 应用 的主商店列表。您目前无法在 自定义 商店列表上运行实验。

Google Play 允许您测试商店列表上的大多数资产,例如您的图标、宣传视频、功能图形和屏幕截图,以及您的简短和长描述。您的 应用 的标题、定价和 自定义 商店列表变体无法测试。

Google Play 上的 A/B 测试允许您

  • 确定您的 应用页面 上最具影响力的元素。
  • 根据目标市场的语言和地区,了解什么能引起他们的共鸣。
  • 由于获得的见解,可能会增加您的 应用 的 转化率。
  • 发现随时间的季节性影响或创意疲劳。

App Store 产品页面优化

产品页面优化 (PPO) 是 ASO 从业者了解不同页面元素对 iOS 转化率 影响的有用工具。Apple 随 iOS 15 推出了 PPO,因此,PPO 变体仅显示给运行 iOS 15 或更高版本的 App Store 用户。

Apple 仅允许您使用 PPO 测试创意资产(图标、预览视频和屏幕截图)最多 90 天。最多可以测试 3 个变体与原始版本进行比较。您可以一次只能为每个 应用 运行一个测试,但您可以为您 应用 支持的所有语言运行本地化测试。

了解如何使用产品页面优化来优化您的 App Store 资产。

在开始 A/B 测试之前,请先考虑清楚您要测试什么以及原因。对于某些人来说,改进屏幕截图将是主要优先事项。对于其他人来说,是否添加 应用 预览视频是主要考虑因素。评估您的品牌或产品的哪些要素对您的商店流量最重要,以及如何使您的 应用 相应地脱颖而出。

使用 AppTweak 进行 A/b 测试及其他

现在我们已经讨论了 about 如何正确构建 A/B 测试以及如何发布它们,下面介绍如何使用 AppTweak 将 A/B 测试提升到新的水平。

1. 监视竞争对手的 a/b 测试

在 AppTweak,我们开发了一项功能,允许您监视竞争对手执行的 A/B 测试。这可以提供有价值的信息,例如您的竞争对手运行 A/B 测试的频率和持续时间、他们最常测试的 应用页面 的要素以及他们在测试中引入的更改。

了解您的竞争对手正在使用 AppTweak 的时间线 进行哪些元数据元素的 A/B 测试。在我们的文章 监视竞争对手的 A/B 测试 中了解更多信息。

AppTweak 的时间线,其中包含 Pokemon Go 的 A/B 图标测试。
查看您的 竞争对手 何时更新了其元数据,包括 AppTweak 的时间线 中 Google Play 的 A/B 测试。

2. 查看您的 a/b 测试在发布前的外观

在发布 A/B 测试之前,请务必仔细检查其外观。使用 AppTweak 的 应用页面预览 上传您的新素材。您将立即看到您的 应用页面 在浅色模式和深色模式下的外观,从而避免任何可能搞砸测试的意外或错误。

AppTweak 的 应用页面预览 允许您在 A/B 测试上线之前对其进行审核。
了解使用 AppTweak 的 应用页面预览 发布前的测试效果。

3. 通过增量 分析 进行超越 a/b 测试

A/B 测试衡量的是直接影响,但它们并不总是 账户 考虑季节性、付费获取转移或自然算法更改等外部因素。

仅仅因为某个变体在短时间内表现良好,并不意味着它始终是最佳的长期选择。考虑一下哪种测试最适合您的假设。

  • A/B 测试 非常适合比较直接更改,例如 “哪个图标带来了更高的 转化率?
  • 增量测试 确定性能提升是否确实是由您的更改引起的,或者其他因素(如付费广告系列或市场趋势)是否发挥了作用。您可以使用 AppTweak 的 增量分析 来执行此操作。

通过阅读 什么是营销中的增量? 了解更多信息

结论

如果做得好,针对您的移动 应用 进行 A/B 测试可能是您 ASO 工具包中的有效工具。它可以帮助您消除猜测,发现真正引起用户共鸣的内容,并在 应用 商店中推动更高的 转化率。

但成功的关键在于您如何运行测试。不要忘记一次测试一个变量,有一个明确的假设,尽可能细分流量,并留出足够的时间来达到统计置信度。使用这些 A/B 测试最佳实践和工具来更智能地进行测试并扩展您的 应用 增长。

最后,如果您准备好监视您的竞争对手并取得领先,请立即开始探索 AppTweak

开始免费试用


Elizabeth Devine
作者 , App Growth Consultant
Elizabeth Devine is an App Growth Consultant at AppTweak, where she specializes in creative optimization. When she’s not helping clients grow their apps, she sews costumes, plays video games, and is a professional wrestler on the side.