为了了解营销人员在为语音搜索页面排名时需要考虑哪些参数,我们进行了一项深入研究,分析了3种设备上超过5万个查询的结果。
我们的研究,你可以在这里查看,产生了一系列的发现,包括10个关键因素,影响谷歌助手如何选择语音搜索答案。
下面你会发现我们完整的方法,它完整地描述了数据收集过程。
1. 硬件
我们使用了三种不同的设备来了解向谷歌Assistant提问的设备是否会对返回的答案产生影响。
我们用了两个家庭扬声器设备和一个安卓智能手机,用编程的方式向它们提出了数万个问题,并记录了每个问题的答案。
我们使用的设备是:
谷歌的家
谷歌家用迷你
小米红米6 (Android)
在小米红米6的情况下,所有的答案都是用耳机记录的,以确保谷歌助手会大声读出答案。目前还不清楚使用耳机是否对给出的答案有任何影响,因为我们没有研究这种影响(因为它不是我们研究的重点)。
此外,所有设备都设置在相同的位置,以提供地理一致性。我们选择的地点是纽约市,更具体地说,是帝国大厦。
2. 制作问题清单
我们为谷歌Assistant准备了一系列问题。这些问题可以手工生成,也可以通过SEMrush的API生成;这是用三种不同的方法完成的,它们是:
常见问题
从SEMrush数据库和先前发表的分析中收集了一系列常见问题。
示例查询包括:
参加婚礼该穿什么?
什么是求职信?
如何通过药检?
关键词生成问题
我们还使用了一系列种子词来生成查询。这些都是基于随机选择的关键词。有了这些种子词,我们收集了一些常见的问题,这些问题以关键词本身为特征。
以关键词“t恤”为例,问题包括:
如何叠t恤?
如何制作自己的t恤?
如何打印t恤?
使用列表构建常见问题
我们列出了一些受欢迎的主题(包括动物和国家),并将这些主题注入到一系列基本问题中。
以动物为例,它是这样运作的:
动物名单:
乌龟
狗
猫
问题列表:
动物b>能活多久?
我可以有一个动物b>作为宠物吗?
在问题列表中循环动物
乌龟能活多久?
狗能活多久?
猫能活多久?
我可以养一只乌龟当宠物吗?
我可以养条狗当宠物吗?
我能养只猫当宠物吗?
这种方法使我们能够识别趋势并消除与研究无关的结果。例如,我们的研究表明谷歌可能有某些类型问题的来源,因为基于名人及其生活的查询通常会返回来自biography.com的结果。这一见解表明,一些作为语音搜索返回的答案似乎来自选定数量的可信来源,而不管SERP中的其他结果是否具有更令人印象深刻的指标。
3. 问问题
当涉及到提问时,我们使用了相同的迭代过程。运行过程如下:
一个问题被输入谷歌文本到说话,然后转换成一个音频文件。
然后用电脑的扬声器播放音频文件,例如,“嘿谷歌,我可以养一只乌龟当宠物吗?”
谷歌助手有五秒钟的时间来处理信息并说出答案。
然后我们播放了一个预先录制好的音频文件,上面写着:“嘿,谷歌,停下来。”这是由于谷歌Home设备在解释设备说话时发送的一些问题时出现了问题。
三秒钟作为缓冲时间,之后问题被发送到一个包含所有问题的文件中,以便交叉参考,以避免重复。
然后这个过程又回到了第一步。
4. 分析问题和答案
通过登录myactivity.google.com,我们能够从上述活动中提取所有语音搜索的问题和答案。我们将这些数据导出为HTML文件,并通过Python库Beautiful Soup抓取它。
导出的文件包含信息块,包括:
问题来了。
b谷歌提供的答案。
链接到答案的来源,如果适用*。
*在某些情况下,通过Android设备询问的特定问题没有提供答案链接。例如,当我们问“Lady Gaga多大了?”,给出的答案是“32年”(不需要链接)。
其他未提供链接的因素包括:
答案是一个照片列表(仅限Android)。
谷歌不知道答案——他的回答是“我还帮不上忙。”
导出文件后,我们收集答案并将其放入表中以供进一步分析。
问题 回答 链接 设备
什么是最好的SEO工具? SEMrush。 www.semrush.com 谷歌家用迷你
5. 收集serp
一旦收集到数据,就会将其放入一个格式化的表格中,其中包含问题和答案以及它们的位置和任何已占用的SERP功能。
为了保持研究的一致性,我们在三个设备上使用了完全相同的位置,并提出了完全相同的问题。
然后以如下格式返回结果:
问题 URL 功能类型 位置
什么是最好的SEO工具? www.semrush.com featured_snippet -1
什么是最好的SEO工具? www.semrush.com/seo 有机 1
通过使用这种方法,我们能够收集每个答案的排名位置以及答案排名的任何SERP特征(例如,Featured Snippet)。值得注意的是,没有收集不包含URL的SERP特性,例如知识面板。
6. 收集度量标准
在收集指标时,我们选择了前10个有机结果和SERP特征进行分析。可以分析前100个结果。然而,初步分析发现,谷歌Assistant选择的97%的答案来自第一页;这使得分析每个问题的100个结果变得不必要。
从SERP排名前10位的每个URL中,我们收集了以下数据:
模式:通过“requests”和“BeautifulSoup”直接从页面本身获得。
页面性能:使用谷歌Page speed API收集页面速度和其他指标。
反向链接:我们使用SEMrush反向链接分析API来提供SERP中排名前10位的反向链接信息。
我们还分析了文本本身的其他几个指标,以建立语音搜索中的排名因素。这些包括:
复杂性:答案中使用的语言类型。
文本长度:对答案进行简单的字数统计。
我们使用了许多不同的尺度来分析文本的复杂性。这些都是:
Flesch Kincaid Grade & Reading Ease
戴尔·查尔可读性评分
科尔曼·刘指数
Linsear写公式
自动可读性索引
页面性能指标
下面您将找到我们在分析页面速度性能时获得的指标的进一步信息。我们评估的指标如下:
DOM节点
最大子元素
最大DOM深度
估计输入延迟
第一个CPU空闲
第一个内容油漆
第一次有意义的绘画
互动
第一次油漆
最后一次视觉变化
观察到的负载
速度指数
互动时间
总字节权重
到第一个字节时间
反向链接的指标
我们使用SEMrush API研究了一些与反向链接相关的指标。下面是收集到的完整列表:
反向链接报告:
Anchor_kw
External_num
形式
框架
图像
Internal_num
Lostlink
Newlink
Nofollow
Page_score_mean
Sitewide
Source_size
Source_title_kw
Trust_score_mean
反向链接概述报告:
Domains_num
Follows_num
Forms_num
Frames_num
Images_num
Ipclassc_num
Ips_num
Nofollows_num
分数
Texts_num
总计
Trust_score
URLs_num
反向链接转域名报告:
Backlinks_num
国家
Domain_ascore
Domain_score
Domain_trust_score
每个指标的描述可以在这里找到。
在“backlinks_refdomains”和“backlinks”的API参数中,报告设置为:
“display_limit = 100”
“display_sort = backlinks_num_desc”
这些报告的单个值是前100个结果的平均值。
阅读我们的语音搜索研究
我们的深入研究使用了上述方法,主要有两个目标:
了解谷歌Assistant用于选择语音搜索查询答案的参数。
比较和理解从不同设备得到的答案的差异。
这如何应用于语音搜索营销?由此,我们发现了10个关键的排名因素,从字数到页面速度,这些因素对语音搜索结果有明显的影响,这些都是使用语音搜索优化服务时需要考虑的宝贵见解。
您可以点击这里查看我们的研究,并揭示影响语音搜索结果的关键排名因素。