这是谷歌的约翰穆勒所说的:
他似乎暗示谷歌使用锚文本来帮助理解链接的上下文,因此,它可能是一个“排名因素”。这并不奇怪——谷歌的原始专利声明他们使用锚文本来影响排名。(稍后会详细介绍!)
这是 约翰的另一条推文,他重申了锚文本的重要性:
问题是:你应该使用什么样的锚文本?如果您想在搜索引擎中排名,是否应该限制使用特定类型的锚文本?你甚至应该操纵锚文本吗?
在本指南中,我们将通过研究384,614 个网页的反向链接的锚文本来揭示我们的发现。但首先,让我们确保我们了解基础知识。
锚文本是指用于将一个网页链接到另一个网页的可点击词。
示例: 在这句话中,蓝色单词 是锚文本。
假设有人决定链接到我们的反向链接检查器。
我们该页面主要目标关键词是“反向检查”,对其中有80K根据全球每月搜索Ahrefs’关键词浏览器。
但并非每个人都会以相同的方式链接到此页面。以下是他们可能使用的一些锚文本变体:
完全匹配:锚文本是我们想要排名的确切关键字或短语。
短语匹配:锚文本包含我们想要排名的关键字短语。
部分匹配:锚文本包含查询中的所有单词,但不是精确的短语。
Branded: 锚文本是我们品牌的名称:
裸URL:锚文本是原始的“裸” URL(即,它会出现在浏览器中):
随机:锚文本是一个不特定的通用短语,不包含我们的目标关键字(例如,“点击这里”、“这个站点”、“这篇文章”等)
图片链接: 锚文本是图片的替代文字 (根据谷歌)。
<a href=”https://ahrefs.com/backlink-checker”>
<img src=”/backlink-checker.png” alt=”Backlink Checker”/>
</a>
站点浏览器 > 输入URL > 锚
现在让我们来看看锚文本的混合可能如何影响我们的排名。
谷歌使用外部锚文本来帮助了解您的页面是关于什么的,以及它应该为哪些关键字排名。我们怎么知道呢?
这是 谷歌算法所基于的原始论文的摘录:
Google 采用了多种技术来提高搜索质量,包括页面排名、锚文本和邻近信息。
因此,如果我链接到这篇文章中以“dog biscuits”作为锚文本的页面,这将向 Google 表明链接页面可能与 dog biscuits 有关。
如果其他人也做同样的事情,那么这将增加谷歌的信心,即相关页面可能会被列为“狗饼干”。毕竟,如果页面与狗饼干没有任何关系,那么两个或多个不相关的网站使用相同的锚文本链接到同一个网页的可能性有多大?相当苗条,我会说。
希望您开始明白为什么锚文本作为排名因素有意义。
但是,当然,SEO中的任何事情都没有那么简单。
早期谷歌(过度)依赖锚文本
在谷歌的原始算法中,锚文本的权重很大。
在他们 1998 年的论文中,谷歌创始人谢尔盖布林和拉里佩奇解释说:
链接文本在我们的搜索引擎中以特殊方式处理。大多数搜索引擎将链接的文本与链接所在的页面相关联。此外,我们将其与链接指向的页面相关联。这有几个优点。首先,锚点通常比页面本身提供更准确的网页描述。
使用锚文本还允许 Google 确定无法使用典型页面信号的媒体格式主题。
其次,锚点可能存在于无法被基于文本的搜索引擎索引的文档中,例如图像、程序和数据库。这使得返回实际上没有被抓取的网页成为可能。
逻辑是合理的,结果令人印象深刻,尤其是与当时的竞争相比——这一事实并没有被创始人自己忽视。
虽然完整的用户评估超出了本文的范围,但我们自己在 Google 上的经验表明,对于大多数搜索,它比主要商业搜索引擎产生更好的结果。
但谷歌很快发现锚文本很容易被操纵。
要为某个查询对网页进行排名,人们只需将多个链接指向该网页,并将其目标关键字作为锚点。
比您的竞争对手更多的关键字丰富的锚文本链接= WIN。
这导致了一些“谷歌轰炸”的有趣例子——搜索引擎优化将通过将锚文本链接指向不相关的页面并对它们进行排名来展示与谷歌游戏是多么容易。
显然,事情必须改变。
谷歌反击操纵锚文本
2012 年 4 月,谷歌推出了他们现在臭名昭著的企鹅算法的第一次迭代。
锚文本是企鹅的主要目标之一。
一些网站的精确匹配锚文本链接过于激进,他们的排名在一夜之间下降。然而,据谷歌称,它只影响了 3.1% 的搜索查询。
但事情并没有就此止步……
谷歌通过随后的企鹅更新继续与操纵性锚文本垃圾邮件作斗争。
大多数 SEO 现在似乎建议谨慎使用精确匹配的锚文本——通常在 1% 到 5% 之间。
那么真相是什么?您应该将精确匹配的锚点保持在最低限度吗?你应该完全避免完全匹配的锚点吗?短语匹配和其他类型的锚点怎么样——你应该如何使用它们?
为了找到答案,我们进行了两项研究。
为了研究锚文本类型和排名之间的相关性,我们查看了 19,840 个关键字的前 20 个搜索结果。
这意味着我们 总共分析了384,614 个网页!
你们中的一些人可能已经注意到 19,840 * 20 != 384,614,而是 396,800。那是因为一些 URL 对我们研究的关键字中的一个以上进行了排名。
所有这些关键字:
- 每月有2K-5K次搜索(随机选择!);
- 由2-4个英文单词组成;
- 不包含特殊字符(例如!#@);
- 是非数字的(即电话号码等关键字被过滤掉)
此外,我们只选择前 10 个搜索结果具有相似 URL评级 ( UR ) 值的关键字。这样做的目的是“隔离”锚文本变量。
让我用一个粗略的例子来解释。
假设“最佳蛋白粉”的前 10 个搜索结果如下所示:
- 精确锚匹配%:100%。UR分数: 60
- 精确锚匹配 %:90%。UR分数: 55
- 精确锚匹配%:80%。UR分数:50
- 精确锚匹配 %:70%。UR分数:45
- 精确锚匹配百分比:60%。UR分数:40
- 精确锚匹配 %:50%。UR分数:35
- 精确锚匹配百分比:40%。UR分数:30
- 精确锚匹配 %:30%。UR分数:25
- 精确锚匹配百分比:20%。UR分数:20
- 精确锚匹配 %:10%。UR分数:15
您可以看到完全匹配锚文本的百分比与排名相关。由此,我们可以推断完全匹配率会影响排名。
然而,这是一种误导,因为还有UR的相关性 。
因此,反向链接(或内部链接)的数量和质量很可能也是这种相关性的部分原因。
另一方面,如果结果看起来像这样……
- 精确锚匹配%:100%。UR分数: 30
- 精确锚匹配 %:90%。UR分数:25
- 精确锚匹配%:80%。UR分数:32
- 精确锚匹配 %:70%。UR分数:33
- 精确锚匹配百分比:60%。UR分数:28
- 精确锚匹配 %:50%。UR分数:31
- 精确锚匹配百分比:40%。UR分数:31
- 精确锚匹配 %:30%。UR分数:27
- 精确锚匹配百分比:20%。UR分数:36
- 精确锚匹配 %:10%。UR分数:29
……那么由反向链接(或内部链接)引起的任何潜在相关性的可能性要低得多。
合理?
好的。让我们来看看结果。
精确匹配锚的影响
首先,我们查看了每个排名位置的完全匹配锚定反向链接的平均百分比和中位数百分比 – 根据指向URL的反向链接总数计算 。
所以看起来这里有一个非常明显的相关性,对吧?没那么快。
显示相关性的蓝线是平均值。这是属于每个位置的点的“有偏差”表示,因为极值很容易扭曲平均值。
我失去你了吗?
假设我们有以下位置 #1 的页面示例:
- 第 1 页: 0% 精确匹配锚点;
- 第 2 页: 0% 精确匹配锚点;
- 第 3 页: 0% 精确匹配锚点;
- 第 4 页: 0% 精确匹配锚点;
- 第 5 页: 100% 精确匹配锚点;
此样本的平均精确匹配锚点 = 20%。
您可以看到这并不能很好地代表整个样本——一个值显着地扭曲了平均值。这就是为什么我们还在图表中添加了中值(橙色线)。您可以看到每个排名位置的中位数为零。
以下是我们的数据科学家Loveme Felicilda对此的评论:
我会说平均值不是 表示相关性的好方法。这就是为什么我也显示中位数。所有位置的中位数为零的事实意味着有很多页面没有完全匹配的反向链接。如果我们的中值显示出与平均值相同的“模式”,那么我们就会有很强的相关性。因此,如果我们想要呈现相关性,那么我们应该在图形上绘制所有点并添加一条最佳拟合线。
这正是我们所做的:
现在您可以看到真正的相关性非常弱。
更重要的是,下面是相关性的直方图。x 轴显示分桶相关值,y 轴显示属于每个桶的 SERP/关键字的数量。
一般来说,图形越钟形和对称,与中间值的相关性越接近(在这种情况下,它为零)。如果它向右倾斜,则更正相关。如果它向左倾斜,那么它是负相关的。
您可以看到,在这种情况下,它略微向右倾斜 – 这表明弱正相关。
有多弱?以下是斯皮尔曼相关性的结果:
斯皮尔曼相关性(平均值): 0.1436
斯皮尔曼相关性(中值): 0.1869
结果:精确匹配锚定链接的百分比与排名之间的相关性相对较弱。平均值和中位数都表明了这一点。
我们包括了中值 Spearman 相关性,因为某些利基(例如,发薪日贷款)非常重锚文本并且可能扭曲了平均值。
但这是为什么呢?
如果谷歌使用锚文本作为排名因素——或者至少像约翰·穆勒所说的那样理解页面的上下文——那么不应该有更大的相关性吗?
不必要。约翰从未说过他们在算法中赋予锚文本多少权重。
此外, 我们的数据 中存在一个潜在的、不可避免的缺陷,我希望对此保持透明。我很快就会谈到这一点。
首先,让我们看看其他锚文本类型的数字……
短语匹配锚的影响
概括地说,短语匹配锚是那些包含目标查询的锚。
例如,如果关键字是“ SEO工具”,那么“最佳SEO工具”或“我最喜欢的SEO工具”都是短语匹配锚。让我们看看这些是如何叠加的。
这里有两件事很突出:
- 平均值的“相关性”类似于精确匹配。
- 短语匹配锚的平均百分比略高于精确匹配。
但同样,为了看到“真正的”相关性,我们需要查看一些不同的图表:
所以这一次,相关性甚至低于精确匹配锚点。
斯皮尔曼相关性(平均值): 0.1057
斯皮尔曼相关性(中值): 0.1393
结果:短语匹配锚的百分比与排名之间的相关性非常弱。
部分匹配锚的影响
部分匹配锚是那些包含查询中所有单词但不作为精确短语的锚。
例如,如果关键字是“ SEO工具”,那么“ SEO 的最佳工具”或“我最喜欢的SEO技巧是使用 Ahrefs 的这个工具”都是短语匹配锚。
让我们看看这些是如何叠加的。
就平均值而言,似乎再次存在类似的相关性,而中位数仍趋于零。
此外,与完全匹配和词组匹配百分比相比,部分匹配关键字的平均百分比相当高。
这是有道理的,因为部分匹配包含完全匹配和短语匹配关键字。
以下是两个图表,可以更好地表示相关性:
这里的相关性与短语匹配相关性几乎相同:
斯皮尔曼相关性(平均值): 0.1076
斯皮尔曼相关性(中值): 0.1393
结果:非常弱的相关性。
随机锚的影响
随机锚是那些包含非特定或通用短语的锚。它们不包含目标关键字(或其任何元素)。
如果关键字是“ SEO tool”,那么“click here”或“this article”都是随机锚点。
让我们看看这些是如何叠加的。
您会注意到的第一件事是,与我们研究的其他类型的锚文本相比,随机锚的平均百分比非常高。这是有道理的,因为除了一些非常具体的锚点之外,随机锚点几乎包含了所有其他锚点。
您还会注意到平均值似乎表明排名与随机锚点的百分比之间存在某种相关性(尽管很弱)。
我认为这是最好的例子,说明为什么查看平均值是一个坏主意。
让我们看一些更可靠的图表来判断真正的相关性。
您可以看到直方图似乎既不向左也不向右倾斜。这意味着相关性趋向于中间值——即零。
以下是斯皮尔曼相关性:
斯皮尔曼相关性(平均值): 0.0161
斯皮尔曼相关性(中值): 0.0130
结果:实际上没有相关性。
这一点也不奇怪。
如果您熟悉 Ahrefs 站点浏览器中的反向链接 报告,那么您就会知道我们会同时显示链接的锚文本和周围的链接文本。
为什么这是相关的?
2004 年,谷歌申请了一项 名为“基于参考上下文的排名”的专利。
这是所述专利的有趣摘录:
[…] 链接周围的数据、链接左侧或链接右侧的数据或与链接关联的锚文本可用于确定与链接关联的上下文。
换句话说,如果实际的锚文本碰巧是随机的并且与链接页面无关,Google 可能会查看周围的链接文本以帮助了解该页面的内容。
您可以通过上面的屏幕截图中描述的示例了解这可能是如何工作的。锚文本是随机/通用的,但周围的链接文本提供了一些上下文。
考虑到这一点,我们认为研究排名与关键字在周围链接文本中的出现之间是否存在任何相关性会很有趣。
所以这就是我们所做的:
我们从研究#1 中采用了相同的一组关键字,但只包括带有随机锚点的页面——即没有任何精确/短语/部分/等的页面。锚定链接。
这给我们留下了 27,156 个网页。
为了尽量减少偏差,我们进一步将样本减少到16K页——每个位置 800 页 (1-20)。这是为了确保任何相关性都基于每个排名位置的相同页数。
让我们来看看我们发现了什么。
精确匹配关键字在周围链接文本中的影响
假设我们的目标关键字是“ SEO 工具”。
以下是在周围链接文本中使用完全匹配关键字的链接示例:
现在让我们看看结果。
您可以看到这里几乎没有相关性。
斯皮尔曼相关(平均): 0.0640
结果:在周围的链接文本中使用完全匹配关键字似乎对排名没有显着影响。
周围链接文本中部分匹配关键字的影响
这次我们研究了目标关键字中所有术语的出现与排名之间的相关性——即部分匹配。
例如,如果我们的关键词是“ SEO tool”,那么这个链接就会落入水桶:
合理?
结果如下:
斯皮尔曼相关(平均): 0.0205
结果:排名与周围链接文本中查询中所有单词的出现之间几乎为零相关性。
来自目标查询的 1+ 个单词对周围链接文本的影响
最后,我们查看了排名与周围链接文本中来自目标查询的至少一个术语的出现之间的相关性。
例如,如果我们的关键字是“ SEO工具”,那么所有这些链接都将落入这个桶中:
您可以看到这也包含精确匹配、短语匹配和部分匹配。
结果如下:
有趣的是,在周围链接文本中包含来自目标查询的至少一个单词的链接的平均百分比相当高——所有排名位置为 20-25%。
尽管如此,重要的是要注意中位数为零,这意味着我们研究的大多数页面都没有与周围文本中目标查询中的一个或多个单词的链接。
至于与排名的相关性:
斯皮尔曼相关(平均):- 0.0701
结果:轻微的负相关,但它非常接近于零,这实际上是没有相关性。
没有任何研究是完美的,我们的也不例外。让我解释一下原因。
假设我们想知道我们的电子邮件地址指南中有多少带有完全匹配锚点的反向链接。
这听起来很容易……直到您考虑到帖子排名7K + 关键字这一事实!
那么我们应该研究这 7,205 个关键字中的哪一个作为我们的完全匹配短语?
我知道你在想什么:这里的主要目标关键字显然是“查找电子邮件地址”,所以我们当然应该研究以该短语作为锚文本的反向链接的数量,对吗?
这是一个有点合乎逻辑的假设,但有两个问题:
首先,虽然我们可以轻松地对这个页面执行此操作,因为我们知道 主要目标关键字,但我们应该如何为 384,614 个网页大规模执行相同的操作?我们不能,也没有,因为无法确定这些页面所定位的主要关键字。
在Ahrefs 关键字资源管理器中,我们在SERP概览中显示了目标关键字的前 10 个排名页面,以及包括“热门关键字”在内的一系列SEO指标。
“热门关键字”是占该页面最多自然流量的关键字。
那么,为什么不使用这个指标来解决我们锚文本研究的第一个问题呢?
答:因为“热门关键字”只显示哪个关键字恰好向页面发送了最多的自然流量,而这并不总是作者打算对其进行排名的关键字。
此外,我认为可以公平地说,许多锚定链接,尤其是完全匹配的链接,是“链接操作”的结果——即 SEO 以目标关键字为锚点建立链接,目的是提高该页面在所述关键字的搜索引擎。
将这两件事放在一起,您就会明白为什么使用“Top 关键字”不能解决我们的问题。
其次,我们的 384,614 个网页样本来自查看 19,840 个关键字的前 20 个排名页面。但是,所有这些关键字都符合一组初始条件,其中一个是每月搜索量在 2,000 到 5,000 之间。该标准本身肯定会排除某些页面的主要目标关键字。事实上,这是其在5500每月搜索量的情况下,“查找电子邮件地址,” 美国。
现在,在您假设我用来说明这一点的页面是一个异常值并且大多数页面没有对这么多关键字进行排名之前,请先看看这个:
我们研究了 300 万个随机搜索查询,发现排名前 10 的页面平均也会对 400 到 1,300 个其他查询进行排名。
所以,很明显,这是我们的研究没有考虑到的大规模事件。
这让我巧妙地进入了你们可能一直在等待的部分……
让我们假设有一些神奇的方法可以知道我们研究的每个页面的主要目标关键字,这会改变什么吗?这是不可能的,但这是否是正确的问题?
我不相信,而且我不认为以建立关键字丰富的主播为目标是 2019 年的好策略。
以下是三个原因:
1) 话题 > 关键词
这是一个有趣的事实:
平均而言,在Ahrefs 博客上的所有帖子中,只有 22%(~⅕)的流量来自主要目标关键字。
因此,即使我们的研究没有任何缺陷,并且我们发现使用完全匹配的锚点,例如,13% 的时间是为您的目标关键字排名的秘诀(不是,只是为了清楚),那么从逻辑上讲,专注于构建关键字丰富的链接仍然不应该是您的重点。
那是因为专注于提高单个关键字的排名显然是一种疏忽——这只会负责发送该页面总流量的一小部分。
但为什么会这样呢?为什么我们的页面——以及其他人的页面——没有看到来自主要目标关键字的总流量的更高百分比?
让我解释…
可以说,谷歌对自然语言查询的理解比以往任何时候都要好。这在一定程度上要归功于 2013 年Hummingbird的推出,根据 Wikipedia 的说法,它“更加重视自然语言查询,考虑上下文和单个关键字的含义” 。
因此,为其目标关键字排名的页面也倾向于对一堆长尾 变体进行排名,当这些变体组合在一起时,通常会导致页面的绝大多数流量。
举一个例子,这里是我们通过Ahrefs 站点浏览器查找电子邮件指南的美国自然流量总量:
这是来自目标关键字的自然流量:
1,076/ 6,200 =来自目标关键字的总流量的约 17%。
所以,把这个完整的循环:
根据定义,精确匹配锚只能针对一个关键字,而在 2019 年,一个关键字的排名不是SEO的全部内容,也不应该成为您的主要目标。
话虽如此,你们中的一些人可能已经发现了这个论点中可能存在的缺陷。或者更准确地说:反驳。
它是这样的:
如果您可以 通过构建以“ x” 作为锚文本的链接让 Google 相信您的页面是关于 x的,并且 Hummingbird 将x 与y和z相关联,那么构建关键字丰富的链接不会间接增加 Google 对您的页面提供服务的信心不仅是x的相关结果,还有y、z和任何其他相关查询,因此有可能全面提高排名和流量?
这可能 是真的,但这肯定是实现这一结果的一种冒险且不必要的困难方式——尤其是后企鹅时代。
做一些页面搜索引擎优化 并优化与主题相关的关键字(即,不仅是x,还有 y 和z)会容易得多。
2) 风险
用关键字丰富的锚建立链接是有风险的。
是的,我的意思是建立 链接……
我想我们都知道有人使用确切的目标关键字作为锚自然地链接到您的页面的情况很少见。这让我想到了一个相关的观点:
如果不诉诸 使用 PBN 等低质量的黑帽策略,就很难建立这样的链接,这不是我们提倡的。
3)弱相关
撇开任何潜在的缺陷不谈,我们的研究结果表明,锚文本在 2019 年的排名中起着相当微不足道的作用。