您的位置 首页 谷歌优化

什么是孤立页面?为什么孤立页面对SEO不利?

什么是孤立页面?为什么孤立页面对SEO不利?

当他们开始在历史悠久的网站上工作时,流沙等待毫无戒心的 SEO。这些技术站点错误的坑,由几代以前的机构散布,减慢并阻碍了 SEO 的努力和进步。当您负责清理它时,找到快速修复是您的首要任务。因此,您可以从基本的站点审核开始,然后查看几个孤立页面。您可能听说过孤立页面对网站不利,但不完全了解它们是什么以及如何修复它们。

什么是孤立页面?

孤立页面是搜索引擎可能难以发现的页面,因为它们没有来自您网站其他地方的内部链接。这些 URL 往往会落空,因为搜索引擎爬虫只能从站点地图文件或外部反向链接中发现页面,而用户只有知道 URL 才能访问该页面。

什么导致孤立页面?

通常,孤立页面是偶然的,并且由于各种原因而发生。最常见的原因是没有用于站点迁移、导航更改、站点重新设计、缺货产品、测试或开发页面的流程。孤立页面也可能是有意的,例如促销和付费广告登陆页面,或者您不希望页面成为用户旅程一部分的任何情况。

为什么孤立页面对 SEO 不利?

搜索引擎很难找到孤立页面,因为它们使用链接来帮助发现新内容并了解页面的重要性。这是谷歌所说的:

谷歌使用称为爬虫的自动化程序搜索网络,寻找新的或更新的页面。我们通过许多不同的方法查找页面,但主要方法是跟踪我们已经知道的页面的链接。

例如,假设您发布了一个新网页,但忘记从您网站的其他地方链接到它。如果该页面不在您的站点地图中并且没有反向链接,Google 将不会找到或索引它。那是因为他们的网络爬虫不知道它的存在。更糟糕的是,该页面无法获得 PageRank。一般来说,PageRank 是谷歌通过计算一个页面获得的“票数”来理解页面重要性的方式。

如何查找孤立页面?

要在您的网站上查找孤立页面,您需要将可抓取的 URL 列表(Google 可以找到的)与人们在您网站上点击的 URL 列表进行比较。这听起来很技术性,但不要气馁。我们使用您熟悉的工具将如何查找孤立页面分解为三个简单的步骤。

1. 查找可抓取的 URL

您可以使用许多工具来收集所有可抓取 URL 的列表。我们通常使用 Ahrefs 的站点审核,因为它通过 Ahrefs 网站管理员工具帐户完全免费,并且您可以选择使用外部反向链接作为查找更多 URL 的来源。这是如何做到的:

前往现场审核。

单击 + 新建项目。

单击 URL 源选项卡并选中反向链接作为 URL 源以及默认设置。

单击继续,按照说明完成设置,然后运行爬网。

反向链接数据对于查找孤立页面很有用,因为它将来自 Ahrefs 链接索引的 URL 混合在一起。如果页面没有任何内部链接,则基本爬虫将找不到它。但是,如果一个页面有反向链接,Ahrefs 会在您的网站上找到该 URL,并且知道爬网没有找到内部链接,因此它一定是孤立页面。站点审核完成后,从页面资源管理器中导出所有内部页面并保存。您将在第 3 步中使用它。

2. 查找有点击的网址

下一步是获取在我们网站上点击的所有 URL 的列表。有很多方法可以做到这一点,最好使用尽可能多的数据源。如果您有权访问,则日志文件可以正常工作,因为它们是更准确的服务器端数据。我们不会深入了解如何访问这些内容,因为这取决于服务器的设置方式。但如果你选择走这条路,这里有三种常见服务器类型的官方指南:

访问 Apache 日志文件 (Linux)

访问 NGINX 日志文件 (Linux)

访问 IIS 日志文件 (Windows)

在本文中,我们将使用 Google Analytics (GA4) 和 Google Search Console,因为每个人的过程基本相同。以下是在 Google Analytics (GA4) 中查找具有命中的 URL 的方法:

登录到您的数据洞察帐户

开始一个新的空白报告

连接 Google Analytics 作为您的数据源

选择您正在分析的帐户 > 选择 GA4 媒体资源

在您的报告中添加一个基本表格

将数据源设置为在步骤 4 中创建的 GA4 属性

将维度设置为页面路径

将指标设置为视图

按视图降序排序

将默认日期范围设置为在网站上安装 GA4 之前

要从表格中导出结果,请单击右上角的三个垂直点,然后点击导出。使用有用的名称保存,例如“date_GA_URLs_people_are_hitting_brandname”,因为稍后您将再次需要它。因为我们导出了页面路径而不是完整的页面 URL,所以我们需要将域添加到电子表格中所有单元格的开头。这在 Google 表格中很容易。只需将 CSV 导入空白表,在左侧插入一个新列,然后将此公式粘贴到单元格 A1 中(确保将 example.com 替换为您的域):

=IFERROR(ARRAYFORMULA(IF(ISBLANK(B:B),"",IF(B:B="Page Path","",IF(B:B="(not set)","","https://example点com" & B:B)))))

由于多个 URL 来源总是最好的,我们还将从 Google Search Console (GSC) 中提取数据。GSC 将导出限制为前 1.000 个 URL,但 Google Data Studio 有一个巧妙的小技巧,可以让您提取更多。你可以尝试这么做:

重新打开您的数据洞察报告。

开始一个新页面(command + M)。

打开资源 > 管理添加的数据源。

单击添加数据源。

选择搜索控制台。

选择您正在分析的网站 > URL 展示 > 网络。

在您的报告中添加一个基本表格。

将维度设置为着陆页。

将指标设置为展示次数。

将每页的行数扩展到 5.000.

编辑日期范围以至少查看过去三个月。

从表中导出结果。

将您的工作表命名为“日期 GSC_URLs_people_are_hitting_brandname”之类的有用名称,因为稍后您将再次需要它。

现在,将人们从您的不同来源访问的所有 URL 合并到一个电子表格中,并通过删除重复项来清理数据。

3. 交叉引用两个 URL 源

最后一步是交叉引用可抓取的 URL(来自 Ahrefs 的 Site Audit)和具有命中的 URL(来自 GA 和 GSC)。为此,请创建一个空白 Google 表格并创建三个选项卡。将它们标记为爬网、点击和交叉引用。在第一张表中,从 Ahrefs 的站点审核中抓取、复制和粘贴所有可抓取的 URL。

要找到这些,请打开从第 1 步导出的 CSV 并过滤传入AllLinks 等于零的结果。这非常重要,因为这些是孤立页面,因此将它们包含在“爬网”选项卡中会导致交叉引用时结果不准确。相反,您应该复制这些 URL 并将它们添加到“点击”选项卡中。接下来,将 Ahrefs 导出中的剩余 URL 复制并粘贴到 Google 表格的抓取标签中。

在第二张表中,点击,复制/粘贴第 2 步中的所有 URL。这些是您使用 Google Analytics、Google Search Console 或您的站点日志文件找到的页面。它包括用户访问过的网页。在第三张表中,交叉引用,在第一个单元格中输入以下函数:

=UNIQUE(FILTER(hits!A:A, ISNA(MATCH (hits!A:A, crawl!A:A, 0))))

点击进入。该功能将自动拉取所有孤立页面,以便于分析。

如何修复孤立页面?

营销人员经常犯的错误是简单地将内部链接添加到所有孤儿页面。这种方法的主要问题是,仅仅因为可以在所有页面上应用快速修复并不意味着它应该是。一些孤立页面是有意的,如 PPC 登录页面,而其他页面则可以被删除,如测试页面。我们不想浪费资源来修复没有损坏或不太可能产生积极影响的东西。

如果在站点迁移期间丢失了一个页面,并且该页面对访问者没有任何价值,那么删除它可能是最好的选择。但是,如果页面有反向链接,也可能值得将 URL 重定向到另一个相关页面以保持反向链接的公平性。让我们看看修复孤立页面的四种策略。

1. 内部链接

对网站访问者有价值的孤立页面应合并到您网站的内部链接结构中,以使访问者和搜索引擎更容易找到它们。例如,假设在网站迁移或重新设计期间忘记了一篇文章。我们需要从我们知道谷歌很快(重新)抓取的相关页面内部链接到它。这是在 Ahrefs 中执行此操作的简单方法:

前往现场审核

打开您网站的最新抓取

在工具 > 打开页面资源管理器下

在页面文本中搜索单词或短语

按自然流量对结果进行排序

2. 无索引

有意不在内部链接的孤立页面(例如广告的登录页面)不应编入索引,以防止它们出现在自然搜索结果中。大多数 SEO 插件使这变得像选中一个框一样简单,但您也可以通过将其复制并粘贴到页面的

部分来手动完成:

 

确保这些页面在 robots.txt 中仍然可以抓取。否则,搜索引擎将看不到 noindex 指令。

3. 合并

合并与另一个页面具有相同或相似内容的孤立页面。这意味着合并内容并将孤立 URL 重定向到其他页面。例如,假设您有相同产品的两个产品列表。其中之一是孤立页面;另一个不是。您应该从孤立页面获取任何唯一有价值的信息并将其添加到另一个页面,然后再将孤立页面重定向到那里。

4. 删除

应该删除对访问者没有价值且没有其他目的(例如付费流量活动)的孤立页面。例如,可以删除未使用的 CMS 主题页面。这将导致出现 404 页面,并且随着时间的推移自然会退出搜索结果。如果页面有反向链接,您可能希望将 URL 重定向到另一个相关页面,以在删除后保留链接公平性。

如何防止孤立页面?

如您所见,审核孤立页面非常耗时。因此,一旦您投入工作,您就希望将来防止出现孤立页面。以下是一些需要考虑的政策和程序。

1. 制定网站迁移计划

任何时候进行网站迁移时都要制定计划,积极主动。您可以通过使用 301 重定向将旧页面重定向到新版本来避免网站上的链接断开和混乱。

2. 设置您的网站结构以获得成功

如果您必须手动在内部链接到新页面,您一定会错过一些并最终得到孤立页面。这就是为什么您应该选择为您处理内部链接的网站结构。大多数类型的 CMS 都是开箱即用的。例如,每次我们发布新的博客文章时,WordPress 都会从我们的博客主页和存档中添加一个内部链接。但是,如果您使用的是自定义解决方案,则需要确保为良好的网站结构准备了必要的代码。

3. 正确移除停产产品

如果您经营一个电子商务网站,您应该从目录中删除停产产品(以及指向它们的所有内部链接)并设置状态代码 404 或 410.未能删除此类产品的内部链接是常见原因孤立页面。如果页面有很好的反向链接,并且产品有更新或改进的版本,您可能需要考虑保留页面以保留反向链接权益。为此,请更新页面内容以解释产品不再可用的原因,包括介绍新的设计功能和链接到新产品页面。这样,用户就不会登陆完全不相关的页面或 404.

4. 定期进行现场审核

通过每月运行审核,您可以随时掌握任何可能从裂缝中溜走的意外孤立页面。您可以使用 Ahrefs 的站点审核中的调度功能轻松完成此操作。

写在最后

查看成排的孤立页面错误并试图理解沉重的技术术语是令人生畏的。虽然查找和修复孤立页面需要大量时间,但并不需要很辛苦。

免责声明:本站不对文章内容负责,仅供读者参考,版权归原作者所有。如有影响到您的合法权益(内容、图片等),请联系本站删除。

相关阅读