为何网站难以被谷歌收录？解决收录难题的关键在哪里？

每个网站都在某种程度上依赖谷歌。很简单：您的页面会被 Google 编入索引，这让人们可以找到您。这就是事情的发展方向。然而，情况并非总是如此。许多页面从未被 Google 编入索引。如果您使用网站，尤其是大型网站，您可能已经注意到并非网站上的每个页面都被编入索引，而且许多页面要等待数周才能被 Google 收录。

导致这个问题的因素有很多，其中许多与排名中提到的因素相同——内容质量和链接就是两个例子。有时，这些因素也非常复杂和技术性。严重依赖新网络技术的现代网站过去因索引问题而臭名昭著，有些仍然如此。

许多 SEO 仍然认为阻止 Google 索引内容的技术性很强，但这是一个神话。如果您没有就要编入索引的页面发出一致的技术信号或抓取预算不足，Google 确实可能不会将您的页面编入索引，但与内容质量保持一致也同样重要。

大多数网站，无论大小，都有很多应该编入索引的内容——但事实并非如此。虽然像 JavaScript 这样的东西确实使索引变得更加复杂，但即使它是用纯 HTML 编写的，您的网站也可能会遇到严重的索引问题。在这篇文章中，让我们解决一些最常见的问题，以及如何缓解它们。

文章目录

1 Google 未将您的网页编入索引的原因
2 热门索引问题
3 如何检查您网站的索引覆盖率？
4 如何增加 Google 将您的网页编入索引的可能性

Google 未将您的网页编入索引的原因

使用自定义索引检查器工具，我检查了美国最受欢迎的电子商务商店的大量样本以查找索引问题。我发现，平均而言，他们 15% 的可索引产品页面无法在 Google 上找到。这个结果非常令人惊讶。接下来我需要知道的是“为什么”：谷歌决定不索引技术上应该被索引的东西的最常见原因是什么?

Google Search Console 会报告未编入索引的页面的多种状态，例如“已抓取 - 当前未编入索引”或“已发现 - 当前未编入索引”。虽然此信息不能明确帮助解决问题，但它是开始诊断的好地方。

如何检查您网站的索引覆盖率？

通过在 Google Search Console 中打开索引覆盖率报告，您可以轻松查看您网站的多少页面未被编入索引。您应该在这里查看的第一件事是排除的页面数。然后尝试找到一种模式——哪些类型的页面没有被索引?

如果您拥有一家电子商务商店，您很可能会看到未编入索引的产品页面。虽然这应该始终是一个警告信号，但您不能期望将所有产品页面都编入索引，尤其是对于大型网站。例如，大型电子商务商店必然会有重复的页面和过期或缺货的产品。这些页面可能缺乏将它们置于 Google 索引队列前端的质量(如果 Google 决定首先抓取这些页面)。

此外，大型电子商务网站往往存在抓取预算问题。我见过电子商务商店拥有超过 100 万种产品的案例，其中 90% 被归类为“已发现 - 目前未编入索引”。但是，如果您看到重要页面被排除在 Google 的索引之外，您应该深感担忧。

如何增加 Google 将您的网页编入索引的可能性

每个网站都是不同的，可能会遇到不同的索引问题。但是，以下是一些有助于您的页面被索引的最佳实践：

1. 避免“Soft 404”状态

确保您的页面不包含任何可能错误地指示软 404 状态的内容。这包括从在副本中使用“未找到”或“不可用”到在 URL 中包含数字“404”的任何内容。

2. 使用内部链接

内部链接是谷歌的关键信号之一，表明给定页面是网站的重要组成部分，值得被索引。在您的网站结构中不要留下孤立页面，并记住在您的站点地图中包含所有可索引的页面。

3. 实施完善的爬取策略

不要让 Google 抓取您网站上的垃圾。如果太多资源用于抓取域中价值较低的部分，Google 可能需要很长时间才能找到好东西。服务器日志分析可以让您全面了解 Googlebot 抓取的内容以及如何对其进行优化。

4. 消除低质量和重复的内容

每个大型网站最终都会有一些不应编入索引的页面。确保这些页面不会进入您的站点地图，并在适当的时候使用 noindex 标签和 robots.txt 文件。如果您让 Google 在您网站最糟糕的部分花费太多时间，它可能会低估您域的整体质量。

5. 发送一致的 SEO 信号

向 Google 发送不一致的 SEO 信号的一个常见示例是使用 JavaScript 更改规范标签。正如 Google 的 Martin Splitt 在 JavaScript SEO Office Hours 期间提到的那样，如果源 HTML 中有一个规范标签，而在呈现 JavaScript 后有另一个不同的标签，则您永远无法确定 Google 会做什么。

写在最后

在过去的几年里，谷歌在处理 JavaScript 方面取得了巨大的飞跃，使 SEO 的工作变得更容易。如今，由于使用的特定技术堆栈而未编入索引的基于 JavaScript 的网站已不太常见。但是我们可以期待与 JavaScript 无关的索引问题也会发生同样的情况吗?我不这么认为。互联网在不断发展。每天都有新网站出现，现有网站也在不断增长。谷歌能否应对这一挑战?这个问题每隔一段时间就会出现一次。我喜欢在这里引用谷歌的说明：

“Google 拥有有限数量的资源，因此当面临几乎无限数量的在线可用内容时，Googlebot 只能找到并抓取该内容的一部分。然后，在我们抓取的内容中，我们只能索引一部分。”

换句话说，谷歌只能访问网络上所有页面的一部分，并索引更小的部分。即使您的网站很棒，您也应该牢记这一点。Google 可能不会访问您网站的每个页面，即使它相对较小。您的工作是确保 Google 可以发现对您的业务至关重要的页面并将其编入索引。

为何网站难以被谷歌收录？解决收录难题的关键在哪里？

Google 未将您的网页编入索引的原因

热门索引问题

1. “已抓取 - 当前未编入索引”

2. “已发现 - 目前未编入索引”

3. “重复内容”

如何检查您网站的索引覆盖率？

如何增加 Google 将您的网页编入索引的可能性

1. 避免“Soft 404”状态

2. 使用内部链接

3. 实施完善的爬取策略

4. 消除低质量和重复的内容

5. 发送一致的 SEO 信号

Google 未将您的网页编入索引的原因

热门索引问题

1. “已抓取 - 当前未编入索引”

2. “已发现 - 目前未编入索引”

3. “重复内容”

如何检查您网站的索引覆盖率？

如何增加 Google 将您的网页编入索引的可能性

1. 避免“Soft 404”状态

2. 使用内部链接

3. 实施完善的爬取策略

4. 消除低质量和重复的内容

5. 发送一致的 SEO 信号

相关阅读

1小鹏独立站：谷歌SEO知识点

2百度SEO与谷歌SEO之间有哪些显著区别？

3哪些跨境卖家做独立站可能更容易成功？

4Ahrefs Evolve 观后感:SEO内容营销的路径

5Google精准搜客户的7个小方法

6让社交媒体和搜索引擎优化协同工作

7外贸营销型网站建设中需要注意哪些关键点？

8如何运用10种SEO技术来增加网站流量？

9发力最后一英里物流 亚马逊革新配送方式

10SEO优化必备四大工具助你快速提升网站排名

9发力最后一英里物流亚马逊革新配送方式