在我访问的 213 个Google Search Console配置文件中,89% 的 Google Search Console 帐户中列出了“已抓取 - 当前未编入索引”缺点。(是的,我数过了)。
任何 SEO 专业人士都会见告你,当你不知道如何办理缺点时,觉得就像天下末日一样,导致有一天你会碰着大量技能缺点积压。
在把这个缺点扔进一堆东西里以供日后查看之前,请先退一步并评估数据。我总结了七种修复方法,以办理我见过的最常见的 SEO 问题,这样您就可以挽救您的网站并节省一点韶光。

页面被抓取但未被索引的缘故原由有多种。
在 2022 年 3 月的 Google SEO Office Hours 中,John Mueller 重点先容了用户可能看到“已抓取 - 当前未编入索引”缺点的一些常见缘故原由,例如:
缺点代码,例如 404 缺点。页面上没有index标签。重复的内容。穆勒后来给出了另一个缘故原由:
“我们抓取了一些东西,但是当我们进行索引时,我们决定我们实际上想要从网站上获取其他东西。”如果你读懂了字里行间的意思,我会将此解读为谷歌将你的内容归类为无帮助,表明存在质量问题。
随着谷歌的 AI 概览公告,谷歌正在减少抓取预算,因此利用优质内容优化您的抓取预算是当务之急。
这与 Gary Illyes 在 X 上提到的内容干系,即用更高质量的内容取代低质量的内容。
如何修复 Google Search Console 中的“已抓取 - 当前未编入索引”?1. 手动检讨报告中标记的所有页面首先,我手动查看了 Google 搜索掌握台“已抓取 - 当前未编入索引”报告中标记的所有页面。
要访问该报告,请转到Google Search Console > 页面,然后查看“为什么页面未被编入索引”部分。
进入报告后,您可以将数据导出到 Google 表格、Excel 或 CSV 进行过滤。
然后我开始深入研究两件事:
与受影响页面的日期比拟:我想看看趋势线是增长还是减少。如果趋势线在减少,则表明我们可能已修复该问题。URL 构造:我想看看参数 URL、措辞子文件夹或类似 URL 之间是否存在范例模式。我利用 Google 表格中的“将文本拆分为列”选项。这有助于我识别模式。如下所示,我已经知道我须要调查两个潜在问题:国际 SEO 和规范标签。2. 启动内部链接层次构造履行项目如果您曾经发布过没有内部链接的内容,或者只是完备忘却了(咳咳),您可能已经问过自己为什么您的内容没有表现。
当你花费数小时、数天乃至数月的韶光准备一个精彩的内容,却创造它只是一团糟,没有任何流量,这可不是什么好事。
幸运的是,如果有办法挽救内容并使其成为更高质量的内容,Google 就准备进行索引。
您所须要的只是一个小型的内部链接层次构造实现项目。
我会花费至少两周的韶光,通过确定要链接的内部页面来方案内部链接机会。
为了找到高质量的内部链接机会,我利用了 Google 的站点搜索运算符,例如“Site:mydomain.com 关键字”。
一旦我网络了我想要链接的 5-10 个页面的列表,我就会在 Google Search Console 中检讨关键字蚕食情形。
转到“搜索结果”>“输入您的查询”>“在 Google 搜索掌握台中按页面过滤”。
然后,我选择想要针对这些术语进行排名的页面作为我的紧张内部链接。
记住您的网站构造。如果导航中没有列出许多页面,搜索引擎可能会由于您的网站构造而找不到它们。
3. 添加自引用规范标签来对抗重复内容我要赢得的下一场战斗是删除报告中的所有重复内容。
向参数 URL 添加自引用规范标签,以避免重复内容。
例如,假设此 URL 在我的“已抓取 - 当前未编入索引”报告中列出:
www.annalovesburritos.com/en/120313规范标签该当是自引用的,如下所示:
www.annalovesburritos.com/en/120313但有时,我碰着这样的问题:规范标签
www.annalovesburritos.com/120313创造短缺了什么?子文件夹丢失。
我面临的另一个寻衅是列出参数 URL 的规范标签时。
让我们利用上面的例子:
www.annalovesburritos.com/en/120313我们添加一个参数:
www.annalovesburritos.com/en/120313?clientID-12345但是当你检讨规范标签时,它会显示参数URL:
www.annalovesburritos.com/en/120313?clientID-12345您不想将参数 URL 列为规范标签,以避免重复内容。
以是,如果你看到这个:
<link rel="canonical" href="https://www.annalovesburritos.com/en/120313?clientID-12345" />
你可能想把它改成这样:
<link rel="canonical" href="https://www.annalovesburritos.com/en/120313" />
5. 仔细检讨 hreflang 标签是否精确
另一个帮助您的内容被抓取和索引的快速方法是仔细检讨您的 hreflang 标签。
您须要确保您的国家和措辞代码是准确的。
但您还须要检讨内容是否以其所述的措辞存在。
我无法见告你我有多少次碰着过显示为日语的 hreflang,但当我真正访问日语网页时,它是用英语写的。
这被视为重复内容,Google 很可能永久不会对其进行索引。
6. 审核你的 XML 站点舆图清理完 canonical 和 hreflang 标签后,请检讨您的XML 站点舆图。
您要确保 XML 站点舆图中列出的所有页面都是 200 个状态页面,并且带有自引用规范标签和在紧张版本下列出确当地化版本。
如果您有关键的资金页面,您可以创建一个临时的 XML 站点舆图,仅关注“已抓取 - 当前未编入索引”报告中列出的页面。
7. 将修复后的 URL 提交给 URL 检讨工具末了一步是将所有固定 URL 手动提交到 Google Search Console 中的 URL 检讨工具中。
常日,我会选择 10-20 个 URL 的批次,然后看看 Google 如何处理这些 URL。
请记住,纵然您做对了所有事情,Google 也不会修复此问题。Google 须要等待一段韶光才能重新抓取每个 URL,并确定它是否比现有页面更好。
有用的内容是避免 Google Search Console 中涌现“已抓取 - 当前未编入索引”缺点的方法让我们面对现实:谷歌很可能由于质量问题而不会索引您的内容。
请记住,本日某个页面被编入索引并不担保来日诰日它也会被编入索引。Google 会改变其评估内容的办法,您必须适应这种变革。
您始终在监控您的内容并探求履行改进的方法。