在谷歌的“Search Off The Record”播客中,John Mueller、Lizzi Sassman 和 Gary Illyes 深入磋商了有关抓取频率与网站质量的误解、当前抓取网络面临的寻衅,以及搜索引擎如何更有效地进行抓取和优化策略。这些谈论揭示了一些SEO从业者普遍存在的误区,并供应了关于优化抓取策略的主要见地。
抓取频率与网站质量的误解有一部分SEOer认为,谷歌频繁抓取某个页面或网站意味着该内容质量高。然而,这种理解并不全面,这次在官方播客当中也明确否认了这个不雅观点:
搜索引擎在抓取网络内容时面临着越来越多的寻衅。

繁芜的网站构造: 当代网站越来越繁芜,动态内容和JavaScript驱动的页面增多,这给搜索引擎带来了抓取难度。传统的抓取方法可能无法有效处理这些繁芜构造,从而影响搜索引擎对内容的准确评估。
内容个性化的寻衅: 随着网站内容个性化的遍及,搜索引擎须要应对同一页面上为不同用户供应不同内容的情形。这种个性化内容增加了抓取的繁芜性,搜索引擎须要更加智能化的策略来有效处理这些情形。
URL参数的影响: URL参数是另一个影响抓取预算的主要成分。如果网站存在大量带有不同参数的URL,Googlebot可能会将资源耗费在这些参数化URL上,而非真正主要的内容页面。这不仅花费了抓取预算,还可能导致关键内容被忽略。
非线性的抓取办法: 谷歌抓取的办法实际上是非线性的,这与谷歌官方文档中描述的“实时跟随链接”有所不同。Gary Illyes在播客中强调,Googlebot并不会实时跟随网站上的链接,而是会先网络链接数据,然后再返回处理。这种非线性的抓取办法意味着,谷歌可能会在不同的韶光点重新访问页面,从而影响抓取的频率和内容的更新。
Google抓取的办理方案URL 参数可能会创建无限的 URL,从而导致抓取效率低下。这对电子商务网站影响尤为显著。每个带有不同参数的页面可能导致 Googlebot 反复抓取类似内容,花费很多抓取预算,这并不利于我们提升网站的整体表现。
避免我们的抓取资源被摧残浪费蹂躏在无效的页面上。播客中明确表示了谷歌在积极探索办理方案,会推出新的算法,并且努力加强与站长们的沟通,以帮助我们更好地管理这些潜在问题。