互联网上重复内容是常态
首先互联网的天下便是充责着很多很多的重复内容。有些针对重复内容研究说 20% – 30%旁边。例如:当某网页引用其他网站的内容时,不免会重复对方网页上的一些内容。
网店很多时候亦会涌现重复内容,例如:相同的产品描述涌如今该产品页和产品分类下的该产品页。只要 URL网址不同搜索引擎就算作不同的页面。

更普遍的例子是同一网站增援加密连线 HTTPS和非加密连线 HTTP ,由于 HTTP和 HTTPS被搜索引擎看作不同网址,以是亦可看作重复内容。
作甚搜索引擎惩罚
搜索引擎是不会对有重复内容的网页惩罚处理。所谓惩罚是指搜索引擎公司将该页面从索引数据库中抽走,导致搜索用户不可能从任何搜索查询中找到该网页。不惩罚不即是喜好。搜索引擎不喜好重复的网页内容。重复的网页内容对搜索引擎来说是对搜索用户提出的查询给出的相同答案,只是网址不同,内容大致是相同。以是搜索引擎只会从相同答案中抽取最好的一个网址放入搜索排名结果页面,其他相同答案被筛走。而这个筛走结果常常被误解为搜索引擎惩罚。
一样平常只有当网站内容大量是一字一句抄袭其他网站而对用户毫无代价并且目标是操控SEO排名时,搜索引擎才会引入惩罚。
网站内重复内容
网站内重复内容更多情形是影响搜索排名的质量评分。搜索引擎亦会对搜索排名结果进行就质量进行过滤,这因此前 Panda重生做的事情,自 Panda 4.2?已经整合在搜索引擎的算法内。可视作为搜索引擎认为:Query Deserves Quality.以是如果将相同一段内容在同一网页上重复很多次,质量评分和用户体验都自然低落,不利搜索排名。
网站内重复内容最大的侵害是:如果是本身网站内的网页内容重复,你希望就目标关键字是用网页 A排名,而搜索引擎可能以为重复内容网页 B更适宜,并利用网页 B在 SERP结果。这便是cannibalization?问题。
其他网站抄袭内容
重复内容最大的侵害更多时候是其他网站抄袭你的内容而导致搜索引擎由于 筛走你的原创内容而不是抄袭者的内容。