外链
内容
机器学习

但是,只有有了优质内容,我们才能去发外链,才能留住用户,得到比较好的排名。以是,优质内容尤为主要。但是我们一样平常的SEO职员局限于英语,写的英文文章可能不太隧道,以是我们可能会花点钱,去找外国朋侪代写。在学了小北学长的内容创作课程之后,我按照小北的模式,也去一些写作平台找国外写手。好,他们写完文章发给我们之后,我们就要把控文章的质量。个中最主要的一步,便是查重,便是用工具查看他们有没有抄袭其他网站的文章内容,我便是在这一个步骤栽了跟头。
他们详细是若何瞒过这些软件,降落重复率的呢?我以近期一篇老外文章里的两个片段来演示一下:
首先,复制这两段内容,用工具http://smallseotools.com/plagiarism-checker/检讨他的重复率,看下面截图,重复率是0:
然后,我将这两段笔墨自己处理一下,改变笔墨的编码办法,再来查重,笔墨都是一样的,得到了下面结果,结果出来的一霎时,当时心里便是一句“卧槽”,64%,写手在整段整段抄袭别人的文章,我当时就傻眼了。不过好在创造的早,只有几篇文章,不然哭都哭不出来!
他们到底是若何实现的呢?很多朋友可能不知道,字符有很多种编码办法,我们一样平常常用的是ANSI编码办法。说到这里想必大家都明白了,没错,这个写手用了一类别的的编码办法Unicode,从而骗过了查重这一关,当我把笔墨文档里字符的编码办法由Unicode改为ANSI时,文章的重复率由0变为了64%,真是见了鬼。而且这两种编码办法的笔墨在文档和页面上你看不出来一丝丝差别,而且不论你把笔墨复制到哪里,他的编码办法都不会改变。如果是什么都不懂的小白,估计要被坑的血本无归。
好,上面说了他们的手腕:便是改变了字符的编码办法。那我们若何才能检讨出别人有没有用Unicode编码办法呢?实在方法很大略:
方法:创建一个记事本文档,将这些笔墨复制到记事本里,如果涌现下面这种情形,那肯定利用的Unicode编码。出于安全考虑,我马赛克掉了大部分笔墨,上次网站被DDOS,怕了。不过我们仍旧能看出差异,很多单词是不连贯的,中间有空格,正常的不是这样的,大家可以去试试看。
有时候有的写手即利用了Unicode编码,在记事本里看着也会跟ANSI编码的一样,这时候,我们就可以点击保存记事本,如果是ANSI编码,就可以保存文档,如果不能保存,涌现下面截图情形,那便是Unicode编码。大家可以看到字形态是正常的,但是却采取了Unicode编码。
我们为您若何才能避免这种情形呢?我以为最好的办法便是哀求干系写手用常规的ANSI字符编码写文章,不要用别的诸如Unicode的编码办法。这便是见告他你懂行,不要忽悠我,这样能省很多麻烦。
我实在创造这个问题挺有时的,昨天晚上,我再检讨同事上传的文章,创造一个问题,我利用“Ctrl F”查看文章的关键词密度。但是我创造了一个非常诡异的征象:明明文章里有20多个这个词根,为什么“Ctrl F”查询显示只有7个关键词,我就一贯很纳闷,然后本日请教了公法律式员的同事,才恍然大悟。当时第一反应便是可能是写手用来作弊的手腕,在我的穷究下,果真是这样,这样写手纵然整段整段抄袭别人的文章,我们还不知情,被蒙在鼓里,想想都以为后怕。
通过以上的经历,其我也明白了一个道理,那便是碰着问题和疑问,一定要彻彻底底的弄清楚,把它办理掉,不然你碰着疑问就放过,那么你永久也发展不了,欺骗自己和生活,他们也会欺骗你。就像这次,我确确实实的发展了,虽然想想都以为害怕,我冲破沙锅问到底的举动救了我,试着想象,如果我在写了几百篇文章还没创造这个问题,那结果会多么的恐怖。
思考:通过Unicode编码是不是可以骗过谷歌?个人觉得不可能,由于谷歌源代码彷佛兼容这个。
好了这次的分享便是这样,大家在内容创作中有碰着类似的问题吗,是若何办理的呢?欢迎大家一起分享!
由于真的是越分享,越幸运
本日为了总结这个履历,都没来得及去跑步,如果大家以为有用,帮忙转发点个在看鼓励一下哈!
(来源:外贸运营那点小事)
以上内容属作者个人不雅观点,不代表雨果网态度!
本文经原作者授权转载,转载需经原作者授权赞许。
上雨果网搜索“跨境资料库”,领取欧美/东南亚各国市场商机、各大平台热销品报告、跨境电商营销白皮书!