在SEO优化中,复制内容是导致网站收录速度慢、内容质量低、排名差的主要原因之一。复制内容的产生一般分为内部原因和外部原因。内部复制的内容大多是由于URL规范化或一些特殊页面造成的内容重复,而外部原因主要是抄袭。文章采集软件的普及和搜索引擎算法在原创内容层次上的局限性,导致了这种内容复制成本低、效果显著。
1、注意URL的规范化
重复内容的处理方法需要从源代码开始。只要URL在早期是标准化的,复制的内容在后期就不会生成。例如:每一篇文章使用固定链接,即使是从不同的目录页面打开,指向的文章都是同一篇文章,或者在某些情况下,需要使用301重定向将重复的内容转移到你想参与排名的页面上。
2、 注意档案页的设置
对于博客来说,复制由存档页面引起的内容是一个常见的问题。因为一个小博客站只有一个作者,所以作者的档案页面上显示的内容往往和博客首页上的内容相同,这就导致了两个页面的重复。处理这种情况有以下方法:
(1)将元索引标记添加到存档页以防止搜索引擎索引;
(2)robots文件disallow不抓取存档页;***后,通过nofolw标记,搜索引擎无法对其他页的存档页的导入链接进行爬网。
3、 注意sessionid的设置
这类页面往往是由不同访问者的登录引起的,导致页面ID参数的改变和原始URL的改变。在这种情况下,我们通常使用规范的标签,用户不会看到不同的页面,但是搜索引擎会将页面权重集中在原始URL上,而不是带有参数的URL上,从而避免复制内容对权重的分散和影响。
4、 重视原创作品的版权保护
这种情况比较难处理。毕竟,这是别人的网站,控制权不在我们手中。为了防止这种情况,我们建议在写文章时,可以在文章底部添加版权信息并重新打印原始链接。在目前内容过度收录的情况下,虽然版权信息往往被忽视,但总有一些网站管理员和我们一样,也受到抄袭和抄袭内容的困扰。一般来说,他们会保持联系,这不仅是对自己负责,也尊重他人的工作。对于搜索引擎来说,外部链接越多,就越容易被判断为原创内容。