之前第一个站由于是小白,上线后都是修修改改的走过来的,包括301、https、伪静态等等。收录一直很好,但最大的问题就是有动态链接、静态链接、更可气的还有不带www的链接,一时我头都大了。
在SEO的角度来说,文章页一定要保持地址的唯一性,这样才方便文章集权提高排名。找了很多方法像301跳转或者直接通过一些方法把动态链接404等,都是效果不佳,也不规范。后来发现比较靠谱规范的做法还是使用canonical标签来解决。
什么是canonical标签?
百度站长给出了定义:对一组内容完全相同或高度相似的网页,通过使用Canonical标签可以告诉搜索引擎哪个页面为规范的网页,能够规范网址并避免搜索结果中出现多个内容相同或相似的页面,帮助解决重复内容的收录问题,避免网站相同内容网页的重复展示及权重的分散,提升规范网页的权重,优化规范网页的排名。
说白了就是相同页面内容多网址了,给予一个canonical标签告诉搜索引擎这个地址才是最规范的,让搜索引擎给予这个地址的文章权重后参入排名。
怎么处理/删除已经收录的动态链接呢?
一、先做屏蔽动态链接
因为网站已经伪静态了,所以对于动态的链接可以直接通过robots.txt文件进行屏蔽,不让搜索引擎再爬取收录。具体写法如下所示。完成后将robots.txt文件上次到网站根目录,然后再到百度站长robots检查或者百度统计robots检查,检查更新的目的是为了让百度搜索引擎知道,这样robots.txt屏蔽动态链接就开始生效了。
关于robots.txt文件设置可以参考文章:zblog博客robots文件的设置「详解」
User-agent: *
Disallow: /*?*
二、通过canonical标签使网址规范化
只需要在HTML 网页的 <head> 部分中,添加一个 rel="canonical" 链接来进行指定规范网址就可以了。比如58侠客个人博客,直接在网站的header.php这个文件的</head>前加上如下代码就可以了。
<link rel="canonical" href="{$article.Url}"/>
加完后注意缓存下页面,然后再去查看文章页源码就会发现canonical标签已经生效了。这里需要注意的是一个页面只能拥有一个canonical标签用来指定地址规范。
通过这2个步骤就可以解决网站已经伪静态了,但是还是收录动态链接的问题。包括解决了网站带www和不带www都收录的问题。
还木有评论哦,快来抢沙发吧~