大家知道网页的相似度是对于网站收录的一个重要标准如果网页之间的相似度过高,就很有可能导致搜索引擎不收录你站点的网页。如果网页和别的网页之间的相似度过高,即使是你网站权重比较高收录了,排名还是不理想的。所以为了提升站点之间的收录和排名,我们在网站建设之初的网站架构方面就应该着手考虑了,还需要在内容建设方面进行注意,今天就来给大家着重介绍一下降低网页相似度的一些方法。
网页相似度是指不同两个网页之间相同部分的代码字节数占两个网页总字节数的百分比,顾名思义就是不同网页的相似程度,如果你的网站转载了其他网站的文章,那么可以说你这个网页和之前原创文章的网页是“相似”的,SEO鼓励原创内容,目的就是避免出现太多相似文章。如果你网站里的网页与网上其他网页有着较高的相似度,那么权重应该不会太高的,这个我们都理解。
同样的,在同一个网站里,不同的页面也会存在相似度问题,这个也是应该注意的。不知道大家在查询自己网站收录情况的时候有没有遇到过这样的一句话:“提示:为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。”可见搜索引擎是很在意网页相似度的。我们在进行网站整体结构优化的时候,就要注意尽量使网页相似度降到最小。
如何知道自己网站里的网页相似度呢,这里有个工具可供大家查询:
http://www.webconfs.com/similar-page-checker.php
一般不同网页间的相似度在60%左右是可以被接受的,因为每个网页之间必然存在相同的部分,比如导航菜单、比如版权信息等,我们不可能每一页的导航和版权信息都写的不同。那么我们要降低网页相似度,就要尽可能的减少网页中的相同部分,尽可能增加网页中不同的部分。
下面我们先从一些细节方面来说说,怎么减少不同网页之前相同的部分(影响网页相似度的分子)。
首先我们应该从网页的架构说起,网页头部、网页侧边和导航以及网页底部,他们大约占了网页相似度的25%~30%。如今很多站长在建站的时候都会选择套用模板,就连关键词和网页的描述统一调用。所以,很多站长确实很苦恼自己明明是原创内容居然百度没有收录,或是就算收录了,以前的内容被剔除了。所以一般套用的模板,或者是一些别人公开的模板被N多人使用了。这一点就在网站的相似度方面有缺陷,输在了起 跑线上。还有一点就是去前年站群泛滥,百度为了识别这些站群,开发了一套关于相似网页结构判断的算法,还申请了专利。所以如果大家想好好经营网站,最好是设计一套独特的模板。
观察一下你所有网页公共部分的代码,将其中的广告代码都采用JS调用,将网页CSS样式采用外联的方式,将大大节省这些代码的长度,也就是减少了网页相似度的分子,此外,公共部分中有哪些不重要的东西,尽可能去掉它们,举个简单的例子,大多数朋友网站的文章页底部都有Powered by XXXCMS以及备-案号这些东西,其实这些只在首页显示就行了,至于内容页面,能省的就省吧,看看百度知道或百度贴吧的内容页,人家底部多简洁……
首页网页头部。首先我们保证每个网页有着不同的标题,不同的描述。注意了,这里的不同是指标题和描述。那么还有关键词呢?是的,关键词是可以相同,但是标题和描述必须有所区别。这样我们把网页头部相似度得比率由以前的10%,降到了0。
其次网页的导航和侧边栏。通过很多网站我们发现,他们有着共同的特点,就是不管在网站首页还是列表页以及内容页,他们都有着相同的导航栏。那么这个导航什么时候让搜索引擎抓取什么时候不让它抓取呢?在这里我就教大家一点小方法。首页的导航是要蜘蛛抓取,以便它继续抓取我们2级或2级以下的栏目和内容。但是到了列表页,我们是不是想让蜘蛛尽快抓取列表上的a标签的内容呢?是的,这个时候我们要避免让蜘蛛在其它标签上过多停留,这时导航栏首当其中了。
以前我们的列表页,当蜘蛛进来的时候,还是要把导航栏读一遍,读取我们重要信息的时间延长了。现在我们就用一些蜘蛛看不到的手法来把这部分屏蔽掉,以达到能让蜘蛛迅速知道该网页是关于什么内容的。所以,在网站的列表页,我们重新制作一个head.html模板,导航栏的部分用javascript 来编写,这样就能让蜘蛛读网meta部分的时候,直接就进入我们的主要内容区域。javascript 和div+css或table提供给用户的效果是一样的,但是蜘蛛是看代码的,它对于javascript里面的内容是忽视的。这样就会减少很多网页之间导航栏重复的问题。
而侧边栏就用相关行业的内容进行调用。侧边栏的网页代码中设置利用标签提取相同标签的文章或栏目。网站的内容页也是此原理。如是导航栏和侧边栏的相似度就降低到5%以下了。
网页的底部。很多站在这个问题上没有注意到。为什么了,他们为了省时间和精力全站的网页底部都有相同的友情链接、版权信息。这个部位是站了网页相似度的5%~10%,是一个不容忽视的地方。这里我们的做法首页是全部的友情链接,而列表页是不会有太多相同的友情链接,只会是相关行业的,到了内容页就不会有友情链接了。因为这里的友情链接是没有什么意义了,不会传递太多的权重了,一般人也不会给别人做全站链接。而版权信息到了列表页和内容页,就会用一些图片来代替。
上面为什么我用了大量文字来解释降低这三个部位在内容页不重要的原因,就是为了存托出主要内容与其它内容页的差异大,从而让搜索引擎认为你这是一篇全新的文章进行收录不会剔除以前相同内容的文章。就算文章内容相似度达到了50%,这样我们就可以进行锚文字,达到增加相关性的作用,搜索引擎就会认为你的这篇文章质量很高会赋予你这篇文章一定的权重。网页与网页的相似度最好降低在55%左右,那么你的文章都会收录不会剔除以前的内容。
除了减少不同网页的公共部分代码,最重要的方面还是要增加不同的部分(影响网页相似度的分母)。
如果条件允许的话,能开启内容页的评论功能最好了,因为不同的内容,网友所写的评论肯定是不同的,不过因为众所周知的原因,评论功能不是每个站长都敢开启的。不同的网页都有它们唯一的一些标识,比如文章的ID,每篇文章的ID肯定是不同的,那么设想一下,如果我们在内容页里都加上本文ID的话,是不是就增加了网页相似度的分母呢?当然这只是一种思维方式,一个ID也就两三个数字,实则影响不了多少,只是说利用这个思维方式,大家可以从多方面尽量去增加这个分母的大小,与ID有相同效果的因素有“网页更新时间”、“本网页地址”、“针对搜索引擎的描述和关键词”、“网页标题”、“上一篇文章或下一篇文章”等等。
发挥你的思维,好好利用上它们吧,以上这些是我帮朋友处理QQ空间加油站这个站网页相似度的时候总结的一些经验,我朋友使用的是动易的CMS,相信运用到其他CMS上也是没任何问题的。
增加这个分母最有效的武器莫过于随机文章了,每篇文章加上一个随机文章列表,给用户推荐了你的文章,就大大增加了网页相似度的分母,可谓何乐而不为。如果你使用的CMS有随机文章这个功能那就最好,如果没有的话,那加个本周热门、本月推荐之类的,也比没有要好。这个方面月光博客做的挺不错,他将Z-blog文章排行这个插件用的相当到位。
总而言之,降低自己网站网页相似度就是要做两件事,减小分子,增大分母,这是做网站SEO优化的一个重要细节,做SEO的朋友,你注意了吗?