当各位seoer还在苦恼你的网站内页为什么那么难收录的时候,可曾想到过,我们的收录的决定者是谁?没错,那就是我们可爱的百度蜘蛛。百度蜘蛛只是一个程序机器人,如果我们能够了解它的行为,抓住它的特性并加以利用,我们就可以轻松解决网站内页收录难的问题。好了,废话少说,现在就由笔者和大家探讨一下如何了解蜘蛛行为来解决这个难题吧。
百度蜘蛛和现实的昆虫蜘蛛行为是非常相似的,如果没有一张蜘蛛网,那么蜘蛛根本无法正确爬行并能寻找到食物。百度蜘蛛行为原理也是如此,因此我们网站必须提供各种各样的链接让百度蜘蛛能够有效爬行并且寻找到页面。为什么我们的内页收录难,原因就是提供给蜘蛛爬行内页的链接太少,或者说太过松散。因此,加强内链是改善百度蜘蛛爬行效率的重要技巧,我们可以在每一篇文章下面都加了一些相关性文章的链接,但是数量不要过多,一到两篇即可,如下图:
当百度蜘蛛顺着我们为它提供的内链寻找到内页后,它就会执行下一个行为---尝试抓取页面。但是要记住,蜘蛛抓取页面只是尝试,并非能够绝对成功抓取。因为有一些网站存在阻碍因素,可能会导致蜘蛛抓取不成功。因此,为了让百度蜘蛛更好抓取,我们应该要注意:
(1)保持服务器的稳定性。服务器如果在百度蜘蛛抓取页面期间突然出问题,自动关闭了,就会产生一个坏印象给百度蜘蛛,如果多次发生这样的事情,可能会让蜘蛛把网站“冷落”一段时间。
(2)去除网站代码的不利因素。网站代码也极可阻碍百度蜘蛛抓取页面,一些js以及flash就是非常典型的表现。因此,尽量压缩js代码,并且尽可能去掉flash,毕竟现在flash对用户体验也是一种伤害,因此能不用尽量不用。
当然,我们还可以通过百度站长平台为我们提供的“压力反馈”工具来检测我们的网站还存在哪些不利抓取的因素,具体使用方法请参考站长平台。
如果我们的网站不存在什么大的不利于蜘蛛抓取的问题,蜘蛛就会执行索引页面的行为了。蜘蛛索引也是一个尝试行为,如果你的网站内容质量不过关,那么蜘蛛是不会成功索引的。因此,我们在更新网站内容时,尽量做到原创或者深度伪原创,做到规律更新,并且最好每篇字数超过500字,这样的文章才能让百度蜘蛛认为是有价值的,而寥寥一两百字对于百度蜘蛛来说是不屑一顾的。
行为四:蜘蛛放出页面 http://www.yixiin.com/ad/
当上面的三个行为都成功执行后,恭喜你,你的该页内页可以说已经被百度收录了,但是不要兴奋过早,收录并不等放出。很多站长觉得很纳闷,为什么百度站长平台的“百度索引量”很多,但是真正用site查看内页收录却很少?其实这并非工具出错,而是蜘蛛尚未放出页面,这个时段我们只需耐心等待,或者通过使用网站锚文本指向该页面来缩短一下放出的时间也是可以的。
百度蜘蛛行为其实并不复杂,它和我们人类都是一样的,喜欢新鲜的,讨厌老套的,因此我们要讨好蜘蛛,让蜘蛛更好收录内页,还是要注重提高网站内容的质量,这样才能提供更新鲜的食物给蜘蛛,让蜘蛛真正爱上你的网站。