抓取期
一般来说,并不是网站一上线,蜘蛛就会去抓取的,一般来说,这中间有一个时间周期,大概一周。
当然,也有可能,有一个网站上线后,一直不被抓取,可能的一个重要原因,就是该网站的域名之前曾经被使用过,被K过,也就是被百度拉入了黑名单,在考察期,所以迟迟不放出来。
如何判断域名是否以前被用过?我们可以用google搜索一下该域名,看是否有老的信息。之所以用google来搜索,是因为google的信息是最多的,它的收录量是最大的,量全面的。如果发现该域名之前被用过,那就果断换域名吧。
另外,在抓取周期里面,还有一个故障周期,可能,这个域名是新的,上线提交,蜘蛛也抓取了,但抓取的过程中发生了问题,可能会发生两种情况,一种是服务器空间商屏蔽蜘蛛,另一种是DNS出问题,也就是域名解析服务器,我们访问网站的时候,先解析到IP地址,再通过IP地址找到服务器,问题就是解析网站的时候,解析不到IP,可能就是被服务器空间商屏蔽了,特别是一些小的空间商,或者国外空间商不稳定,或许会导致出现这种情况。所以尽量选择稳定的国内空间。
如何判断空间商是否有屏蔽的问题呢,两个小技巧,一个是网站上线后,一定要去验证百度站长平台,如果被屏蔽,会有消息提醒;另一个是抓取诊断,通过该功能进行路径提交,测试抓取是否正确稳定。
收录期
蜘蛛抓取后,是有一个周期的,未必会马上收录。并且在收录的时候,会先收录首页。有一个沙盒概念,说是一个新网站,会有一个考察期,沙盒期导致某些内页是不会马上放出来的,同时,也可能导致收录期会很长。
如何缩短沙盒期,要注意一些技巧
一是,在沙盒期的时候,要知道蜘蛛是否来抓取内页,这是很重要的。可能通过查看网站日志来分析。如果搜索引擎抓取了内页,但没有放出来,那么我们的解决办法就是发外链,我们这指的是,发内页的链接。
投票期
投票期指的是提高网站的综合得分。投票期也是有周期的,发现期1周,权重越高的网站,发现期越短,统计期1周,时间不能缩短,作用期时间不定,死亡期,当该链接失效后,就进入死亡期。
计算期
与个概念有关,搜索引擎的倒排索引,搜索引擎会对关键词做一个预处理,先排好了,当用户搜索的时候,直接展现给顾客,这也就是为什么百度搜索关键词的时候,只需要不到一秒的时间就能出来,节能了很多时间,而不是你搜索的时候,百度才去数据库搜索结果。这就是所谓的倒排索引,是倒序来的,不是正着来的。