对于解决问题,思路是很有可能就是扭转局面的关键。网站为什么不被收录呢?我们可以用这么一种思路去看,一件事情发展必然是由开始、经过、结束三个过程。那么我们也可以从收录的三个过程来分析问题。收录的三个过程是怎样的呢?
首先:蜘蛛知道了网站的存在,然后才会来到网站爬行,最后收获回去存储(即收录)。根据这个过程,我们来分析并解决问题。
http://www.yixiin.com/news/
第一步:我们首先得问问自己,蜘蛛知道不知道我们的网站呢?如果不知道,我们怎样让蜘蛛知道?这里有几个办法,直接ping、站长平台的提交链接、提交sitemap等,这些都是最基本的方法,告诉蜘蛛我们网站的存在,并且提醒蜘蛛过来爬行。
第二步:蜘蛛来网站爬行。如果提醒了蜘蛛,但是还不来网站爬行怎么办?我们查看一下robots协议是否把蜘蛛给拦截了或者曾经拦截被它记住了,现在有阴影。解决方式当然是修改robots对蜘蛛开放。然后看看网站的内容是否可以被蜘蛛抓取,毕竟有些东西是蜘蛛无法抓取的,例如JS代码、IFRAM框架、图片等等,这些东西尽量少用。重点提醒一点,网站的布局、标题不能随便修改,否则……后果自负。
第三步:蜘蛛已经在站内爬来爬去了,但是没找到有用的东西,结果就是依然不会被收录。所以,网站的内容一定要有价值或者原创,实在不行就伪原创,绝对不可以直接从别的网站复制粘贴。