在对自己网站进行设计时候要注意一些细节,避免自己的网站进入蜘蛛陷阱中,一些设计结果是对搜索引擎不友好的,是不利于蜘蛛爬行,这样就叫做蜘蛛陷阱。笔者在建设自己的网站推广自己的网站不断了解学习到一些蜘蛛陷阱的类型,现在总结出来与大家分享。
以前笔者的网站首页让设计人员设计一个很大的flash文件,感觉这样可以吸引用户,在网站停留时间更长,但是后来发现这个做法是不妥的,整个首页就一个flash文件,虽然可以给用户带来视觉效果,却对搜索引擎带来不利影响。因为搜索引擎没有办法抓取到flash文件的文字内容,对于用户可能起到视觉效果,对于搜索引擎却是什么都没有的,搜索引擎不能读取flash文件也就没有索引出有价值的文字信息。要解决这个问题,可以把网站首页flash文件换成全文字的带有图片的,这样搜索引擎可以抓取到文字,不会对收录造成影响。
Javascript和flash一样,也可以给用户带来视觉上的冲击,有的网站喜欢使用javascript脚本生成导航系统,其实这个也是蜘蛛陷阱之一。虽然搜索引擎都可以尝试解析js脚本,不过这不能代表搜索引擎就可以解析得了js脚本。我们应该使得搜索引擎在访问我们的网站尽量工作量得到最小化,不要增加搜索引擎的工作量,要让搜索引擎的工作尽量简单,在笔者对其他网站分析,搜索引擎有的是可以在技术上获得javascript脚本中包含的链接,也可以执行脚本跟踪链接,但是,对于一些权重较低的网站来说,搜索引擎就觉得没有必要去执行脚本的。
网站上的链接必须使用最简单标准的html链接,尤其是导航系统,用css做导航系统也可以实现很多视觉效果。相反的,javascript链接在seo也有特殊用途,那就是如果站长不希望有页面被收录,例如没有排名意义的页面,重复的页面,都可以考虑用javascript脚本来阻挡搜索引擎爬行。
一般来说网站页面地址url有动态和静态的,静态url比较符合搜索引擎的口味,动态url不利于搜索引擎蜘蛛爬行,这就说明了自己的网站页面地址尽量设计成静态的。判断一个地址是静态还是动态的笔者给出一个简单的辨别办法,动态的url是带有问号的,等号和参数的网址。
有的网站内容要注册后成为网站的会员才可以进行浏览的,这样的网站大部分以论坛为准,这个时候搜索引擎是没有办法看到的,蜘蛛不能填写用户名,密码,也不会像用户那样自己去注册的,所以为了保证网站收录,站长要考虑好网页内容是否真需要用户注册才可以浏览,要权衡下利弊。在用户注册登录网站的时候,有时候会记住网站用户登录信息,跟踪用户访问路径等,强制用户使用cookies,用户浏览器如果没有启用cookies,页面就会显示不正常,搜索引擎蜘蛛就相当于一个禁用了cookies的浏览器,强制使用cookies只会造成搜索引擎无法正常访问。
最后笔者想讲的是如果你在网站设计中使用了框架结构,建议可以取消了。现在的网站已经很少使用框架结构了,因为框架结构已经越来越不利于搜索引擎抓取了。对于搜索引擎来说访问一个使用框架结构的网址所抓取的html只包含调用其他html文件代码,并没有包含其他文字信息,搜索引擎也就无法判断这个网址内容是什么,也就无法鉴定网站优质程度,即使搜索引擎跟踪调用其他html文件,但是这些文件却是不完整的页面,所以如果你还在使用框架结构,建议取消之,和flash一样,不要浪费时间研究怎么让搜索引擎收录框架结构了。