站长基础说说之搜索引擎能够多么容易的抓取您的网站？

2018-05-30 04:14:55 互联网258商务网38

核心提示：URLs 就像网站和搜索引擎抓取工具之间的桥梁：为了能够抓取到您网站的内容，抓取工具需要能够找到并跨越这些桥梁（也就是找到并

URLs 就像网站和搜索引擎抓取工具之间的桥梁：为了能够抓取到您网站的内容，抓取工具需要能够找到并跨越这些桥梁（也就是找到并抓取您的URLs）。如果您的URLs很复杂或冗长，抓取工具不得不需要反复花时间去跟踪这些网址；如果您的URLs很规整并且直接指向您的独特内容，抓取工具就可以把精力放在了解您的内容上，而不是白白花在抓取空网页或被不同的URLs指引却最终只是抓取到了相同的重复内容。

　　帮助抓取工具更快更好地找到您的内容的一些建议，主要包括：http://www.yixiin.com/news/

　　1、去除URL中的用户相关参数

　　那些不会对网页内容产生影响的URL中的参数——例如session ID或者排序参数——是可以从URL中去除的，并被cookie记录的。通过将这些信息加入cookie，然后301定向向至一个“干净”的URL，你可以保持原有的内容，并减少多个URL指向同一内容的情况。

　　2、控制无限空间

　　你的网站上是否有一个日历表，上面的链接指向无数个过去和将来的日期（每一个链接地址都独一无二）？你的网页地址是否在加入一个&page=3563的参数之后，仍然可以返回200代码，哪怕根本没有这么多页？如果是这样的话，你的网站上就出现了所谓的“无限空间”，这种情况会浪费抓取机器人和你的网站的带宽。如何控制好“无限空间”，参考这里的一些技巧吧。

　　3、阻止Google爬虫抓取他们不能处理的页面

　　通过使用你的robots.txt 文件，你可以阻止你的登录页面，联系方式，购物车以及其他一些爬虫不能处理的页面被抓取。（爬虫是以他的吝啬和害羞而著名，所以一般他们不会自己 “往购物车里添加货物” 或者 “联系我们”）。通过这种方式，你可以让爬虫花费更多的时间抓取你的网站上他们能够处理的内容。

　　4、一个 URL, 一段内容

　　在理想的世界里，URL和内容之间有着一对一的对应：每一个URL会对应一段独特的内容，而每一段内容只能通过唯一的一个URL访问。越接近这样的理想状况，你的网站会越容易被抓取和收录。如果你的内容管理系统或者目前的网站建立让它实现起来比较困难，你可以尝试使用rel=canonical元素去设定你想用的URL去指示某个特定的内容。

点赞 0反对 0举报 0 收藏 0 打赏 0

更多>同类资讯

推荐图文

推荐资讯

点击排行

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,258商务网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站资讯与建议：125493959@qq.com 客服QQ：2924917661

2924917661

• 站长基础说说之搜索引擎的内外部优化你知道多少	• 站长基础说说之网站百度收录需要注意的问题
• 站长基础说说之网站改版后的降权处理方法有哪些	• 站长基础说说之新手学习优化的3大步骤
• 站长基础说说之网站如何增加网站内页收录	• 站长基础说说之seo优化应该从seo的原理上出发才
• 站长基础说说之SEO新手易走进的优化几大误区	• 站长基础说说之SEO优化如何判定一个外链的价值
• 站长基础说说之蜘蛛是如何抓取页面数据的？	• 站长基础说说之百度图片的热门目录收录规则有哪