站长基础说说之搜索引擎抓取不到的20种网站内容_SEO优化_258商务网
推广 热搜: 广州  SEO  贷款  深圳    二手    贵金属  网站建设  机器人 

站长基础说说之搜索引擎抓取不到的20种网站内容

   2018-08-22 00:55:56 258商务网10
核心提示:1、spider未能正确处理的网页性质及文件类型(如flash、script、ps、某些动态网页及frame、数据库)2、 没有指向链接的孤岛网页3
 1、 spider未能正确处理的网页性质及文件类型(如flashscriptps、某些动态网页及frame、数据库)
2、 没有指向链接的孤岛网页
3、 spider访问时因为某些原因正好是死链接 http://www.yixiin.com/news/list-1833.html
4、 被认为是劣质网页而不抓
5、 因为/色情/反动/spam/等问题而不抓的非法网页
6、需要输入用户名、密码方可打开的网页
7、网站用robots协议拒绝搜索引擎抓取的网页
8、 搜索引擎还未来得及抓取的新网页
9gophernewsgroupsTelnetftpwais等非http信息
10 网站数据库做得太差劲,spider一抓就宕,只好不抓
11、搜索引擎库里有,但是未能正确索引网页中信息
12、分词引起误差
13、图型中的文字信息你看得懂但搜索引擎看不懂
14、停用词等搜索引擎故意不索引的信息
15、 搜索引擎对某些网页有选择的索引,未索引全部网页信息
16、搜索引擎正确索引了网页中信息,但和你用的关键词不同
17、你用的搜索关键词中含有错别字
18、网页作者用了错别字 http://www.yixiin.com/news/
19、没有错别字,但网页作者用的词汇和你的关键词不同,毕竟,文字的特性,允许有n种方式表达同一种信息
20、简体繁体不同编码
 
反对 0举报 0 收藏 0 打赏 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行

网站首页  |  付款方式  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报
免责声明:本站所有信息均来自互联网搜集,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!并不代表本站观点,258商务网对此不承担任何相关法律责任!如有信息侵犯了您的权益,请告知,本站将立刻删除。
友情提示:买产品需谨慎
网站资讯与建议:125493959@qq.com 客服QQ:2924917661点击这里给我发消息2924917661点击这里给我发消息