站长基础说说之搜索引擎抓取不到的20种网站内容

2018-08-22 00:55:56 258商务网10

核心提示：1、spider未能正确处理的网页性质及文件类型（如flash、script、ps、某些动态网页及frame、数据库）2、没有指向链接的孤岛网页3

1、 spider未能正确处理的网页性质及文件类型（如flash、script、ps、某些动态网页及frame、数据库）

2、没有指向链接的孤岛网页

3、 spider访问时因为某些原因正好是死链接 http://www.yixiin.com/news/list-1833.html

4、被认为是劣质网页而不抓

5、因为/色情/反动/spam/等问题而不抓的非法网页

6、需要输入用户名、密码方可打开的网页

7、网站用robots协议拒绝搜索引擎抓取的网页

8、搜索引擎还未来得及抓取的新网页

9、gopher、newsgroups、Telnet、ftp、wais等非http信息

10 网站数据库做得太差劲，spider一抓就宕，只好不抓

11、搜索引擎库里有，但是未能正确索引网页中信息

12、分词引起误差

13、图型中的文字信息你看得懂但搜索引擎看不懂

14、停用词等搜索引擎故意不索引的信息

15、搜索引擎对某些网页有选择的索引，未索引全部网页信息

16、搜索引擎正确索引了网页中信息，但和你用的关键词不同

17、你用的搜索关键词中含有错别字

18、网页作者用了错别字 http://www.yixiin.com/news/

19、没有错别字，但网页作者用的词汇和你的关键词不同，毕竟，文字的特性，允许有n种方式表达同一种信息

20、简体繁体不同编码

点赞 0反对 0举报 0 收藏 0 打赏 0

更多>同类资讯

推荐图文

推荐资讯

点击排行

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,258商务网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站资讯与建议：125493959@qq.com 客服QQ：2924917661

2924917661

• 站长基础说说之搜索引擎的内外部优化你知道多少	• 站长基础说说之网站百度收录需要注意的问题
• 站长基础说说之网站改版后的降权处理方法有哪些	• 站长基础说说之新手学习优化的3大步骤
• 站长基础说说之网站如何增加网站内页收录	• 站长基础说说之seo优化应该从seo的原理上出发才
• 站长基础说说之SEO新手易走进的优化几大误区	• 站长基础说说之SEO优化如何判定一个外链的价值
• 站长基础说说之蜘蛛是如何抓取页面数据的？	• 站长基础说说之百度图片的热门目录收录规则有哪