1、网站内部添加了错误的内部链接 编辑失误或者程序员大意让页面产生了不存在的页面。 2、网站短暂无法访问 因为服务器、空间或程序问题导致网站短暂无法访问,产生大量返回码为5开头的服务器错误页面。 3、外部链接错误 用户或者站长在站外发布了错误URL;别的网站复制或采集了你们含有错误链接的页面。 4、爬虫提取了不完整的URL 个别爬虫在提取页面URL的时候,因为URL中有不规则字符或者URL与后边的文字链接起来,导致URL失效。 |
1、网站内部添加了错误的内部链接 编辑失误或者程序员大意让页面产生了不存在的页面。 2、网站短暂无法访问 因为服务器、空间或程序问题导致网站短暂无法访问,产生大量返回码为5开头的服务器错误页面。 3、外部链接错误 用户或者站长在站外发布了错误URL;别的网站复制或采集了你们含有错误链接的页面。 4、爬虫提取了不完整的URL 个别爬虫在提取页面URL的时候,因为URL中有不规则字符或者URL与后边的文字链接起来,导致URL失效。 |