百度快照描述内容与实际网页描述内容会如何?
网站每天更新文章都收录,可是为什么收录的文章的标题和描述内容都与实际的不符呢? http://www.yixiin.com/ad/
其他都正常,就百度不一样,打开网站一看,不看不知道,一看吓一跳。如此低级的SEO作弊居然还问我为何百度抓取的标签内容与实际的不符。描述标签的内容不一样。
百度快照没抓到title、description标签的原因的是因为内容不对,但是没抓到的原因是说出来了,但是抓到了但是显出来的与实际的不符的原因还没说明我们知道百度对table框架网站的爬取是不太兼容的,而且从搜索引擎的原理来讲,其抓取系统首先是将整个网页下载下来,然后将里面的文字内容提取出来,经过分析去除html格式,清除噪音,然后分词,最后存入索引库。
table框架的乱套直接导致搜索引擎蜘蛛的爬取效率和结果,那么取出代码剩下的文字有可能就与实际的文字有误差。那么这个时候百度对于爬取得来的文字内容与页面description标签内容进行对比,如果符合,就会采用description标签内容,如果符合这个页面的内容,那么百度就会自动截取一段文字作为这个页面最适合的描述。(百度这个原理是为了提高搜索用户的体验)
description标签内容“”明显是不符合上图中的蜘蛛抓取内容。而且百度蜘蛛爬取网页内容的习惯是从上往下,从左往右的,网站的源代码都是才用DIV+CSS代码布局,而且结构布局,也非常合理
模拟蜘蛛爬取的内容description内容是最适合描述首页的内容,如果你的网站没有description及内容,百度自动去判断description标签显示内容以显示出来,不然排名出来的页面,如果描述没有,势必会影响搜索用户在百度搜索的体验。而如何是一些知名的商业平台,如淘宝网,一些知名商城,如果出现多余的字,可能会影响用户的搜索体验,因为这里出现后面的字,可能会给用户造成是冒充的假站,因为大家已经习惯 仅仅只有“淘宝网“三个字才是官方网站的习惯。(个人理解,应该是这样) http://www.yixiin.com/spread/
淘宝案例属于特例,不在本文的范围之内。 综上所述,作为一般性的网站,才用DIV+CSS代码,摒弃table框架等代码,以及从上往下,从左往右的代码布局习惯才能让百度抓取正常,才能显示实际的与页面内容想符合的description内容。