搜索引擎的使命是提供给用户能满足其需求、高质量的内容,百度搜索引擎会根据网页的质量情况对其排序进行调整。高质量网页会获得更多展现的机会,质量较低的网页会减少展现机会,甚至不予收录。
页面的价值主要受感兴趣的受众群大小、页面的稀缺程度、页面的质量高低、页面的时效性特征强弱四个方面影响,搜索引擎会根据这些调整网页排序。而在百度网页搜素质量白皮书里也指出类似的衡量标准:对每一个网页,百度搜索引擎会从以下三个维度综合考虑给出一个质量分:
内容质量
网页浏览体验
可访问性
一、衡量网页质量的维度——内容质量
网页主体内容是网页的价值所在,百度主要从以下角度评价网页内容质量:内容制作成本高低;内容是否有效、完整丰富;是否原创;信息是否真实有效;是否权威或投入较多专业的知识和经验;是否存在作弊行为。
①、内容质量高:内容质量好的网页,花费了较多时间和精力编辑,倾注了大量经验和专业知识,内容清晰、有效、完整且丰富。例如:专业医疗网站发布的内容丰富的医疗专题页面;、资深工程师发布的完整解决某个技术问题的专业文章、专业B2C网站上,完整有效的商品购买页、权威新闻站原创或经过编辑整理的热点新闻报道、经过网友认真编辑,内容丰富的百科词条。
②、内容满意度中:能满足用户需求,但未花费较多时间和精力编辑,不能体现出经验和专业知识的完整网页。例如:贴吧里一个普通的帖子、一个普通的百度知道问答结果、没有进行任何编辑,直接转载其它网站的新闻。
③、主体内容信息量较少或已失效:主体内容信息量较少,或无任何有效信息,只能起参考作用。例如:论坛中,缺少有价值信息的“水帖”、商品团购等已下架或无货、招聘交易类信息过期;、页面上有明显的过期标记。
④、无有效内容,完全不能满足用户需求:未经认真编辑整理、粗制滥造或从别处采集的内容。主要表现是:主体内容空洞或不能支撑页面主题,不能满足用户主要需求。例如:问答页,有问无答,或回答完全不能解决问题、内容空短,不能支撑页面的主要意图、站内搜索结果页,但没有给出相关信息、各类作弊网页。
二、衡量网页质量的维度——浏览体验
用户希望看到干净、且易阅读的内容,排版混乱、广告过多会影响用户的阅读体验,影响用户阅读体验的网页,会被降低展现的机率。浏览体验的好坏主要受内容排版、广告这两个因素的影响。
①、浏览体验好:排版合理,浏览顺畅,广告不影响阅读;主要内容突出、明确。一般具有以下特征:排版合理,版式美观,易于阅读和浏览;用户需要的内容占据网页最重要位置;能够通过页面标签或页面布局十分清楚地区分出哪些是广告;广告不抢占主体内容位置,不妨碍用户对主要信息内容的获取。
②、浏览体验差:页面布局和广告影响了主体内容的获取包括但不仅限于以下情况:
(1)排版布局差:正文内容不换行或不分段,阅读困难;字体和背景颜色相近,内容辨别困难;页面布局不合理,页面首屏看不到任何有价值的主体内容。
(2)广告影响阅读体验:弹窗广告;广告与内容混淆,不容易区分;广告遮挡主体内容;或者在通用分辨率下,首屏都是广告,看不到主体内容;影响阅读的浮动广告过多。
三、衡量网页质量的维度——可访问性
用户希望快速地获取到需要的信息,我们尽可能为用户提供能一次性直接获取所有信息的内容。不能直接获取到主体内容的网页,会被降低展现的机率。百度会从资源有效性、主体资源可浏览性等方面判断网页的可访问性。
①、可正常访问的网页:无权限限制,能直接访问所有主体内容的网页。
②、死链&主体资源失效:死链无法提供任何有价值的内容,我们希望网站中的死链,都第一时间通知搜索引擎。比如:
404、403、503等页面;
程序代码报错页面;
开后提示内容被删除,或因内容已不存在跳转到首页;
资源下载页上的下载链接不存在或资源失效;
视频播放页视频无效或不存在,无法播放。
③、网页信息主体部分需要权限或需要安装冷门插件:网页主体内容需要权限,提高用户获取信息的成本,百度会降低对其的评价。比如:
论坛附件下载需要权限;
文档全文查看需要权限;
需要安装冷门插件才能正常访问。
不管是百度搜索研发部在谈互联网页面价值的时候就指出的受众群大小、页面稀缺度、页面质量、页面时效性四个要素,还是百度网页搜素质量白皮书给出的内容质量、网页浏览体验、可访问性三个维度。
百度都是从搜索用户的角度出发,要挖掘全方位满足绝大部分用户需求的网页,所有可能会对用户产生价值的页面都是对搜索引擎有价值的,搜索引擎会衡量这些页面的质量,并将这些页面建立索引排序给需求用户。
所以网站的网页需要从各个角度去提高其用户体验的价值,某个价值大放异彩不一定就能在页面排序大战中脱颖而出。