搜索引擎进行网站排名的原理用一句简单明了的话总结出来就是:匹配度。举个例子,我们都去过图书馆,http://www.yixiin.com/一般现在的图书馆的入口处,都有电子检索计算机,可以进行作者名字检索,可以进行图书分类或关键词检索,我们可以观察一下,排名是不是匹配度越高,排名就越靠前呢?这其实也是搜索引擎的排名机制,熟悉了这一点也就方便我们规划下一步的搜索引擎优化步骤。
大多数80后的年轻人都在中学时期去过图书馆看书,那个时代没有电脑,检索图书的方式采用的事卡片式检索,也就是首先对图书进行人工分类并集中摆放,然后根据分类进行卡片标注,还有的图书馆采用英文字母前后顺序标注图书序列号进行检索,这样的方式需要我们一栏一栏的查找,费时又费力。现在好了,大部分先进的图书馆采用计算机检索系统,根据不同的检索条件,多样式的对图书进行分类查找,并显示图书所在位置和图书余量、借阅情况等,非常方便。而我们所熟悉的搜索引擎也采用这种检索系统,那么现有的搜索引擎都是在这个原理的基础上改进升级的。
搜索引擎程序对网页的排名动作分成3个阶段:抓取、预处理、排名。为了方便蜘蛛顺利抓取每一篇日志,我们经常说要实现站内结构扁平化及url目录层级越少越好。这一步是为了方便蜘蛛抓取数据并存入数据库。预处理阶段是对网页内容筛选存档的过程,网页的快照就是存在百度数据库中的数据,相当于照片。预处理过程中,搜索引擎程序会把网页的标签清除,留下文字部分,根据文字内容、词语重复度等,与网页标题标签进行匹配打分,按照一定的格式生成数据页面并存档。排名阶段,匹配度越高的网页,排名越靠前。
以上是简单的阐述一个网页在搜索引擎排名的过程,其实我们还要注意国内搜索引擎百度特有的分词技术,百度会根据词库,对网页标题进行分词,对关键词是如何分词的呢?我们可以通过查看网页快照,对关键词分词情况进行统计,从而精确地筛选每一个网页的关键词分配及密度,更好的把握分词及排名机制。
http://www.yixiin.com/sitemap/index-htm-mid-5-letter-j.html
http://www.yixiin.com/sitemap/index-htm-mid-5-letter-k.html
http://www.yixiin.com/sitemap/index-htm-mid-5-letter-l.html
比如我们搜索老默seo,看百度的快照,就会发现百度对关键词进行了分词,并对关键字分词后的标注显示为黄色。