1)搜索引擎蜘蛛程序(Spider)爬行和抓取互联网,并建立索引(Index)
搜索引擎都会派出一个或者多个搜索引擎程序( Robot)去抓取互联网的一些新鲜网页,http://www.yixiin.com/gift/ 这个程序也叫做蜘蛛程序(Spider)或者机器人( Robot),这些程序以知名站点为基础,顺着链接逐步爬遍整个互联网,每当发现新鲜的网页都会做记录,并将这些记录文件(URL,标题,描述)存储在编号,压缩打包在自己的服务器上,以便后期的关键处理进行匹配。
因为蜘蛛程序是顺着链接走的,所以链接的重要性也由此可见,尤其对于一个新的站点而言,建立必要的外链就显得非常的必要,建立外链也是吸引蜘蛛程序爬行,建立搜索收录的常见搜索引擎优化要素之一szbrys.com.cn。
2)搜索词语处理,匹配关键词
当用户需要检索某一关键词,敲定搜索键之后,下面的工作就是有搜索引擎来处理,首先搜索引擎会做关键词分析,对于中文搜索来说,比如,搜索引擎字典匹配;判断搜索词是否有有拼写错误或者错别字(进行必要提醒),搜索词是否有空格,去除停止词等,按照分词技术逐一处理。
然后就是根据关键字在事先建立好的索引中查找匹配关键字,以及包括关键字的内容网页。当然这一过程将是一个十分迅速的过程。
3)排序
搜索引擎匹配完关键字之后要做的一件事情就是将这么多的文件,按照一定的排列顺序进行排列,为后期的显示结果做准备。
进行排序也就是大家常说的搜索引擎算法,搜索引擎算法是搜索引擎最为重要的机密,一般而言,这些排序都是以一些因素来作为排名依据,那么都有哪些因素来主导着这些排序呢?概括起来主要有关键字密度,关键字突出度,关键字链接流行度等因素。
介于各家搜索引擎的排序重点不一,所以同一个关键字在不同的搜索引擎中所表现的排名结果也就各不相同,这里就可以很好的理解。即使同一个搜索引擎的不同时期也会调整这些排序的权重,结果就是同一关键字的排名会有波动,也是很容易理解的事情。
当然,以上只是简单的描述排序过程,其实排序是搜索引擎最为复杂的过程,期间还要计算关键字的相关性,和应用一些过滤法等,复杂过程难以想象。
4)显示搜索结果
当该关键字有付费时间,则优先排名,排名后,按照排序结果进行排序,只要将这些排序的结果按照标题,描述,URL形式展示出来就可以,但是有一点要强调的是这些展示的内容并不在所检索网站,而是搜索引擎网站服务器上。只有最后一步,当用户点击,才会链接到检索网站上。http://www.yixiin.com/quote/