身为SEO,我们每天都在围着关键词排名而努力,但而要想获得好得排名,我们就必须懂得艘多引擎的工作原理,只有这样我们才能做的更好,很多技巧很多软件也都是围绕这个原理来发展的
搜索引擎蜘蛛工作流程大概是通过发现某一个链接(可以是外链或者友链)然后顺着这个链接爬到这个网页 ,把这个网页加入到临时库,对这个网页进行分析(包括提取关键词、切词、分析重复性等,这个是经过分析系统进行的)然后提取网页中的链接,顺着这些链接再去下载其他的网页,就这样一直循环下去。http://cn.yixiin.com/news/
搜索引擎把蜘蛛抓取来的网页先放到临时数据库中,然后就会交给数据分析系统进行处理,数据分析系统处理的过程主要有:
1、把html代码都去掉,提取出来网页的内容,然后就删除那些没用的内容,比如版权和一些其他和网页主题明显不相关的内容。
2、去除重复,就是搜索引擎发现有重复的网页或者你这个网页和其他网页重复就会删掉
3、分词,就是把网页的内容进行中文分词,进行排列出来放入索引库中,同时计算某个关键词的密度,还有核心关键词的密度,还有重要的是这个网页的排名因素,比如链接的数量和质量,给这个页面的分数,用户体验等,也一并放到索引库中
4、利用正排索引和倒排索引进行排名,通过用户接口也就是用户提交的搜索词,进行匹配,经过计算相关度和这个网页的质量等因素进行排序,然后返回结果
搜索引擎的工作原理很复杂,不过只要我们多多了解,我们都会学的更好更多,一起学习。http://cn.yixiin.com/