相关度与搜引得擎
相关度计算是搜引得擎最关紧的技术之一,现时最为有名的算法当属Google的PageRank技术。可谓,搜引得擎赢得了相关度技术,就赢得了用户;赢得了用户,就赢得了市场。对于铅直搜引得擎来说,除开常理的相关度算法,因为铅直搜引得擎植根于一个特定的领域,与特定领域的信息接合起来,发掘剖析其中的深度数据,以实行更为精密的相关度算法,从而莫大提高用户查询的正确度。
相关度与站长
相关度在搜引得擎的排序中具备至关关紧的效用?我们用例子来申说,例如"郑州网站建设"时,出如今搜索结果前列的都是我们需要的关于"郑州网站建设"的网页,而不是夹杂了"郑州网站优化""郑州网站推广"这些内容的综合网页?这就是网页与所查询网站关键词之间相关度的问题,网页与原始查询的相关度越高,网页在搜引得擎中的排序越靠前。不过在搜引得擎中,有时分词技术并不尽然让我们词语在一起,不过效果也是同样的,有分词就有组合。
当我们搜索某个网站关键词的时分,搜引得擎首先会将每个网页的文档内容以多维空间和数码仪式体现,并将这些数据存储到数据库居中,当用户在施行某个网站关键词的检索时,搜引得擎首先会查询该网站关键词的矢量数据,继续会将此数据与已经存在于搜引得擎数据库中,当用户在施行某个网站关键词的搜索时,搜引得擎首先会查询该网站关键词的矢量数据,继续会将此数据与已经存在于搜引得擎数据库中的数据施行对比,将相关度最好的以资排出来。
也就是说,当用户在百度的搜索框中输入原始查询词"郑州网站建设"时.百度的算法系统首先会将"郑州网站建设"这个网站关键词施行数据化办理,而后将得出的数据与库中预先存储好的网页文档施行对比,最终,将合宜的结果按拍摄关度从高终归的次第施行排序,并展出如今用户面前。