分析搜索排名算法之中文分词
中文分词,信任大家并不生疏。无论是搜索引擎开发的程序员仍是有满足经历的SEOer。都应该对其有或多或少的明白。笔者作为搜索引擎开发的程序员,也站在SEOer视点,今日对中文分词进行一些浅谈,并浅析中文分词在搜索引擎优化中的注意事项。http://www.yixiin.com/spread/
一、中文分词算法种类
从中文分词种类来看,常见的分词算法有:正向最大匹配、逆向最大匹配、双向最大匹配、最佳匹配法、最少分词法、词网格算法等等。
二、常见分词算法简略分析
1、最大匹配法(ForwardMaximumMatchingmethod,FMM法):拔取包括6-8个汉字的符号串作为最大符号串,把最大符号串与词典中的单词条目相匹配,若是不能匹配,就削掉一个汉字持续匹配,直到在词典中找到相应的单词停止。匹配的方向是从右向左。
2、逆向最大匹配法(BackwardMaximumMatchingmethod,BMM法):匹**向与MM法相反,是从左向右。试验标明:关于汉语来说,逆向最大匹配法比最大匹配法更有用。
双向匹配法(Bi-directionMatchingmethod,BM法):比拟MM法与RMM法的切分成果,然后决议正确的切分。
3、最佳匹配法(OptimumMatchingmethod,OM法):将词典中的单词按它们在文本中的呈现频度的巨细摆放,高频度的单词排在前,频度低的单词排在后,然后进步匹配的速度。
往往在实践运用中各种算法会连系运用,比方:双向最大匹配连系(FMM+BMM),此办法是很多分词公司的做法。
三、中文分词在SEO实践中的注意事项
拔取关键词时,要注意其分词规律,长尾关键词更是如此。比方做生日蛋糕的。若是连系了地域性,往往效果会更好,比方,生日蛋糕-北京-上海-广州-深圳。这样用户会更简单找到其站。辅关键词排名上来了,也会对主关键词排名起推进效果。http://www.yixiin.com/ad/