做seo都说内容为王,确实,搜索流量来源于关键词,关键词来源于内容。
喜马拉雅seo项目定位于千万收录量、日几十万级别uv,从seo角度来说下面两种能力是“根”:
1、优质内容生产能力;
2、个性化内容管理能力;
一、对于内容生产能力,主要由以下策略解决:
第一种、批量移植现有内容
批量挖掘、批量采集、批量发布互联网上已经存在的内容;
第二种、大力推进创造ugc内容
从产品着手促进用户自主产生内容,包括促进自助聚合内容、自主更新内容;
第三种:自然聚合现有内容
让已有的采集内容、ugc内容在自然的条件下进行组合、聚合、重组;
第四种:对自然生产无效内容进行重组,使之成为有效内容
比如:类似这种移动端为主的产品,一次性用户比例很高。从web角度来说,有利:批量生产页面;有弊:都是无效页面。
那么怎样变废为宝?对内容进行合理化重组很管用。
二、对于个性化内容的管理能力,主要由程序和人工结合解决。
庞大一个问题排在面前,数千万页面,如何管理,如何把有价值的页面以良好的姿态展现给蜘蛛?
我们没办法一个个去定义、去修改。这里推荐了解一个技术大牛常使用的宝贝:正则表达式
是的,思路上学习正则表达式,以一定的规则去处理批量数据;
第一步、提取关键信息;
第二步、设定好基础规则;
第三步、对规则进行分组;
第四步、设定规则生效范围、优先级;
所以,如果你了解正则是如何运行,就能很轻松做好规则系统设计,那么处理千万级数据也是游刃有余了。
============================
下面给出简单案例:
喜马拉雅title管理规则系统配置-逻辑
———————————-自定义配置↓↓↓
首页:
Title需要的字段:自定义
keywords: 自定义
Description:需要的字段:{分类名},自定义
分类页面:
Title需要的字段:{分类名},自定义
keywords: 自定义
Description:需要的字段:{分类名},自定义
———————————-全局配置↓↓↓
专辑详情页:
Title需要的字段:{专辑名},自定义
keywords: 自定义
Description:需要的字段:
{简介:提取40个汉字},{专辑名},自定义
领域详情页:
Title需要的字段:{领域名},自定义
keywords: 自定义
Description:需要的字段:
{简介:提取40个汉字},{领域名},自定义
个人详情页:
Title需要的字段:{用户名},自定义
keywords: {用户名},自定义
Description:需要的字段:
{简介:提取40个汉字},{用户名},自定义
声音详情页:
Title需要的字段:{标题},{所属专辑} ,{所属分类} ,{作者名} ,{上传者用户名},自定义
keywords: {领域} ,{继承上级分类设定的关键词}
Description:需要的字段:
{简介:提取40个汉字},{所属领域名},{所属专辑名},{所属分类名},{作者名},{上传者用户名},自定义
———————————-
Title:显示30个汉字
Des:显示80个汉字
分类的标题:根据关键词组合(自定义)
专辑的标题:目标关键词(相对热门的词)
详情页的标题:7到20字之间
详情页的简介:50个汉字以上
============================