最近新做了一个企业网站,也是采用了比较流行的织梦系统。目前网站文章有1800篇的样子。网站上线5天内,百度收录数量已达300,谷歌已达1500,总体来说收录还算可以。
下面谈谈我的做法。因为是以前别人用过的域名,在网站上线之前就采集好以前收录过的URL,大约50个,然后进行保存。网站上线后,立马提交404错误链接。通过工具提取这个域名在百度站长工具里面的全部链接几千个吧,然后对这些垃圾外链进行处理,处理的办法是用条件语句筛选,比如:筛选某域名所有链接,筛选某关键词全部链接。上千、上万的垃圾链接处理其实就这么简单,因为百度可以批量拒绝嘛,根据域名、网站、URL来拒绝外链。
新开的站加入站长平台后。没有获取到sitemap提交功能的名额,但是也制作了一个站点地图文件,将站点地图的html链接,通过提交URL的形势提交给百度。
接下来是比较关键的一步:一般我们的思维是网站首页某些列表都是最新的文章,我也是这样做,但是我在首页重要位置留了一块区域,用来展示高质量、高原创度的文章。这得益于一个想法的实现。我给织梦文章表自定义了很多属性。
织梦文章表自定义了以下属性:文章字数、文章相同数量、文章原创度、文章链接、百度抓取次数、百度最近抓取、百度收录、百度快照、谷歌抓取次数、谷歌最近抓取、谷歌收录、谷歌快照。通过织梦的SQL语句来调用的。比如首页那块重要区域我的调用条件是:百度未抓取且原创度大于90,且文章字数大于800。总之想要什么数据,都可以直接用SQL语句来任意调用。实现站内的推荐,以及链接平衡均匀分布。让每一篇文章都有被展示到的机会。以及赋予链接的权重。
这种想法的实现得益于一个插件,链接织梦文章表,以及IIS日志表,通过两个表的联合查询。来分析文章的这些属性数据。这个插件也是因为最近工作需要就折腾捣鼓出来了。如图所示
到了第3天、第4天收录抓取还是比较稳定。通过SQL语句查询到百度还是有大量的URL未抓取到。怎么办?于是我想了这样一个办法,用织梦的自定义单页功能,做了一个list文章列表的模板,专门来展示百度未抓取文章,放在网站最底部并命名为:sitemap_1.html。而且这个文件里面的内容是随机的,这样保证所有未收录的文章都会被展示到。经过数据测试这个文件一上线后。百度立马抓取到sitemap_1.html这个文件。当然接下来的结果肯定高兴了。那些未被抓取到的url通过这个入口又被抓取到了。数据经过表对比分析,的确是这样,无误。
接下来是安装插件,安装定时审核插件,保证每天会放出新的文章。定时生成首页以及地图,这样整个站内就形成强大的链接自定义展示功能。百度蜘蛛抓取顺畅无比,让百度蜘蛛来了总会找到新的、有价值的内容。对于外链这块,每天偶尔发几个外链吸引下蜘蛛抓取就行了。没有大量的发布垃圾链接。以后可能会考虑做视频外链、以及一些比较有价值的链接。
今天就写了这么多。原创不容易,有兴趣的深圳医疗SEO可以和我交流额。黄其林个人瞎扯主页/,专注于研究医疗SEO,以及SEO工具。