作为软件服务行业公司,对网站进行数据分析,出一个完美的分析报告,是赢得客户信赖的方法之一。下面套用统计分析中的知识点,进行百度蜘蛛爬行分析。
一、同比与环比
同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。http://www.yixiin.com/photo/
例:8月份的第一星期蜘蛛抓取情况与7月份的第一个星期蜘蛛抓取情况的对比数值,就是同比。
环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。
例:8月份的第二个星期与8月份第一个星期的蜘蛛统计数据的对比情况,就是环比。
二、百分比与百分点
百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
例:网站页面总数为3000,蜘蛛抓取数为800,那么网站被抓取的百分数是 800/3000 * 100% = 27%,需要考虑改善蜘蛛抓取的效率了。
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。
例:A网站未做蜘蛛抓取效率改进前的被抓取率为:27%,改进后被抓取率为52%,那么该网站改进后比改进前提高了25个百分点。
三、比例与比率
比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
例:全部栏目抓取数为10000,A栏目抓取2000,B栏目抓取3000,C栏目抓取5000,那么A、B、C栏目抓取比例为20%、30%、50%,如果C栏目不是你主要引导的栏目,那么说明网站结构出现了不小的问题。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
四、频数与频率
频数是指一组数据中个别数据重复出现的次数。
例:分析百度蜘蛛IP段与网站权重的关系,统计到某一个网站蜘蛛一共有50个IP,其中123.*.*.*有30个,202.*.*.*有20个,那么123IP段的频数为30,202IP段的频数为20.
频率是每组类别次数与总数的比值。
例:在上例中,123.*.*.*的频率是30/50 * 100% = 60%
五、绝对数与相对数
绝对数:绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也可以表现为在一定时间、地点条件下数量的增减变化。
例:网站上线3个月,收录数为50000;网站改版后一个月,收录比改版前多了5000。
相对数:相对数是指由两个有联系的指标对比计算而得到的数值,它是用以反映客观现象之间数量联系程度的综合指标。计算公式:相对数=比较数值/基础数值。
例:pv是ip的4.5倍;A页面到B页面的二次点击率是50%。如果相对数过低,或者低于行业的平均水平,应该考虑改善相关页面的内容相关度。
例:以上例数据为基础,A栏目与B栏目的比率是2000:3000 也就是 2:3。http://www.yixiin.com/news/
六、平均数
我们日常提到的平均数,一般是指算术平均数,即全部数据累加后除以数据个数。它可以反映出总体数量的一般水平,掩盖掉总体内各单位的差异性。
例一、通过对比竞争对手的链接数量得到一个平均值,这就是该个项目初期的链接建设的数量预测。
例二、网站运营一段时间后,通过统计的各栏目的蜘蛛爬行次数,停留时间。得到的平均数,作为一个判断标准,低于平均数的栏目和页面需要改善吸引蜘蛛的策略。