实例解读百度统计中“百度收录量查询”功能
a5里2011年9月27日有一篇文章“实例证明百度统计里的收录也并不准确”,该文作者认为百度统计中“百度收录量查询”里显示的收录量是不准确的,他的依据是“百度收录量查询”的结果和site:的结果有很大的区别,比如该文作者举例一个网站site结果是382条,而百度统计里却是205;另一个站site结果是0,而百度统计收录量却是1261。这么大的数据出人让该文作者认为百度统计里的收录量是不准确的。
我认为这是对“百度收录量查询”功能的误解,下面我也根据自己网站的收录数据来分析说明一下我的观点,可能有理解不对的地方,还请高手指出。我以自己的一个一级域名的主站和一个二级域名的网站的收录数据举例来说明,下图就是这两个网站的“百度收录量查询”截图,由于a5不能文章不能留太多网址,所以下面就用“一级站”和“二级站”来简称这两个网站。

首先说一下“百度收录量查询”的特点,这个查询并不是显示网站每天的收录数据值,而是显示百度大更新的收录值,一般百度每月有3-4次大更新,对应的就是图中所示的数据点。下面分析数据,“一级站”在2011年5月前使用过淘宝客的API,所以收录量在2万以上,5月之后撤销了API,也用robot.txt禁止API页面被收录,所以2011年6月到现在的收录数据一直在降低。“二级站”从建站开始一直坚持每天一篇或每两天一篇文章的更新频率,所以从2010年10月到2011年4月,百度统计显示的收录量是递增的,2011年5月由于操作失误,收录的页面被百度K了很多,7月份首页也被K掉,直到9月初重新被收录,百度统计显示收录量在变化中攀升。
再来看一下百度统计的收录量与site的结果比较,下面图中显示的是一级站和二级站9月份两者的比较数据,其中一级站site数据中421是真实的,450、470、500是记忆中大体的数字。可以看到,一级站和二级站的百度统计收录量都是稳步增加的,而site数据一级站逐渐下降,二级站稳定为1,这是什么原因呢?

首先解释一级站,该站site收录中还有大量淘客API的页面,所以site数据比百度统计的收录量大,site数字逐渐降低应该是百度逐渐剔除那些不存在的api页面。对于二级站,9月初刚刚恢复百度收录,百度site一直仅显示首页,因此收录一直是1。由此看来,百度统计给出的数字应该是百度数据库里对网站的收录页面的统计,这个页面数量应该是百度认为该网站中值得收录的页面!而site中的页面是不真实的,而且不能正确显示收录的变化。
通过百度统计的收录量可以帮助站长做什么呢?用处可能有很多,以我的网站为例来说3点用处,第一点,我的站一直在更新内容,所以百度统计收录量稳步上升,这应该是正常的变化趋势,只有这样的趋势才能证明网站是健康的,百度权重会稳步上升的。第二点,以二级站为例,虽然site仅给出首页一个页面,但是百度统计的数据在逐渐增长,说明只要坚持更新,最终这些收录都会从site里放出来的。第三点,我一个二级域名站(http://shop98.taobao581.cn),9月百度统计收录显示为6,而site却显示没有收录,这应该说明百度已经开始关注这个网站,并开始考察,只要站长坚持,最终会被收录并site放出页面的。
最后我想说,站长应该掌握主动权,让自己的网站循序渐进的正规发展,这百度统计就会显示正常的变化趋势,通过百度统计来诊断网站应该是次要的。











