百度原创算法

来源:岁月联盟 编辑:exp 时间:2014-06-12

上海seo

 

  我是一个接触seo还不到3个月的菜鸟,略深入的了解这一行以后发现,水不是一般的深。深也就罢了,咱慢慢趟总有触底的一天。无奈趟着趟着发现,水还混的很。

  作为新生,我也问过一些前辈“菜鸟怎么做seo”他们会说:多原创,多外链收录自然就有了,有了权重有了pr渐渐的排名就会上去了。

  但是原创真的有用么?答案绝对是肯定的!

  但是你写的原创有效果么?答案是模糊的!

  原因有如下几点:

  1, 百度抓取的不及时。原创写出来以后,你放到自己的网站上,百度无法保证第一时间抓取你的文章。这里的因素有多重,你的权重不够高,你的外链不够广,蜘蛛没能第一时间访问你的原创页面,而新站即使被百度获知,其爬行的周期也一般较长,在没有充分活跃度和广泛的外链支持下,基本上百度无法做到第一时间获取你网站上的新内容。

  2, 百度抓取的滞后性,意味着同样的文章有可能被别人转载,如果他的转载平台百度蜘蛛活动很频繁,那么无疑这篇被转载的文章会被百度认为属于转载者的原创,就是说,他偷了你的东西,公安都不认为东西属于你,你说你冤不冤?

  3, 抓取和放出是两个概念。如果你的原创被抓取了,但是由于未知原因,未被放出。而是记录在案,转载者的网页也被抓取,但是已经放出了。那么你如何判断谁是采集谁是原创?这种情况,不是没有,往往转载者的页面会优先放出,而原创者的页面却放出滞后,甚至根本不会放出。在我们不了解蜘蛛是否抓取的情况下,如何判断原创与否?

  4, 抓取做出时间先后的标注,但是这些数据不是我们能看到的,先抓取的未必就先放出,后放出的未必就是采集或者转载。在不透明的索引数据库中,作为seo的我们只能通过简单的site查看收录的情况下,如何取舍原创与采集?

  5, 再者国内网站数以亿计,毫不讳言的说,相当一部分数据看上去很优秀的站点,其内容基本上靠转载和采集,但是依然获得了蜘蛛良好的友好度,频繁访问频繁抓取。而对于新站的我们即便是日日笔耕不辍,句句原创也很难仅凭一点获得良好的权重。

  综上,原创与否真的不重要。百度千方百计的出台针对原创文字的甄别算法,目前看来很有可能无疾而终。在不能保证及时索引全部网站日常跟新的页面内容的情况下,原创甄别工作就存在先天的设计缺陷问题。在此前提下,无论后续的技术多么具备合理性,都不可能弥补因前提缺失而产生的漏洞。

  笔者毫不讳言,我站的所谓原创都是采集来的,虽然是新站,但是采集文章跟新极有规律,蜘蛛抓取放出也能实现稳步增长。但这就能表示百度觉得我文章是原创么?肯定不是的!如果不是,为什么还继续保持稳定收录增长?我认为,百度觉得这个站是个活的,是一个有生命力的站点,所以就要保持抓取保持稳定的收录。鼓励站点持续经营下去。除此以外我想不到好的解释。

  最后,回到标题,原创算法必死!

  Ps:原创必死也得原创,本文由尚运seo技术支持原创:www.songlucky.com