2018-07-14
影响百度爬虫抓取的网站SEO优化细节有(yǒu)哪些
大多(duō)站長(cháng)都知道百度爬虫的重要性,一般你的网页参与排名要分(fēn)四个步骤,分(fēn)别是抓取、收录、索引、展现,其中抓取是我们站長(cháng)做SEO网站优化的第一步,那么问题来了,站長(cháng)做网站优化的哪些操作会影响到百度蜘蛛的抓取呢(ne)?
百度蜘蛛一般是通过IP来进行抓取的,同时对于某个IP的抓取数量也是有(yǒu)限的,如果你的IP上很(hěn)多(duō)站点,那么分(fēn)配到某个站点的抓取量就会变低,尤其是同IP有(yǒu)大站的情况。另外一个方面,同IP的网站有(yǒu)敏感站点或者和你的网站是相似站的话,也会从侧面影响你网站的抓取,所以,网站优化尽量选取独立IP。
内容质量
虽然百度的官方文(wén)档中没有(yǒu)出现原创内容的词汇,实际上百度想要表达的内容是只要是对客户有(yǒu)用(yòng)的内容,虽然不是原创的,但是也会给与好的排名,所以出现了很(hěn)多(duō)针对非原创内容使用(yòng)的内容生产方法,比较好的方法是内容分(fēn)模块加随机组合,效果很(hěn)好,收录也不错。但大部分(fēn)站長(cháng)理(lǐ)解的非原创是转载和抄袭,伪原创等等,百度蜘蛛对于这类站点的态度可(kě)想而知。退一万步说,如果你真想做伪原创,你要至少保证30%的差异性,可(kě)以用(yòng)组合的方式来解决。
网站要保证内容质量的另一个方面是说百度对于某类站点的收录是有(yǒu)限的,百度收录你的站点前会给你的网站进行评级,根据评级决定你的网站的收录量是多(duō)少,这就是很(hěn)多(duō)站長(cháng)时间久了收录会下降的根本原因。為(wèi)此,我们需要做的提高有(yǒu)效收录的数量,根本原因就是要提供高质量的内容页去覆盖搜索需求,但不幸的是,高质量的内容页面一般也是原创的,所以,想要偷懒通过伪原创创造文(wén)章内容的站長(cháng)可(kě)以省省了。
网站的打开速度和加载速度
网站的打开速度会从侧面影响百度蜘蛛的抓取。虽说蜘蛛抓取你的网页是没有(yǒu)网页大小(xiǎo)區(qū)别的(实际上网页越大代表你的网页的丰富度越大,百度会给与优质展现),但从用(yòng)户的角度来说,当你的网页打开加载时间超过3s,对于营销型的seo网站就会增加跳出率,跳出率高了就会影响你的网站评级,网站评级走低了网站的收录也就低了。所以网站的打开速度会间接影响百度蜘蛛的爬取。
站点的安全性
站長(cháng)必须时刻注意你站点的安全性问题,比如说打不开,黑链跳转,被抓取了WEBSHELL等,站長(cháng)都要第一时间恢复,并且在百度站長(cháng)工具中做好相对应的补救措施。一般网站被黑的结果都是挂黑链,所以有(yǒu)时间要看一下自己源代码中是不是加了很(hěn)多(duō)黑链,黑链都是批量加的,视觉上很(hěn)容易分(fēn)辨。如果你做不了及时处理(lǐ),百度爬虫抓取了相关页面或者借此跳转到非法页面,会给你降权,一般通过挂黑链引起的降权百度是很(hěn)不容易恢复排名的。