文章收录是网站排名的基础,如果收录文章很低,用户访问到网站的几率将近乎为零,主要关系如下:索引文章→收录文章→用户搜索→排名显示。这次我们从4大部分来谈谈网站收录的问题。
索引与收录的关系
很多小伙伴都搞不懂索引和收录这两个小概念,我这里跟大家稍微解释一下:
索引
索引量仅指被百度搜索引擎建立了索引的网页总量,表示网站中有多少页面可以作为搜索候选结果,不同网页因内容重要性、稀缺性不同,被展现的几率有很大差别。
收录
收录量是指搜索引擎对网站页面的收录数据,结合索引来理解,就是蜘蛛首先爬取网站,建立一个索引库,然后放出的页面数量就是收录量,一般Site命令查询出来的数据结果就是收录的数据,这个数据不是非常准确,作参考指标。
索引与收录的关系
通常的情况下,网站是要经过两次审核的,第一次审核通过的页面会被百度收录,显示为索引量,在索引量当中要进行二次审核,通过的这些页面就会被释放出来,形成site。即:发布文章→审核通过建立索引→再次审核通过建立收录
PS:site出来的数据仅供参考,目前百度正在对site命令进行调整,调整后数据应该会更加准确一些。
为什么网站迟迟没有收录
网站迟迟没有被收录或者收录一直涨不起来,这时候我们难免心急,或许我们可以从以下方面解决网站收录问题:
一个新站
百度基本上是在一周内收录首页,其他页面查询没有收录,主要是因为目前网站正在处于考核期,考核期一般时间在1-2个月左右。过了这个考核期,百度会批量放出之前收录的网址。
网站结构问题
网站结构对蜘蛛爬行有很大影响,如果网站迟迟没有收录,可以通过查询蜘蛛爬行日志来确定网站结构有没有问题。如果蜘蛛爬行不了可以通过建立网站地图或者重新设置网站架构来解决网站结构问题。
内容重复
内容重复是指相似的内容重复出现在网站,或者网络上已经有了相同的文章,这种情况下我们需要尽量减低相似度,提高被收录的可能性。
文章质量
网站内容几乎都是伪原创,且伪原创度低,原创内容很少,也会影响网站收录。
网站URL动态链接
URL动态链接是指网站网址中出现&,?等字符的链接,这也会影响到蜘蛛爬行,我们可以通过链接静态化解决这个问题。
其他
网站服务器不稳定(经常打不开或者响应慢),网站被黑过(网站里面存在大量垃圾链接),网站域名曾经被处罚(被百度拉入过黑名单)等问题也会造成网站没有收录。
如何提高网站收录
提交收录
很多小白在网站建设好了之后,只顾着更新文章,而没有把网站提交给百度或其他搜索引擎,这样会导致收录速度非常慢,因此在网站内容填充完毕后,应该主要将网站提交,并且接入百度统计,这样每天的IP流量从什么站来的,都可以通过百度统计代码查到了。
提交网站可以在各大搜索引擎搜索站长平台,Eg:在百度搜索:百度站长平台。然后注册账号提交网站即可。
原创内容
搜索引擎比较喜欢原创的文章,尤其喜欢定时定量发布原创文章的网站,我们就应该投其所好,定时定量发布原创文章。如果原创文章不多,也可以进行高质量的伪原创,一般原创文章或者高质量的伪原创文章,被收录的几率会比较大。
主动提交
除了百度蜘蛛自动爬取外,我们更新完文章后,可以将更新文章的链接手动提交给蜘蛛爬行。这样效率会高很多。
内链建设
为了提高收录量,我们可以在每篇文章里面增加推荐阅读,增加蜘蛛爬行入口。一般已收录文章的推荐阅读效果最大。
SEO优化
SEO优化主要体现在:标题,关键字,描述,还有正文中。标题含有关键字,描述中也含有关键字,文章正文反复出现关键词,一般建议一篇文章对应一个关键词,防止太多关键词对蜘蛛造成干扰。
正文中第一次出现关键词加粗或者修改文字颜色,并增加超链接指向网站首页。
文末增加推荐阅读,建议控制在2篇左右。
外链推广
外链是提高网站收录很重要的一步,但是垃圾外链会对网站造成严重的影响,因此需要对外链进行筛选。
A:外链网站:B2B网站,分类信息网,新浪博客,知乎等。
B:筛选网站:利用site命令筛选,具体如图:
首先确定筛选时间,之后点击 清除 按钮,会显示出相关收录,如果没有收录的话,就可以考虑不在改网站建设外链了。
还有一种建设外链的办法叫做新闻源,一般医疗行业使用新闻源比较多,不过现在新闻源的话限制比较大,很多都没办法加入网站超链或者明文链接了,需要的话可以去了解一下。
如何确定一篇文章的主题
百度指数:https://index.baidu.com/
搜索关键词后,我们可以看到该关键词的需求图谱,如图:
图中显示,越靠近关键词的热度越高,写的文章越容易被收录。
同理:在舆情洞察中,写的文章被收录的几率也是非常大的。
百度搜索风云榜:http://top.baidu.com/
百度搜索风云榜一般是我们追热点使用的,热点追好也可以提高网站文章的收录。
伪原创检测工具
在这里安利一个软件包,叫做《爱站SEO工具包》,这个工具包里面包含很多SEO必备小工具,其中就有伪原创检测工具。
将文章复制进去后即可检测,对飘红数量高的句子我们可以进行适当的修改,保证原创度在70%以上即可。请注意:这个原创度只是参考而已,只要文章是好的,对用户有用的文章收录几率就会提交高,如果是原创文章的话,可以忽略这个检测。
网站排名需要一段漫长的时间,在这段时间中,我们只需要做好文章的更新,站内优化及外链建设即可,切勿操之过急~
-- END --
欢迎您关注我的公众平台"职业运营人",我将在公众平台中输出“全栈运营”人员会接触到的所有知识,敬请期待~