网站文章不被收录的原因有哪些

发布时间: 2022-12-22 00:01:25 来源: 励志妙语 栏目: 情感美文 点击: 95

网站内容不收录的原因是什么网站内容不收录的原因以及解决方式:一、搜索引擎是否知道页面的存在搜索引擎要收录该页面,必须知道有这个页...

网站文章不被收录的原因有哪些

网站内容不收录的原因是什么

网站内容不收录的原因以及解决方式:
一、搜索引擎是否知道页面的存在
搜索引擎要收录该页面,必须知道有这个页面。如果蜘蛛都不知道页面,就收录不了,这里主要分为两点:搜索引擎找不到网页入口和不让搜索引擎抓取。
1、搜索引擎找不到页面入口很多时候不是你更新了文章搜索引擎就要来抓取收录的,要怎么让蜘蛛知道你的更新呢?除了有规律的更新,可以向百度站长平台主动提交URL或者是提交站点地图,也可以让搜索引擎被动收集,这就是通过外链让蜘蛛知道你的网页,还有很多时候蜘蛛来到了你的网站,却找不到你更新的链接,因为网站的链接结构做得太复杂或是内链结构差,以致搜索引擎在抓取时间类不会爬到网站深处的页面,这也造成蜘蛛不知道该页面的存在。所以不管怎么样,第一步我们要保证页面能被蜘蛛看到,关于这一点可以通过查看网站日志来判断蜘蛛是否来访过。
2、不让搜索引擎抓取很多网站有意无意的直接在robots文件屏蔽了百度或网站部分页面,却整天在找原因为什么蜘蛛不来抓取我的页面,这能怪百度吗?你都不让别人进门了,百度是怎么收录你的网页?所以有必要时常去检查一下网站robots文件是否正常。
二、蜘蛛是否正常抓取:
1、网站正常访问都知道,蜘蛛抓取页面要从域名到DNS服务器再到网站空间,所以其中任何一个环节出现问题,蜘蛛都不能正常的抓取,首先域名需要备案,然后域名解析要正常,如果解析出现问题,域名是不能访问网站ip地址的,这个时候网站打不开,蜘蛛抓取不了页面。
2、服务器稳定如果服务器比较卡或者不稳定,会直接影响蜘蛛抓取,蜘蛛不能很好的去抓取页面或由于加载慢只抓取到网页一半,这就很大程度上影响了网站的收录。
3
三、蜘蛛收录标准是否达到:
1、行业不同标准也不同这个是显而易见的,新闻类网站肯定比一般企业站容易收录,而对于医疗、博彩、成人用品等网站,标准肯定是更加严格,所以对于不同的行业,百度给予的收录标准也是不一样的。
2、不同的网站标准不同百度有一个优先抓取的原则,对于绝大多数用户喜欢,权重高的网站收录得要快,就像新浪网、腾讯网收录得肯定要比一般网站要快,为什么?因为信任,这类网站本身就有其严格的过滤系统,在此类网站公布的内容百度基本是直接抓了就收,搜索引擎是互联网与用户的桥梁,它的目的就是给用户提供有价值的内容,你能为它提供良好的内容,它当然也会对你更好,这是互利的。
3、内容的质量度蜘蛛爬行频繁,就不收录,或者收录了隔几天查看又没收录。主要有两点:一是网站内容大量采集或者是提供无任何价值内容,二是网站还处于新站,百度对其有个考核期,收录较慢。

网站不收录解决方法

一、分析网站日志:看是否有被蜘蛛爬过如果页面未被蜘蛛爬行页面未被Baiduspider爬行,那么你可以适当的给该页面做一些外链来引导蜘蛛过来爬行,也可以给搜索引擎提交该页面。那么我们就可以进行以下操作:
二、页面爬行了未收录当页面长时间都不被百度收录的话,那么就要适当的给该页面增加一些附加价值或者对该页面进行重新的进行修改。你可以对文本新增一些图片,视频或者内容,也可以对标题进行再次编辑。总之,要让Baiduspider再次过来爬行的时候,返回的状态码不是一个无变化的状态吗,这样你的页面被收录的几率就大大的提升了。

三、检查robots设置,看是否主动屏蔽蜘蛛Robots的设置也是非常重要的,这个很多人可能对这些还不了解。大家可看这篇文章《》,这里面有详细的教程说明,我就不再啰嗦了。若是自己robots设置的问题,那么自己进行纠正后,再在百度站长工具后台里面进行更新robots这样的话好让百度蜘蛛重新更改状态。
四、页面是否存在敏感词汇如今,很多词对搜索引擎来说都有一定的敏感,敏感词很有可能造成的页面不被收录,有时候也会造成网站被将去或被k。所以站长们再建设内容的时候一定要注意不要在文中出现敏感词。
五、页面内容是否存在采集及无价值内容百度在算法中明确表明,过多的采集会被百度认为是垃圾站。建议,提交些有价值、以用户需求为目的的内容。
网站本身原因:网站原因又分为几种:
1、新网站未收录。如果是由于新网站的原因未收录是很好处理的,主要继续坚持原创并做一些外链来吸引蜘蛛,就会很快被收录了;
2、网站被K或者降权了。如果网站被K了或者降权了,收录肯定是会受到影响的。最直接的影响就是网站的文章不收录,这是降权比较严重的情况;
3、网站有被降权的迹象。
网站内容原因

一、质量不高,相关性不高

二、与网络上的现有文章重复度高
网站内页不被收录分析步骤
1、看网站时间。网站时间,不是指域名时间而是从网站第一天文章算起的时间,如果网站才一两月,网站收录低是很正常现象。因为网站并没有在百度哪里获得足够的综合页面评比很高的分数。这是蜘蛛来抓取网站内容,停留的时间很少,很多页面没有抓取到就走了。导致新的页面没有抓取到,应该把网站首页和内页进行一下外链,吸引蜘蛛来抓取,增加蜘蛛停留时间。

2、网站是否最近一段时间改动过。对于一个不算是新站的网站来说,不收录的原因,很可能最近时间网站进行改动,这里的改动并不是进行大规模的改版。也是经常性对网站标签进行调整。现在遇到这样的原因,增加网站h1标签,导致内页抓取呈现出来的搜素结果一样,去掉h1标签,并且进行其他标签的删除,导致网站不收录,这种后果可能导致网站的降权,从而导致不收录。

3、频繁提交未收录页面。我们知道网站内容页收录,涉及到搜索引擎最基本的原理,那就是爬行,抓取,建立索引,收录等过程。这原本是搜索引擎一种主动行为,但是人为每天提交网站,导致搜索引擎信任度下降,也会减少收录和展示机会。

4、网站重复率高,完全采集。刚开始百度对于新站来说,根本不知道网站情况。打个比方,例如我把你介绍给另外一个人,前期我可能只知道你叫什么?不知道性格,能力等其他情况。这是搜索引擎也是一样,前期知道你首页的标题(title),只能接下来全面考察网站,然后判断出你网站是垃圾站还是良好的网站。如果你网站一直采集,这样搜索引擎就会发现你网站内容和别的内容一样。就会好感度降低,想想好感度降低搜索引擎还愿意给网站内容呈现。

至于其他一些情况,网站结构和服务器情况等,对于企业站和小网站来说,这种情况一般不会很常见。很简单,在做网站之前,公司程序员都会把结果给调整好,服务器也不会经常更换。因此,我们网站如果收录可以从这四个方面简单着手,看下网站是否存在这种情况。如果存在,改正过来,观察一段时间,网站就会开始收录,总收录量慢慢就会上升。
唯有高质量的原创内容才能真正地提升网站的权重与排名,那么如果你网站的内容大多都是采集的,根本没有原创性可言,自然搜索蜘蛛就会觉得你的内容没有任何价值,不给以收录也是很正常的。

网站页面不被收录的原因是什么

1、网站内容多次重复

这一个是绝大多数文章不被搜索引擎收录的原因,所以我把它放在第一位,虽然这个是老生常谈的话题了,但是我还是想给各位手里有低权重的站长说一下。

因为我相信绝大部分的站长每天都在做这件事,随便把几篇主题相同的文章混合在一起,这就是一篇文章了,这种做法可能对高权重的网站没有任何负面影响,相反可能会提高他的权重。

但是相对于低权重的网站,这中做法只会降低搜索引擎对你的网站的信任,就好像花粉,对于有些人可以优化一下空气质量,但是对于一些人只会令他出现病状。

对于一些低权重的老网站,内容重复是导致文章不收录的一大因素。

2、文章格式不乱、层次不分明

这个是很多人忽略的问题,有时候看到一篇的文章,一段都有五六百字,阅读起来非常疲劳,有很多人都在用采集工具去寻找文章,采集以后,就只是替换几个字就搬上去了,往往文章带有之前的格式,或者段落错乱,文章出现大量的空白。

对于这些问题,搜索引擎是很容易识别的,如果文章的格式不好,层次不分明也会认为这篇文章质量度不高,用户不喜欢,所以他也会减慢收录的速度或者不收录。

3、网站的内容是否被大量采集

这点是很常见的网站突然不收录的原因,如果你网站没有进行更新改版,突然碰到不收录的况,那很有可能是因为你的文章被很多采集,而采集你文章的网站页面权重又比较高,这就会让百度产生疑惑,对你网站要进行审核,看看你的文章是不是自己原创的(对于如何防止文章被采集的技巧,大家可通过《有效防止文章被复制采集的方法技巧》的相关介绍来详细了解)。

4、文章内容不够新颖,缺少差异性

现在有很多网站优化人员都非常喜欢深度伪原创,但是这种文章在一定的情况下,其收录速度没有那些内容新颖的文章那么快。

因为深度伪原创只是换汤不换药,大家都在做“回锅肉”,就好像我们每天都吃一道菜,就算是山珍海味都会有腻的一天,再说搜索引擎都吃那么多年了,如果你换一下菜式,保证搜索引擎可以“秒杀”你。

再说了,搜索引擎收录并不只是收录你的文章内容,他是收录你整个文章的页面,就像一篇相同的文章会被多次收录,那是因为发布这篇文章的页面都不相同,每个网站设计的文章页面必须要有差异性,不要单独的就是文章的内容,其他什么东西都没有。

对此,建议你也可以查考哪些收录好的网站,内容页是如何设计的,有推荐文章,推荐阅读等等之内的,来提高文章页面与其他网站的差异性。

5、网站近期有大规模的文章更新

如果你的网站近段时间内有大规模的更新,突然停止收录是正常的,百度要重新对你的网站进行评判,如果是这样,你只要做好站内文章的更新和稳定的外链,制定一个稳定的网站内容建设方案(具体可查看《网站内容建设的6大策略》的相关介绍),等待百度反应过来即可。

6、文章出现敏感词

现在百度已经加大人工对文章收录的审核,这种做法应该就好像是谷歌快讯哪样,当网络哪里出现敏感词,百度内部的相关人员就会去进行人工审核,甚至文章出现敏感词,就直接被搜索引擎排斥,没有进行收录,甚至会影响网站的权重。

些人看到互联网上很多无所顾忌的言语,但是说的很在理,又或者是发表在了一些比较大的平台上,因而不但被收录了,而且支持的人也很多,有些网站编辑就会依样画葫芦,就在自己网站上也发布此类文章。

但是别忘了,我们的网站只是万千网站中一个,要依靠搜索引擎来获得微小的权重与流量,我们根本无法与那些大型的门户网站或者是新闻类网站相提并论,因此,觉得对于敏感字眼的使用还是要小心加小心,最好不用,不然,就不能怪蜘蛛不收录你的文章了。

7、高质量外链过少

即使你的网站已经运营了一两年了,可网站的文章页面的外链如果很少,或者没有,那么也会导致文章没有被收录,或者收录很慢。

这主要的原因可能就是网站的外链广泛度太低,链接质量度太低,搜索引擎难以找到你,这时要考虑把网站登录到知名分类目录,或多做一些高质量链接。

8、网站的友情链接影响收录

对于友情链接的交换我们一定也要慎重,就好比交友不慎很容易拉你下水,当然只是少数,我们应对我们的友链每周进行统计,然后进行数据观察,对方的外链,对方排名,收录是多了还是少了。

如果你的友链被牵连降权或者你的友链降权那么抱歉你也会被一起受到惩罚,在惩罚期间内你同样会出现快照慢,收录少的情况,所以做好友链检查也每周例行的工作。

如果搜索引擎爬去到你的友情链接的网站,搜索引擎蜘蛛也可以通过对方链接你的原因,从而爬去到你的网站,收录你的页面。

9、搜索引擎蜘蛛爬取的频繁度

一个网站收录的快与否,根本原因就是搜索引擎蜘蛛爬取的频繁度,这个对网站文章收录非常的最重要。

可能有人会反驳说:文章的原创度才是最重要的,只要文章的原创度高,搜索引擎蜘蛛就会立马收录的。

那么,针对这个疑问,我先问下大家一个问题,一些高权重的论坛或博客里面的文章就算没有原创度,是直接复制的文章,为什么也一样被百度收录呢?而且还是秒收?

其实很简单,做站时间长的站长都应该知道,当网站的更新越频繁,那么吸引的蜘蛛也就越多,其实我们就算是做外链也都是有吸引蜘蛛的目的,当网站每天都有在更新的时候,蜘蛛对于你的网站爬取的频率就会提高,而蜘蛛爬取的频率越高,你的文章被收录的也就越多。

但也并不是说搜索引擎蜘蛛越多越好,这点我曾在《抓取网站的搜索引擎蜘蛛是不是越多越好》的一文中跟大家做过详细的介绍,在此就不多说了。

10、网站优化过度

优化过度说的最明显的莫过于关键词堆砌,好比一个人吃保健品,吃多了也会成为毒药,因为你无法消化,肯定会造成体内营养过剩,优化过度还存在于站内链接过多,已经过度导致页面权重分散,而最终你的首页权重平平,会出现收录降低也是很正常的事情,另外,网站挂黑链,网站做多重镜像,有的时候甚至为了迎合用户体验,加了很多图片,很多FLASH,压根没什么收录价值可言,抱歉搜索引擎不认识你,也不会收你的。

11、网站被降权

如果文章质量过关,那么还是长时间不被收录,只有一个答案,唯一的解释就是,网站被降权了,请检查网站,是否有被降权的征兆(具体可查看《如何分析网站是否真的被降权惩罚及解决方法》的相关介绍)。

这是文章不收录最常见的一种原因,网站降权后,网站有可能会暂停收录,因为搜索引擎对这个网站不信任,重点对他审核。

12、网站权重高低影响收录

如果是一个新网站,就算你的网站前面几点都做的很好,文章写的很好,原创也有价值,毕竟你是新站,权重不高,搜索引擎也不会收录你的文章。

所以你必须努力提高自己网站的权重,才能够彻底解决收录的问题。

13、网站中途改版

网站已经运营了一两年之后,感觉现在的模板不够好,于是就对网站进行全面改版,也会导致网站文章短暂的不收录。

对于网站改版后,网站内容出现不收录,很大可能是因为网站的程序换掉了,并且链接都发生了改变,这种大变动的改变必然会致使网站出现快照不更新、内容不被收录,网站排名全线下降的情况。

比如说,网站之前收录的链接是动态id生成的,改版后网站采用了静态生成页面链接,瞬间网站由动变静,并且链接全都换掉,那么搜索引擎收录了的页面就会出错。

搜索引擎是以收录的页面来识别网站的,如果突然发现你的网站变了一个样,搜索引擎就得对你的网站重新认识,从而把你的网站拉入考核期,看你的网站是否存在异常。

14、网站空间或服务器突然不稳定了

当搜索引擎通过其他外链达到网站的时候,发现网站访问不了,那么他就会扫兴而回。这好像一个老朋友想到你家做客,他去到家门口的时候,他敲了半天的门都没有人你都没有出来迎接他,这时候不要说不收录了,没有降权就已经很不错了。

所以在网站建设前期,一定要选一个稳定的网站空间,千万不要因为一点便宜,而丧失长久的利益,想想看,如果百度经常打不开,他会发展到今天这规模吗?

在这点上,你要记得每天检查自己的服务器信息,把看iis日志养成一种习惯。

15、搜索引擎新算法更新

另外,还有一种原因就是因为搜索引擎新算法的更新,有时候,因为搜索引擎新算法、新规则的出台,我们的网站又违背了新算法的规则,也会导致网站短期的不收录,或者直接被降权。

对于这种原因导致的不收录文章,只要我们根据搜索引擎新算法的规则,将网站完善或改进一下,很快就恢复了。
1、网站整体权重低、2、内页权重低、3、网站内页质量低、4、网站内页样板文字太多,页面相似度太大。
原创,原创,原创,重要的事说三遍。

网站不收录的原因汇总及解决方法?

SEO
第一,前往一些高收录的网站发一些引导链接,引导搜索引擎蜘蛛前来爬抓。
第二,查看目前网站空间服务器是否稳定、网站程序是否设置了权限、页面状态码是否正常等,导致搜索引擎蜘蛛无法正常爬抓。
一般通过日志和监控服务器的软件可以了解这些。另外,目前搜索引擎站长平台推出了抓取诊断工具,可以帮助我们了解搜索引擎在抓取的时候的抓取情况,从而解决该问题。
第三,网站内容是否违反了国家法律,导致网站不被搜索引擎收录。
如果是,则立即即可解决收录问题。
第四,网站由于作弊等,被搜索引擎惩罚,导致不收录。
解决办法:删除作弊行为。
第五,网站删除了大量内容,导致网站内部存在大量404页面,从而导致了网站不收录。
解决办法:
(1)恢复删除内容;
(2)提交网站404给搜索引擎,提高网站抓取频次,从而加速搜索引擎识别404的速度,加快收录。
第六,网站内部做相关内部链接和sitemap网站地图,让搜索引擎多次爬抓相关数据,从而引导搜索引擎收录。
第七,添加自动提交和主动提交等提交给搜索引擎数据的代码,帮助收录。
搜外网seo优化收录减少的8个常见原因和解决办法总结:
(1) 网站作弊 原因: 比如堆积关键字,隐性文字等等。如果出现这样的情况,百度就算已经收录了你,别庆幸自己蒙混过关,因为在更新的时候也会慢慢剔除的。
(2) 网站规范 原因:标题和关键词(KeyWords)过多,有的站长喜欢把搜索相关的关键字都放进去,你放一万个也没用的。还有就是描述(Description)不合理,如果你是新站,这个绝对有用的,要设置好。 解决方法:标题里留三四个关键字足够了,太多了百度不喜欢。建议设置为页面主题+专题名+网站名。至于关键词,你加上了没关系,但是至少页面应该出现点相关内容吧。描述的设置很简单,只要语言通顺,对页面做个大概的总结,出现两三次关键字就足够了。
(3) 网站质量 原因: 内容几乎全部采集来的,而且是采集的很热门的文章。百度突然会收录你几千页,但是百度收录后,在一定时间内,会重新检索,如果你内容没有价值的话,被丢弃。 解决方法:采集后,稍微修改一下再发布。不要太懒,你动动手,把文章简单浏览一下,更改段落或者部分内容,至少有点和别人不一样的地方。原创的多了最好,另外在页面留个版权信息。
(4) 网站连接 原因:网站缺少外部连接,或者外部连接逐渐减少,百度对你站的重视当然也会降低,慢慢的减少收录内容。连接的质量是很重要的。垃圾连接宁可不要!另外,检查你的页面,如果有连接指向被封的站,百度会把你当作帮助犯的。 解决方法: 检查网站外部连接,少的话就去交换,或者去一些大站大论坛发点能引起别人兴趣的帖子,留下连接。回复的人越多,效果越好。 如果站内有连接指向被封的站,尽快删除。
(5) 网站改版 原因: 网站没有修改好,就已经提交到百度,动不动来个大变化,大更新,今天这样,明天那样。分类和标题换来换去。还有时候出现测试,或者其他和网站无关的内容。 解决方法:定位好,要做什么站就坚持下去。可以增加新的分类和内容。老的内容最好不要胡乱删除。如果你更换空间的换,最好提前换。保证在一段时间内以前的空间内容继续存在,以防万一。
(6) 网站空间 原因:网站空间不稳定,动不动打不开网站,百度连续两次以上更新都无法抓到相信信息,那么你肯定要被从数据库清理,因为百度以为你的站已经关闭,或者相关页面不存在了。还有一个就是,你IP上多次出现作弊站点,跟着倒霉了。 解决方法:买空间时候注意,找点信誉好的IDC。别光为了便宜,如果经常出问题,别说百度了,网民也承受不了。毕竟你的站不会引起百度重视。另外,买空间时候时候检查一下虚拟主机IP上的站点,和收录情况,以及被封闭站点的数量。
(7) 网站安全 原因: 自己的站点上加了恶意代码或者故意挂马的话,百度能分析的出来。会降低你的信任度。还有就是被那些小黑客用工具入侵,修改或者删除了大部分页面。 解决方法: 定期备份,出现问题及时解决。一般百度更新都是夜里勤快。对个人站每天更新的不多。如果一旦不正常,立刻处理,应该可以避免的。
(8) 网站优化 原因:对SEO有一定的了解,就刻意的修改,网站做出来,过度优化,虽然没有明显作弊,但是根本没有任何价值。虽然通过百度可以得到流量,毕竟网站做出来是提供给别人浏览的,如果你回头率过低,也不行。百度不是一直提倡所谓的用户体验嘛。 解决方法:不要过分优化,SEO的本质是为搜索引擎服务,不是欺骗。万事把握个度。
本文标题: 网站文章不被收录的原因有哪些
本文地址: http://www.lzmy123.com/qingganmeiwen/268495.html

如果认为本文对您有所帮助请赞助本站

支付宝扫一扫赞助微信扫一扫赞助

  • 支付宝扫一扫赞助
  • 微信扫一扫赞助
  • 支付宝先领红包再赞助
    声明:凡注明"本站原创"的所有文字图片等资料,版权均属励志妙语所有,欢迎转载,但务请注明出处。
    有哪些特别治愈的文章推荐有什么华丽而又清雅的文章吗
    Top