日照网络公司
扫描关注网站建设微信公众账号

扫一扫微信二维码

日照网站优化_搜索引擎抓取页面的方式

昊诺网络o2017-07-20 08:01:30o网络知识o

  常见的搜索引擎的抓取方式主要有广度优先、深度优先、大站优先、高权重优先、暗网抓取及用户提交等,接下来将详细介绍这几种页面抓取方式及其优缺点。

  广度优点
  如果把整个网站看作是一颗树,首页就是跟,每个页面就是叶子。广度优先是一种横向的页面抓取方式,先从树的较浅层开始住区页面,直接抓取完同一层的所有页面后才进入下一层。因此,在对网站进行优化的时候,我们应该把网站中相对重要的信息展示在层次较浅的页面上。因此,通过广度优先的抓取方式,搜索引擎就可以优先抓取到网站中相对重要的页面。

  深度优点

  与广度优先的抓取方式恰恰相反,深度优先是一种纵向的页面抓取方式,首先跟踪的是浅层页面中的某一个链接,从而逐步抓取深层次页面,直至抓取完深层的页面后才返回浅层页面继续向深层页面抓取。使用深度优先的抓取方式,搜索引擎可以抓取到网站中比较隐蔽、冷门的页面,这样才能满足更多用户的需求。

  大站优先

  由于大型网站比小型的网站更有可能提供更多更有价值的内容,因此,如果搜索引擎优先抓取大型网站中的网页,那么就可以在更短的时间内为用户提供更有价值的信息。大站优先,顾名思义就是对互联网中大型网站的页面进行优先抓取,是搜索引擎中的一种信息抓取策略。

  怎样识别所谓的大型网站呢?一是前期人工整理大站种子资源,通过大站发现其他的大站;二是对已经索引的网站进行系统的分析,从而识别那些内容丰富、规模较大、信息更新频繁的网站。
  在完成大站识别后,搜索引擎就会对URL资源列表中大站的页面进行优先抓取。这也是为什么大型网站往往比小站内容抓取更及时的原因之一。

  高权重优先

  权重,简单地说就是搜索引擎对网页重要性的一种评定。所谓的重要性归根到底就是网站或者网页的信息价值。

  暗网抓取

  暗网(又称作深网、不可见网、隐藏网)是指那些存储在网络数据库里、不能通过超链接访问而需要通过动态网页技术或者人工发起查询访问的资源集合,不属于那些可以被标准搜索引擎索引的信息。
  用户提交

 
为了抓取更多的网页,搜索引擎还允许网站管理员主动页面。网站管理员只需要把网站中页面的URL按照制定的格式制作成文件,提交给搜索引擎,搜索引擎就可以用过该文件对网站中的页面进行抓取及更新。
  这种由网站管理员主动提交页面的方式大大提高了搜索引擎抓取页面的效率,也大大增加了网站页面被抓取的数量。

  以上是日照网站优化公司(昊诺网络)分享,希望大家能够喜欢,想了解更多关于网站优化的知识请关注我们的网站动态!

文章关键词