• <li id="0bn34"><legend id="0bn34"><th id="0bn34"></th></legend></li>

      <label id="0bn34"><mark id="0bn34"><strong id="0bn34"></strong></mark></label>
      <span id="0bn34"><optgroup id="0bn34"></optgroup></span> <label id="0bn34"><mark id="0bn34"><strong id="0bn34"></strong></mark></label>

      <rt id="0bn34"></rt>
      <span id="0bn34"><optgroup id="0bn34"><center id="0bn34"></center></optgroup></span>
      <li id="0bn34"><big id="0bn34"><listing id="0bn34"></listing></big></li>
      搜索引擎蜘蛛抓取份額是什么?抓取份額是由什么決定的?
      • 更新時(shí)間:2025-05-15 05:39:44
      • 開發(fā)經(jīng)驗(yàn)
      • 發(fā)布時(shí)間:3年前
      • 740

      一月份時(shí),Google新的SEO代言人Gary Illyes在Google官方博客上發(fā)了一篇帖子:What Crawl Budget Means for Googlebot,討論了搜索引擎蜘蛛抓取份額相關(guān)問(wèn)題。對(duì)大中型網(wǎng)站來(lái)說(shuō),這是個(gè)頗為重要的SEO問(wèn)題,有時(shí)候會(huì)成為網(wǎng)站自然流量的瓶頸。


      今天的帖子總結(jié)一下Gary Illyes帖子里的以及后續(xù)跟進(jìn)的很多博客、論壇帖子的主要內(nèi)容,以及我自己的一些案例和理解。

      強(qiáng)調(diào)一下,以下這些概念對(duì)百度同樣適用。


      什么是搜索引擎蜘蛛抓取份額?

      顧名思義,抓取份額是搜索引擎蜘蛛花在一個(gè)網(wǎng)站上的抓取頁(yè)面的總的時(shí)間上限。對(duì)于特定網(wǎng)站,搜索引擎蜘蛛花在這個(gè)網(wǎng)站上的總時(shí)間是相對(duì)固定的,不會(huì)無(wú)限制地抓取網(wǎng)站所有頁(yè)面。


      抓取份額的英文Google用的是crawl budget,直譯是爬行預(yù)算,我覺(jué)得不太能說(shuō)明是什么意思,所以用抓取份額表達(dá)這個(gè)概念。


      抓取份額是由什么決定的呢?這牽扯到抓取需求和抓取速度限制。


      抓取需求

      抓取需求,crawl demand,指的是搜索引擎“想”抓取特定網(wǎng)站多少頁(yè)面。決定抓取需求的主要有兩個(gè)因素。一是頁(yè)面權(quán)重,網(wǎng)站上有多少頁(yè)面達(dá)到了基本頁(yè)面權(quán)重,搜索引擎就想抓取多少頁(yè)面。二是索引庫(kù)里頁(yè)面是否太久沒(méi)更新了。說(shuō)到底還是頁(yè)面權(quán)重,權(quán)重高的頁(yè)面就不會(huì)太久不更新。


      頁(yè)面權(quán)重和網(wǎng)站權(quán)重又是息息相關(guān)的,提高網(wǎng)站權(quán)重,就能使搜索引擎愿意多抓取頁(yè)面。


      抓取速度限制

      搜索引擎蜘蛛不會(huì)為了抓取更多頁(yè)面,把人家網(wǎng)站服務(wù)器拖垮,所以對(duì)某個(gè)網(wǎng)站都會(huì)設(shè)定一個(gè)抓取速度的上限,crawl rate limit,也就是服務(wù)器能承受的上限,在這個(gè)速度限制內(nèi),蜘蛛抓取不會(huì)拖慢服務(wù)器、影響用戶訪問(wèn)。


      服務(wù)器反應(yīng)速度夠快,這個(gè)速度限制就上調(diào)一點(diǎn),抓取加快,服務(wù)器反應(yīng)速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取。所以,抓取速度限制是搜索引擎“能”抓取的頁(yè)面數(shù)。


      抓取份額是由什么決定的?

      抓取份額是考慮抓取需求和抓取速度限制兩者之后的結(jié)果,也就是搜索引擎“想”抓,同時(shí)又“能”抓的頁(yè)面數(shù)。網(wǎng)站權(quán)重高,頁(yè)面內(nèi)容質(zhì)量高,頁(yè)面夠多,服務(wù)器速度夠快,抓取份額就大。


      小網(wǎng)站沒(méi)必要擔(dān)心抓取份額

      小網(wǎng)站頁(yè)面數(shù)少,即使網(wǎng)站權(quán)重再低,服務(wù)器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個(gè)幾百頁(yè),十幾天怎么也全站抓取一遍了,所以幾千個(gè)頁(yè)面的網(wǎng)站根本不用擔(dān)心抓取份額的事。數(shù)萬(wàn)個(gè)頁(yè)面的網(wǎng)站一般也不是什么大事。每天幾百個(gè)訪問(wèn)要是能拖慢服務(wù)器,SEO就不是主要需要考慮的事了。


      大中型網(wǎng)站可能需要考慮抓取份額

      幾十萬(wàn)頁(yè)以上的大中型網(wǎng)站,可能要考慮抓取份額夠不夠的問(wèn)題。

      抓取份額不夠,比如網(wǎng)站有 1 千萬(wàn)頁(yè)面,搜索引擎每天只能抓幾萬(wàn)個(gè)頁(yè)面,那么把網(wǎng)站抓一遍可能需要幾個(gè)月,甚至一年,也可能意味著一些重要頁(yè)面沒(méi)辦法被抓取,所以也就沒(méi)排名,或者重要頁(yè)面不能及時(shí)被更新。


      要想網(wǎng)站頁(yè)面被及時(shí)、充分抓取,首先要保證服務(wù)器夠快,頁(yè)面夠小。如果網(wǎng)站有海量高質(zhì)量數(shù)據(jù),抓取份額將受限于抓取速度,提高頁(yè)面速度直接提高抓取速度限制,因而提高抓取份額。


      百度站長(zhǎng)平臺(tái)和Google Search Console都有抓取數(shù)據(jù)。如下圖某網(wǎng)站百度抓取頻次:

      上圖是SEO每天一貼這種級(jí)別的小網(wǎng)站,頁(yè)面抓取頻次和抓取時(shí)間(取決于服務(wù)器速度和頁(yè)面大小)沒(méi)有什么大關(guān)系,說(shuō)明沒(méi)有用完抓取份額,不用擔(dān)心。

      有的時(shí)候,抓取頻次和抓取時(shí)間是有某種對(duì)應(yīng)關(guān)系的,如下圖另一個(gè)大些的網(wǎng)站:


      可以看到,抓取時(shí)間改善(減小頁(yè)面尺寸、提高服務(wù)器速度、優(yōu)化數(shù)據(jù)庫(kù)),明顯導(dǎo)致抓取頻次上升,使更多頁(yè)面被抓取收錄,遍歷一遍網(wǎng)站更快速。

      Google Search Console里更大點(diǎn)站的例子:

      最上面的是抓取頁(yè)面數(shù),中間的是抓取數(shù)據(jù)量,除非服務(wù)器出錯(cuò),這兩個(gè)應(yīng)該是對(duì)應(yīng)的。最下面的是頁(yè)面抓取時(shí)間。可以看到,頁(yè)面下載速度夠快,每天抓取上百萬(wàn)頁(yè)是沒(méi)有問(wèn)題的。


      當(dāng)然,像前面說(shuō)的,能抓上百萬(wàn)頁(yè)是一方面,搜索引擎想不想抓是另一方面。

      大型網(wǎng)站另一個(gè)經(jīng)常需要考慮抓取份額的原因是,不要把有限的抓取份額浪費(fèi)在無(wú)意義的頁(yè)面抓取上,導(dǎo)致應(yīng)該被抓取的重要頁(yè)面卻沒(méi)有機(jī)會(huì)被抓取。


      浪費(fèi)抓取份額的典型頁(yè)面有:

      大量過(guò)濾篩選頁(yè)面。這一點(diǎn),幾年前關(guān)于無(wú)效URL爬行索引的帖子里有詳細(xì)討論。站內(nèi)復(fù)制內(nèi)容低質(zhì)、垃圾內(nèi)容日歷之類的無(wú)限個(gè)頁(yè)面上面這些頁(yè)面被大量抓取,可能用完抓取份額,該抓的頁(yè)面卻沒(méi)抓。


      怎樣節(jié)省抓取份額?

      當(dāng)然首先是降低頁(yè)面文件大小,提高服務(wù)器速度,優(yōu)化數(shù)據(jù)庫(kù),降低抓取時(shí)間。


      然后,盡量避免上面列出的浪費(fèi)抓取份額的東西。有的是內(nèi)容質(zhì)量問(wèn)題,有的是網(wǎng)站結(jié)構(gòu)問(wèn)題,如果是結(jié)構(gòu)問(wèn)題,最簡(jiǎn)單的辦法是robots文件禁止抓取,但多少會(huì)浪費(fèi)些頁(yè)面權(quán)重,因?yàn)闄?quán)重只進(jìn)不出。


      某些情況下使用鏈接nofollow屬性可以節(jié)省抓取份額。小網(wǎng)站,由于抓取份額用不完,加nofollow是沒(méi)有意義的。大網(wǎng)站,nofollow是可以在一定程度上控制權(quán)重流動(dòng)和分配的,精心設(shè)計(jì)的nofollow會(huì)使無(wú)意義頁(yè)面權(quán)重降低,提升重要頁(yè)面權(quán)重。搜索引擎抓取時(shí)會(huì)使用一個(gè)URL抓取列表,里面待抓URL是按頁(yè)面權(quán)重排序的,重要頁(yè)面權(quán)重提升,會(huì)先被抓取,無(wú)意義頁(yè)面權(quán)重可能低到搜索引擎不想抓取。


      最后幾個(gè)說(shuō)明:

      鏈接加nofollow不會(huì)浪費(fèi)抓取份額。但在Google是會(huì)浪費(fèi)權(quán)重的。noindex標(biāo)簽不能節(jié)省抓取份額。搜索引擎要知道頁(yè)面上有noindex標(biāo)簽,就得先抓取這個(gè)頁(yè)面,所以并不節(jié)省抓取份額。canonical標(biāo)簽有時(shí)候能節(jié)省一點(diǎn)抓取份額。和noindex標(biāo)簽一樣,搜索引擎要知道頁(yè)面上有canonical標(biāo)簽,就得先抓取這個(gè)頁(yè)面,所以并不直接節(jié)省抓取份額。但有canonical標(biāo)簽的頁(yè)面被抓取頻率經(jīng)常會(huì)降低,所以會(huì)節(jié)省一點(diǎn)抓取份額。抓取速度和抓取份額不是排名因素。但沒(méi)被抓取的頁(yè)面也談不上排名。

      我們專注高端建站,小程序開發(fā)、軟件系統(tǒng)定制開發(fā)、BUG修復(fù)、物聯(lián)網(wǎng)開發(fā)、各類API接口對(duì)接開發(fā)等。十余年開發(fā)經(jīng)驗(yàn),每一個(gè)項(xiàng)目承諾做到滿意為止,多一次對(duì)比,一定讓您多一份收獲!

      本文章出于推來(lái)客官網(wǎng),轉(zhuǎn)載請(qǐng)表明原文地址:https://www.tlkjt.com/experience/7495.html
      推薦文章

      在線客服

      掃碼聯(lián)系客服

      3985758

      回到頂部

      **肉体一级毛片| 花季传媒app下载免费观看大全 | mm1313亚洲国产精品无码试看 | 国产在线激情视频| 被男按摩师添的好爽在线直播| 国产在线一卡二卡| 麻豆视频免费看| 国产婷婷色综合av蜜臀av| 色多多福利网站老司机| 国产一区二区欧美丝袜| 精品久久久久久中文字幕女 | 精品三级久久久久电影网1| 午夜性色一区二区三区不卡视频| 色哟哟www网站| 国产99久久久久久免费看| 色哟哟国产精品免费观看| 国产一区二区三区在线免费 | 国产乱人视频在线播放| 精品国产三级v| 国产FREEXXXX性麻豆| 美女国产毛片a区内射| 午夜视频在线观看区二区| 狠狠久久精品中文字幕无码| 亚洲综合在线一区二区三区| 浪潮AV色综合久久天堂| 免费看黄色视屏| 男人扒开女人的腿做爽爽视频| 人人爽人人爽人人爽人人片av| 永久免费看bbb| 人与动人物欧美网站| 欧美人与z0xxx另类| 亚1州区2区三区4区产品| 无遮挡边吃摸边吃奶边做| 久久精品视频一区| 日韩不卡手机视频在线观看| 亚洲av永久无码精品秋霞电影影院| 日本护士取精视频xxxxx全部| 五月婷在线视频| 成人网站在线进入爽爽爽| 久久91精品国产91久久小草| 成人欧美日韩一区二区三区|