文章ID:213時(shí)間:2021-12-15人氣:
搜索引擎工作原理:
首先蜘蛛(spider)通過頁面上在超級(jí)鏈接關(guān)系,不斷的發(fā)現(xiàn)新的URL并抓??;
其次將爬行在數(shù)據(jù)存儲(chǔ)原始頁面數(shù)據(jù)庫;
再次進(jìn)行頁面分析,對(duì)頁面進(jìn)行初步分析(比如:標(biāo)題、頁面權(quán)重、鏈接深度等)對(duì)內(nèi)容進(jìn)行質(zhì)量分析;
在頁面分析的基礎(chǔ)上,對(duì)有價(jià)值的內(nèi)容建立索引;
最后匹配用戶檢索內(nèi)容,用戶檢索關(guān)鍵詞后 ,排名程序調(diào)用索引庫數(shù)據(jù),計(jì)算排名顯示給用戶;
了解到搜索引擎基礎(chǔ)工作原理,就更好的方便去我們?nèi)チ私馐珍浥c索引的區(qū)別了;
1,收錄和索引分別指什么
收錄:頁面被Baiduspider發(fā)現(xiàn)、分析過
索引:Baiduspider經(jīng)初步分析后認(rèn)為有意義,做建庫處理,站點(diǎn)中有多少頁面可以作為搜索候選結(jié)果,就是一個(gè)網(wǎng)站的索引量。
站點(diǎn)內(nèi)容頁面需要經(jīng)過搜索引擎的抓取和層層篩選后,方可在搜索結(jié)果中展現(xiàn)給用戶。頁面通過系統(tǒng)篩選,并被作為搜索候選結(jié)果的過程,即為建立索引。
目前site語法的數(shù)值是索引量估算值,比較不準(zhǔn)。推薦站長(zhǎng)們使用我們的新工具,同時(shí)我們也正在努力改進(jìn)site語法。
2,收錄和索引的關(guān)系
包含關(guān)系,先收錄才可以建索引,收錄量大于索引量。百度站長(zhǎng)平臺(tái)鏈接提交工具是通往收錄的大門。
3,收錄和索引的意義
【收錄意義1】收錄是索引的前提,站點(diǎn)需要保持服務(wù)器穩(wěn)定(參考抓取診斷工具、抓取異常工具)、robots正確(《robots寫法和需求用法對(duì)應(yīng)表》),為Baiduspider抓取鋪平道路
【收錄意義2】Baiduspider只能處理已分析過的頁面,面對(duì)新舊頁301和移動(dòng)適配,可為已收錄頁面完成權(quán)值評(píng)分以及流量切換
【索引意義1】只有被建入索引庫的網(wǎng)頁才有獲得流量的機(jī)會(huì)(網(wǎng)頁雖然被建入索引庫,但獲得流量的機(jī)會(huì)并不同,無效索引很難獲得流量)
【索引意義2】新聞源站點(diǎn)(新聞源目錄)內(nèi)的鏈接,必須先被網(wǎng)頁庫建索引,才有機(jī)會(huì)出現(xiàn)在新聞檢索中
4,如何查詢收錄量和索引量
目前百度未提供查詢收錄的工具,任何第三方提供的所謂收錄查詢都是不靠譜兒的。站長(zhǎng)可以通過LOG日志分析估算收錄,注意真假Baiduspider(《如何識(shí)別百度蜘蛛》)
真實(shí)索引量只能通過百度站長(zhǎng)平臺(tái)索引量工具查詢
目前有第三方開發(fā)的工具可以輔助分析索引中頁面的引流能力
內(nèi)容聲明:1、本站收錄的內(nèi)容來源于大數(shù)據(jù)收集,版權(quán)歸原網(wǎng)站所有!
2、本站收錄的內(nèi)容若侵害到您的利益,請(qǐng)聯(lián)系我們進(jìn)行刪除處理!
3、本站不接受違規(guī)信息,如您發(fā)現(xiàn)違規(guī)內(nèi)容,請(qǐng)聯(lián)系我們進(jìn)行清除處理!
4、本文地址:http://www.gootek.com.cn/article-213.html,復(fù)制請(qǐng)保留版權(quán)鏈接!
網(wǎng)站排名是很多小伙伴重視的事情,但是有時(shí)候就會(huì)遇到明明做了很多優(yōu)化手段,排名一直上不去,這讓很多小伙伴很困擾,其實(shí)是因?yàn)槲覀兒雎粤艘恍┲匾襟E。
最新資訊 2021-03-04 11:35:45