這是SEO基礎(chǔ)知識(shí)第2篇:搜索引擎是如何工作的?
那么,什么是搜索引擎?它是如何工作的呢?今天,我們了解下搜索引擎的基本運(yùn)作原理。
什么是搜索引擎?
簡(jiǎn)單來(lái)說(shuō),搜索引擎是一種在線查找工具,幫助我們?cè)诨ヂ?lián)網(wǎng)上找到想要的信息。
提到搜索引擎,大家可能首先想到的是谷歌(Google)。
谷歌(Google)在全球搜索引擎市場(chǎng)中占據(jù)了很大的份額,可以說(shuō)是最受歡迎的搜索引擎之一。
來(lái)源:statcounter
但是,除了谷歌,市面上還有很多其他的搜索引擎,但它們的工作原理大致相同。
搜索引擎如何工作?
要提升網(wǎng)站在搜索引擎中的排名,首先要了解搜索引擎是如何工作的?
每個(gè)搜索引擎都有自己獨(dú)特的算法,我們以谷歌為例,了解它的工作機(jī)制。
谷歌(Google)的搜索引擎工作流程可以分為三個(gè)主要步驟:
1.抓取
首先,谷歌需要找到互聯(lián)網(wǎng)上的網(wǎng)頁(yè)。
由于網(wǎng)絡(luò)上沒(méi)有統(tǒng)一的網(wǎng)頁(yè)目錄,谷歌需要通過(guò)兩種方式來(lái)發(fā)現(xiàn)新網(wǎng)頁(yè):
鏈接發(fā)現(xiàn):如果一個(gè)網(wǎng)頁(yè)被其他網(wǎng)頁(yè)鏈接,谷歌就可以順著這些鏈接找到新的頁(yè)面。
網(wǎng)站主動(dòng)提交:網(wǎng)站管理員可以通過(guò)提交網(wǎng)站地圖,告訴谷歌哪些網(wǎng)頁(yè)需要被抓取。
一旦谷歌發(fā)現(xiàn)了網(wǎng)頁(yè),它就會(huì)派出Googlebot(也叫爬蟲或蜘蛛)來(lái)訪問(wèn)這些頁(yè)面。
爬蟲就像一個(gè)網(wǎng)頁(yè)閱讀器,能夠讀取并解析網(wǎng)頁(yè)內(nèi)容。
不過(guò),要注意在抓取過(guò)程中,Googlebot有時(shí)會(huì)遇到一些問(wèn)題,導(dǎo)致我們的網(wǎng)頁(yè)無(wú)法被抓取。
比如
-我們的網(wǎng)站服務(wù)器可能出現(xiàn)故障
-我們的網(wǎng)絡(luò)連接可能不穩(wěn)
-或者網(wǎng)站設(shè)置了訪問(wèn)限制
這就是谷歌(Google)如何發(fā)現(xiàn)和了解網(wǎng)頁(yè)內(nèi)容的第一步。
2.索引
抓取網(wǎng)頁(yè)后,谷歌(Google)會(huì)對(duì)網(wǎng)頁(yè)進(jìn)行分析,理解頁(yè)面的內(nèi)容。這一過(guò)程稱為索引。
谷歌(Google)會(huì)讀取網(wǎng)頁(yè)的標(biāo)題、正文、圖片、視頻等信息,并處理網(wǎng)頁(yè)上的關(guān)鍵詞和其他重要元素。
同時(shí),谷歌(Google)還會(huì)記錄很多關(guān)于網(wǎng)頁(yè)的信息,比如:
這個(gè)網(wǎng)頁(yè)是用什么語(yǔ)言寫的
是針對(duì)哪個(gè)國(guó)家或地區(qū)的用戶
網(wǎng)頁(yè)在不同設(shè)備上是否好用
這些收集到的信息會(huì)被存儲(chǔ)在谷歌(Google)的大型數(shù)據(jù)庫(kù)中。
但并不是所有的網(wǎng)頁(yè)都會(huì)被索引,以下情況可能導(dǎo)致我們的網(wǎng)頁(yè)被排除在外:
-內(nèi)容質(zhì)量較差;
-網(wǎng)站明確標(biāo)明不希望被索引;
-網(wǎng)站設(shè)計(jì)問(wèn)題,導(dǎo)致谷歌無(wú)法理解頁(yè)面內(nèi)容。
簡(jiǎn)單來(lái)說(shuō),這個(gè)階段就是谷歌(Google)在理解和整理它找到的網(wǎng)頁(yè)內(nèi)容,為之后能在搜索結(jié)果中展示這些內(nèi)容做準(zhǔn)備。
3.呈現(xiàn)搜索結(jié)果
當(dāng)我們或者用戶在搜索框輸入內(nèi)容時(shí),谷歌(Google)會(huì)根據(jù)很多因素來(lái)決定向我們展示什么結(jié)果:
會(huì)考慮我們?cè)谀睦锼阉?/p>
用的是什么語(yǔ)言
是用手機(jī)還是電腦在搜索
比如說(shuō),同樣搜索"自行車維修店",在北京和在廣州看到的結(jié)果肯定是不一樣的。
搜索結(jié)果的展示方式也會(huì)根據(jù)搜索內(nèi)容的不同而改變。有時(shí)候會(huì)顯示地圖,有時(shí)候會(huì)顯示圖片,這都取決于谷歌(Google)判斷什么樣的展示方式最適合我們的搜索需求。
有時(shí)候一個(gè)網(wǎng)頁(yè)雖然已經(jīng)被Google收錄了,但在搜索結(jié)果中卻看不到,主要有這么幾個(gè)原因:
-這個(gè)網(wǎng)頁(yè)的內(nèi)容跟搜索的內(nèi)容不相關(guān)
-網(wǎng)頁(yè)內(nèi)容質(zhì)量不夠好
-網(wǎng)站設(shè)置了不允許展示的規(guī)則
總的來(lái)說(shuō),這個(gè)過(guò)程是自動(dòng)的,也是動(dòng)態(tài)變化的,目的是為了給用戶提供最好的搜索體驗(yàn)。
總結(jié)一下,Google的工作過(guò)程就是這樣:
先抓取網(wǎng)頁(yè),再對(duì)網(wǎng)頁(yè)進(jìn)行索引,然后根據(jù)我們的搜索請(qǐng)求選出最相關(guān)的結(jié)果展示給我們。