2015年9月16日 星期三

搜尋引擎工作原理-關鍵字查詢-查詢流程

關鍵字查詢


在計算完所有頁面權重後,搜尋引擎就可以向使用者提供資訊查詢的服務。搜尋引擎查詢功能的實現非常複雜,用戶對返回結果的時間要求也非常高(通常是秒級),要在這麼短時間完成這麼複雜的計算是很不現實的,所以,搜尋引擎需要透過一套高效率的機制來處理。

這主要包含:
  • 在用戶發出查詢請求前就完成查詢關鍵字的反向索引、相關頁面權重計算等工作。
  • 為那些查詢最頻繁的關鍵字對應的頁面排序清單建立快取機制。

1.查詢流程

(1):先對用戶提供的查詢準則進行切詞,並刪除查詢準則中沒有意義的字或詞。例:“的” “得”等停用詞。

(2):再以切詞結果作為條件在關鍵字反向索引清單中進行匹配。

(3):如果存在匹配結果,則把所有與關鍵字相匹配的頁面URL組成一個清單。

(4):最後,把匹配的頁面按照權重從高到低排序,並返回給用戶。

其中(3)、(4)在此用者查詢之前已經完成。
查詢處理流程示意圖



目的:知道查詢是這樣的流程,那我們在實作上是不是就盡量接近這樣的流程走!
                            
大原則就是簡單易懂,讓搜尋引擎抓取到後能快速分析,為網站(頁面)進行建立列表易找取。






每天學一點快樂輕鬆學~
「往上走的人沒時間往後看,因為你不會發現你們正在拉開差距。」



沒有留言:

張貼留言