搜尋引擎抓取策略
頁面抓取:
上篇SEO文章介紹"頁面抓取流程",相信讀者已經掌握了網站加快被搜尋引擎收錄的方法,接著我們就要談怎麼能提高網站中被收錄頁面的數量?這就是要從了解搜尋引擎收錄頁面的工作原理開始。
把網站頁面組成的集合看作勢一個有向圖,從指定頁面出發,沿著頁面中的連結,按某種特定的策略對網站中的頁面進行遍歷。
1.不停從URL列表中移出已經訪問過的URL,存儲原始頁面,同時提取原始頁面中的URL資訊。
2.再將URL分為功能變數名稱及內部URL兩大類,同時判斷URL是否被訪問過。
3.將未訪問過URL加入URL列表中,迴圈似掃描URL清單,直到URL資源耗盡為止。
沒有留言:
張貼留言