網(wǎng)站搜索引擎的分類及其技能架構(gòu)
來源:
www.woyoto.com.cn | 發(fā)布時間:2022年09月21日
2022年9月21日,
搜索引擎中各網(wǎng)站的有關(guān)信息都是從用戶網(wǎng)頁中主動提取的,所以用戶的視點看,我們擁有更多的自主權(quán);而目錄索引則要求有必要手藝別的填寫網(wǎng)站信息,而且還有各式各樣的約束。更有甚者,假如工作人員以為你提交網(wǎng)站的目錄、網(wǎng)站信息不合適,他能夠隨時對其進行調(diào)整,當然事先是不會和你商議的。
搜索引擎的分類
搜索引擎按其工作方式首要可分為三種:
分別是全文搜索引擎(Full Text Search Engine)
目錄索引類搜索引擎(Search Index/Directory)
元搜索引擎(Meta Search Engine)。
全文搜索引擎
全文搜索引擎是當之無愧的搜索引擎,國外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,國內(nèi)著名的有百度(Baidu)。它們都是經(jīng)過從互聯(lián)網(wǎng)上提取的各個網(wǎng)站的信息(以網(wǎng)頁文字為主)而樹立的數(shù)據(jù)庫中,檢索與用戶查詢條件匹配的相關(guān)記載,然后按必定的擺放次序?qū)⒊晒貋斫o用戶,因而他們是真實的搜索引擎。
從搜索成果來歷的視點,全文搜索引擎又可細分為兩種,一種是擁有自己的檢索程序(Indexer),俗稱“蜘蛛”(Spider)程序或“機器人”(Robot)程序,并自建網(wǎng)頁數(shù)據(jù)庫,搜索成果直接從本身的數(shù)據(jù)庫中調(diào)用,如上面提到的7家引擎;另一種則是租借其他引擎的數(shù)據(jù)庫,并按自定的格局擺放搜索成果。
當用戶以關(guān)鍵詞搜索信息時,搜索引擎會在數(shù)據(jù)庫中進行搜索,假如找到與用戶要求內(nèi)容相符的網(wǎng)站,便選用特殊的算法——通常依據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程度、出現(xiàn)的位置、頻次、鏈接質(zhì)量——核算出各網(wǎng)頁的相關(guān)度及排名等級,然后依據(jù)相關(guān)度凹凸,按次序?qū)⑦@些網(wǎng)頁鏈接回來給用戶。這種引擎的特點是搜全率比較高。
目錄索引
雖然有搜索功用,但嚴格意義上不能稱為真實的搜索引擎,僅僅按目錄分類的網(wǎng)站鏈接列表罷了。(更簡單說便是網(wǎng)址導(dǎo)航網(wǎng)站)
用戶完全能夠按照分類目錄找到所需求的信息,不依托關(guān)鍵詞(Keywords)進行查詢。目錄索引中最具代表性的莫過于大名鼎鼎的Yahoo、新浪分類目錄搜索。
目錄索引,顧名思義便是將網(wǎng)站分門別類地存放在相應(yīng)的目錄中,因而用戶在查詢信息時,可選擇關(guān)鍵詞搜索,也可按分類目錄逐層搜索。如以關(guān)鍵詞搜索,回來的成果跟搜索引擎一樣,也是依據(jù)信息相關(guān)程度擺放網(wǎng)站,只不過其間人為因素要多一些。假如按分層目錄搜索,某一目錄中網(wǎng)站的排名則是由標題字母的先后次序決議(也有例外)。