概念
發(fā)展
隨著yahoo!的出現(xiàn),搜索引擎的發(fā)展也進(jìn)入了黃金時代,相比以前其性能更加優(yōu)越,F(xiàn)在的搜索引擎已經(jīng)不只是單純的搜索網(wǎng)頁的信息了,它們已經(jīng)變得更加綜合化,完美化了。以搜索引擎權(quán)威yahoo!為例,從1995年3月由美籍華裔楊致遠(yuǎn)等人創(chuàng)辦yahoo!開始,到現(xiàn)在,他們從一個單一的搜索引擎發(fā)展到現(xiàn)在有電子商務(wù)、新聞信息服務(wù)、個人免費(fèi)電子信箱服務(wù)等多種網(wǎng)絡(luò)服務(wù),充分說明了搜索引擎的發(fā)展從單一到綜合的過程。
缺陷
然而由于搜索引擎的工作方式和因特網(wǎng)的快速發(fā)展,使其搜索的結(jié)果讓人越來越不滿意。例如,搜索“電腦”這個詞匯,就可能有數(shù)百萬頁的結(jié)果。這是由于搜索引擎通過對網(wǎng)站的相關(guān)性來優(yōu)化搜索結(jié)果,這種相關(guān)性又是由關(guān)鍵字在網(wǎng)站的位置、網(wǎng)站的名稱、 標(biāo)簽等公式來決定的。這就是使搜索引擎搜索結(jié)果多而雜的原因。而搜索引擎中的數(shù)據(jù)庫因為因特網(wǎng)的發(fā)展變化也必然包含了死鏈接。
發(fā)展
在百度、Google、雅虎等主流搜索引擎愈發(fā)發(fā)展成熟以外,各類不同的搜索大全也在今日的互聯(lián)網(wǎng)逐漸興起。搜索大全即為集各種不同類型搜索引擎,涵蓋多語言于一身的搜索集合。該類搜索引擎大全的興起,讓搜索變得更加簡單。幾乎所有的內(nèi)容都能在“一頁之間”完成。比如風(fēng)靡一時的百google度,谷姐,比如新近出來的sou1sou等,就是將其它的搜索引擎的結(jié)果集合在一塊。
抓取網(wǎng)頁
處理網(wǎng)頁
搜索引擎抓到網(wǎng)頁后,還要做大量的預(yù)處理工作才能提供檢索服務(wù)。其中,最重要的就是提取關(guān)鍵詞,建立索引文件。其他還包括去除重復(fù)網(wǎng)頁、分析超鏈接、計算網(wǎng)頁的重要度等。
檢索服務(wù)
用戶輸入關(guān)鍵詞進(jìn)行檢索,搜索引擎從索引數(shù)據(jù)庫中找到匹配該關(guān)鍵詞的網(wǎng)頁;為了用戶便于判斷,除了網(wǎng)頁標(biāo)題和URL外,還會提供一段來自網(wǎng)頁的摘要以及其他信息。
如果你想在互聯(lián)網(wǎng)上本地區(qū)域?qū)ふ夷骋粯訓(xùn)|西或資料,可以在google、baidu或其他搜索器中輸入:某某產(chǎn)品名稱或資料名稱然后用逗號“,”再輸入所在地城市名稱,點擊搜索,這樣很多關(guān)于某城市相關(guān)產(chǎn)品或資料就出現(xiàn)。例如:某某產(chǎn)品,城市名稱;或某某資料名稱,城市名稱。