Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 18视频在线观看,亚洲免费在线视频播放,天天干天天拍天天操

          整合營(yíng)銷(xiāo)服務(wù)商

          電腦端+手機(jī)端+微信端=數(shù)據(jù)同步管理

          免費(fèi)咨詢(xún)熱線:

          什么是搜索引擎?有什么作用?

          導(dǎo)讀:我們現(xiàn)在正處在一個(gè)信息過(guò)載的時(shí)代。

          全世界每年產(chǎn)生1EB到2EB (1EB≈1018B)信息,相當(dāng)于地球上每個(gè)人每年大概產(chǎn)生250MB信息。其中,紙質(zhì)信息僅占所有信息的0.03%。

          靜態(tài)網(wǎng)頁(yè)有上百億,動(dòng)態(tài)及隱藏網(wǎng)頁(yè)至少是靜態(tài)網(wǎng)頁(yè)的500倍。Tom 認(rèn)為人的大腦只能存儲(chǔ)約200MB信息,一生只能接觸約6GB信息。

          近些年,大數(shù)據(jù)技術(shù)的出現(xiàn)及發(fā)展、深度學(xué)習(xí)以及神經(jīng)網(wǎng)絡(luò)計(jì)算能力的提高,加速提高了我們對(duì)信息的處理能力,但是并沒(méi)有緩解信息過(guò)載給我們?cè)斐傻挠绊憽?a style='color:#0000CC;font-size:16px;' href='http://www.jungjaehyung.com/content-3292-24538-1.html' title='搜索引擎的分類(lèi)及其工作原理' target='_blank'>搜索引擎成為我們獲取信息的主要手段之一

          在這里插入圖片描述

          01 什么是搜索引擎及搜索系統(tǒng)

          信息檢索( ,IR)是從文檔集合中返回滿(mǎn)足用戶(hù)需求的相關(guān)信息的過(guò)程。它是一門(mén)研究信息獲取()、表示()、存儲(chǔ)(Storage)、組織()和訪問(wèn)(Access)的學(xué)科。

          檢索來(lái)自,有些人把它翻譯成獲取,本義是獲得與輸入要求相匹配的輸出。

          而搜索來(lái)自Search,指帶有目的性地尋找。信息檢索不僅僅是指搜索,信息檢索系統(tǒng)(IR System)也不僅僅是搜索引擎。

          搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,將用戶(hù)檢索到的相關(guān)信息展示給用戶(hù),為用戶(hù)提供檢索服務(wù)。

          搜索引擎包括4個(gè)接口,分別是搜索器、索引器、檢索器、用戶(hù)接口。

          具體的搜索引擎架構(gòu)示意圖如下所示

          在這里插入圖片描述

          搜索系統(tǒng)的概念可以從如下兩方面解釋。

          系統(tǒng)角度。從系統(tǒng)角度來(lái)看,搜索系統(tǒng)是一個(gè)更廣泛的概念,包括搜索引擎。具有相關(guān)性計(jì)算和分析的系統(tǒng)都可以歸為搜索系統(tǒng)。除了我們常說(shuō)的搜索引擎外,搜索系統(tǒng)還應(yīng)該包括外部支持的業(yè)務(wù)場(chǎng)景和應(yīng)用領(lǐng)域等特征。

          用戶(hù)角度。從用戶(hù)角度來(lái)看,搜索系統(tǒng)的輸出是對(duì)用戶(hù)需求的投射,因此我們?cè)谠O(shè)計(jì)搜索系統(tǒng)時(shí)需要觀察用戶(hù)對(duì)檢索結(jié)果的反應(yīng),除此之外,還得考慮相應(yīng)的應(yīng)用場(chǎng)景以及搜索工程。

          02 搜索引擎的發(fā)展史

          20世紀(jì)90年代,Tim Berners-Lee開(kāi)啟了互聯(lián)網(wǎng)時(shí)代,并使其獲得大規(guī)模發(fā)展。1990年,Tim Berners-Lee開(kāi)發(fā)出世界上第一個(gè)Web服務(wù)器和第一個(gè)Web客戶(hù)端,被命名為萬(wàn)維網(wǎng)(World Wide Web,WWW)。

          搜索引擎分幾類(lèi)_什么是搜索引擎?有哪些分類(lèi)?_搜索引擎分類(lèi)包括

          次年,世界上第一個(gè)WWW網(wǎng)站info.cern.ch成立,伴隨該網(wǎng)站成立的還有HTTP傳輸協(xié)議及相應(yīng)的HTML等Web服務(wù)技術(shù)的誕生。1993年,NCSA發(fā)明了第一個(gè)顯示圖片的瀏覽器Mosaic,隨后客戶(hù)端瀏覽器逐漸趨于成熟。這些技術(shù)為互聯(lián)網(wǎng)的快速發(fā)展奠定了基礎(chǔ)。

          互聯(lián)網(wǎng)的快速發(fā)展使得搜索引擎的出現(xiàn)成為必然。1990年,第一個(gè)互聯(lián)網(wǎng)搜索引擎Archie出現(xiàn),主要用于搜索FTP服務(wù)器上的文件。

          在用戶(hù)準(zhǔn)確輸入文件名的前提下,Archie可以準(zhǔn)確地告訴用戶(hù)該文件的位置。雖然Archie搜索的內(nèi)容不是網(wǎng)頁(yè),但工作原理與網(wǎng)頁(yè)搜索相似:自動(dòng)搜索信息資源、建立索引、提供檢索服務(wù)。

          1995年,Excite搜索引擎正式上線,它是早期流行的搜索引擎之一。Excite的出現(xiàn)可以追溯到1993年2月,起由是6名斯坦福大學(xué)生想通過(guò)分析字詞關(guān)系對(duì)互聯(lián)網(wǎng)的大量信息進(jìn)行有效檢索。

          Excite以概念檢索聞名,是搜索引擎技術(shù)—文本檢索的代表。文本檢索一般包括布爾模型、向量空間模型等,主要用于計(jì)算用戶(hù)查詢(xún)關(guān)鍵詞和網(wǎng)頁(yè)文本內(nèi)容的相似度。

          1995年4月,Yahoo正式成立。其由斯坦福大學(xué)博士楊致遠(yuǎn)和大衛(wèi)·費(fèi)羅創(chuàng)建。隨著訪問(wèn)量和收錄鏈接數(shù)的增長(zhǎng),Yahoo對(duì)互聯(lián)網(wǎng)上重要站點(diǎn)的目錄進(jìn)行分類(lèi)整理,迎合了用戶(hù)需求,從而得到快速成長(zhǎng)。

          Yahoo也成為“目錄導(dǎo)航”搜索引擎技術(shù)的代表。該技術(shù)提高了被收錄網(wǎng)站的質(zhì)量,但不便于擴(kuò)展且收錄網(wǎng)站數(shù)量較少。

          1998年9月,拉里·佩奇和謝爾蓋·布林共同創(chuàng)建Google公司,其以鏈接分析等新技術(shù)大幅度提高搜索質(zhì)量,成為占有搜索引擎市場(chǎng)份額最大的公司。

          Google是鏈接分析技術(shù)的代表,其充分利用網(wǎng)頁(yè)之間的鏈接關(guān)系,考慮網(wǎng)頁(yè)鏈入的數(shù)量和質(zhì)量,從而計(jì)算網(wǎng)頁(yè)的排名,提升搜索質(zhì)量。

          2000年1月,中國(guó)最大的搜索引擎公司百度成立,并一舉成為國(guó)內(nèi)最大的搜索引擎。目前,百度不再只是某一搜索引擎技術(shù)的使用,其試圖通過(guò)用戶(hù)查詢(xún)、地理位置以及歷史行為(搜索、點(diǎn)擊、瀏覽)去理解用戶(hù)此刻真正的需求。

          統(tǒng)計(jì)的2019年1月~12月全球搜索引擎市場(chǎng)份額中,Google占比高達(dá)92.63%,微軟的Bing和雅虎分別位居第二和第三,百度排在第四位。

          統(tǒng)計(jì)的2019年1月~12月中國(guó)國(guó)內(nèi)搜索引擎市場(chǎng)份額占比中,百度依靠本地化優(yōu)勢(shì),以67.51%的占比排在第一位,搜狗和神馬排在第二和第三。

          在互聯(lián)網(wǎng)快速發(fā)展的今天,信息正呈爆炸式增長(zhǎng),如何在信息過(guò)載的環(huán)境下快速有效地定位到目標(biāo)信息成為關(guān)鍵問(wèn)題。

          搜索是解決信息過(guò)載較為有效的方式。搜索引擎通過(guò)對(duì)互聯(lián)網(wǎng)資源整理和分類(lèi),并將其存儲(chǔ)在數(shù)據(jù)庫(kù)中為用戶(hù)提供查詢(xún)服務(wù),包括信息搜集、信息分類(lèi)、用戶(hù)查詢(xún)等。

          因此,作為互聯(lián)網(wǎng)網(wǎng)站和應(yīng)用的入口,搜索引擎的地位越來(lái)越重要。

          在這里插入圖片描述

          03 搜索引擎的分類(lèi)

          搜索引擎可以分為以下4類(lèi):全文搜索引擎、元搜索引擎、垂直搜索引擎、目錄搜索引擎。下面對(duì)這4類(lèi)搜索引擎進(jìn)行具體介紹。

          1. 全文搜索引擎

          什么是搜索引擎?有哪些分類(lèi)?_搜索引擎分幾類(lèi)_搜索引擎分類(lèi)包括

          計(jì)算機(jī)通過(guò)掃描文章中的每個(gè)詞,對(duì)每個(gè)詞建立索引,記錄詞匯在文章中出現(xiàn)的次數(shù)和位置信息。當(dāng)用戶(hù)進(jìn)行查詢(xún)時(shí),計(jì)算機(jī)按照事先建立好的索引進(jìn)行查找,并將結(jié)果反饋給用戶(hù)。按照數(shù)據(jù)結(jié)構(gòu)的不同,全文搜索可以分為結(jié)構(gòu)化數(shù)據(jù)搜索和非結(jié)構(gòu)化數(shù)據(jù)搜索。

          對(duì)于結(jié)構(gòu)化數(shù)據(jù),全文搜索一般是通過(guò)關(guān)系型數(shù)據(jù)庫(kù)的方式進(jìn)行存儲(chǔ)和搜索,也可以建立索引。

          對(duì)于非結(jié)構(gòu)化數(shù)據(jù),全文搜索主要有兩種方法:順序掃描和全文檢索。

          2. 元搜索引擎

          按照功能劃分,搜索引擎可以分為元搜索引擎(Meta Search Engine)和獨(dú)立搜索引擎( Search Engine)。

          元搜索引擎是一種調(diào)用其他獨(dú)立搜索引擎的搜索引擎,其能對(duì)多個(gè)獨(dú)立搜索引擎進(jìn)行整合、調(diào)用并優(yōu)化結(jié)果。獨(dú)立搜索引擎主要由網(wǎng)絡(luò)爬蟲(chóng)、索引、鏈接分析和排序等部分組成;元搜索引擎由請(qǐng)求提交代理、檢索接口代理、結(jié)果顯示代理三部分組成,不需要維護(hù)龐大的索引數(shù)據(jù)庫(kù),也不需要爬取網(wǎng)頁(yè)。

          元搜索引擎具體實(shí)現(xiàn)邏輯如下圖所示

          在這里插入圖片描述

          請(qǐng)求提交代理就是將請(qǐng)求分發(fā)給獨(dú)立搜索引擎。元搜索引擎可以按照用戶(hù)需求和偏好請(qǐng)求實(shí)際需要調(diào)用的獨(dú)立搜索引擎,該方式能夠有效提升用戶(hù)查詢(xún)的準(zhǔn)確率和響應(yīng)效率。

          檢索接口代理是將查詢(xún)內(nèi)容轉(zhuǎn)化成獨(dú)立搜索引擎能夠接受的模式,并且保證不會(huì)丟失必需的語(yǔ)義信息。結(jié)果顯示代理是元搜索引擎按照用戶(hù)的需求采用不同的排序方式對(duì)結(jié)果進(jìn)行去重、排序。元搜索引擎常用的排序方式有:相關(guān)度排序、時(shí)間排序、搜索引擎排序等。

          元搜索引擎的整體工作流程如下:

          3. 垂直搜索引擎

          垂直搜索引擎是針對(duì)某個(gè)行業(yè)的專(zhuān)業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,對(duì)特定人群、特定領(lǐng)域、特殊需求提供服務(wù)。它的特點(diǎn)是專(zhuān)業(yè)、精確和深入。垂直搜索引擎將搜索范圍縮小到極具針對(duì)性的具體信息。

          垂直搜索引擎的結(jié)構(gòu)與通用搜索系統(tǒng)類(lèi)似,主要由三部分構(gòu)成:爬蟲(chóng)、索引、搜索。但垂直搜索的表現(xiàn)方式與Google、百度等搜索引擎在定位、內(nèi)容、用戶(hù)等方面存在一定的差異,所以它不是簡(jiǎn)單的行業(yè)搜索引擎。

          用戶(hù)使用通用搜索引擎時(shí),通常是通過(guò)關(guān)鍵字進(jìn)行搜索,該搜索方式一般是語(yǔ)義上的搜索,返回的結(jié)果傾向于文章、新聞等,即相關(guān)知識(shí)。垂直搜索的關(guān)鍵字搜索是放到一個(gè)行業(yè)知識(shí)的上下文中,返回的結(jié)果是消息、條目。對(duì)于有購(gòu)房需求的人來(lái)說(shuō),他們希望得到的信息是供求信息而不是關(guān)于房子的文章和新聞。

          4. 目錄搜索引擎

          目錄搜索引擎是網(wǎng)站常用的搜索方式,類(lèi)似于書(shū)本章節(jié)目錄。該搜索方式是對(duì)網(wǎng)站信息整合處理并分目錄呈現(xiàn)給用戶(hù),整合處理的過(guò)程一般需要人工維護(hù),更新速度較慢,而且用戶(hù)需要事先了解網(wǎng)站的基本內(nèi)容,熟悉主要模塊,所以應(yīng)用場(chǎng)景越來(lái)越少。


          主站蜘蛛池模板: 国产精品一区二区三区高清在线| 一区二区三区免费电影| 中文字幕无线码一区2020青青| 精品无码人妻一区二区免费蜜桃 | 美女免费视频一区二区| 制服美女视频一区| 中文字幕日韩人妻不卡一区| 香蕉免费一区二区三区| 日韩在线视频一区二区三区| 超清无码一区二区三区| 久久综合亚洲色一区二区三区| 中文激情在线一区二区| asmr国产一区在线| 精品日产一区二区三区手机| 国产精品高清一区二区人妖| 色一情一乱一伦一区二区三区日本| 亚洲色欲一区二区三区在线观看| 麻豆一区二区三区精品视频 | 亚欧色一区W666天堂| 亚洲综合色一区二区三区| 国产福利电影一区二区三区,亚洲国模精品一区 | 日韩成人一区ftp在线播放| 中文字幕无线码一区| 国产大秀视频在线一区二区| 亚洲高清偷拍一区二区三区 | 国产精品香蕉一区二区三区| 丰满人妻一区二区三区视频| 亚洲Av无码一区二区二三区| 日韩精品无码久久一区二区三| 无码精品人妻一区二区三区人妻斩| 亚洲一区精品中文字幕| 国产精品一区二区四区| 亚洲一区二区三区免费在线观看| 老鸭窝毛片一区二区三区| 亚洲一区在线视频| 免费无码一区二区三区蜜桃| 日韩在线一区视频| 中文字幕一区二区三区5566| 熟女少妇丰满一区二区| 国产一区二区三区免费看| 日韩中文字幕一区|