八寶粥的配料和做法(八寶粥的配料和做法大全) Activex控件無(wú)法安裝解決辦法(activex控件裝入失敗) 怎么趕上早上六點(diǎn)的飛機(jī)?(怎么趕上早上六點(diǎn)的飛機(jī)航班) 魚(yú)珠膠的作用是什么(魚(yú)珠膠是什么膠水) 過(guò)年的時(shí)候 給親戚朋友們拜年要注意些啥?(過(guò)年哪些親戚需拜年) 烤香腸的做法(臺(tái)式烤香腸的做法) 大月氏讀yue還是rou(大月像高達(dá)) 菏澤商標(biāo)注冊(cè)流程有哪些?(菏澤商標(biāo)注冊(cè)流程有哪些企業(yè)) 怎樣養(yǎng)成牛奶肌(怎樣養(yǎng)成牛奶肌?) 三年級(jí)語(yǔ)文閱讀理解訓(xùn)練題及答案(三年級(jí)語(yǔ)文閱讀) 如何破解無(wú)線路由密碼(如何破解無(wú)線路由密碼設(shè)置) 深圳獅王教育(獅王教育) 手機(jī)QQ怎么免費(fèi)設(shè)置聊天背景(手機(jī)qq怎么設(shè)置聊天背景全部一樣) 品管員工自我評(píng)價(jià)(品管員工作職責(zé)) 摧枯拉朽怎么解釋(摧枯拉朽的解釋是什么) 《世界第一等》尤克里里譜-吉他譜(世界第一等吉他簡(jiǎn)譜) 炒面的做法簡(jiǎn)單好吃(炒面的做法) 拉鏈拉不動(dòng)怎么辦、有什么妙招(拉鏈拉不動(dòng)怎么辦,有什么妙招可以解決) ps的羽化是怎么使用的(ps羽化有幾種方法) pixiv加速器哪個(gè)好用(加速器哪個(gè)好用) 男人補(bǔ)腎吃什么最好(男人補(bǔ)腎吃什么最好?) win7系統(tǒng)下劍靈客戶端BNS崩潰報(bào)告錯(cuò)誤的處理(劍靈總是客戶端錯(cuò)誤) 成功人生的標(biāo)記是什么(成功人生) usdt是什么幣(usdt是什么幣是哪個(gè)的) iTunes Store是什么 iTunes Store怎么用(itunes store是什么東西) chip away是什么意思(chip是什么意思) 美發(fā)編發(fā)發(fā)型(美發(fā)編發(fā)發(fā)型女) 古詩(shī)游子吟ppt課件(游子吟古詩(shī)圖片) 蘑菇怎么拼讀(蘑菇怎么拼讀音節(jié)) 武尸奪戰(zhàn)力指數(shù)(武尸) 歐倫堡皮鞋的保養(yǎng)護(hù)理(歐倫堡皮鞋的保養(yǎng)護(hù)理是什么) 漢化補(bǔ)丁怎么用(vray漢化補(bǔ)丁怎么用) 千元以上回音壁音響推薦(回音壁音響5 1推薦) 皮凍家常做法(皮凍家常做法視頻) 推薦幾個(gè)非常好聽(tīng)且適合睡覺(jué)聽(tīng)的鋼琴曲(推薦幾個(gè)非常好聽(tīng)且適合睡覺(jué)聽(tīng)的鋼琴曲子) 減肥器材抖抖機(jī)有用嗎(減肥器材) vs是什么意思(vs是什么意思 漢語(yǔ)) 創(chuàng)建在線考試需要用到什么軟件?(在線考試的軟件有哪些) 葫蘆絲吹奏方法技巧?(葫蘆絲吹奏方法) 練習(xí)倒立的好方法(練倒立的技巧) 油茶的做法(油茶的做法和功效與作用) 《口袋西游》游戲評(píng)測(cè)(《口袋西游》游戲評(píng)測(cè)怎么樣) 喝白酒有哪些好處?(喝白酒有哪些好處呢) 初三作文 華為手機(jī)文件夾加密碼如何設(shè)置(華為手機(jī)文件夾加密碼如何設(shè)置密碼保護(hù)) 黃花梨木圖片大全 黃花梨木鑒別技巧(黃花梨木的鑒別方法) 四面體的體積公式有哪些(四面體的體積公式) 侍弄怎么拼音(侍弄拼音怎么讀音) 移動(dòng)用戶網(wǎng)上怎么查詢?cè)捹M(fèi)賬單?(移動(dòng)用戶網(wǎng)上怎么查詢?cè)捹M(fèi)賬單余額) 國(guó)資委是干什么的(國(guó)資委是干啥的)
您的位置:首頁(yè) >要聞 >

什么叫垂直搜索引擎

導(dǎo)讀 垂直搜索是針對(duì)某一個(gè)行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是對(duì)網(wǎng)頁(yè)庫(kù)中的某類專門(mén)的信息進(jìn)行一次整合,定向分字段抽取出需要的數(shù)

垂直搜索是針對(duì)某一個(gè)行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是對(duì)網(wǎng)頁(yè)庫(kù)中的某類專門(mén)的信息進(jìn)行一次整合,定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶。 垂直搜索引擎和普通的網(wǎng)頁(yè)搜索引擎的最大區(qū)別是對(duì)網(wǎng)頁(yè)信息進(jìn)行了結(jié)構(gòu)化信息抽取,也就是將網(wǎng)頁(yè)的非結(jié)構(gòu)化數(shù)據(jù)抽取成特定的結(jié)構(gòu)化信息數(shù)據(jù),好比網(wǎng)頁(yè)搜索是以網(wǎng)頁(yè)為最小單位,基于視覺(jué)的網(wǎng)頁(yè)塊分析是以網(wǎng)頁(yè)塊為最小單位,而垂直搜索是以結(jié)構(gòu)化數(shù)據(jù)為最小單位。然后將這些數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù),進(jìn)行進(jìn)一步的加工處理,如:去重、分類等,最后分詞、索引再以搜索的方式滿足用戶的需求。 整個(gè)過(guò)程中,數(shù)據(jù)由非結(jié)構(gòu)化數(shù)據(jù)抽取成結(jié)構(gòu)化數(shù)據(jù),經(jīng)過(guò)深度加工處理后以非結(jié)構(gòu)化的方式和結(jié)構(gòu)化的方式返回給用戶。 垂直搜索引擎的應(yīng)用方向很多,比如企業(yè)庫(kù)搜索、供求信息搜索引擎、購(gòu)物搜索、房產(chǎn)搜索、人才搜索、地圖搜索、mp3搜索、圖片搜索……幾乎各行各業(yè)各類信息都可以進(jìn)一步細(xì)化成各類的垂直搜索引擎。 舉個(gè)例子來(lái)說(shuō)明會(huì)更容易理解,比如購(gòu)物搜索引擎,整體流程大致如下:抓取網(wǎng)頁(yè)后,對(duì)網(wǎng)頁(yè)商品信息進(jìn)行抽取,抽取出商品名稱、價(jià)格、簡(jiǎn)介……甚至可以進(jìn)一步將筆記本簡(jiǎn)介細(xì)分成“品牌、型號(hào)、CPU、內(nèi)存、硬盤(pán)、顯示屏、……”然后對(duì)信息進(jìn)行清洗、去重、分類、分析比較、數(shù)據(jù)挖掘,最后通過(guò)分詞索引提供用戶搜索、通過(guò)分析挖掘提供市場(chǎng)行情報(bào)告。 垂直搜索引擎大體上需要以下技術(shù) 1.Spider 2.網(wǎng)頁(yè)結(jié)構(gòu)化信息抽取技術(shù)或元數(shù)據(jù)采集技術(shù) 3.分詞、索引 4.其他信息處理技術(shù) 垂直搜索引擎的技術(shù)評(píng)估應(yīng)從以下幾點(diǎn)來(lái)判斷 1.全面性 2.更新性 3.準(zhǔn)確性 4.功能性 垂直搜索的進(jìn)入門(mén)檻很低,但是競(jìng)爭(zhēng)的門(mén)檻很高。沒(méi)有專注的精神和精湛的技術(shù)是不行的。行業(yè)門(mén)戶網(wǎng)站具備行業(yè)優(yōu)勢(shì)但他們又是沒(méi)有技術(shù)優(yōu)勢(shì)的,絕對(duì)不要想像著招幾個(gè)人就可以搞定垂直搜索的全部技術(shù),作為一個(gè)需要持續(xù)改進(jìn)可運(yùn)營(yíng)的產(chǎn)品而不是一個(gè)項(xiàng)目來(lái)說(shuō)對(duì)技術(shù)的把握控制程度又是垂直搜索成功的重要因素之一。

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章