目錄
目錄X

馬太福音動(dòng)易全文檢索引擎預(yù)覽版悄然露面

 

  細(xì)心的網(wǎng)友們可能已經(jīng)發(fā)現(xiàn)了,點(diǎn)擊動(dòng)易官方網(wǎng)站頂部的搜索按鈕,將跳轉(zhuǎn)到一個(gè)全新的類似Google的搜索界面——這就是動(dòng)易廣州研發(fā)中心的最新成果:動(dòng)易全文檢索引擎!
 
(圖1:動(dòng)易全文檢索界面)
(圖2:多關(guān)鍵詞組合檢索)
 
  全文檢索是指計(jì)算機(jī)索引程序通過掃描文章中的每一個(gè)詞,對(duì)每一個(gè)詞建立一個(gè)索引,指明該詞在文章中出現(xiàn)的次數(shù)和位置,當(dāng)用戶查詢時(shí),檢索程序就根據(jù)事先建立的索引進(jìn)行查找,并將查找的結(jié)果反饋給用戶的檢索方式。這個(gè)過程類似于通過字典中的檢索字表查字的過程。其好處是通過對(duì)網(wǎng)站數(shù)據(jù)庫(kù)的數(shù)據(jù)建立索引,查詢時(shí)不訪問數(shù)據(jù)庫(kù),能有效減輕數(shù)據(jù)庫(kù)和系統(tǒng)的壓力,從而實(shí)現(xiàn)大容量、高速訪問的目標(biāo)。
 
  目前動(dòng)易全文檢索引擎Ver0.0.0.1Preview版具備有多關(guān)鍵字搜索、關(guān)鍵詞組合搜索、全文檢索(對(duì)標(biāo)題與內(nèi)容同時(shí)檢索)等功能,能快速準(zhǔn)確地檢索到相關(guān)信息并對(duì)關(guān)鍵詞進(jìn)行高亮顯示。
 
  多關(guān)鍵字組合、句子查詢,達(dá)到毫秒級(jí)的速度
  為了迎合大多數(shù)網(wǎng)民對(duì)搜索功能的慣性和依賴性,很多網(wǎng)站只好提供通過SQL語句查詢數(shù)據(jù)庫(kù)來實(shí)現(xiàn)一些簡(jiǎn)單的模糊匹配,但是這種“搜索”功能通常只能匹配一個(gè)關(guān)鍵字,匹配的數(shù)據(jù)庫(kù)字段也非常有限。而使用動(dòng)易全文檢索,用戶可以隨便地輸入一個(gè)或多個(gè)關(guān)鍵詞,甚至輸入一句話,大大提高了用戶操作的友好度。
(圖3:分詞檢索與全文檢索)
 
  查詢不訪問數(shù)據(jù)庫(kù),降低數(shù)據(jù)庫(kù)負(fù)擔(dān),減輕系統(tǒng)壓力
  當(dāng)用戶直接查詢數(shù)據(jù)庫(kù),不但查詢速度慢,而且會(huì)導(dǎo)致數(shù)據(jù)庫(kù)的壓力增大,當(dāng)數(shù)據(jù)庫(kù)記錄超過一定數(shù)量時(shí),頻繁地查詢數(shù)據(jù)庫(kù),會(huì)導(dǎo)致數(shù)據(jù)庫(kù)的負(fù)載直線上升,從而波及其它功能的使用,尤其是同時(shí)有很多用戶訪問的時(shí)候,對(duì)數(shù)據(jù)庫(kù)和系統(tǒng)會(huì)產(chǎn)生較大的壓力,嚴(yán)重時(shí)會(huì)導(dǎo)致信息塞車,甚至?xí)?dǎo)致系統(tǒng)崩潰。
  動(dòng)易全文檢索引擎則是一套真正的搜索引擎,它通過對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行索引,在查詢時(shí)不訪問數(shù)據(jù)庫(kù),可以實(shí)現(xiàn)毫秒級(jí)的檢索速度和每秒上百次的并發(fā)訪問,用戶搜索對(duì)數(shù)據(jù)庫(kù)的壓力為零。
 
  略微遺憾的是,在這個(gè)預(yù)覽版里,索引本地文件與索引外站網(wǎng)頁(yè)的功能并沒有出現(xiàn);此外,當(dāng)遇到繁體輸入時(shí),系統(tǒng)還無法將其自動(dòng)進(jìn)行簡(jiǎn)繁體轉(zhuǎn)換匹配,而搜索結(jié)果排序以及高級(jí)搜索(“完全匹配、與、或、非”等多種組合關(guān)鍵詞的搜索方法)等功能都尚未提供,另外對(duì)網(wǎng)站群中的各個(gè)網(wǎng)站的分別索引與搜索的管理功能還有待加強(qiáng)。畢竟這是第一個(gè)預(yù)覽版,讓我們共同期待下一個(gè)版本的面世吧。
【打印正文】 發(fā)布時(shí)間:2009-02-23 12:50:55 瀏覽次數(shù): 作者: 來源:本站原創(chuàng)
×

用戶登錄