一個(gè)是站內(nèi)搜索,一個(gè)是線上搜索。當(dāng)然是不一樣的。信息檢索不等于搜索引擎?;ヂ?lián)網(wǎng)的發(fā)展明顯促進(jìn)了信息檢索技術(shù)的發(fā)展和應(yīng)用,大量搜索引擎產(chǎn)品誕生,為網(wǎng)民提供了快速獲取信息和網(wǎng)絡(luò)信息導(dǎo)航的良好工具。但是,把信息檢索等同于使用搜索引擎,就陷入了一個(gè)誤區(qū)。全文信息檢索技術(shù)在搜索引擎技術(shù)中也有廣泛的應(yīng)用,但是互聯(lián)網(wǎng)信息搜索和企業(yè)信息搜索是不同的。
傳統(tǒng)信息檢索系統(tǒng)的通用索引數(shù)據(jù)庫多為GB級別,但互聯(lián)網(wǎng)網(wǎng)頁搜索需要處理數(shù)千萬網(wǎng)頁,搜索引擎的基本策略是采用檢索服務(wù)器集群,這對于大多數(shù)企業(yè)應(yīng)用是不合適的,也是不必要的,不適用于企業(yè)應(yīng)用。二是內(nèi)容相關(guān)性。信息太多了,查找和整理顯得尤為重要。谷歌等搜索引擎開發(fā)了網(wǎng)頁鏈接分析技術(shù),該技術(shù)基于網(wǎng)頁在互聯(lián)網(wǎng)上的連接次數(shù)。
4、企業(yè)非 結(jié)構(gòu)化 數(shù)據(jù)存儲用哪家的比較好?要國內(nèi)的廠商山彥數(shù)據(jù),專注于為非結(jié)構(gòu)化 數(shù)據(jù),山彥海量對象存儲MOS采用去中心化、分布式技術(shù)架構(gòu),支持百億級文件和EB容量存儲,效率高。文中提到的結(jié)構(gòu)化 數(shù)據(jù)、non 結(jié)構(gòu)化 數(shù)據(jù)、semi 結(jié)構(gòu)化 數(shù)據(jù)都是存儲形式之一。
結(jié)合典型場景,比如企業(yè)ERP、財(cái)務(wù)系統(tǒng),就更容易理解;醫(yī)療HIS 數(shù)據(jù)數(shù)據(jù)庫;教育卡;政府行政審批;其他核心數(shù)據(jù)庫等。這些應(yīng)用程序需要什么樣的存儲方案?基本包括高速存儲應(yīng)用需求、數(shù)據(jù)備份需求、數(shù)據(jù)共享需求和數(shù)據(jù)容災(zāi)需求。不是結(jié)構(gòu)化 數(shù)據(jù),包括視頻、音頻、圖片、圖像、文檔、文字。具體到典型案例,如醫(yī)學(xué)影像系統(tǒng)、教育視頻點(diǎn)播、視頻監(jiān)控、國家地理信息系統(tǒng)、設(shè)計(jì)院、文件服務(wù)器(PDM/FTP)、媒體資源管理等具體應(yīng)用,這些行業(yè)的存儲需求有數(shù)據(jù)存儲、數(shù)據(jù)備份和-2。
5、高分懸賞!!請問何謂 結(jié)構(gòu)化、半 結(jié)構(gòu)化、非 結(jié)構(gòu)化問題??(超緊急...結(jié)構(gòu)化:數(shù)據(jù)structure字段的含義是確定而明確的,如數(shù)據(jù)library中的標(biāo)題結(jié)構(gòu)。Semi結(jié)構(gòu)化:有一定的結(jié)構(gòu),但語義不確定,比如。有些不確定性(表)不是結(jié)構(gòu)化:雜亂無章數(shù)據(jù),很難按照一個(gè)概念提取。不規(guī)則結(jié)構(gòu)化度是指一個(gè)決策問題的決策過程、決策環(huán)境和規(guī)律,能否用清晰的語言(數(shù)學(xué)或邏輯)表達(dá)出來。
1).結(jié)構(gòu)化決策問題結(jié)構(gòu)化決策問題相對簡單直接,其決策過程和方法有固定的規(guī)則可循,可以用清晰的語言和模型來描述,按照一定的通用模型和決策規(guī)則可以實(shí)現(xiàn)其決策過程的基本自動(dòng)化。大多數(shù)早期的管理信息系統(tǒng)都可以解決這類問題,例如,利用運(yùn)籌學(xué)方法解決資源優(yōu)化問題。