對(duì)于信息密集型的石油行業(yè)來(lái)說(shuō)尤其如此。在多年的生產(chǎn)實(shí)踐中,國(guó)內(nèi)石油行業(yè)發(fā)展了大部分信息的綜合數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用、企業(yè)標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)等技術(shù)和成果,極大地支撐了石油勘探開(kāi)發(fā)的各個(gè)流程。但是,與國(guó)外石油公司相比,在信息資源協(xié)同、分析、挖掘、共享、決策支持和集群計(jì)算等方面還存在一定差距。核心點(diǎn)是如何有效的存儲(chǔ)和利用非結(jié)構(gòu)化數(shù)據(jù)。
4、非結(jié)構(gòu)性的 數(shù)據(jù)庫(kù)系統(tǒng)有哪些?非結(jié)構(gòu)化數(shù)據(jù)庫(kù)系統(tǒng)有:1。對(duì)數(shù)據(jù)庫(kù)高并發(fā)讀寫(xiě)的高性能需求。2.HugeStorage對(duì)海量數(shù)據(jù)高效存儲(chǔ)和訪問(wèn)的需求。3.數(shù)據(jù)庫(kù)的高可伸縮性和高可用性需求。NoSQL(NoSQLNotOnlySQL)的基本意思是“不僅僅是SQL”,是一個(gè)全新的數(shù)據(jù)庫(kù)革命運(yùn)動(dòng),早期提出,09年趨勢(shì)越來(lái)越高。
5、數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展歷程1,主題導(dǎo)向。運(yùn)營(yíng)數(shù)據(jù)庫(kù)的數(shù)據(jù)組織是面向事務(wù)的,各個(gè)業(yè)務(wù)系統(tǒng)是分離的,而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是按照某個(gè)主題域組織的。主題是一個(gè)抽象的概念,是指用戶使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行決策時(shí)所關(guān)心的關(guān)鍵方面。一個(gè)主題通常與多個(gè)操作信息系統(tǒng)相關(guān)。2.綜合的。面向事務(wù)的操作數(shù)據(jù)庫(kù)通常與一些特定的應(yīng)用相關(guān),而數(shù)據(jù)庫(kù)彼此獨(dú)立,往往是異構(gòu)的。
3.相對(duì)穩(wěn)定。運(yùn)營(yíng)類(lèi)型數(shù)據(jù)庫(kù)中的數(shù)據(jù)通常是實(shí)時(shí)更新的,數(shù)據(jù)根據(jù)需要及時(shí)變化。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)主要用于企業(yè)決策分析,涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢。某個(gè)數(shù)據(jù)一旦進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),一般會(huì)保存很長(zhǎng)時(shí)間,即數(shù)據(jù)倉(cāng)庫(kù)中有大量的查詢操作,但很少有修改和刪除操作,通常只需要定期加載和刷新即可。4.反映歷史變遷。
6、“數(shù)據(jù)倉(cāng)庫(kù)之父”談如何處理非 結(jié)構(gòu)化數(shù)據(jù)雖然non-結(jié)構(gòu)化數(shù)據(jù)很難處理,但它已經(jīng)存在很久了,絕對(duì)比計(jì)算機(jī)的歷史還要久。不信你想想圣經(jīng),埃及象形文字,卡馬河佛經(jīng),這些都是對(duì)與錯(cuò)結(jié)構(gòu)化 data,他們的歷史可想而知。這些非-結(jié)構(gòu)化數(shù)據(jù)肯定比硅片早。雖然搜索引擎已經(jīng)出現(xiàn)了一段時(shí)間,但它絕不像印刷時(shí)代那么古老。即使現(xiàn)在搜索引擎已經(jīng)很完善了,但現(xiàn)在還不是隨意處理非-結(jié)構(gòu)化數(shù)據(jù)信息的時(shí)候,至少目前是這樣。
無(wú)用的輸入,無(wú)用的輸出只有當(dāng)非-結(jié)構(gòu)化數(shù)據(jù)從數(shù)據(jù)倉(cāng)庫(kù)中提取出來(lái)時(shí),非-結(jié)構(gòu)化數(shù)據(jù)的真實(shí)價(jià)值才會(huì)被搜索引擎釋放出來(lái)。很難整合非結(jié)構(gòu)化數(shù)據(jù)。想想那些被提出很久的信息技術(shù)問(wèn)題:無(wú)用信息輸入和無(wú)用信息輸出(GIGO),你就知道即使用功能強(qiáng)大的搜索引擎去處理那些本質(zhì)上沒(méi)有經(jīng)過(guò)提煉和整合的數(shù)據(jù),會(huì)得到什么結(jié)果。搜索引擎的結(jié)果會(huì)告訴我們答案,返回給用戶的會(huì)是一些未經(jīng)提煉的無(wú)用信息。
7、 結(jié)構(gòu)化數(shù)據(jù)和非 結(jié)構(gòu)化數(shù)據(jù)是什么意思總的來(lái)說(shuō),我們把數(shù)據(jù)類(lèi)型分為結(jié)構(gòu)化 data、half 結(jié)構(gòu)化 data和non 結(jié)構(gòu)化 data。結(jié)構(gòu)化數(shù)據(jù)可以用數(shù)據(jù)表示,也可以用統(tǒng)一的結(jié)構(gòu)表示,如數(shù)字、字符、符號(hào)等,結(jié)構(gòu)化 Data又稱(chēng)行數(shù)據(jù),是以二維表結(jié)構(gòu)進(jìn)行邏輯表達(dá)和實(shí)現(xiàn)的,嚴(yán)格遵循數(shù)據(jù)格式和長(zhǎng)度規(guī)范,主要由關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)和管理。Semi 結(jié)構(gòu)化 data是介于完全結(jié)構(gòu)化 data(如關(guān)系數(shù)據(jù)庫(kù)和面向?qū)ο髷?shù)據(jù)庫(kù))和完全非結(jié)構(gòu)化數(shù)據(jù)(如聲音和圖像文件)之間的數(shù)據(jù),HTML。