那么你可能會(huì)問(wèn),這些數(shù)據(jù)可以用Excel來(lái)存儲(chǔ)和管理。為什么需要用數(shù)據(jù)庫(kù)?Excel表相當(dāng)于一個(gè)移動(dòng)硬盤。用了就不能用了。而數(shù)據(jù)庫(kù)相當(dāng)于網(wǎng)盤,允許多人同時(shí)使用里面的數(shù)據(jù)。網(wǎng)盤的容量也比硬盤大。數(shù)據(jù)庫(kù)不僅可以連續(xù)存儲(chǔ),而且讀寫(xiě)速度很高,可以大大保證數(shù)據(jù)的有效性,不像Excel文件容易出現(xiàn)修改錯(cuò)誤。
7、hadoop與傳統(tǒng)的關(guān)系型 數(shù)據(jù)庫(kù)(如 oraclehadoop的hdfs支持海量數(shù)據(jù)存儲(chǔ),mapreduce支持海量數(shù)據(jù)的分布式處理oracle雖然可以構(gòu)建集群,但是當(dāng)數(shù)據(jù)達(dá)到一定極限時(shí),查詢處理速度會(huì)變得很慢,機(jī)器的性能會(huì)很高。其實(shí)這兩件事并不相似。hadoop是分布式的云處理架構(gòu),傾向于計(jì)算數(shù)據(jù),而oracle是關(guān)系型的。要比較的話,可以用oracle來(lái)比較hbase。
8、數(shù)據(jù)科學(xué)家如何選擇mysql、mongodb等 數(shù)據(jù)庫(kù)?我覺(jué)得必須先根據(jù)業(yè)務(wù)場(chǎng)景來(lái)決定。無(wú)論選擇哪個(gè)數(shù)據(jù)庫(kù)最終都是為了解決實(shí)際問(wèn)題。其次考慮成本,開(kāi)發(fā)者對(duì)數(shù)據(jù)庫(kù)的熟悉程度,以及維護(hù)難度。第一,兩者數(shù)據(jù)庫(kù)在業(yè)務(wù)場(chǎng)景上的差異還是蠻大的。mysql是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),在處理小型系統(tǒng)和關(guān)系型數(shù)據(jù)方面有很多優(yōu)勢(shì)。百度上有很多,比如多語(yǔ)言支持,開(kāi)源,免費(fèi)等等。目前很多中小公司都在用mysql。
MonogoDB是非關(guān)系nosql 數(shù)據(jù)庫(kù),屬于文檔類型數(shù)據(jù)庫(kù)。它以json和String等鍵值對(duì)的形式存儲(chǔ)。常用的nosql-2/是redis。Monodb用的比較少(個(gè)人)。這種非關(guān)系型數(shù)據(jù)庫(kù)通常用于存儲(chǔ)一些不會(huì)頻繁修改的數(shù)據(jù)進(jìn)行緩存。此外,我們還使用monogodb開(kāi)發(fā)商城的購(gòu)物車功能。
9、關(guān)系型 數(shù)據(jù)庫(kù)Oracle的數(shù)據(jù)導(dǎo)入非關(guān)系型 數(shù)據(jù)庫(kù)mongodb。我沒(méi)學(xué)過(guò)所謂的NoSQL;然而;不過(guò)我覺(jué)得還是要從根本上脫離數(shù)據(jù)庫(kù)這個(gè)概念。我也這么想,但是不知道怎么從Oracle移植到mongodb。首先,為什么需要將關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)導(dǎo)入NoSql 數(shù)據(jù)庫(kù)?是為了實(shí)現(xiàn)什么樣的需求?我也是開(kāi)發(fā)商。我推薦以下幾點(diǎn):不要試圖將關(guān)系型數(shù)據(jù)庫(kù)轉(zhuǎn)換為非關(guān)系型數(shù)據(jù)庫(kù):1。節(jié)省維護(hù)成本;2.軟件和硬件成本。
(當(dāng)然不同系統(tǒng)硬件配置也不一樣);3.為分發(fā)而分發(fā);4.從軟件的角度來(lái)說(shuō),轉(zhuǎn)換只是單純的為了提高IO的速度;如果非要強(qiáng)行移植,需要考慮以下幾點(diǎn):1。Mongodb的維護(hù)和容災(zāi)需要相對(duì)專業(yè)的開(kāi)發(fā)人員(如果你的運(yùn)維會(huì),那就當(dāng)我沒(méi)說(shuō)),因?yàn)镸ongodb的很多配置需要一些簡(jiǎn)單的javascript語(yǔ)法支持,對(duì)開(kāi)發(fā)人員來(lái)說(shuō)會(huì)更容易一些;2.Mongodb是一種“非關(guān)系”類型,所以在用嚴(yán)格遵循范式設(shè)計(jì)的關(guān)系類型數(shù)據(jù)庫(kù)進(jìn)行移植時(shí),需要考慮多表查詢的效率。