那么你可能會問,這些數(shù)據(jù)可以用Excel來存儲和管理。為什么需要用數(shù)據(jù)庫?Excel表相當(dāng)于一個(gè)移動硬盤。用了就不能用了。而數(shù)據(jù)庫相當(dāng)于網(wǎng)盤,允許多人同時(shí)使用里面的數(shù)據(jù)。網(wǎng)盤的容量也比硬盤大。數(shù)據(jù)庫不僅可以連續(xù)存儲,而且讀寫速度很高,可以大大保證數(shù)據(jù)的有效性,不像Excel文件容易出現(xiàn)修改錯(cuò)誤。
7、hadoop與傳統(tǒng)的關(guān)系型 數(shù)據(jù)庫(如 oraclehadoop的hdfs支持海量數(shù)據(jù)存儲,mapreduce支持海量數(shù)據(jù)的分布式處理oracle雖然可以構(gòu)建集群,但是當(dāng)數(shù)據(jù)達(dá)到一定極限時(shí),查詢處理速度會變得很慢,機(jī)器的性能會很高。其實(shí)這兩件事并不相似。hadoop是分布式的云處理架構(gòu),傾向于計(jì)算數(shù)據(jù),而oracle是關(guān)系型的。要比較的話,可以用oracle來比較hbase。
8、數(shù)據(jù)科學(xué)家如何選擇mysql、mongodb等 數(shù)據(jù)庫?我覺得必須先根據(jù)業(yè)務(wù)場景來決定。無論選擇哪個(gè)數(shù)據(jù)庫最終都是為了解決實(shí)際問題。其次考慮成本,開發(fā)者對數(shù)據(jù)庫的熟悉程度,以及維護(hù)難度。第一,兩者數(shù)據(jù)庫在業(yè)務(wù)場景上的差異還是蠻大的。mysql是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,在處理小型系統(tǒng)和關(guān)系型數(shù)據(jù)方面有很多優(yōu)勢。百度上有很多,比如多語言支持,開源,免費(fèi)等等。目前很多中小公司都在用mysql。
MonogoDB是非關(guān)系nosql 數(shù)據(jù)庫,屬于文檔類型數(shù)據(jù)庫。它以json和String等鍵值對的形式存儲。常用的nosql-2/是redis。Monodb用的比較少(個(gè)人)。這種非關(guān)系型數(shù)據(jù)庫通常用于存儲一些不會頻繁修改的數(shù)據(jù)進(jìn)行緩存。此外,我們還使用monogodb開發(fā)商城的購物車功能。
9、關(guān)系型 數(shù)據(jù)庫Oracle的數(shù)據(jù)導(dǎo)入非關(guān)系型 數(shù)據(jù)庫mongodb。我沒學(xué)過所謂的NoSQL;然而;不過我覺得還是要從根本上脫離數(shù)據(jù)庫這個(gè)概念。我也這么想,但是不知道怎么從Oracle移植到mongodb。首先,為什么需要將關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)導(dǎo)入NoSql 數(shù)據(jù)庫?是為了實(shí)現(xiàn)什么樣的需求?我也是開發(fā)商。我推薦以下幾點(diǎn):不要試圖將關(guān)系型數(shù)據(jù)庫轉(zhuǎn)換為非關(guān)系型數(shù)據(jù)庫:1。節(jié)省維護(hù)成本;2.軟件和硬件成本。
(當(dāng)然不同系統(tǒng)硬件配置也不一樣);3.為分發(fā)而分發(fā);4.從軟件的角度來說,轉(zhuǎn)換只是單純的為了提高IO的速度;如果非要強(qiáng)行移植,需要考慮以下幾點(diǎn):1。Mongodb的維護(hù)和容災(zāi)需要相對專業(yè)的開發(fā)人員(如果你的運(yùn)維會,那就當(dāng)我沒說),因?yàn)镸ongodb的很多配置需要一些簡單的javascript語法支持,對開發(fā)人員來說會更容易一些;2.Mongodb是一種“非關(guān)系”類型,所以在用嚴(yán)格遵循范式設(shè)計(jì)的關(guān)系類型數(shù)據(jù)庫進(jìn)行移植時(shí),需要考慮多表查詢的效率。