主要翻譯自官網(wǎng)I,存儲Systemspark部署在盡可能靠近數(shù)據(jù)的地方是因為大多數(shù)Spark工作可能需要從外部存儲systems(如Hadoop文件系統(tǒng)或HBase)讀取輸入。Spark已經(jīng)取代Hadoop成為最活躍的開源大型數(shù)據(jù)項目,但是,在選擇大型數(shù)據(jù)框架時,企業(yè)不應(yīng)厚此薄彼,著名專家BernardMarr在一篇文章中分析了Spark和Hadoop的異同,Hadoop和Spark都是big數(shù)據(jù)框架,都提供了一些工具來執(zhí)行常見的big數(shù)據(jù)任務(wù),但恰恰,它們執(zhí)行的是不同的任務(wù)。雖然據(jù)說Spark在某些情況...
更新時間:2024-12-15標簽: 存儲spark數(shù)據(jù)Android包括spark本地數(shù)據(jù)存儲 全文閱讀