大數(shù)據(jù)分析需要哪些工具?一般會先用large 數(shù)據(jù) analysis,比如MongoDB,GBase等。數(shù)據(jù)庫.如何優(yōu)化操作大小數(shù)據(jù)volume數(shù)據(jù)庫如何優(yōu)化操作大小數(shù)據(jù)volume數(shù)據(jù)庫以relationship數(shù)據(jù)庫system Informix為例,介紹了改進用戶查詢計劃的方法,1.Da 數(shù)據(jù)工具:數(shù)據(jù)存儲和管理工具Da 數(shù)據(jù)完全從數(shù)據(jù)存儲開始,也就是從Da 數(shù)據(jù)框架Hadoop開始。
HADOOP、SASS、R語言、ApacheSpark等。盛達的眾包平臺有解釋。SAS,HADOOP,SPARK .其實不止如此。Excel:常用于日常報表、報告和抽樣分析。它的圖表功能非常強大,輕松搞定10萬級數(shù)據(jù)。UltraEdit: Text工具比TXT工具更容易使用,打開和運行速度更快。ACCESS: Desktop 數(shù)據(jù)庫,主要用于日常的抽樣分析(做全口徑的統(tǒng)計分析要消耗大量的資源和時間,通常分析師會隨機選取一些數(shù)據(jù)進行分析)。使用SQL語言,處理100萬數(shù)據(jù)還是很快的。
當然,如果我的能力和時間允許的話,學(xué)習(xí)一下最近比較流行的分布式數(shù)據(jù)庫,提高自己的編程能力,對我以后的職業(yè)發(fā)展也有很大的幫助。分析軟件主要推薦:SPSS系列:老牌統(tǒng)計分析軟件,SPSSStatistics(偏統(tǒng)計函數(shù),市場調(diào)研)和SPSSModeler(偏數(shù)據(jù) mining),不用編程簡單易學(xué)。SAS:老經(jīng)典的挖礦軟件,需要編程。
sql有,數(shù)據(jù)太大。如果要全部備份,會很麻煩。這不是數(shù)據(jù)庫的問題。最好是重建數(shù)據(jù)庫的結(jié)構(gòu),一次只備份一小部分,其他的不做改動不備份。一般在app_date文件夾中,可以通過連接sql字符串得到名稱數(shù)據(jù)庫,然后打開SqlServer2000找到名稱數(shù)據(jù)庫,包含在右鍵屬性中。在微軟的big 數(shù)據(jù)解決方案中,數(shù)據(jù)管理是最底層最基礎(chǔ)的環(huán)節(jié)。
數(shù)據(jù) management主要包括三個產(chǎn)品:SQLServer、SQL server Parallel數(shù)據(jù)Warehouse和HadooponWindows。微軟為不同類型的數(shù)據(jù)提供了不同的解決方案。具體來說,對于結(jié)構(gòu)化的數(shù)據(jù),SQLServer和SQLServer可以并行使用數(shù)據(jù) warehouse處理。非結(jié)構(gòu)化數(shù)據(jù)可以在WindowsAzure和WindowsServer上進行基于Hadoop的分發(fā)處理;流數(shù)據(jù)可以由SQLServerStreamInsight管理,并提供接近實時的分析。