列聯(lián)表中常用來衡量相關(guān)性的相關(guān)系數(shù)有哪些?什么是相關(guān)性分析問題1:什么是屬性相關(guān)性分析?屬性相關(guān)性分析用于幫助過濾掉統(tǒng)計上不相關(guān)或弱相關(guān)的屬性,保留最相關(guān)的屬性(與挖掘任務(wù)相關(guān))。列聯(lián)表中常用來衡量相關(guān)性的三個相關(guān)系數(shù)是皮爾遜相關(guān)系數(shù)、斯皮爾曼相關(guān)系數(shù)和肯德爾相關(guān)系數(shù)。
生物統(tǒng)計學(xué)中常用的一個概念是相關(guān)系數(shù),可以推導(dǎo)出相關(guān)系數(shù)來構(gòu)建基因共表達(dá)網(wǎng)絡(luò)?;蚓W(wǎng)絡(luò)分析的大多數(shù)方法都是基因表達(dá)相關(guān)系數(shù)計算的延伸和推導(dǎo)。即使復(fù)雜的算法也是基于相關(guān)系數(shù)的計算。所以了解相關(guān)系數(shù)對后續(xù)的分析影響很大。皮爾遜相關(guān)系數(shù)是最常見的相關(guān)計算。皮爾遜相關(guān)百度百科解釋:Pearsoncorrelationcoefficient,也叫皮爾遜積矩相關(guān)系數(shù),是線性相關(guān)系數(shù)。
φ系數(shù)C系數(shù)V系數(shù)有以下特點(diǎn):φ相關(guān)系數(shù)是描述2×2列聯(lián)表數(shù)據(jù)相關(guān)程度最常用的相關(guān)系數(shù)。φ系數(shù)適用于2×2列聯(lián)表,因為對于2×2列聯(lián)表中的數(shù)據(jù),計算的φ系數(shù)可以控制在0 ~ 1的范圍內(nèi)。φ0時,表示兩個變量相互獨(dú)立;當(dāng)|φ|1時,說明兩個變量完全相關(guān)。注:當(dāng)列聯(lián)表R×C中的行數(shù)r或列數(shù)C大于2時,φ系數(shù)會隨著r或C的增大而增大,φ值沒有上限。
關(guān)聯(lián)相關(guān)系數(shù),也稱為列聯(lián)系數(shù),簡稱C系數(shù),主要用于列聯(lián)表大于2×2的情況。當(dāng)列聯(lián)表中兩個變量相互獨(dú)立時,系數(shù)為c0,但不能大于1。C系數(shù)的特點(diǎn)是其可能的最大值取決于列聯(lián)表的行數(shù)和列數(shù),且隨R和C的增加而增加.列聯(lián)系數(shù)的限制:按不同的行和列計算的列聯(lián)系數(shù)不便于比較,除非兩個列聯(lián)表的行數(shù)和列數(shù)相同。當(dāng)兩個變量相互獨(dú)立時,v 0;當(dāng)兩個變量完全相關(guān)時,V1,所以V的值在0和1之間。
3、excel里的數(shù)據(jù)分析相關(guān)性,方差分析的各個指標(biāo)是什么含義?我想不用我說你第一張表是什么吧?我來說一下第二張表方差分析SS代表偏離平均值的平方和,組間SS反映的是各組數(shù)據(jù)的差異。其值等于兩列各自之和的平方除以每列數(shù)據(jù)之和,然后兩列之和的平方除以總數(shù),如上面的930 * 930/18 897 * 897/18(930 897)*(930 897)/3629。組內(nèi)SS反映組內(nèi)數(shù)據(jù)的變異,其值等于組間總SS;總SS的算法是兩列各數(shù)據(jù)的平方和減去兩列數(shù)據(jù)之和的平方除以兩列數(shù)據(jù)總數(shù);Df稱為自由度,組間df列數(shù)為1,組內(nèi)df數(shù)據(jù)列數(shù)MS表示均方,可以代替均方偏差之和來消除組內(nèi)數(shù)據(jù)個數(shù)不同帶來的影響。SS/dfF值是通過將組間均方除以組內(nèi)均方獲得的。如果F值接近1,則組間差異沒有統(tǒng)計學(xué)意義。如果F遠(yuǎn)大于1,說明組間差異具有統(tǒng)計學(xué)意義(F值越大,說明兩組數(shù)據(jù)相關(guān)性越小)。Fcrit是一個具體值,可以通過查閱F邊界表得到。一旦確定了組數(shù)和組內(nèi)數(shù)據(jù)的個數(shù),F(xiàn)crit值就一定了(所謂具體值就是這個意思)PVALU。
4、pearson相關(guān)系數(shù)的數(shù)值為多少證明有相關(guān)性?標(biāo)準(zhǔn)是什么?謝謝!!相關(guān)系數(shù)(correlation coefficient)是統(tǒng)計學(xué)家卡爾·皮爾遜(karl pearson)設(shè)計的第一個統(tǒng)計指標(biāo),是研究變量之間線性相關(guān)性的一個量,一般用字母r表示,由于研究對象的不同,相關(guān)系數(shù)的定義也有很多種,皮爾遜相關(guān)系數(shù)是最常用的一種。相關(guān)系數(shù)r的絕對值一般在0.8以上,認(rèn)為A和B有很強(qiáng)的相關(guān)性。在0.3和0.8之間,可以認(rèn)為存在弱相關(guān)性。低于0.3,沒有相關(guān)性。需要指出的是,相關(guān)系數(shù)有一個明顯的缺點(diǎn),即其接近1的程度與數(shù)據(jù)組數(shù)n有關(guān),容易給人一種錯覺。