人體成分剖析報(bào)告可信度有多少?如何評(píng)價(jià)我的體測(cè)表??在做主成分剖析(pca)時(shí),選取的主特征是原來數(shù)據(jù)的哪些特征呢??健明迪檢測(cè)
明天我們將要學(xué)習(xí)R言語進(jìn)階中*重要的統(tǒng)計(jì)內(nèi)容---主成分剖析,它在我們的研討中簡直是無處不在,運(yùn)用*廣的就是將主成分放入回歸模型停止擬合,用于矯正相關(guān)的混雜要素。
主成分剖析的基本思想是將多個(gè)變量停止線性組合,在保管原數(shù)據(jù)主要特征的同時(shí)增加變量個(gè)數(shù),從而到達(dá)降維的目的。R言語的內(nèi)置函數(shù)princomp提供了未經(jīng)旋轉(zhuǎn)的主成分剖析。
1. 慣例主成分剖析
在這里,我還將以鳶尾花數(shù)據(jù)集(iris)為例引見如何在R中停止主成分剖析:
# 主成分剖析
# 輸入原始數(shù)據(jù)并提取相關(guān)主成分
mydata <- iris # 將iris命名成mydata以便后續(xù)操作
mydata$type[which(mydata$Species== "setosa")]<- 0 # 設(shè)置setosa為0
mydata$type[which(mydata$Species== "versicolor")]<- 1 # 設(shè)置versicolor為1
mydata$type[which(mydata$Species== "virginica")]<- 2 # 設(shè)置virginica為2
attach(mydata) # 固定數(shù)據(jù)框
fit <- princomp(~ Sepal.Length+Sepal.Width+Petal.Length+Petal.Width, cor=TRUE) # 對(duì)花萼和花瓣的相關(guān)數(shù)據(jù)停止主成分剖析,cor=TRUE表示從相關(guān)系數(shù)矩陣提取主成分(實(shí)踐上是對(duì)數(shù)據(jù)的一種規(guī)范化)
summary(fit) # 輸入各個(gè)主成分的解釋方差
loadings(fit) # 輸入載荷
plot(fit,type="lines") # 碎石圖
biplot(fit) # 對(duì)前兩個(gè)主成分繪圖
從下面的*幅圖來看,前兩個(gè)主成分的累計(jì)方差貢獻(xiàn)率到達(dá)95.8%,并且碎石圖的結(jié)果也顯示前兩個(gè)主成分所占方差較大,因此我們其實(shí)只需用這兩個(gè)主成分就能很好描畫鳶尾花的特征了。
各個(gè)主成分的載荷實(shí)踐上反響的是各原始變量和主成分的關(guān)系,從圖中結(jié)果我們不美觀出,主成分1主要反映花萼長度、花瓣的長度和花瓣的寬度這三個(gè)原始變量,而主成分2主要反映花萼寬度這個(gè)原始變量,因此前兩個(gè)主成分基本就能完全反映一切的變量特征了。
*后一幅圖實(shí)踐上是依照前兩個(gè)主成分繪制的散點(diǎn)圖,從圖中不美觀出:應(yīng)用主成分1可以將“setosa”與其他兩類分開,然后應(yīng)用主成分2將“versicolor“和”virginica“分開。
這里我想和大家引見一下“psych“包(一個(gè)十分弱小的統(tǒng)計(jì)R包)的主成分函數(shù)principal( ),這個(gè)函數(shù)可以協(xié)助我們提取和旋轉(zhuǎn)主成分:
# 極小氣差旋轉(zhuǎn)法
# 保管前兩個(gè)主成分
library(psych)
fit2 <- principal(mydata[,1:4], nfactors=2,rotate="varimax") #nfactors指定主成分個(gè)數(shù),rotate指定旋轉(zhuǎn)方法
fit2 # 輸入結(jié)果
關(guān)于rotate參數(shù),我們主要有如下選項(xiàng) "none", "varimax", "quatimax","promax", "oblimin", "simplimax"和"cluster",有興味的冤家可以自行了解,我在這兒就不贅述了。
從上圖的結(jié)果來看,前兩個(gè)主成分的累計(jì)方差貢獻(xiàn)率為96%,并且*主成分主要表征花萼長度、花瓣的長度和花瓣的寬度這三個(gè)原始變量,而第二主成分主要反映花萼寬度這個(gè)原始變量,這和之前的剖析分歧。
2. 主成分回歸
接上去,我將以fit2的結(jié)果為例引見本期內(nèi)容*重要的局部---主成分回歸:
# 提取主成分
detach(mydata) # 解固定原數(shù)據(jù)
PC <- as.data.frame(fit2$scores) # 提取各觀測(cè)點(diǎn)的主成分
PC <- cbind(PC,mydata$type) # 按列兼并
colnames(PC) <- c("PC1", "PC2","type") # 重命名變量
fit3 <- lm(type ~ PC1 + PC2,data=PC) # 應(yīng)用前兩個(gè)主成分對(duì)type停止線性回歸
summary(fit3)
輸入結(jié)果顯示PC1和PC2都是十分清楚的,而PC1的效應(yīng)量為正值,PC2則是負(fù)值,這和主成分結(jié)果分歧。
關(guān)于主成分剖析的內(nèi)容就講到這里,希望大家能掌握主成分剖析的方法以及如何用主成分停止回歸剖析,我們下期再見!
人體成分剖析報(bào)告可信度有多少?如何評(píng)價(jià)我的體測(cè)表??在做主成分剖析(pca)時(shí),選取的主特征是原來數(shù)據(jù)的哪些特征呢??健明迪檢測(cè)
石川:2007 年,任天堂的游戲機(jī) Wii 上推出了一款超級(jí)紙片馬里奧(super paper Mario)的游戲。在大少數(shù)操作中,它十分接近傳統(tǒng)的超級(jí)馬里奧,是一個(gè) 2D 的游戲,玩家控制馬里奧從左至右移動(dòng)闖關(guān),如下圖...Copyright ? 2023.廣州市健明迪檢測(cè)有限公司 .粵ICP備2022046874號(hào)技術(shù)文章 檢測(cè)服務(wù) 相關(guān)資訊