[爆卦]主成分分析sas是什麼?優點缺點精華區懶人包

為什麼這篇主成分分析sas鄉民發文收入到精華區:因為在主成分分析sas這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者belly938 (菸酒與性)看板NCKU_EDU97標題主成分分析時間Thu Mar 12 1...


主成分分析的用意就是把五個變項V1-V5
用一組數字W1-W5加權組合成一個新的分數C
W1-W5就是特徵向量,C就是主成分

產生組合可以使用共變數矩陣和相關矩陣
其中產生相關矩陣之前要先把原本變項V1-V5
都化成標準分數之後再求V1-V5兩兩之間的相關
進而形成相關矩陣

五個變項可以產生最多五個主成分
五個主成分累積起來可以解釋全部變項的總變異
特徵值就是該主成分所能解釋的變異量(解釋量)
而且五個特徵值的加總一定等於5(變項數量)

以第一個主成分C1來說
把C1的特徵向量乘以根號C1的特徵值等於負荷量
(接著請參閱課本表12的第一個直行)
.983 .982 .939意謂著C1跟V1的簡單相關為.983
C1跟V2的簡單相關為.982,依此類推
相關越高表示C1越能夠代表、解釋這個變項

想像一下有五個主成分C1-C5
他們的平均數與變異數都不一樣
如果現在設法使其全部標準化
每一個主成分的變異數都是1
(參閱課本表14跟16)
那麼特徵向量也會跟著調整變動
這個就是成分分數係數(表15)
也就是特徵向量除以根號特徵值

主成分彼此之間的相關為0
表13就是這個意思而已

最重要的來了,"23縣市之主成份數據"
前面提過V1-V5已經被標準化成標準分數
C = V1W1 + V2W2 + V3W3 + V4W4 + V5W5
代表第一個縣市在五個變項上面的加權總分
而這個總分屬於第一個主成分
如果第二個到第23個縣市也這樣做
第一個主成分下面就會出現23個總分
如果五個主成分都這樣做
結果就是SAS的Data Set WORK.PRIN2這個表格
如果你具有實驗精神
把PRIN 1的23個數值加總求平均和變異數
你會發現結果就在Summary statistics表格裡面
而這個龐大表格的目的只是要告訴你
每個主成分裡面包括了哪些組合分數

有人問到
SAS的報表裡面總共出現三次princomp
其實這是三次相同的檢定過程與結果
只是第一次用的是共變數矩陣
第二次是用相關矩陣
第三次是把主成分標準化之後重作一次
這次的作業只需要截取第二次的部分

如果有問題請提出來一起討論

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.223.141
※ 編輯: belly938 來自: 220.134.160.27 (03/12 21:43)
cat417:幫你加分!好棒的孩子!記得作業好好寫~姐姐看完書跟你討論^^ 03/13 15:38
rong7325:推推,謝謝林林喔!超熱心~~~ 03/15 22:59

你可能也想看看

搜尋相關網站