作者loveunco (掛版沒有公理正義可言)
看板Statistics
標題[問題] 多變量變異數分析或變異數分析
時間Fri Dec 24 15:18:43 2010
想請問一下各位
多變量變異數分析 或 變異數分析的使用時機 ?
對於調查研究而言 有沒有一些相適配的部份@@
以上!感謝~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 210.240.225.148
→ Chsieh:一個單變量一個多變量〈被毆 12/24 19:57
→ coldwind0912:一樓不會被毆呀 相當中肯 事實上就是如此 12/24 22:19
→ gsuper:就是分小批處理或一次全部處理的差別 12/25 14:54
→ gsuper:一個 3-levels 的 one-way ANOVA 可以切成 3個 t檢定 12/25 14:55
→ gsuper:同樣的 , 多變量ANOVA也能切割成很多小的ANOVA來算 12/25 14:55
→ ADORIAN:樓上講的有誤... 12/26 11:18
→ coldwind0912:g大 如果可以這樣說切就切 說分批就分批.... 12/26 21:54
→ coldwind0912:那統計學家們 發展出這麼多的分析方法 是太無聊是嗎? 12/26 21:55
→ bmka:g大要不要認真考慮做統計,你有很好的creativity,很適合做研究 12/28 12:00
→ bmka:可以再想想,切割成小的ANOVA後,怎麼把所有的information再 12/28 12:03
→ bmka:串起來,PS:類似的想法其實有被用來處理更複雜的資料結構 12/28 12:04
→ bmka:有興趣不妨查查composite likelihood method 12/28 12:05
→ bmka:明年statistica sinica有一期專門討論這個方法的應用 12/28 12:54
→ bluechuchy:MANOVA有整體檢定,不是說用ANOVA切一切就好的 12/28 17:17
→ bluechuchy:即便你用ANOVA把顯著水準臨界值調高,也都跑得出來 12/28 17:18
→ bluechuchy:但按理論或實務需求需要整體檢視時,就是死在多變量 12/28 17:20
→ bluechuchy:假定違反....> <,有很多事不是想像中這麼容易達到... 12/28 17:21
推 gsuper:受教了 12/28 19:15
→ ADORIAN:不是死在違反設設. 一個二維的MANOVA要切幾個一維的ANOVA 12/28 23:31
→ ADORIAN:來看? 我想應該是不可數個 12/28 23:32
→ ADORIAN:很多軟體書都寫 做 ANOVA 前要先做 MANOVA, 都會讓人摸不 12/28 23:38
→ ADORIAN:著頭緒. (卻沒寫說 regression 前要 multivariate regs.) 12/28 23:39
→ bmka:為什麼是不可數? 12/28 23:54
→ bmka:如果只對mean structure有興趣,不考慮efficiency,那麼MANOVA 12/28 23:56
→ bmka:是可以"切成"ANOVA來看, 想想GEE的精神,其實有異曲同工之妙 12/28 23:58
→ bmka:(GEE with working independent correlation structure) 12/29 00:00
→ ADORIAN:二維的MANOVA [Y1, Y2] 硬是要切成一維來看的話, 不只有 12/29 01:10
→ ADORIAN:Y1 及 Y2 兩種選擇, 任何的 a1Y1+a2y2 都是一種一維的情況 12/29 01:11
→ ADORIAN:GEE 的想法很有趣, 我從沒這樣想過, 再想想看 12/29 01:12
→ ADORIAN:或許要考慮一下有多不 efficiency ... 12/29 01:22
→ bmka:a1Y1+a2y2?除非這個新outcome有特殊的解釋意義才會想這麼做吧 12/29 01:34
→ ADORIAN:的確 [Y1 bar, Y2 bar] ~ MN(\mu, \Sigma/n), 在 n 夠大 12/29 01:39
→ ADORIAN:單變量就夠用, 但誰能保證 n 夠大到的可以不用多變量 12/29 01:41
→ ADORIAN:No, 這就是單變量與多變量的差別, 一樓是正解 12/29 01:41
→ bmka:一樓當然是對的, 但是看不懂A大n跟ANOVA,MANOVA選擇的說法 12/29 01:44
→ ADORIAN:就是不 efficiency 12/29 01:51
→ ADORIAN:我的意思是 你說的用 GEE wiht independent working corr 12/29 01:53
→ bmka:當然啦~最efficient的方法還是要回到full likelihood 12/29 01:53
→ ADORIAN:也是對的, 但是還是要考慮一下efficiency 12/29 01:53
→ bmka:pseudolikelihood method (eg.GEE)一般不會比較efficient 12/29 01:55
→ bmka:但是很多情況下我們會犧牲efficiency,選擇一個更robust的方法 12/29 01:56
→ bmka:這也是為什麼GEE會受歡迎,因為只要mean structure是對的 12/29 01:57
→ bmka:那麼inferential results(with robust SE) 就會是對的 12/29 01:58
→ bmka:即使working correlation structure 不對 12/29 01:58
→ bmka:所以g大在沒修過太多統計課程的情況下可以提出"切割"的看法 12/29 02:02
→ bmka:真的是要好好鼓勵 :D 12/29 02:03
→ ADORIAN:很同意你說的^^ , GEE 的好處與切不切就不太有相關 12/29 02:04
→ bmka:有的,每一維的mean structure其實就是一般的regression 12/29 02:09
→ bmka:而ANOVA其實就等同於做regression 12/29 02:10
→ bmka:當然,我是把g大的idea放大跟美化,不過這樣看東西比較有趣 12/29 02:12
推 gsuper:看了以上一串我只能說 還好我的指導教授離統計很遙遠 12/29 02:39
→ gsuper:出去吃個消夜就變成這樣 XDD 12/29 02:39
→ ADORIAN:直接由 ANOVA 的檢定統計量來看, 只要 E[Y1|x=1] 與 12/29 08:43
→ ADORIAN:E[Y1|x=0] 有點不同, 在 n 夠大時, Y1|x=1 與 Y2|x=0 的檢 12/29 08:44
→ ADORIAN:定結果就會拒絕 H0 (consistent). 但不代表對所有 n 來說 12/29 08:44
→ ADORIAN:兩個 ANOVA 能做到二維 MANOVA 的事 (不 efficient). 12/29 08:45
→ ADORIAN:這是大樣本性質, 與由不由 GEE 來看無關. 12/29 08:45
→ ADORIAN:打錯.. Y1|x=1 與 Y1|x=0 的檢 12/29 08:47
→ bmka:分開兩個ANOVA的假設比MANOVA少(2 marginal densities vs 1 12/29 09:29
→ bmka:joint density)當然能做的事比較少 XD 12/29 09:31
→ bmka:除非correlation structure是主要的興趣,否則還是回到 12/29 09:37
→ bmka:efficiency vs robustness的選擇囉...各有各的優/缺點 12/29 09:38