[爆卦]共變異數分析是什麼?優點缺點精華區懶人包

為什麼這篇共變異數分析鄉民發文收入到精華區:因為在共變異數分析這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者winchin (撼動宇宙的第一小步)看板Statistics標題[問題] 共變數分析-違反迴歸...


各位版大好,我又有問題上來請教大家

假如我的研究設計是:
自變項A:國家的經濟能力(分三組,各組有強到弱的次序之分)
依變項B:國家參加環境保護運動的情況(連續變數)
控制變數(共變數)C:加入國際組織的時間(連續變數)

我的研究主題是想知道:
這三個經濟能力不同的組別,在環境保護運動的參與上是否有顯著差異?
經濟情況越好的國家組別,參加次數是否其他組別多?


但在統計時我發現,某些國家因為比較晚建國
所以加入國際組織的時間比較晚,進而讓他們的參加次數不高
而這些國家大多是經濟能力中等或不好的國家
所以如果直接用ANOVA來分析
很容易就會讓"經濟力好"的組別與其他組之間有顯著差異出現
但這種差異很可能是因為"加入國際組織的時間早晚"所造成的
所以我想把變項C(加入的時間先後)給控制住
再去看組別之間有無顯著差異


我本來打算用 單因子共變數分析(ANCOVA)
一開始就先做迴歸斜率同質檢定
但結果出來數值都是顯著的,表示違反迴歸斜率同質
很多統計書籍都說:
只要違反迴歸斜率同質,就不能用ANCOVA

但接下來的作法就有不同意見,讓我無從分辨起要採信哪一個:

1. 有人認為"在單因子共變數分析下,即使違反迴歸係數同質
的假設影響並不大"(朱經明, 2007)
2. 有人認為"可以改作雙因子變異數分析Two-Way ANOVA"
3. 有人認為應採Johnson-Neyman 法來分析
4. 有人認為"不管共變量,而僅僅使用ANOVA
(因為研究者所使用的共變量不存在研究設計價值)"
http://ppt.cc/VrsX
5. 將數據做轉換,比如平方、對數、倒數


我的疑惑和困難點在於:
1. 我可以不管迴歸斜率的檢定結果,直接作共變數分析嗎?

2. 如果改作雙因子變異數分析(Two-Way ANOVA),這算把C變項給"控制住"嗎?

3. 我有試作雙因子變異數,但結果 自變項A*變項C 交互作用這項有達到顯著
書上是說這時候只要考慮 A*C 交互作用這項就好
但我的研究目的只是想知道:A的三個組別之間有無差異
A*C的交互作用做出來的結果並不是我要的
例如:
我要的結果是:經濟力佳>經濟力差
而雙因子變異數交互作用的結果:
在比較早加入國際組織的組別裡面,經濟力佳>經濟力差
這樣變成我在解釋時還要把"加入時間"這個變項一起說明
如果用共變數分析的話,就可以直接說明"排除變項C後的結果"

那我能否不管A*C這一項,直接看A這一欄去做事後檢定,再報告結果?





4. 我也考慮過用Johnson-Neyman 法來分析
但問題是我找不到軟體去畫迴歸線
而且我看很多用Johnson-Neyman 法的論文
他們都是有分前、後測,但我沒有
而且我的組別有三組,那是不是代表我要畫3條迴歸線?

這樣在解釋時又要把"加入的時間"放在一起解釋
就跟用雙因子變異數時出現一樣的問題:
我只想知道 排除"加入時間"這個變項之後
自變項A的組別之間有無差異
我不想去說明"加入時間"這個變項

5. 我可以按前面有個人說的,直接作ANOVA就好嗎?
(因為共變量不存在研究價值?)

6. 資料轉換 這招我也用過了,就是始終違反迴歸斜率同質...

很抱歉,我把問題打得很長
但這樣才能把我的疑問說清楚

煩請有經驗的版友們幫我解答疑惑
感謝!

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 112.105.52.203
※ 編輯: winchin 來自: 112.105.52.203 (07/12 04:31)
※ 編輯: winchin 來自: 112.105.52.203 (07/12 04:32)
※ 編輯: winchin 來自: 112.105.52.203 (07/12 04:32)
※ 編輯: winchin 來自: 112.105.52.203 (07/12 06:39)
yhliu:不一定要用共變異數分析; 當然, 不顧共變數的差異而直接做 07/12 12:41
yhliu:ANOVA 是不可以的. 如果各組的迴歸模型誤差項變異數差不多, 07/12 12:42
yhliu:可以合併用一個複迴歸模型來分析; 否則就每一組一個迴歸模型 07/12 12:43
yhliu:而後再固定 x 而比較各組之 fitted values 吧. 07/12 12:44
yhliu:若合併用一個複迴歸模型, A 建立兩個 dummy variable, 07/12 12:45
yhliu:模型 y = A + B + A*B (這是仿軟體表示法), 即 07/12 12:45
yhliu: y = β0+β1*A1+β2*A2+β3*B+β4*A1*B+β5*A2*B + ε 07/12 12:47
yhliu:哦...漏了 C 變數了! 07/12 12:47
yhliu:若是三組各一個迴歸模型, 比較時設定 B 及 C 之值, 求 y^ 及 07/12 12:48
yhliu:其標準誤, 而後三組間兩兩比較: 07/12 12:50
yhliu: t = (y1^-y2^)/√[(se(y1^))^2+(se(y2^))^2] 07/12 12:51
感謝您的回應!!
我又發現,原來控制變數C和自變數A之間其實也有相關性
所以用共變數分析好像也沒有啥效用
而那個Johnson-Neyman 法好像也只能用來分析2組的情況
對於3組以上的情形就不適用..= =

嘆 只怪我統計不夠好(在我這領域連共變數分析或ANOVA都很少人用過)
所以您說的用迴歸模型來比較...這對我來說太難了
我只會把共變數丟入自變項控制起來,然後看關聯係數 F值..之類的
但就是不會用多元迴歸模型來比較各組平均數的差異......

不過總之還是謝謝您^^...
※ 編輯: winchin 來自: 112.105.52.203 (07/14 07:10)
yhliu:3組, 類似 ANOVA 的 F 統計量那樣的也不是不行, 只是可能複 07/15 16:12
yhliu:雜些罷了. 上面建議的兩兩比較是較簡單, 易理解的. 07/15 16:13
yhliu:一般在做 ANOVA 或 ANCOVA, 只不過是試圖得到關於 k 組間是 07/15 16:14
yhliu:否存在差異的整體概念罷了, 通常如果 F 檢定顯著, 之後仍然\ 07/15 16:15
yhliu:會再做多重比較以確定差異是在哪兩組之間發生的. 那麼, 直 07/15 16:16
yhliu:接做兩兩差異的多重比較而不先透過 F 做整體檢定也未嘗不可, 07/15 16:16
yhliu:只是需要考慮整體型I誤機率之控制罷了, 大不了犧牲點檢定力 07/15 16:17
yhliu:用 α/3 為每個兩兩 t 檢定之顯著水準. 07/15 16:18
winchin:感謝Y大!!請問Y大可以幫我解答另一個問題嗎? 07/15 16:19
winchin:我把問題寫在下面那一篇文裡頭 07/15 16:19
winchin:是關於虛擬變項迴歸分析的 R R^2 F值的問題 感謝!! 07/15 16:20
andrew43:題外話, 你描述問題的文句段落很棒. 07/17 03:05

你可能也想看看

搜尋相關網站