[爆卦]迴歸分析不顯著是什麼?優點缺點精華區懶人包

為什麼這篇迴歸分析不顯著鄉民發文收入到精華區:因為在迴歸分析不顯著這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者tonmai (hey)站內Statistics標題[問題] 階層迴歸分析係數不顯著時間Fri ...

迴歸分析不顯著 在 政經八百 Instagram 的最讚貼文

2021-05-17 13:34:18

#政經八百政治標記 〔#如果雨之後 #天氣與選舉的關係〕 每當選舉到來,大眾所關心的不僅是激烈的選情,也會注意投票當日的天氣,在既有印象中,多半認為好天氣可以增加選民投票的意願。反之,若天候不佳,一般則預期將影響選情,讓投票率不如預期。 但事實真是如此嗎?今天我們簡單就引述多篇政治學研究,來簡...


最近在分析資料時遇到一個狀況,想請教各位該怎麼解釋/調整分析方式。

我的研究中是使用多元迴歸分析,而預測變項是分成兩個區塊投入。

分析結果,兩個模式的整體解釋力都有達到顯著,

模式一和模式二的 R平方 分別為.28和.43,R平方改變量達到顯著。

但是,在模式二中,所有變項係數都未顯著。(變項間沒有共線性的問題,vif=1-2)


未標準化係數
模式 B 估計值 標準誤差 標準化係數 t P
-------------------------------------------------------------
1 (常數) 1.736 1.188 1.461 .148
A .547 .245 .230 2.238 .028
B .727 .256 .303 2.837 .006
C .218 .101 .232 2.149 .035
-------------------------------------------------------------
2 (常數) -3.162 1.971 -1.604 .113
A .405 .240 .170 1.688 .096
B .477 .262 .199 1.816 .074
C .104 .106 .111 .980 .331
D .228 .124 .224 1.839 .070
E .200 .123 .196 1.634 .107


對於這樣的結果該怎麼解釋呢?

我目前是以模式一進行解釋,但總覺得怪怪的(畢竟模式二的解釋力較大)。


ps.我也試著在預測變項中只投入ABCD或ABCE,

兩個模式都有顯著(一個是C、D變項顯著,一個是A、C、E顯著)。

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 1.170.126.113
coldwind0912:能否提供一下變項的平均數.標準差 02/01 12:53
coldwind0912:我想問題應該在那.... 02/01 12:53

謝謝提問,平均數標準差如下:
A 2.63 ± 2.48
B 3.16 ± 2.46
C 6.97 ± 6.28
D 18.52 ± 5.79
E 13.13 ± 5.76
依變項 7.20 ± 4.21

coldwind0912:如此看來 您的變項是連續型data嗎? 02/01 18:29
coldwind0912:以這描述性統計量來看 殘差好大...能分析迴歸模型嗎? 02/01 18:30
coldwind0912:http://ppt.cc/OcNW 這個說明先看看 不是很嚴謹paper 02/01 18:33
coldwind0912:但有大概的講了一些迴歸分析的觀念 02/01 18:33

其實嚴格講算是ordinary scale,因為是使用李克特式量表。

殘差的問題,我其實不太確定(不太會看圖)有沒有符合常態分配...
http://ppt.cc/O7T7

順帶附上殘差P-P圖及殘差-預測値散布圖
http://ppt.cc/BRDG
http://ppt.cc/vuaH

coldwind0912:其實 照圖表看起來 是有點沒有符合迴歸殘差的假定 02/02 01:48
coldwind0912:但應該不致於反應到迴歸係數上影響這麼多才是 02/02 01:49
coldwind0912:但我滿好奇 如果是用likert量尺 為何標準差如此大... 02/02 01:50
coldwind0912:以likert六點量表來說 應該標準差約略為1吧 02/02 01:51
coldwind0912:所以 你的資料或變項型態是不是要再確認看看? 02/02 01:52

不好意思,沒說清楚,
A、B變項是單題的10點量表,C、D、E都是多題加總之後的分數。
變項是都有正偏態的情形,但應該不影響迴歸的使用?

yhliu:Model 2 是 model 1 加上 D, E 兩解釋變數? 我猜這兩解釋變 02/02 15:26
yhliu:數不會與 A, B, C 無關或低度相關. 但顯然這兩變數加入, 至 02/02 15:28
yhliu:少其中之一, 對解釋力的貢獻是可懷疑的. 模型中加入不重要的 02/02 15:29
yhliu:解釋變數, 將使參數估計的誤差擴大, 這是導致在 model 1 顯 02/02 15:30
yhliu:著的 A, B, C 等解釋變數在 model 2 變成不顯著的可能原因. 02/02 15:31
yhliu:看標準化係數看不出什麼, 看原始尺度的迴歸係數及其標準誤, 02/02 15:32
yhliu:比較能看出問題是否如我猜測的. 02/02 15:33

沒錯,model 2 就是再加上D、E變項。

其實這些變項間都有或多或少相關(如下表)
Y A B C D E
Y 1
A .289* 1
B .394** .079 1
C .362** .154 .314** 1
D .485** .276* .432** .309** 1
E .429** .127 .257* .479** .480** 1

我目前解釋的方式是比較朝向
「ABC變項就可以很好的解釋Y,增加DE變項無法增加對Y的了解」來解釋。
但又卡在,
當以ABCD或ABCE來預測時,
其實又都可顯著增加解釋力(和只用ABC來預測相比),且D/E變項也有顯著解釋力,
這樣說起來,
好像是因為變項間的相關才導致以ABCDE來預測時,所有變項的效果都不顯著。
只是先前詢問老師,
老師是覺得相關也沒有到極高、VIF也都蠻低的(都不到2),應該不是這個問題。

ps.已補上未標準化的數據,好像也沒有誤差過度膨脹的狀況。

coldwind0912:從未標準化估計值的標準誤來看 我覺得標準誤有點大.. 02/02 19:32
coldwind0912:尤其A.B又是單題10點量表 從M和SD來說 這分布也太... 02/02 19:33
coldwind0912:單題的10點量表 要視為continuous data跑回歸..... 02/02 19:34
coldwind0912:我只能說這誤差值沒爆表 已經是不幸中的大幸了... 02/02 19:35
yhliu:本來 model 1 的係數顯著性就不是很高 (t 值不是很大), 加入 02/03 17:17
yhliu:D, E, 雖然 VIF 不是很大, 但係數的標準誤應有明顯提高吧? 02/03 17:18
yhliu:這樣結果變成不顯著, 又有什麼奇怪? 02/03 17:19
yhliu:增加解釋項, 必然提高 R^2, 因此才有 adjusted R^2 的提出, 02/03 17:20
yhliu:希望稍為修正虛假的 R^2 提高現象. 02/03 17:21
yhliu:如果認為 D, E 還是應考慮, 那麼, 試著去掉 D 或去掉 E 看看 02/03 17:21
yhliu:吧. 02/03 17:22
yhliu:回頭看了係數及標準誤, 是係數變小了. 這是因 D, E 變數分掉 02/03 17:23
yhliu:了 A, B, C 的 "效應". 因為這些變數相互間都是正的相關, 所 02/03 17:24
yhliu:以 A, B, C 的係數因 D, E 的加入而變小也是很合理的. 02/03 17:25
yhliu:100元分給5個人跟分給3個人相比, 當然每個人得到的錢變少; 02/03 17:26
yhliu:即使5個人分時總錢數略有增加, 除非增加幅度夠大, 否則每個 02/03 17:27
yhliu:人分得的錢也將變少. 這個例子就像這種情況. 02/03 17:28

感謝大家的熱心指導、討論!
讓我可以釐清對迴歸的一些觀念,也發現到自己之前忽略了好多該注意的地方。
我比較清楚問題在哪裡了,剛好放完年假可以回學校再努力!
如果大家還有其他想法,或是想提醒後進注意的,也歡迎再提出。

再次感謝大家!新年快樂!
※ 編輯: tonmai 來自: 1.170.11.184 (02/05 17:45)

你可能也想看看

搜尋相關網站