[爆卦]控制變數回歸是什麼?優點缺點精華區懶人包

為什麼這篇控制變數回歸鄉民發文收入到精華區:因為在控制變數回歸這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者implicit (隱)看板Statistics標題Re: [問題]請教SPSS如何控制某幾個X...


※ 引述《WendyWang (粉紅喵)》之銘言:
: 關於logistic regression有點問題一直無法解開
: 爬過文沒有找到類似的文章
: 特來請教各位大大~
: 我目前主要要探討
: X:三種不同抽菸量(類別變項)
: 對於Y:肺部疾病 (有/無)(二元變項) 的區辨力
: 但是要控制一些X : 年齡(老/中/青), 性別(男/女), 收入(高/低) (共變項)
: 採用logistic regression
: 在SPSS裡面的做法
: Depedent: 肺部疾病(有/無)
: Covariate: 年齡(老/中/青), 性別(男/女), 收入(高/低), 抽菸量(高/中/低)
: 結果:
:         有無肺部疾病
: B OR 95% C.I.
:     Lower Upper
: 年齡
:   青 0.389 0.708 0.200 1.912
:   中   1.000
:   老 -0.141 3.682 2.036 9.514
: 性別
: 男 1.000
: 女 -0.442 0.643 0.135 3.053
: 收入
: 低 1.000
: 高 -1.689 0.485 0.040 1.859
: 抽菸量
: 低 1.000
: 中 3.029 2.685 2.308 5.386
: 高 1.057 20.878 2.164 50.500
: 不過老闆說~ 這些X都有係數和OR出現
: 只代表把全部X都同時考量 是為crude model
: 並非把年齡, 性別, 收入"控制"了 (adjusted)
: 因為老闆也不是很懂 (我們不是統計厲害的系所)
: 但老闆說如果有被"控制"的X 就不會出現在model中 不會還有係數或OR
: 可是找過相關的書籍和文獻~
: 都找不著別的做法 (還是會同時出現所有X的係數和OR)
: 而且SPSS中~ binary logistic regression也沒有能控制某些covariate的選項
: 請教高手大大們~
: 希望能給些指點
: 謝謝!!

這其實就是「控制變數」概念的問題
就我的認知,你老板可能也稍稍弄錯了控制變數的意義
所謂控制變數,是因為非是研究的主要探討變數
但是又這個(些)變數又會對依變數產生影響,所以必須要「控制」
在統計上的處理就是視為「自變項」丟入
而在統計上的意義則是將控制變項的「效果」自依變項中「排除」
所以這也是為什麼自變項愈多 則迴歸的R-square愈高
題外話
這類控制的意義在迴歸中常稱為「控制變數」(control variables)
而在變異數分析(ANOVA)中則稱為「共變數」(covariates)
ANOVA加上covariate的概念就是為共變數分析(ANCOVA)


當然另一個問題是
既然控制變數跟自變數在處理上是一樣的
那分為控制變數跟自變數的意義在那?
主要是在於研究的焦點
大部份研究的焦點都是集中在某幾個變數間的效果
但是有些額外的變數已經被證實或者應該會對依變項有影響
若是不控制這些變數的效果 (也就是不把這些變數的效果排除的話)
則分析的結果就會被挑戰
所以當研究中清楚的區分出控制變數與自變數後
研究的可信度可以比較有說服力
當然,控制變數的效果不論顯著與否,通常是不討論的
而且有時為了清楚表達,
許多人會採用階層迴歸(hierarchical regression)的方式來表現
讓讀者知道控制變數解釋了多少變異量,而後的自變項又增加了多少變異量

回到你的問題
縱然logistic regression非是線性迴歸
但是控制,或者你這邊說的共變數的意義是一樣的
所以在模型中出現控制變數的odds ratio是正常的
而且是必然的
當然如前所說,你並不需要特別去討論這些共變數的意義
只要將焦點集中在自變項的OR就可以了
希望這樣有回答到你的疑問


--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.110.191
WendyWang:謝謝大大~另想請問Multinomial logistic regression~ 08/04 21:54
WendyWang:在SPSS裡面有分別放factor和covariate的地方~ 08/04 21:55
WendyWang:這樣自變數和共變數的處理是否就不同了~ 08/04 21:55
WendyWang:但結果出來自變數有呈現三種抽菸量的OR 08/04 21:56
WendyWang:可是共變數(類別變項)卻都只有一個係數和OR,沒有各組的 08/04 21:56
WendyWang:是否Multinomial的 共變數只能放連續變項? 08/04 21:58
implicit:Multinomial logistic regression的用法我不太確定 08/04 23:47
implicit:我要查一下才能回覆你囉~ 08/04 23:47
kingbee:自變項被設定dummy 共變項被當作連續變項使用了 08/05 09:11
kingbee:Multinomial 差在會有多個依變項 就有n-1個捷距 08/05 09:12
kingbee:解釋上比較不容易解釋 08/05 09:12
implicit:就像k大說的,Multinomial是用在二個以上的類別為依變項 08/05 15:43
implicit:你的研究依變項只有二類,理應用一般的邏輯斯迴歸就可以 08/05 15:44
WendyWang:謝謝兩位大大幫忙~感激不盡~苦惱如何跟老闆說他想錯了.. 08/06 01:04
WendyWang:請問大大~ 關於SPSS的邏輯斯回歸有無推薦的書籍呢? 謝謝 08/06 01:05
implicit:有一本書 logistic regression: a self-learning text 08/06 14:52
implicit:我覺得寫得很清楚 你可以參考一下 08/06 14:53
WendyWang:謝謝大大的幫忙~ 08/07 14:17
sneak: 可是共變數(類別變項) https://daxiv.com 01/02 14:57

你可能也想看看

搜尋相關網站