為什麼這篇依變項意思鄉民發文收入到精華區:因為在依變項意思這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者implicit (隱)看板Statistics標題Re: [問題]請教SPSS如何控制某幾個X...
依變項意思 在 Cyrus @ 除了旅行、還是旅行 Instagram 的最佳解答
2021-09-24 01:24:47
#近況 最近有看我story的大家都知道 這些天迷上了烘焙 花藝工作室現在都變成烘焙工作室了 整個都是蛋糕的香氣 中秋節還做了幾個曲奇+瑪德蓮的禮盒送給家人 幸好家人永遠是最包容的 都開開心心地把成品都吃光光了 然後有點體會到媽媽看著小孩把東西都吃掉的滿足心情~哈哈🤭 烘焙真的是一門高深的科學 溫...
※ 引述《WendyWang (粉紅喵)》之銘言:
: 關於logistic regression有點問題一直無法解開
: 爬過文沒有找到類似的文章
: 特來請教各位大大~
: 我目前主要要探討
: X:三種不同抽菸量(類別變項)
: 對於Y:肺部疾病 (有/無)(二元變項) 的區辨力
: 但是要控制一些X : 年齡(老/中/青), 性別(男/女), 收入(高/低) (共變項)
: 採用logistic regression
: 在SPSS裡面的做法
: Depedent: 肺部疾病(有/無)
: Covariate: 年齡(老/中/青), 性別(男/女), 收入(高/低), 抽菸量(高/中/低)
: 結果:
: 有無肺部疾病
: B OR 95% C.I.
: Lower Upper
: 年齡
: 青 0.389 0.708 0.200 1.912
: 中 1.000
: 老 -0.141 3.682 2.036 9.514
: 性別
: 男 1.000
: 女 -0.442 0.643 0.135 3.053
: 收入
: 低 1.000
: 高 -1.689 0.485 0.040 1.859
: 抽菸量
: 低 1.000
: 中 3.029 2.685 2.308 5.386
: 高 1.057 20.878 2.164 50.500
: 不過老闆說~ 這些X都有係數和OR出現
: 只代表把全部X都同時考量 是為crude model
: 並非把年齡, 性別, 收入"控制"了 (adjusted)
: 因為老闆也不是很懂 (我們不是統計厲害的系所)
: 但老闆說如果有被"控制"的X 就不會出現在model中 不會還有係數或OR
: 可是找過相關的書籍和文獻~
: 都找不著別的做法 (還是會同時出現所有X的係數和OR)
: 而且SPSS中~ binary logistic regression也沒有能控制某些covariate的選項
: 請教高手大大們~
: 希望能給些指點
: 謝謝!!
這其實就是「控制變數」概念的問題
就我的認知,你老板可能也稍稍弄錯了控制變數的意義
所謂控制變數,是因為非是研究的主要探討變數
但是又這個(些)變數又會對依變數產生影響,所以必須要「控制」
在統計上的處理就是視為「自變項」丟入
而在統計上的意義則是將控制變項的「效果」自依變項中「排除」
所以這也是為什麼自變項愈多 則迴歸的R-square愈高
題外話
這類控制的意義在迴歸中常稱為「控制變數」(control variables)
而在變異數分析(ANOVA)中則稱為「共變數」(covariates)
ANOVA加上covariate的概念就是為共變數分析(ANCOVA)
當然另一個問題是
既然控制變數跟自變數在處理上是一樣的
那分為控制變數跟自變數的意義在那?
主要是在於研究的焦點
大部份研究的焦點都是集中在某幾個變數間的效果
但是有些額外的變數已經被證實或者應該會對依變項有影響
若是不控制這些變數的效果 (也就是不把這些變數的效果排除的話)
則分析的結果就會被挑戰
所以當研究中清楚的區分出控制變數與自變數後
研究的可信度可以比較有說服力
當然,控制變數的效果不論顯著與否,通常是不討論的
而且有時為了清楚表達,
許多人會採用階層迴歸(hierarchical regression)的方式來表現
讓讀者知道控制變數解釋了多少變異量,而後的自變項又增加了多少變異量
回到你的問題
縱然logistic regression非是線性迴歸
但是控制,或者你這邊說的共變數的意義是一樣的
所以在模型中出現控制變數的odds ratio是正常的
而且是必然的
當然如前所說,你並不需要特別去討論這些共變數的意義
只要將焦點集中在自變項的OR就可以了
希望這樣有回答到你的疑問
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.110.191