為什麼這篇Dummy variable SPSS鄉民發文收入到精華區:因為在Dummy variable SPSS這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者sk2allwin (allwin)站內Statistics標題Re: [程式] SPSS, d...
※ 引述《saxonwing (翾刖)》之銘言:
: [軟體程式類別]:
: SPSS
: [程式問題]:
: dummy coding及exclude variable
: [軟體熟悉度]:
: 高(1年以上)
: ←雖然算常用,但其實真的沒有很熟,會用到的就是那幾樣
: [問題敘述]:
: 想請教大家幾個問題,被卡到快抓狂了orz
: (1)dummy coding的時候,使用0跟1或1跟2有差嗎?
: 在我過去的上課和使用經驗當中,dummy就是使用0和1
: 我所需要處理的變項是性別,一開始就設定為男性=1,女性=2
: 但是這次在分析資料的時候,發現了一個狀況
: 有一份問卷是實驗進行到一半的時候才加入的
: 因此前20個受試者都沒有這份問卷的數據
: 當我將性別與該份問卷的數據相乘想看交互作用時
: 前20個應該是遺漏值的受試者有些卻出現了0
: 也就是說,男性(1)*問卷分數沒問題,遺漏的部分就還是沒有數據
: 但是女性(0)*問卷分數,本該是遺漏的地方卻是0
: 這個問題我一直解決不了,換成99並設定遺漏值也是同樣的狀況
: 因此我聽從學校老師的建議,將性別置換成1跟2
: 就沒有再出現這個狀況
: 但我手邊的工具書和課本、外校的統計老師以及在網路上找到的範例
: dummy都是以1跟0去做編碼
: 所以我想請問大家,到底dummy能不能用1跟0以外去編碼
: 還是就像那個老師說的,只要不一樣即可?
如果有加入交互作用項的話,dummy用0、1和用1、2會有不同的係數。
如果沒有交互作用項的話,dummy用0、1出來的結果和用1、2是一致的。
沒有交互作用時:
y=β1*dummy+β2*問卷分數+ε
當dummy為0=女和1=男時:
女的分數:y女=β2*問卷分數+ε
男的分數:y男=β1+β2*問卷分數+ε
當dummy為1=女和2=男時:
女的分數:y女=β1+β2*問卷分數+ε
男的分數:y男=β1*2+β2*問卷分數+ε
請注意:此時兩者的差別出現在β1,因為β1是常數,所以基本上dummy設為0、1
或設為1、2,產生的變項係數會一致(也就是兩者的差別是在截距項)。
試著思考您的方程式應該如下:
y=β1*dummy+β2*問卷分數+β3*dummy*問卷分數+ε
當dummy為0=女和1=男時:
女的分數:y女=β2*問卷分數+ε
男的分數:y男=β1+β2*問卷分數+β3*問卷分數+ε
當dummy為1=女和2=男時:
女的分數:y女=β1+β2*問卷分數+β3*問卷分數+ε
男的分數:y男=β1*2+β2*問卷分數+β3*問卷分數*2+ε
請注意:此時dummy為0、1時,女生沒有β3的估計值;
但是dummy為1、2時,女生有β3的估計值。因為β3的估計值是跟著變項(問卷分數)而動,
所以變項的係數估計值在dummy為0、1以及dummy為1、2間會不同。
PS.用dummy為0、1時,你可以先用「選擇觀察值」的功能先使用「無問卷分數遺漏」的
個案進行compute,爾後再用全部觀察值來跑regression。
這樣就可以解決你女生交互項出來為0的狀況。
另外,case數如果少的話,也可以考慮手動遺漏值
: (2)用Enter法卻出現Exclude variable
: 接續上面
: 當我進行回歸的交互作用分析時
: 是使用Enter法將變項一層一層丟進去
: 例如想看性別與A、B問卷的交互作用
: 第一層是丟"性別、A、B"
: 第二層丟"性別*A、性別*B、A*B"
: 第三層是丟"性別*A*B"
: 分明不是使用stepwise,output卻出現exclude variable
: 直接把我的交互作用項踢掉
: 我不知道為什麼會出現這個問題
: 是因為共線性過高的關係嗎?那要如何處理呢?
: 請大家救救我QQ
: [程式範例]:
: REGRESSION
: /MISSING LISTWISE
: /STATISTICS COEFF OUTS R ANOVA
: /CRITERIA=PIN(.05) POUT(.10)
: /NOORIGIN
: /DEPENDENT DELTA_32
: /METHOD=ENTER gender NMR_total SSRT
: /METHOD=ENTER GxN GxSSRT NxSSRT
: /METHOD=ENTER G_N_SSRT.
: (平常是直接點視窗上的按鈕,上面是點完paste出來的)
我猜測你是沒看懂報表。
因為你用的是hierarchical regression。
所以基本上報表會報出每一層沒有納入的變項,另列一個exclude variable的報表。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 36.238.89.73