為什麼這篇多項式羅吉斯迴歸spss鄉民發文收入到精華區:因為在多項式羅吉斯迴歸spss這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者shirley7483 (Shirley)看板Statistics標題[程式] SPSS 非獨立...
[軟體程式類別]:SPSS
[程式問題]:
在SPSS使用logistic regression分析非獨立樣本,
與迴歸分析中觀察樣本必須獨立的前提假設是否有衝突?
[軟體熟悉度]:新手
[問題敘述]:
我的實驗設計是每個受測者會被分配到甲/乙其中一種情境,
每個情境中都有四種不同的商品,受測者須對評估這些商品,並選擇購買其中之一,
雖然每個受測者拿到的四種商品都不同,但可依商品特性分成A、B、C、D四種,
研究目的:在不同情境下,評估行為(是否查看評論、是否查看商品資訊)和商品特性
(A、B、C、D)對於購買行為的影響會不會不同
查詢過後發現,這類discrete choice model的實驗,通常會使用multinomial logistic
regression 或 conditional logistic regression來做分析
想要請教各位的是:
logistic regression有一前提假設是【樣本之間必須彼此獨立】,
而上述實驗屬於非獨立樣本(因為買其中之一就不會買其他的商品),
使用SPSS的 multinomial logit 或 conditional logit 會不會有問題呢?
目前嘗試使用SPSS分析,但一想到觀察樣本必須獨立的假設,心裡就覺得不太踏實...,
實作中也有遇到一些疑問想請教
1. multinomial logit因為DV要是多類別,所以刪減資料,只取被購買的那項商品來分析
dataset size = 受測者人數
DV:購買哪種特性的商品(A、B、C、D)
IV:情境(甲、乙)、背景變項(如:年齡、性別、是否熟悉這類商品...等)、
是否看商品評論、是否看商品資訊、交互作用項
使用multinomial logit的疑問是,若要將所有資料納入(把未被購買的商品加進來)
,資料結構要如何修改呢?
還是其實可以不修改資料結構,直接把所有資料丟進去跑,只是DV改成是否購買?
2. conditional logit,以survival cox regression來實作,
時間變數的部分是將購買的商品設為1,未被購買的設為2
dataset為long format,size = 受者者人數*商品數(4)
DV:是否購買
IV:情境、背景變項、是否查看評論、是否查看商品資訊、商品特性、交互作用項
想請教這邊的conditional logit是否需要考慮觀察樣本必須獨立的前提假設呢?
3. 如果要研究商品特性與情境如何影響評估行為,
將DV改成是否查看評論,這樣是不是就能將資料視為獨立樣本,
可直接使用binary logistic regression了呢?
[程式範例]:
dataset (long format)大概長這樣 http://imgur.com/5xUikOW
再請各位協助解惑了,感激不盡!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.240.100.128
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1496308348.A.F6E.html
※ 編輯: shirley7483 (111.240.100.128), 06/01/2017 18:21:54
※ 編輯: shirley7483 (111.240.100.128), 06/01/2017 20:17:24
感謝andrew43大的回覆!
您說的一人一列資料的意思是,要把其他未被購買的商品放進來嗎?
(如:B/C/D商品的特性、是否查看B/C/D商品的評論、是否查看B/C/D商品的資訊)
還是您的意思是只須分析 每人選擇購買的商品 的那筆資料就好?(不管另外三個商品)
另外,關於問題3,如果想以 是否查看評論 來當作應變數,會有非獨立樣本的問題嗎?
(可能有人只看A商品的評論,有人看A、C的評論,有人全部都看)
補充:每個人的ABCD商品是完全不同的,只是有類似的特性才歸類成四種類別
(受測者1拿到的A商品與受測者2拿到的A商品不同,但都有A特性)
※ 編輯: shirley7483 (111.240.100.128), 06/01/2017 21:08:51
※ 編輯: shirley7483 (111.240.100.128), 06/01/2017 21:14:03
不獨立的問題來自於希望將四種商品的特徵與行為都納入為自變數
在long format(如文中附圖)中,雖然每人之間獨立,但每筆資料(有紀錄每人對每項商品
做出的動作)是不獨立的
若是改成wide format,遇到的問題:不知DV、IV該如何設計,才能將未被購買的另外三
個商品納入考量?
之前曾看過在這類choice model中使用mixed logit來分析的文章,SPSS中可能可使用的是
GEE、mixed model,對這兩種方法瞭解較少,不知道上述dataset適不適合使用?
目前理解是,這兩種方法都是以連續變數為應變數,但我的資料中,應變數為類別變數
(「是否購買」或「購買A/B/C/D哪種商品」或「是否查看評論」),故可能不適合...
※ 編輯: shirley7483 (118.150.79.175), 06/02/2017 14:24:21
感謝yesrex、andrew43!
對於轉換成wide table之後有點不太懂,想再請教三個問題 >"<
1.不太確定如何轉成wide table(對dummy variable沒有很理解)
試著轉換之後,wide table大概會長這個樣子嗎?
http://imgur.com/UIMvKUj
2.yesrex大說的是,使用wide table做MNL,應變數放purchase(此人購買ABCD哪種商品),
自變數就直接將剩下的都丟進去?
3.andrew43大說的之後挑掉的意思是,如第2點,做full model分析後,把不顯著的挑掉,
然後繼續試各種自變數與交互作用的組合嗎?
如果是的話,有個疑問:alterA_review、alterB_review...這四個變數推測是一組的,
,然後其中有一個是reference category。若有兩個不顯著先剔除,那剩下的兩個變數
該如何解釋呢?
還是這四個變數是一組的,要就一起剔除,不然就一起留下,才能夠解釋?
以上,感謝大家不厭其煩的協助!!!
※ 編輯: shirley7483 (111.240.96.23), 06/03/2017 23:52:01