作者jayljill (jill)
看板Statistics
標題[問題] 求高手解救! 關於研究跑法(羅吉斯迴歸)
時間Thu Jun 11 23:12:47 2015
各位統計的強者好!
小的最近run完實驗,現處於資料分析完的狀態,但仍有一些疑問。
首先,想跟大家告知一下,我研究的自變項與應變項
,自變項為一個:(1)網頁上不同的"位置"(有6個位置;數類目變項)
應變項只有一個“被選擇與否”(有與沒有;數二元變項)
研究問題: (1)六個位置中,是不是某一個位置特別容易被選擇?
由於我的應變項為二元變項,因此我跑了"二元羅吉斯回歸"(自變項創虛擬變項)
**因此,我目前“疑問”的點在於
,因為每一位受測者一次會看到六個位置,
而他們的決策只有一個(意即選位置1就不會選位置2,3,4,5,6)
當依變項彼此牽制時,跑二元羅吉斯回歸是否適當?
若不適當,是否有其它跑法呢?
麻煩各位大大解惑了嗚嗚
目前資料結構>>>
id (受測者編號) 位置 決策(0為有;1為沒有)
1 1 0
1 2 0
1 3 0
1 4 0
1 5 1
1 6 0
2 1 1
2 2 0
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.37.129.45
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1434035570.A.DA2.html
→ mosenay: multinomial regression如何? 06/12 00:31
推 allen1985: 你的研究看起來只有 應變項 沒有自變項耶 因為所有人 06/12 00:47
→ allen1985: 看到的都是相同的六個位置 你再想想你到底想分析什麼 06/12 00:47
→ allen1985: 如果只是看這六個位子 有沒有哪個平均來說比較多 06/12 00:48
→ allen1985: 那麼不需要用邏輯斯迴歸 試試看卡方檢定 06/12 00:48
→ yhliu: 用不著 logistic regression. 06/12 06:14
→ yhliu: 就你的設定, 是6選1的選擇, 這是 multinomial pop. 的問題. 06/12 06:15
→ yhliu: 用卡方配適度檢定, H0: p1=p2=...=p6=1/6 06/12 06:16
→ yhliu: 如果是6個位置可獨立選或不選, 而非6選1, 則屬於6個二項群 06/12 06:18
→ yhliu: 體的問題, 也是用卡方檢定: 均齊性檢定. H0: p1=...=p6 06/12 06:18
→ yhliu: 事實上你用 logistic regression, 就等於是後一種. 只是你 06/12 06:20
→ yhliu: 的設定是一個多項群體, 而非6個二項群體, 因此不適用後一種 06/12 06:21
→ yhliu: 如果有瀏覽者特性資料為解釋變項, 或以瀏覽時間為解釋變項, 06/12 06:23
→ yhliu: 反應變項是那6選1的選擇, 就用1F說的 multinomial reg. 06/12 06:24
推 JeffMathis: 這解釋真詳細 真棒:D 06/12 10:59
→ jayljill: 感謝以上回答的大大(哭)。我現在有較清楚的方向。 06/12 14:55
→ jayljill: 然而我仍然有兩個問題。(1)執行卡方檢定時,一般一位 06/12 14:58
→ jayljill: 受測者的自變項只有一個值,如檢視不同居住地區的政黨 06/12 15:01
→ jayljill: 是否不同,一位參與者不是住北就是中或南。然而,現在參 06/12 15:05
→ jayljill: 與者一次會看到六個位置,不知道這樣的資料結構跑卡方是 06/12 15:07
→ jayljill: 適當?另,因為我有測每個位置的瀏覽時間,因此想設為解 06/12 15:09
→ jayljill: 釋變項,請問我在跑Multinomial時,是分別將六個位置的 06/12 15:10
→ jayljill: 瀏覽時間設為自變項(factor那一欄會有六個值),依變項 06/12 15:13
→ jayljill: 依變項為參與者的選擇(位置1或23..,以位置1作為參考) 06/12 15:15
→ jayljill: 這樣下去跑嗎? 再麻煩解惑了!嗚嗚嗚 06/12 15:15
→ andrew43: 如果實驗設計成每個受測者都只能6選1,那問題(1) pass 06/12 18:08
→ andrew43: 問題(2)可能可行,但要注意假重覆問題。 06/12 18:12
→ andrew43: 時間共變數是否要做適當轉換也可能要先想清楚。 06/12 18:53
→ andrew43: 因為我猜想你關心的可能不是絕對時間長,而是受測者內的 06/12 18:54
→ andrew43: 相對時間長。 06/12 18:54
→ jayljill: 感謝andrew43回答!!但我目前跑出來的結果感覺有點怪。 06/12 23:18
→ jayljill: 現在跑出來的結果的總數是240而非40(我的樣本是40),但 06/12 23:23
→ andrew43: 就是我所謂的假重複問題。 06/12 23:24
→ jayljill: 6個位置(列)下的總和是40(選擇與否是欄;位置為列) 06/12 23:26
→ jayljill: 不知道這樣結果是否正確 ヽ(゚Д`)ノ゚ 06/12 23:28
→ andrew43: 我不知道如何完全解決。可能要考慮受測者這個隨機因子。 06/12 23:29
→ andrew43: 但我對實驗方法不是完全了解。不能做更多假設來推測了。 06/12 23:32
→ jayljill: 喔!!我瞭解了。我再自行思考如何解決假重複性的問題。感 06/12 23:34
→ jayljill: 謝你壓~~ 06/12 23:34
→ yhliu: 6個選擇只能選一個, 是多項群體, 算是多變量, 而不是 6 個 06/13 03:56
→ yhliu: cases. 至於考慮有 response-dependent 的解釋變項, 印象中 06/13 03:57
→ yhliu: (很久很久以前的記憶了) 有所謂 conditional-logit model, 06/13 03:58
→ yhliu: 好像就是分析這種資料的. (不過我也無法確定這記憶有沒錯.) 06/13 04:00
→ yhliu: 上面的 "response-dependent" 正確說法好像應該是 choice- 06/13 04:01
→ yhliu: dependent. 06/13 04:01
→ andrew43: 該方法也可推廣到多項式反應變數,如上述網頁 Example 2 06/13 04:51
→ andrew43: 我對照了好幾個例子,都和你的資料相似。看來就是yhliu 06/13 05:11
→ andrew43: 大說的方法沒錯。 06/13 05:11
→ andrew43: 我也長知識了。 06/13 05:12
→ jayljill: 感謝yhliu與andrew43的回答。andrew43貼的網址我仔細研 06/13 18:53
→ jayljill: 研了一個下午,確實可行,感謝。只是若我只想知道這六 06/13 18:55
→ jayljill: 個位置被選擇的機率,使用條件邏輯model,我就不知道我 06/13 18:56
→ jayljill: 的解釋變項為何,我剛剛想了想,若我只是單純想知六個位 06/13 18:58
→ jayljill: 被選擇的機率是否不同,不知道是否可以用Repeated 06/13 18:59
→ jayljill: measure ANOVAl跑呢??? 06/13 19:00
→ andrew43: repeated measure Anova 不太適合二元變數,也不一定有c 06/13 20:20
→ andrew43: hoice dependent 的內涵。 06/13 20:20
→ yhliu: 單純看6者之中何者被選機率較大, 不就一開始說的, 卡方配適 06/14 15:11
→ yhliu: 度檢定 H0: p1=...=p6 = 1/6. 06/14 15:12
→ jayljill: 感覺總和應該40,而非240!!?? 06/14 21:08
→ andrew43: 錯了。簡單說,只分析y=1的資料。 06/15 00:57
→ andrew43: 也就是檢驗7:10:5:1:10:7 是不是 1:1:1:1:1:1。 06/15 00:58
→ andrew43: 你再想想看。感覺你沒有完全了解y大的意思。 06/15 00:59
→ jayljill: 喔我好像了解了!!這樣我是不是改用"無母數卡方跑"呢?! 06/15 10:28
→ jayljill: 就只針對分析Y=1的部分! 06/15 10:29
→ andrew43: 沒錯。 06/15 18:58