為什麼這篇虛擬變數設定鄉民發文收入到精華區:因為在虛擬變數設定這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者weiwei1110 (威威)看板Statistics標題[程式] R 虛擬變數設定問題請教時間...
[軟體程式類別]:
R
[程式問題]:
跑多元迴歸時的虛擬變數設定問題
[軟體熟悉度]:
新手以上一點點
[問題敘述]:
目前正在建立一個有關flyingV募資平台的迴歸模型
依變數 Y = (每筆專案的)實際募資金額/目標金額
其中有幾組自變數X是虛擬變數,如
1.不同專案類別(category):共有九種→設計、科技、社會...等
2.是否有早鳥優惠(earlybird):共有兩種→有或無
3.專案發起月份(month):共有12種→12個月
但我用factor來代替虛擬變數,所以我的迴歸模型大概如下:
model <- lm(y ~ X1+...+factor(category)+factor(earlybird)+factor(month)+...)
想請問如果設factor的話,R會自動把這幾個變數判斷為虛擬變數嗎???
還是需要設dummy variable才行???
目前看起來好像是能夠執行,但是很怕一切都是我的誤會OAQ
附上其中一組model的迴歸結果
http://imgur.com/oMTDF8M
有爬過文跟估狗過,但是找不太到相關資訊
所以只好勞駕各位專業的大大幫忙了 > <
謝謝!!!
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.100
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1465958847.A.1E5.html
※ 編輯: weiwei1110 (140.112.25.100), 06/15/2016 10:53:01
※ 編輯: weiwei1110 (140.112.25.100), 06/15/2016 10:53:19