[爆卦]虛擬變數定義是什麼?優點缺點精華區懶人包

為什麼這篇虛擬變數定義鄉民發文收入到精華區:因為在虛擬變數定義這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者Nu (Nu)看板Statistics標題[程式] Stata 設公司虛擬變數後 跑panel的...



[軟體程式類別]:
Stata
[程式問題]:
迴歸

[軟體熟悉度]:
新手(不到1個月)


[問題敘述]:
我的資料是panel型態

有用xtset ID Time 定義過 ( ID就是公司的代碼,如台泥1101這樣 )

而且有Sort ID Time

因為想要測量不同公司的影響,因此我對每個公司都有設虛擬變數

大概有一千多家公司,所以有一千多個虛擬變數,

而且我有用瀏覽資料檢查過,

只要公司代碼是1101的時候,第一個虛擬變數就會是1,其它都是0,

公司代碼是1102時,第二個虛擬變數就都是1,其它都是0,以此類推


接著我用xtreg y d1-d1292 x1 x2 x3,fe

跑完後每個虛擬變數都出現omitted because of collinearity的訊息

所以這些變數的係數都變成omitted

不過x1 x2 x3等自變數的係數還是有跑出來



然後又改用一般複迴歸,reg y d1-d1292 x1 x2 x3

情況有改善,但還是有一百多家公司的虛擬變數被drop掉



請問有高手知道是為什麼嗎?




-----------------------------------------------------------------------------

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.123.28.131
※ 編輯: Nu 來自: 140.123.28.131 (03/06 16:39)
ahuai612:虛擬變數過多會有共線性的問題 03/12 23:32
ahuai612:要不要試試最後一家公司不要設虛擬變數? 03/12 23:32

你可能也想看看

搜尋相關網站