[爆卦]虛擬變數 控制變數是什麼?優點缺點精華區懶人包

為什麼這篇虛擬變數 控制變數鄉民發文收入到精華區:因為在虛擬變數 控制變數這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者easy212028 (easy212028)看板Statistics標題[問題] year d...


其實我對於dummy variable一直不是很了解
下午爬了前面的文章,算是了解了dummy,是要設一個對照組去做比較的
但是我現在有一個問題是
我被要求要在原本的回歸式中加入year dummy 和industry dummy
去控制year 和industry的影響
但我不太理解這是要怎麼做,做完之後又應該怎麼解釋?

我的資料年度是從1998-2012,industry是依據北美NAICS二位數去做分類從11-91
那要我做dummy的意思是將每一個年度和每一個產業都設一個dummy,
然後代入方程式中嗎?

例如我現在的方程式是

y=x+control

y是應變數,x是自變數,control是多個控制變數的簡化表示
要再加入year dummy和industry dummy的意思是讓方程式變這樣嗎?

y=x+control+y1998+....y2012+industry11+.....industry91

如果是這樣dummy variable的要求不是要用n-1個嗎?
那我應該要去掉1998年的,還是2012年的呢?
industry也是同樣的問題,要去掉哪一個呢?

這樣跑完後的迴歸係數結果要怎麼解釋?

我真的有認真爬了版上的文章,也在網路上蒐尋過,
但都沒有找到我要的答案,所以在此po文
希望版上有人可以為我解答?
或者如果有人知到哪裡有資訊可以讓我自己去看我也願意去翻查資料
謝謝!

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.105
※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1397201750.A.7BF.html
※ 編輯: easy212028 (140.112.25.105), 04/11/2014 15:36:58
andrew43:去掉哪個,哪個就成為基準點,按你需求做就可以了。 04/11 19:08
easy212028:我試著放入了year dummy,1998-2012總共14個年度,我放 04/11 19:12
easy212028:了13個dummy進去,但是卻出現其中一個有共線性問題,我 04/11 19:13
easy212028:查過,dummy產生共線性應該是dummy trap的關係,但是我 04/11 19:14
easy212028:確實有刪掉一個dummy了,為什麼還是有共線性問題? 04/11 19:14
easy212028:不知道有沒有人知道這樣要怎麼辦? 04/11 19:15
yhliu:15個年度14個虛擬變數, 再加行業別, 再加其他控制變數, 還有 04/12 04:27
yhliu:主要的解釋變數, 這模型未免太複雜了! 有幾筆資料?足夠估計 04/12 04:28
yhliu:這麼多項的係數?計算上不會因誤差的傳播而失真嗎? 04/12 04:29
easy212028:是老師突然跟我說要加入年度和行業dummy進去控制的,我 04/12 11:04
easy212028:也不確定是不是就是這樣加 04/12 11:05

你可能也想看看

搜尋相關網站