為什麼這篇虛擬變數 控制變數鄉民發文收入到精華區:因為在虛擬變數 控制變數這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者easy212028 (easy212028)看板Statistics標題[問題] year d...
其實我對於dummy variable一直不是很了解
下午爬了前面的文章,算是了解了dummy,是要設一個對照組去做比較的
但是我現在有一個問題是
我被要求要在原本的回歸式中加入year dummy 和industry dummy
去控制year 和industry的影響
但我不太理解這是要怎麼做,做完之後又應該怎麼解釋?
我的資料年度是從1998-2012,industry是依據北美NAICS二位數去做分類從11-91
那要我做dummy的意思是將每一個年度和每一個產業都設一個dummy,
然後代入方程式中嗎?
例如我現在的方程式是
y=x+control
y是應變數,x是自變數,control是多個控制變數的簡化表示
要再加入year dummy和industry dummy的意思是讓方程式變這樣嗎?
y=x+control+y1998+....y2012+industry11+.....industry91
如果是這樣dummy variable的要求不是要用n-1個嗎?
那我應該要去掉1998年的,還是2012年的呢?
industry也是同樣的問題,要去掉哪一個呢?
這樣跑完後的迴歸係數結果要怎麼解釋?
我真的有認真爬了版上的文章,也在網路上蒐尋過,
但都沒有找到我要的答案,所以在此po文
希望版上有人可以為我解答?
或者如果有人知到哪裡有資訊可以讓我自己去看我也願意去翻查資料
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.105
※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1397201750.A.7BF.html
※ 編輯: easy212028 (140.112.25.105), 04/11/2014 15:36:58