為什麼這篇線性回歸預測鄉民發文收入到精華區:因為在線性回歸預測這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者honichi (honichi)看板Statistics標題[問題] 線性回歸預測模型的變數選...
統計專業板友好,老妹統計外行一個,工作多年基本上都還給教授了,
最近負責帶的暑期實習生專案遇到了一個問題想請教
<背景>
研究主題是「市場變數對公司產品價格(單位價格)的影響」
(敝公司產品類似記憶體產業那種3-5家寡占性競爭)
事實上這個主題在2015年曾有前手研究過,當時以2010-2014資料分析,
得出最強三大相關性的因子為
1.供需 2.市占率總變動值(前三大取絕對值) 3. 下游客戶獲利率
然而此次以2015-2021資料研究,整體變數的相關性幾乎都接近0或低度相關
勉強找出前三大相關性因子為
1.季節性 2.市占率總變動值 3.競爭對手獲利率
光是供需這一點完全變成沒有相關性,就快被老闆問到瘋了~不過我已經找到解釋的原因
(市場供需的結構改變和目前使用的估算資料可能和我們理解的真實世界不同)
<問題>
由於需要預測2022價格走勢,我讓實習生找出一個比較合適的模型 (多變數線性回歸)
我直覺認為應該1.季節性 2.市占率總變動值 3.競爭對手獲利率的模型會是最合適的
R2=0.77
各自P-value為0.0/0.69/0.0
沒想到實習生卻得到1.季節性 2.供需 3.競爭對手獲利率的組合會更合適
R2=0.82
各自P-value為0.0/0.04/0.0
原本跟老闆說,供需已經變不重要變數了,結果預測還使用了供需這個變數
完全打臉~
我的問題可能問得不夠專業,盼板友可以分享可能的原因或不吝指正
謝謝大家~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 165.225.116.174 (美國)
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1632448520.A.0DC.html