[爆卦]sst統計是什麼?優點缺點精華區懶人包

為什麼這篇sst統計鄉民發文收入到精華區:因為在sst統計這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者goshfju (Cola)看板Grad-ProbAsk標題Re: [商管] [統計] 交大工工...


※ 引述《goshfju (Cola)》之銘言:
: ※ 引述《constipation (constipation)》之銘言:
: : 題目在下面..怕題目太長有人會直接左轉,所以先摘要一下
: : 這題是迴歸無截距模型~主要是想問(b)小題
: : 有給樣本數據~想請問SSTO會=SSR+SSE嗎?
: : 因為有看到某詳解是
: : ANS:
: : 無截距模型不一定通過(Xbar,bYar)之點,
: : 但一定通過(0,0)...所以SSTO=Σ(Yi-0)^2 SSR=Σ(Yhat-0)^2 SSE=(Yi-Yhat)^2
: : 所以SSTO = SSR + SSE
: : => 352 = 340.37+11.63 (解答用樣本數據帶入上述三公式剛好相等)
: : 但是無截距模型不是殘差和Σei≠0嗎? 如果公式是向上面的解答這樣的話
: : 不是應該代入任何無截距模型 SSTO都會 = SSR+SSE嗎? 麻煩高手幫忙解惑
: 我沒証過
: 但
: SST = Σyi^2
: SSReg = b^2Σxi^2
: SSE = Σei^2
: ( yi = bxi + ei)
: SST = SSReg + SSE
: 一定會滿足
: 應該也不難證
: 我證一下好了
: Σyi^2 = Σ(bxi + ei)^2 = b^2Σxi^2 + Σei^2 + 2bΣxiei
: ( 由最小平方法可知 Σxiei = 0 )
: 所以就得到
: Σyi^2 = b^2Σxi^2 + Σei^2
: SST = SSReg + SSE

有人來信跟我說沒截距項的話
SST =\= SSReg + SSE
很堅持 SST 一定要是 Σ(yi-ybar)^2
然後說我擅自改平方和的定義 =.=

我是不懂
為何他就是不聽我的話
跑跑統計軟體看看或是找迴歸的原文書去驗證
就是很相信他看的東西(補習班講義?)或是聽別人說的

但我還是找些資料
其實看wiki就夠了
http://en.wikipedia.org/wiki/Simple_linear_regression
看相關係數的地方
http://i.imgur.com/kqJ7inL.png
沒截距項的話...
是不需要扣除平均數的

我再跑下統計軟體
樣本數據為
x y
1 2
2 3
3 5
4 8
5 9
結果在下面
http://i.imgur.com/IRfaPRI.png
我把它貼上來

Regression Analysis: y versus x

The regression equation is
y = - 0.300 + 1.90 x

Predictor Coef SE Coef T P
Constant -0.3000 0.6351 -0.47 0.669
x 1.9000 0.1915 9.92 0.002

S = 0.605530 R-Sq = 97.0% R-Sq(adj) = 96.1%

Analysis of Variance

Source DF SS MS F P
Regression 1 36.100 36.100 98.45 0.002
Residual Error 3 1.100 0.367
Total 4 37.200

有截距項時 總變異平方和的自由度為4 這裡的 SST=Σ(yi-ybar)^2=37.2

Regression Analysis: y versus x

The regression equation is
y = 1.82 x

Predictor Coef SE Coef T P
Noconstant
x 1.81818 0.07329 24.81 0.000

S = 0.543557

Analysis of Variance

Source DF SS MS F P
Regression 1 181.82 181.82 615.38 0.000
Residual Error 4 1.18
Total 5 183.00

沒截距項時 總變異平方和的自由度為5
代表這裡沒有扣除平均數

2 2 2 2 2 2
SST=Σyi =2 +3 +5 +8 +9 =183
跟我上篇文推的式子穩合

而沒截距項時 SST=SSReg+SSE 上篇文推過了

我來稍微推下為何有截距項時
平方和要扣除樣本平均數
yi=a+bxi+ei
a=ybar-b*xbar代入yi得
yi-ybar=b(xi-xbar)+ei
SST=Syy=Σ(yi-ybar)^2=Σ[b(xi-xbar)+ei]^2= …… =b1^2*Sxx+Σei^2=SSReg+SSE

(展開並利用最小平方法的結果)
不難看出因為有截距項的關係..
所以才會扣除樣本平均數

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 203.74.133.4

你可能也想看看

搜尋相關網站