為什麼這篇y對x的迴歸直線鄉民發文收入到精華區:因為在y對x的迴歸直線這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者Pacers31 (17)看板Math標題Re: [中學] 高中統計一問時間Sun Sep 1...
※ 引述《beckda (五十倍一百倍我都)》之銘言:
: 關於y對x的迴歸直線
: 必過點(Ux,Uy)
: 若假設迴歸直線為y=2x+4
: 那請問下列幾個疑問
: (1)x對y的迴歸直線為何不可以改為x=(y-4)/2
: 雖然我知道要另外算新的斜率但不知道要如何解釋
y=2x+4 斜率2 (x-y系統),x=(y-4)/2 斜率1/2 (y-x系統)
假如兩迴歸直線可以直接像上述這樣表示
代表斜率要互為倒數,畫在x-y坐標平面上是同一條直線,真的是如此嗎?
資料(X1,Y1), (X2,Y2),..., (Xn,Yn)
y對x的迴歸直線y=ax+b
當中的a,b是使得 Σ[Yi-(aXi+b)]^2 達到最小的a,b ---(*)
結果推得斜率a=Sxy/Sxx (Sxy=Σ(Xi-Ux)(Yi-Uy), Sxx=Σ(Xi-Ux)^2)
x對y的迴歸直線x=cy+d
當中的c,d是使得 Σ[Xi-(cYi+d)]^2 達到最小的c,d ---(#)
結果推得斜率c=Sxy/Syy (Syy=Σ(Yi-Uy)^2)
從結論公式來看
a,c若要互為倒數(ac=1),那只有一種情形: 相關係數平方SxySxy/(SxxSyy)=1
所以只要不是完全相關,兩條迴歸直線的斜率就不會剛好是倒數了
或者你可以從散佈圖上說明一下 (*)以及(#)的意義
先在坐標平面上(橫x,直y)畫幾個資料點,畫一條感覺上的適合直線L
(*)的準則是將每個資料點(Xi,Yi)作鉛直線到直線L的長度,平方總和要最小
(#)的準則是將每個資料點(Xi,Yi)作水平線到直線L的長度,平方總和要最小
原始問題就變成了x-y平面上同一條直線L,同時能夠滿足(*)以及(#)準則
但真的會如此嗎? 從前面推得的斜率a,c結論已說明,除非是完全相關
否則斜率不會互為倒數,也就是這兩條迴歸直線畫在x-y平面上不會是同一條!
有點冷冰冰地直接從最小平方法的準則以及公式去解釋...
不知道有沒有更人性更生活化一點的方式說明...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.241.39.249
※ 編輯: Pacers31 來自: 123.241.39.249 (09/01 17:13)