[爆卦]二維數據分析迴歸直線是什麼?優點缺點精華區懶人包

為什麼這篇二維數據分析迴歸直線鄉民發文收入到精華區:因為在二維數據分析迴歸直線這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者diego99 (誰是我的小天使?!)看板tutor標題[解題] 高一下 數據分析 相關係數與迴...


1.年級:高一下

2.科目:數學科

3.章節:第四章 數據分析

高雄市新興高中100學年度下學期第三次段考

題目來源:http://ppt.cc/EfBi

4.題目:

S高中的高一有學生700位,第一次期中考與第二次期中考的數學

成績分別以X與Y表示(用0至100評分),若X與Y的相關係數為0.83

則下列敘述何者正確?

(A) 由相關係數得知,X與Y有正向關係(即第一次期中考考得好,

則第二次期中考考得會比較好;反之,則第二次期中考考得會

比較差)

(B) 此兩次段考成績適合用x=a+by表示其相關情形(其中a,b為
^^^^^^^^
常數,b>0)

(C) 2x+5與5-2y的相關係數為0.83

(D) 7+2x與5-2y的相關係數為-0.83

(E) ( log x )×50與( log y )×50的相關係數為 | log 0.83 |


5.想法:

這題新興高中給的答案是(A)(B)(D),

只是我對(B)選項有點不解,

雖然查了一下維基百科http://ppt.cc/pMFV

簡單線性回歸(英語:simple linear regression)

應用時機:

1. 以單一變數預測

2. 判斷兩變數之間相關的方向和程度
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
但是很難理解如何用簡單線性迴歸去看兩變數間的相關程度,

一個迴歸係數為正的迴歸直線無法直接看出它們的相關程度吧?

即使是題目已給相關係數為0.83的高度相關,

這迴歸直線也只能看出他們的分佈情況,而非相關情況阿0.0

所以想請問所學是統計專長的老師,

還請您指點迷津,感恩!

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.64.108.17
※ 編輯: diego99 來自: 61.64.108.17 (06/18 10:16)
Intercome:應該單純就是因為高度相關所以適用迴歸直線罷了 06/18 10:47

題目已經說明它的相關係數了,

在選項裡面放個適合用迴歸直線表示其相關情形是件很奇怪的事情...

我要表達的是這條直線並無法表示相關情況阿。

lyricslee:答案沒問題,你邏輯很怪 06/18 12:27

可以請老師您提出哪邊的邏輯很怪嗎?
※ 編輯: diego99 來自: 61.64.108.17 (06/18 12:44)
alamabarry:我個人覺得和不合適~或是數值高不高~是很主觀的問題 06/18 12:42
alamabarry:除非有一開始就定義出題者所謂的合適準則為何 06/18 12:43
DKer:X與Y之間相關性高,且其關係接近X=a+bY <=這樣算相關情形嗎? 06/18 12:44
DKer:我也覺得那個選項的用字不夠明確 06/18 12:45
alamabarry:何謂相關性高~~我覺得這就很有爭議了 06/18 12:46
DKer:有些課本或參考書會列出高中低度相關,相關係數的參考值 06/18 12:47
DKer:但終究也是主觀認定,實際上根據回歸目的不同,「高」的門檻 06/18 12:48
DKer:也是會變化的 06/18 12:48
DKer:拍謝我廢話很多XD 06/18 12:49

不會,很感謝你們:)

現在我倒是滿期待知道我邏輯很怪的點在哪
※ 編輯: diego99 來自: 61.64.108.17 (06/18 12:53)
bluesky0831:統計學上的相關性分析指的是兩變數間直線線性相關程度 06/18 12:57
bluesky0831:一般來說相關係數絕對值介於0.5與1之間就是強相關 06/18 12:58
bluesky0831:既然相關係在數學模型上對於直線的配適度高 使用題目 06/18 12:59
bluesky0831:使用B選項所說的方程式表達相關性是很合理的 06/18 13:00
goshfju:簡單回歸的話 相關係數達顯著 迴歸係數也會達顯著 06/18 13:31
goshfju:中學蠻多關於統計的題目都這樣 想太多反而選不出來 06/18 13:32
alamabarry:以學生角度來選答案~會踹測出題老師的想法選擇B對 06/18 13:35
alamabarry:以家教老師的想法~我會跟學生說這個選項其實不合理 06/18 13:36
alamabarry:我覺得這是可以跟學生討論的~ 06/18 13:37
alamabarry:也有學生會問~~如過用一個699次的多項式來算出方程式 06/18 13:38
alamabarry:這樣可以達成0誤差~~這樣是OK的嗎 06/18 13:38
CC:這選項明明就非常合理... 06/18 13:44
weilai81241:原則上適用回歸直線的情況為|r|>0.7,即高度相關 06/18 14:15

感謝各位老師的回應,

http://ppt.cc/DtI6

剛剛看了一下這一篇,順便複習了一下很久以前學的,

假設相關係數(或判定係數)夠高並且被檢定為顯著好了,

真的會有人說適合用一條直線來表示資料間的「相關」情形嗎?@@
※ 編輯: diego99 來自: 61.64.108.17 (06/18 14:30)
bluesky0831:相關係數跟判定係數是兩件事情... 建議你找本統計的書 06/18 15:26
bluesky0831:好好看過 相關係數絕對值大小指的是兩隨機變數聯合 06/18 15:29
bluesky0831:率分佈在一條直線附近的配適程度 判定係數在講回歸模 06/18 15:30
bluesky0831:型解釋力 簡單線性回歸基本上就是以相關係數為基礎 06/18 15:31
diego99:我沒說這兩個一樣喔... 06/18 15:32
bluesky0831:判定係數不是在說明資料間"相關"情形... 06/18 15:34
bluesky0831:簡單"線性"回歸 所以相關情形以直線作為判定準則 06/18 15:34

可是我看的書好像不是這樣耶,

判定係數R^2 = SSR/SST,目的是用來說明迴歸式的解釋能力,

做到這個地步的確可以解釋兩變數間呈現高度相關。

我要說明的事情是,

就算是用簡單線性迴歸,

你還是必須將判定係數計算出來,

才能知道兩變數間的相關情況,

而不是只拿出一條最適合直線出來就要說可以表示兩變數間的相關情形。

CC:為什麼不行,題目都說了"適合",也說了表示相關"情形" 06/18 15:45
diego99:當然,有錯還請指正。 06/18 15:46
※ 編輯: diego99 來自: 61.64.108.17 (06/18 15:48)
bluesky0831:那你知道簡單回歸中相關係數平方會等於判定係數嗎= = 06/18 15:49
bluesky0831:解釋力是有先後關係的 相關性沒有 相關係數在說變數 06/18 15:50
diego99:這我知道耶,不過即使如此,這題目這樣出也不對阿 06/18 15:51
bluesky0831:相關程度 判定係數在說解釋力... 所以R^2不只在說相 06/18 15:51
bluesky0831:關性 06/18 15:51
bluesky0831:哪裡不對了? 以X=a+bY為模型 XY變數間相關係數0.83耶 06/18 15:52
bluesky0831:我覺得他這個選項要考的是b>0那個地方 如果沒寫b>0這 06/18 15:54
bluesky0831:個選項就錯了 06/18 15:55
bluesky0831:給你個數學定義好了 相關係數=1若且為若存在常數b>0和 06/18 15:59
bluesky0831:任意常數a 使得X=a+bY之機率為1 06/18 16:00
diego99:這應該是定理而非定義吧... 06/18 16:05

所以相關係數夠高,做出的迴歸直線就足以表示兩變數間的關係了嗎?

感謝,受教了:)

bluesky0831:sorry打太快 定理定理~~~ 06/18 16:06
bluesky0831:判定係數的解釋力是指自變數對依變數的解釋力 不完全 06/18 16:08
bluesky0831:在講相關性 反而是相關係數才在講相關性 06/18 16:09
※ 編輯: diego99 來自: 61.64.108.17 (06/18 16:09)
bluesky0831:真的覺得這選項只在考那個b>0...沒那麼複雜= = 06/18 16:09
diego99:沒啦,因為我的想法是認為沒那麼直接阿...囧 06/18 16:10
bluesky0831:相關係數夠高才有機會讓迴歸模型顯著 顯著就可以代表 06/18 16:10
bluesky0831:機率上該模型可以代表兩變數間關係 06/18 16:11
diego99:問題在於大多數的高中生目前還不懂這些 0.0 這才麻煩 06/18 16:11
bluesky0831:就是這麼直接 你wiki一下相關係數的圖 如果不夠高根本 06/18 16:12
bluesky0831:沒辦法以線性模型做配適 06/18 16:12
diego99:圖我知道,但是我真的沒看過直接用迴歸直線去表示相關情況 06/18 16:13
diego99:而是用相關情況去說明迴歸直線... 06/18 16:14
bluesky0831:如果是我 我會告訴學生相關係數是兩變數間直線線性關 06/18 16:14
bluesky0831:係 正負號代表同向或反向變 數值大小代表配適度 06/18 16:15
bluesky0831:簡單線性迴歸: 相關係數→線性模型→判定係數 06/18 16:17
DKer:我想發問 為什麼b>0一定要加? 06/18 16:27

其實我更好奇的是明明題目就有說相關係數了,

為什麼選項中還要寫個適合用一條直線表示相關情形...

感覺一整個鬼打牆阿...

無論如何,感謝指教啦 :)
※ 編輯: diego99 來自: 61.64.108.17 (06/18 16:31)
DKer:我覺得括號就算整個拿掉也可以選,只是加了括號的描述更精準 06/18 16:29
CC:我認為這題用字精確,完全沒問題,但是d老師大概聽不進去 06/18 16:31
alamabarry:我的疑問只有一個~~相關係數多高才較高? WHY? 06/18 17:00
alamabarry:數值要多高才叫做適合線性函數的模型? WHY? 06/18 17:01
alamabarry:變成兩個疑問了 ... 06/18 17:02
bluesky0831:要是b<0表示變數間是反向關係, 相關係數必為負... 06/18 17:06
bluesky0831:所以要是沒寫b>0一定不能選 06/18 17:06
bluesky0831:更不用說括號拿掉了 06/18 17:07
bluesky0831:多高才適合的問題樓上D大跟W大有回答了 06/18 17:09
DKer:可是選項本身沒有錯誤吧 06/18 17:12
DKer:感覺像是:「他是男生」與「他是男高中生」的差別而已 06/18 17:12
goshfju:r=0.83 => R^2=0.83^2 , r 達顯著 <=> beta 達顯著 06/18 17:16
bluesky0831:沒有阿都說r=0.83了 r跟b在簡單回歸必定同號... 06/18 17:18
bluesky0831:不能使用b<0去表達XY之間關係 那是模型選擇錯誤... 06/18 17:20
bluesky0831:男高中生必定男生 男生未必男高中生... 06/18 17:21
CC:B沒寫有什麼差 06/18 17:22
DKer:嗯~可是「他是男生」這個選項不會因為沒說高中生而不能選啊 06/18 17:27
bluesky0831:沒寫的話就可能"不適合"用X=a+bY表示關係 因為當b<0時 06/18 17:27
bluesky0831:跟兩變數相關性剛好相反 試想兩變數樣本在二維平面上 06/18 17:28
bluesky0831:排列成正斜率 可是你用負斜率直線方程式代表它 06/18 17:29
bluesky0831:這樣就是"不適合" 而題目要"適合" 06/18 17:29
bluesky0831:因為題目要的是男高中生不是男生而已~ 06/18 17:30
admboy:b沒寫也沒差阿 題目講適合 你硬要用負的去說不行 06/19 01:31
admboy:適合是指用這個模型去描述 但用哪個是你選定的問題 06/19 01:31
admboy:你不能選定一個錯的去推翻這東西 只是b有講會更精確罷了 06/19 01:32
bluesky0831:b如果沒寫就未必適合 我只是把不適合的地方舉例 06/19 01:38
bluesky0831:因為是多選題 要完全正確才能選吧 06/19 01:38
lyricslee:我覺得B大的想法很有問題 06/19 01:42
bluesky0831:你是指b>0的部分嗎T^T 06/19 01:47
lyricslee:當然是,b有沒有寫大於零哪有差啊 06/19 01:57
bluesky0831:好吧 可能我邏輯上有點錯誤 但寫<0或=0肯定不行的吧 06/19 02:00
bluesky0831:寫>0是比較嚴謹的做法 06/19 02:00

這題我最初的問題是

在相關係數夠高的情況下,是不是真的能用一條直線去表示其相關情況?

在我原本的認知中,只能說大多數樣本點會散佈在離這條直線很近的地方,

而非直接用這條直線就能把他們的相關情況給找出來。

不過有專家們的背書,我想我應該知道要如何跟學生解釋了。

感謝版上各位統計專家的指教 :)
※ 編輯: diego99 來自: 61.64.108.17 (06/19 11:39)
goshfju:Y_hat = a+bx 不代表所有點在一直線上 但有那個趨勢在 06/19 22:33
goshfju:Y_hat 是Y的估計值 相關係數(r)越接近-1或1 06/19 22:34
goshfju:判定係數 (R^2=r^2) 也會越高 代表真實的點會離直線越近 06/19 22:35
andygenisu:A反而怪,「比較好、差」是跟什麼比也沒說清楚 06/20 00:03
andygenisu:「相關情形」改成「關係」就較不會有混淆之虞了 06/20 00:04

你可能也想看看

搜尋相關網站