作者eco100 ( )
站內Statistics
標題[問題] 卡方跟K-S的比較
時間Wed Aug 14 12:06:32 2013
假設我有兩組資料如下:
d1 d2 d3 d4 d5 d6 d7 d8 d9
控制 21.8 47.7 65 142 245 350.5 478.3 643.1 818.7
實驗 11.4 52.1 52.8 173.3 285.1 394.2 521.3 727.3 879.7
我想比較這兩組的分配是否有差異
分別用了卡方檢定跟KS檢定
卡方我把控制組數據當成 期望值Ei 實驗組當成Oi
卡方值 = Σ(Oi-Ei)^2/Ei = 46.05 > X^2(0.95,8) p-value = 2.32232E-07
而K-S檢定 則是用SPSS的兩組獨立樣本比較
算出來的p-value是 1
我的問題是 這兩個方法算出來的p-value 有點天差地遠
我是覺得K-S的結果似乎比較合乎數據的樣子
是卡方的計算有問題嗎?
還請大家賜教,謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.32.9
→ andrew43:你做的二個檢定不是同一個目的啊. 08/14 17:04
→ andrew43:你要做 Kolmogorov-Smirnov Goodness-of-Fit Test 才是. 08/14 17:19
→ eco100:嗯?我做的不是適合度檢定嗎? 就是比較兩組數據CDF的差異 08/14 21:39
→ eco100:以最大的差異當做統計量 算出p-value? 08/14 21:40
→ andrew43:你可以自己檢查看看. 08/16 08:33
推 anovachen:這些數值代表的是d_i出現的頻率嗎? (i=1~9) 08/17 00:04
→ anovachen:更正: 不是頻率...= = 08/17 00:06
→ anovachen:不是頻率也不是次數...我也不曉得該怎麼做QQ 08/17 00:07
→ eco100:這些值單純就是實驗出來的數據 是連續型的 所以不適合卡方? 08/17 00:15
→ anovachen:相同條件下重複九次實驗得到的九筆數據嗎? 08/17 00:46
→ andrew43:我說錯了. 你的KS是對的, 但誤用 chisq 了. 08/17 01:48
→ andrew43:多謝anovachen問了我沒注意的問題. 08/17 01:49
sorry 我自己都沒說清楚 我再詳細描述一下好了
事實上d1~d9是不同的天數
然後呢 其實每一天 都收集了repeat20次的data
而不同天的repeat 是獨立的 (也就是 沒有block)
post上來的 是每天的平均值
這種型態的資料 一開始的想法當然是想用 重覆的two-way anova
但是 每天的變異數會不一樣 天數愈久 變異數就愈大 所以就不適合
再來從數據上看 隨著天數增加 不管實驗組或控制組 值都會愈來愈大
但這也是預料之中 真正有興趣的是想判斷出
實驗組跟控制組 的表現"pattern"是否一樣
或者說 實驗組數據的成長幅度 是否跟控制組一樣
因為最後就覺得不管怎樣 都是直接用平均值做比較
我就沒有把始末說這麼清楚 當時主要是想問為何K-S跟卡方的結果差異這麼大
所以目前看來 卡方是不適合的?
那K-S用在這個case上是OK的嗎?
或者有其他更適合的方法?
謝謝!
※ 編輯: eco100 來自: 118.166.213.21 (08/17 14:18)
→ yhliu:卡方 與 K-S 都不適用這資料! 08/18 12:04
→ yhliu:計量值反應, 可以考慮 "重複量測" 之分析. 最好用原始數據, 08/18 12:05
→ yhliu:不要直接算平均值再拿平均值分析. 08/18 12:06
→ yhliu:或許也可考慮 ANCOVA? 不過, 誤差變異之同質性, 及時間序列 08/18 12:07
→ yhliu:之相關性是問題. 又: 如果認為實驗組與控制組成立趨勢不同, 08/18 12:08
→ yhliu:則 ANCOVA 不適合. 08/18 12:09
→ eco100:ANCOVA? 糟糕 不太熟 我會再做一下功課 謝謝老師 08/18 12:45
→ eco100:那再請教一下 我有另外做t-test 其實就是每天的repeat 08/18 12:46
→ eco100:分開做t-test 想說其中一天的p-value小於0.001的話 08/18 12:47
→ eco100:這判斷 實驗組跟控制組pattern是不一樣的 這樣合理嗎? 08/18 12:48
→ eco100:就 08/18 12:55
→ yhliu:ANCOVA是在兩組趨勢相同時比較兩組之差距. 但 "pattern" 或 08/19 19:51
→ yhliu:許應指兩組趨勢不同? 至於各日分別比較, 這是以各日結果看兩 08/19 19:52
→ yhliu:組是否有差異, 並不是 "pattern" 的差異. 08/19 19:53