作者hawawa (熙熙熙)
看板Statistics
標題[問題] 獨立樣本T檢定
時間Tue Apr 5 02:41:35 2011
在獨立樣本T檢定時
如果兩個樣本的數目比例差異很大
例如A 80個 B 20個
這樣會比較容易顯著?
還是比較不容易顯著?
還是沒有影響?
為什麼?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.124.167.207
→ yhliu:這樣當兩群體變異數不等而你卻用變異數相等的檢定程序時, 04/05 11:01
→ yhliu:偏誤比較大. 04/05 11:02
→ yhliu:再者, 印象中, 當兩群體變異數相等時, 樣本數最佳配置是等樣 04/05 11:06
→ yhliu:本. 事實上 1/80 + 1/20 > 1/50+1/50, 表示如果用等樣本, 04/05 11:07
→ yhliu:Xbar1-Xbar2 的標準差會比較小. 04/05 11:08
我並沒有考慮兩群體變異數相等或是不相等...
假設變異數相等 等樣本時 Xbar1-Xbar2 的標準差會比較小
所以T值大 易顯著?
另外,我想到的是分佈的問題
樣本數比例差很多 T分布近似的情況就不好
是不是會影響檢定?
※ 編輯: hawawa 來自: 220.137.74.93 (04/05 16:32)
→ obarisk:看有沒有同質和常態 04/05 17:47
→ yhliu:甚麼叫 "t 分布近似"? 若群體非常態, 我不能保證你的 t 統計 04/05 22:03
→ yhliu:量是甚麼分布; 若群體雖是常態但變異數不等, t 統計量之分布 04/05 22:04
→ yhliu:也不是 t 分布. 當 n1=n2 這樣的特殊情形, 它剛好與假設群體 04/05 22:08
→ yhliu:變異數不等時的 Welch-t 相等, 其分布仍不是 t 分布, 只是數 04/05 22:08
→ yhliu:值的研究認為可以用 t 分布 "近似" --- 這個 "近似" 不是數 04/05 22:09
→ yhliu:學上的近似, 只是如上述, 前人以數值研究結論認為的 "近似". 04/05 22:10
→ yhliu:至於這 "近似" 究竟好不好, 與 t 分布差了多少, 我沒仔細看 04/05 22:10
→ yhliu:原論文, 自己也沒做過研究, 無法回答. 04/05 22:11
→ yhliu:至於兩常態群體變異數不等而誤用變異數相等的公式, 我所謂有 04/05 22:14
→ yhliu:"偏誤" 的意思是: t 統計量分母原本是分子的標準誤, 但前述 04/05 22:15
→ yhliu:錯誤導致分母不是分子(Xbar1-Xbar2)之標準誤的適當公式, 在 04/05 22:16
→ yhliu:大樣本下考慮, 可能有很大的偏誤. 04/05 22:18