[爆卦]標準差伸縮是什麼?優點缺點精華區懶人包

為什麼這篇標準差伸縮鄉民發文收入到精華區:因為在標準差伸縮這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者tomchc (TOMCHC)站內Statistics標題[問題] 相關係數與Fisher tr...


如果是跟統計軟體有關請重發文章
如果跟論文有關也煩請您重發文章
文章類別是為了幫助大家搜尋資料與解答,造成不便之處請見諒


不好意思

小弟我在做研究分析資料的時候遇到了一些問題

想了幾個方法都覺得有點怪怪的

現在我有一個二維的資料表

是人(N)--各基因表現量(G)

接著我把人分成兩組N1,N2

每一組當中分別去計算相關係數

計算方式是

取出k個g-g'(基因表現量pair)的pair在N1和N2中

分別計算出相關係數

也就是說

每一個相關係數是N1或N2個樣本對的相關係數,總共各有k個

然後對這k*2個相關係數做Fisher transformation

ln((1+r)/(1-r))

可以得到兩組常態分佈

N1~(μ1,δ1), N2~(μ2,δ2)

希望可以比較這兩組人當中是不是相關係數的分佈有差異

但是問題來了

這個過程當中牽涉到兩個參數

一個是N的大小,跟所取相關係數樣本有關

一個是k的大小,跟最後比較的樣本有關

要怎麼樣處理才對呢?

自己想過如下

1.直接做t-test,這樣子就無法把N弄進來

2.Fisher transformation告訴我們

做Fisher transformation後他的標準差是1/sqrt(N-3)

不過這裡做了k次

原本想針對他的標準差伸縮*sqrt(N-3)

但是這樣反而樣本多的標準差變大

好像又以點怪怪的

請問到底要怎麼做才有對呢?

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 124.11.139.229
yhliu:k 個表現量是相同基因樣本的, 因此你所得到的這些樣本相關係 01/05 10:51
yhliu:數不能假設是獨立的. 但又難以估算它們的相關係數, 因此可能 01/05 10:52
yhliu:只好每一種表現量分別去做兩樣本 t 比較. 另外, 或許需要考 01/05 10:53
yhliu:慮 "整體誤差率" 的問題... 01/05 10:53
yhliu:兩獨立樣本相關係數之比較, 在群體是常態, 並且兩樣本數都 01/05 10:54
yhliu:夠大的情況下, 用 Fisher 的 z 轉換, 統計量是: 01/05 10:54
yhliu:z = (z1-z2)/√{1/(n1-3)+1/(n2-3)} 01/05 10:55

你可能也想看看

搜尋相關網站