[爆卦]連續變數定義是什麼?優點缺點精華區懶人包

為什麼這篇連續變數定義鄉民發文收入到精華區:因為在連續變數定義這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者yhliu (老怪物)看板Math標題Re: [分析] (實變)連續隨機變數定義時間Sun Ja...


※ 引述《annboy (BlueGun)》之銘言:
: 為了避免混淆,先定義一些符號:
: (Ω,B,P) : probability space
: Q : the set of all rational numbers
: X:Ω→Q : a random variable
: F:Q→[0,1] : CDF of X

藉這個例子, 我想說的是: 這分布函數是:
在所有有理數點不逢續, 在所有無理數點它是連續的.

要講清楚這點, 我們把定義寫得更清楚些:
X 的值域是 Q, 並且在 Q 上有一個排序
q_1,...,q_n,...
使得我們很清楚 P[X=q_n] = p_n, 並且 Σp_n = 1.

假設所有 p_n 都是正數. 如若不然, 我們改考慮
Q' = {q_n in Q; p_n > 0}

當然, Σp_n 是個收斂的級數.

而 X 的分布函數是 F(x) = Σ_{q_n≦x} p_n.

若 x = q_n, 則 F(x) - F(x-) = p_n.
所以, 對任意 δ>0, F(x)-F(x-δ) ≧ p_n > 0.
所以 F 在此點不連續.

若 x not in Q. 由於 F 必是右連續, 我們要證明 F
在 x 連續, 只需證明它左連續. 也就是說, 對任意
ε>0, 私我們要找到一個 δ>0,使得
F(x) - F(y) < ε, 只要 x-δ < y < x
由於 F 是單調遞增, 事實上我們只要證明存在這麼個
δ>0 滿足 F(x)-F(x-δ) < ε 即可.

由於 Σp_n 收斂, 存在 N, 使得 Σ_{n>N} p_n < ε.

令 δ>0 且 δ < min{x-q_n; q_n < x, n≦N}
則若 x-δ < q_n < x, 必然 n>N.

F(x) - F(x-δ) = Σ_{q_n≦x; q_n>x-δ} p_n
≦ Σ_{n>N} p_n < ε
故 F 在此 x 連續.


這就是離散型隨機變數的基本性質:
(1) 其有效值域(具正機率值的點的集合)是可數的.
(2) 其分布函數在此隨機變數之有效值域各點不連續;
在有效值域之外各點都連續.

至於連續型隨機變數, 單以 "值域含不可數點" 是不夠的.
除了以分布函數處處連續為定義之外, 另一等價的定義是:
R 上(假設只考慮實數值隨機變數)各點之單點機率皆為 0.

而就一般實數值隨機變數而言, 還有混合型這並不是
只在純數學上討論, 而是實際應用上就有, 例如觀測資料
時小於 a 的以 a 記, 或大於 b 的以 b 記. 若原本是連
續型的, 如此修整過變成在 a 或 b 有正機率, 所以已不
是連續型了, 而是混合型隨機變數.

在實務應用上連續型隨機變數常伴隨 "機率密度",其分布
函數及一些量(如期望值變異數等)常涉及積分, 這是所謂
絕對連續型. 在比較純數學討論上, 則還有一種連續型隨
機變數不能用機率密度來表現其機率分布, 稱為奇異連續
型. 在有些機率論教本上就會描繪出這樣的例子: Cantor
distribution 是一個典型的例子.


※ 引述《znmkhxrw (QQ)》之銘言:
: 總結來說, 給一個隨機變數, 其(1) 離散與連續的定義
: (2) 值域可數與否
: (3) 累積分布函數連續與否
: 以上這三個的關係是??

要給予明確定義, 除了用 "值域" 的概念外, 應加上 "機率".

Def.:
一隨機變數稱離散的(離散型)條件是: 存在 R 的一可數子集
Q = { r_1, r_2, ... } 使 P{Q} = 1;
或等價的: 使 ΣP{r_n} = 1.
所有使 P{r_n} > 0 的點所形成的集合又稱為此隨機變數之
有效值域, 或稱為其 support.

一隨機變數為連續的(連續型)其條件是: 對 R 上任一點,
其單點機率 P{x} 均為 0.
連續型隨機變數之 support 可定義為 R 上使機率值為 1
之最小閉集合. 另一等價定義是 R 上所有使
P[x-δ < X ≦ x+δ] > 0 for any δ>0
之所有 x 所形成的集合.


依以上定義, 離散型隨機變數之有效值域是可數的; 而連續型
隨機變數之值域顯然不可數(可數集之機率值都是0).

又, 前面已證明了離散型隨機變數的分布函數在其有效值域各
點都是不連續, 而在其他處則處處連續.

事實上對任意隨機變數 X 而言, P[X=x] = 0 是其分布函數在
x 點連續的充要條件:
P[X=] > 0 則 F(x)-F(x-) = P[X=x] > 0
即代表 F 在 x 左邊不連續; 反之, 取 δ_n↓0, 則
P[X=x] = P{∩_n[x-δ_n<x<x]) = lim_n (F(x)-F(x-δ_n))
= F(x) - F(x-)
因此 P[X=x] = 0 表示分布函數 F 在 x 左邊連續, 也就是 F
在 x 連續.

又: 連續型隨機變數之 support 兩種定義等價. 因若 A 是機
率 1 之最小閉集, 則 A 中一點 x 必有
P[x-δ<X<x+δ] > 0 for all δ>0,
否則 A 可排除 x 的一個 δ-鄰域仍是機率 1 之閉集, 那就
與 A 的定義矛盾了. 反之, 若 x 不在 A 中, 則 x 的一個
δ-鄰域完全在 A 之外, 當然有 P[x-δ<X<x+δ] = 0.



--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.41.121.39 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Math/M.1579428282.A.654.html
※ 編輯: yhliu (114.41.121.39 臺灣), 01/19/2020 19:25:06
※ 編輯: yhliu (114.41.121.39 臺灣), 01/19/2020 20:41:44
znmkhxrw : y大的意思是說, 如果X:Ω→R with range(X) = Q 01/19 22:33
znmkhxrw : 則F:R→[0,1]cdf 在所有無理點連續, 有理點不連續? 01/19 22:35
znmkhxrw : 後半段好多我消化一下 感恩^^ 01/19 22:35
yhliu : 在所有具單點正機率值的點不連續. 如果 X 的值域 01/20 00:16
yhliu : 具可數個點, 則 X 必是離散的. 而把那些機率 0 的點 01/20 00:18
yhliu : 除外, 則在真正有效的(具單點正機率)值域上每一點, 01/20 00:20
yhliu : 分布函數都是不連續的; 邢在其他處, 分布函數都是 01/20 00:22
yhliu : 連續的. 其實對任意隨棧變數而言, 分布函數是否不 01/20 00:24
yhliu : 連續就看它是否具有正值的單點機率. 01/20 00:25

你可能也想看看

搜尋相關網站