為什麼這篇微分定義證明鄉民發文收入到精華區:因為在微分定義證明這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者yhliu (老怪物)看板trans_math標題Re: [微分] 連鎖法則的證明時間Wed A...
微分定義證明 在 雨城說書 ? Instagram 的最佳解答
2021-08-18 10:21:55
《瘟疫》──卡繆及其「人本主義」下的反抗 #每天為你摘一頁書 「『但是我必須對您說:這一切無關英雄主義,是關係到正直。我的想法或許令您發笑,但對抗瘟疫唯一的方法,就是正直。』 『正直是什麼?』藍柏突然神情嚴肅地問。 『我不知道一般的定義是什麼,但對我來說,它的定義就是做好我的工作本分。』」─...
※ 引述《Edward56 (白面書生段譽 )》之銘言:
: 我看不太懂chain rule的證明所使用的概念
既然你的問題出自於 chain rule 的證明, 就談一下這個
證明好了.
設 y=f(x), x=g(t), 所以 y=f(g(t))
The chain rule 說:
若 g 在 t=a 可微, f 在 x=b=g(a) 可微,
則 f(g(t)) 在 t=a 可微, 且
(d/dt)f(g(t)) = f'(g(a))g'(a)
依 "單變數可微就是導數存在" 的結論, 要證明 f(g(t))
在 t=a 可微, 要考慮的是
Δy/Δt ≡ (f(g(a+Δt))-f(g(a)))/Δt
= Δy/Δx.Δx/Δt
≡ (f(g(a+Δt))-f(g(a)))/(g(a+Δt)-g(a)).
(g(a+Δt)-g(a))/Δt
在非正式推導時, 就是利用這個關係, 讓 Δt→0 取極限.
然而, 在正式證明中會發現: 這式會發生問題, 因為我們
無法保證 Δt≠0 時 g(a+Δt)≠g(a). 也就是說,上列將
Δy/Δt 表示成 Δy/Δx.Δx/Δt 有可能第一項會出現
"除以 0" 這種不被允許的算式.
因此, 要證明單變數的 chain rule, 有兩個方式, 一是:
將分解式的第一項用另一個函數取代:
h(Δt) = f'(g(a)) if g(a+Δt)=g(a)
= (f(g(a+Δt))-f(g(a)))/(g(a+Δt)-g(a))
if g(a+Δt)≠g(a)
得 Δy/Δt = h(Δt).Δx/Δt, 而後讓 Δt→0 取極限.
另一種方法可以同時適用於多變數函數, 那就是重新定義
"可微分". 這個新定義對多變數函數同時也適用, 那就是:
將 Δy=f(x+Δx)-f(x) 表示成:
Δy = A(x).Δx + ξ(x,Δx).Δx
在定義中考慮的是單點 x, 例如 x=a. 因此可以簡化上式:
Δy = A.Δx + ξ(Δx).Δx
其中 A 是常數 (意思是: A 與 Δx 無關). 而 "可微分"
的定義是: 有一個常數 A 使得上列右式中
ξ(Δx)→0 當 Δx→0
很容易證明這個定義 (在單變數實數函數中) 與導數存在
是等價的, 而且符合可微分定義的 A(x)=f'(x).
回到 chain rule, 顯然我們要證明
f(g(a+Δt))-f(g(a)) = f'(g(a))g'(a)Δt+ξ(Δt)Δt
而且 ξ(Δt)→0 當Δt→0. 而我們知道的是 f 在 g(a)
可微以及 g 在 a 可微. 就第一點, 可望得
f(g(a+Δt))-f(g(a))
= f'(g(a))g'(a)(g(a+Δt)-g(a))
+ δ.(g(a+Δt)-g(a))
其中 δ→0 當 g(a+Δt)-g(a)→0.
可是, 前面提過的問題又出現了: 若 g(a+Δt)-g(a) = 0
怎麼辦? 因為考慮 g(a+Δt)-g(a)→0 時的極限必須它不
為 0. 所以, 你所疑惑的 "補點" 定義出現了:
定義 δ(0) = 0.
把這 "補點" 的想法帶回原來的可微分定義中, 就是
Δy ≡ f(a+Δx)-f(a)
= f'(a).Δx + ξ(Δx).Δx
其中
ξ(Δx) = (f(a+Δx)-f(a))/Δx - f'(a) 當 Δx≠0
= 0 當 Δx=0
在 f'(a) 存在的前提下, 顯然 lim ξ(Δx) = 0. 因此,
Δx→0
如上定義 ξ(0) 使得 ξ 在 0 連續 (並非 ξ 處處連續,
除非 f 本身是處處連續).
由此可知: 上述 ξ(0)=0 的定義, 是在證明 chain rule
時必要的一個小程序, 但不是定義 "可微分" 這概念時必
要的; 至於 ξ 在 0 連續, 只是上述定義的一個小結論,
或者說敘述較方便?其實它並不是很重要---看看如何完成
chain rule 證明, 就知道所謂 "ξ連續" (在以下證明中
用 δ) 這概念是否重要了.
[Chain rule 之證明]
設
f(b+Δx)-f(b)=f'(b)Δx+δ(Δx).Δx, δ(0)=0
g(a+Δt)-g(a)=g'(a)Δt+η(Δt).Δt
又: b=g(a), Δx=g(a+Δt)-g(a).
則得:
f(g(a+Δt))-f(g(a))
= f'(g(a)).Δx + δ(Δx).Δx
= f'(g(a))(g(a+Δt)-g(a))+δ(Δx).Δx
= f'(g(a))(g'(a)Δt+η(Δt)Δt)+δ(Δx).Δx
= f'(g(a))g'(a).Δt + f'(g(a)).η(Δt).Δt
+δ(Δx).(Δx/Δt).Δt
= f'(g(a))g'(a).Δt +
(f'(g(a)).η(Δt)+δ(Δx).(Δx/Δt)).Δt
取 ξ(Δt) = f'(g(a)).η(Δt)+δ(Δx).(Δx/Δt),
則
f(g(a+Δt))-f(g(a)) = f'(g(a))g'(a).Δt + ξ(Δt).Δt
而 Δt→0 時:
(1) η(Δt) → 0, 因此 f'(g(a)).η(Δt) → 0.
(2) Δx→0 (或等於0), 因此 δ(Δx)→0 或等於 0;
且Δx/Δt = (g(a+Δt)-g(a))/Δt →g'(a). 故
δ(Δx).(Δx/Δt) → 0.
因此, ξ(Δt)→0, 當 Δt→0.
▌
注意在 (2) 中考慮了 Δx=0 定義此時 δ(Δx)=0. 我們
可以不談及δ在0連續; 也可以直用 "δ在0連續" 來說明
δ(Δx).(Δx/Δt) → 0 當 Δt→0.
--
嗨! 你好! 祝事事如意, 天天 happy! 有統計問題? 歡迎光臨統計專業版! :)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
我們強調專業的統計方法、實務及學習討論, 只想要題解的就抱歉了!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.41.98.234