[爆卦]k fold cross validation實作是什麼？優點缺點精華區懶人包

為什麼這篇k fold cross validation實作鄉民發文收入到精華區：因為在k fold cross validation實作這個討論話題中，有許多相關的文章在討論，這篇最有參考價值！作者lucien0410 (lucein)看板DataScience標題Re: [問題] Valid...

作者lucien0410 (lucein)

看板DataScience

標題Re: [問題] Validation set 到底在做什麼?

時間Fri Mar 30 10:14:39 2018

ot大的建議讓我弄懂了neural net訓練時
為什麼都要附上一組validation set
(如果我又錯了再請g大幫我validate一下！)

是的我們就假設如果沒有validation set會發生什麼事
另外我們再來假設我們有無窮無盡的時間或是運算資源
沒有validation set 我們可以訓練neural net嗎?
答案是可以的 YES!

訓練到底需要什麼：
(1) 訓練資料
(2）預先設好的超參數 (e.g. layer size, layer type, mini batch size 等等;
特別注意我沒有設定epoch size; 或者我們把epoch size設為無限大(反正我們有無限
的時間和運算資源);

(1）(2) 弄好就可以開始epoch by epoch 的訓練了;
每次搞定一個epoch 我們就會得到一個模組
我們讓它訓練到天荒地老; 產生無數個模組;
用數學集合的方式來表示的話,我們就會得到下面的集合.
trained_models=
{<epoch_i, train_preplexity_i, train_accuracy_i, Same_HyperParameter> ｜for i
in N }

這個時候問題就來了！！！
trained_models 是一個無限大的集合我們想要從中挑一個最好成員那該怎麼挑呢?
這些成員的超參數都一樣所以超參數不能用來作為挑選的依據
那有哪些特徵是可能有用的呢?
train_preplexity, train_accuracy 可能有用但很可能不準因為我們會有overfitting
的問題; epoch number也不能用, 因為也不一定高的epoch越好, 一樣是overfitting的問
題.

每個epoch的模組都一模一樣！！！

這樣就像唐伯虎點秋香每個都戴上面具那個才是我們的秋香呢?
隨便選一個大家拼人品嗎? 挑到石榴姊怎麼辦?

唐伯虎就大喊了 "別人笑我太瘋癲我笑他人看不川 ..."
看誰抖了一下

我們可以用類似的方式
預先準備好一個validation set,每個epoch訓練好,就要它預測validation set看看
現在加進了validation set, 我們的模組集合就會變成這樣
{<epoch_i, train_preplexity_i, train_accuracy_i, validation_preplexity_i,
validation_accuracy_i, Same_HyperParameter> ｜for i in N }
現在我們就可以從validation preplexity 和 accuracy 來判斷要挑那個好.
注意這裡,我們依然*不是*挑超參數,因為這組模組集合的成員的超參數還是依然一模一樣

現在我的理解就變成跟著一起訓練的validation set的作用就是用來挑ephoch number了

還有這裡的validation 跟 cross validation 沒有關聯; 因為我們沒有*cross*
用的一直是同一份的validation dataset
這個就僅僅算是*hold-out validation*

以上是算是澄清事實吧
要是講錯了再麻煩大家指點!
######################################

以下我再來提問兩個問題

（a）用偷偷把validation set塞回去這樣好嗎? 會有什麼問題?

如果這個validation set就是拿來挑那個ephoch好,
那我們現在可以作弊一下
我們先使用validation set 找到最佳的ephoch number
記住這個黃金數字
現在把validation set放到training set 兩個合在一起
(這樣我們就有更多樣本了)
再把這個新的較大的training set再重新一次
反正我們已經*預先*知道那個epoch最好了

用偷偷把validation set塞回去這樣好嗎? 會有什麼問題?
實作上這是慣用手法嗎?

（b）用了validation set 就*一定*能挑到最好的了嗎?
我認為覺得不是這跟我們的validation set挑的好不好非常有關
要是人品不好正好挑到不具代表性的樣本來做validation
那我們的validation preplexity 和 accuracy 也就不可靠了

(以後我要罵人都要罵 "祝你的validation set都挑到壞樣本！"
推文就說 "希望你的validation set挑的特別好!")
這個也呼應了pipidog大前文說的 validation set 怎麼挑是個大學問

validation成績最好應該也不是一定最好的模組吧
要避免挑到極端樣本的機會還是得來弄一下n-fold cross-validation
但是弄了n folds 之後訓練時間就增加了n倍
除了增加時間成本外這樣的作法可能會有什麼問題呢?
實作上這是慣用手法嗎?

※ 引述《outrunner (ot)》之銘言：
: ※ 引述《lucien0410 (lucein)》之銘言：
: : 可是可是我的問題沒有回答到 (是我一開始沒問對問題)
: 不如你來回答問題, 你怎麼知道模型要訓練到什麼時候(epoch size)?
: : 換個方式講
: : 假設我有兩份已知資料(AB兩份資料）
: : A拿來訓練
: : B拿來測試
: : B的測試結果告訴我們成果到底怎樣公平的驗證
: : B就是終極測試
: 這樣做當然很好, 但代價也很昂貴.
: 回到上面的問題, 你需要驗證多少次? 每個epoch驗證一次?
: 更別提很多時候是沒辦法這樣做的.
: (ex. B沒有答案. 有的話我會拿來做訓練)
: : 但其實訓練A之前可以調整很多hyperparameter
: : 所以就先把A切成 a b
: : 拿a 訓練 b 測試找尋最佳的hyperparameter
: : 找到後再依這樣的設定訓練A (期待B的測試會最好)
: : 但是OpenNMT要求在訓練小寫a時也必須提供val set
: : 這就是我的問題了
: 他就是邊訓練邊測試啊, 不然你怎麼知道訓練得如何了?
: 其實就是把你想手動做的事情自動化啦.
: 如果你有看他的說明書:
: Validation files are required and used to evaluate
: the convergence of the training.
: It usually contains no more than 5000 sentences.
: 第一句就是前面講的.
: 第二句的意思是做這個很浪費時間. (別誤會, 是學問很大的意思)
: 然後"找尋最佳的hyperparameter"也不是很重要,
: 想太多不如先train下去, train久了就有fu了.

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 68.230.60.98
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1522376082.A.FDF.html
※ 編輯: lucien0410 (68.230.60.98), 03/30/2018 10:28:42

→ EGsux: 你都要做seq2seq了你要不要認真查一下書看一次這些ML DL 03/30 12:08

→ EGsux: 基本阿 03/30 12:08

推 yoyololicon: 原po感覺很興奮XD 03/30 12:46

推 goldflower: 1. 假設你validation set找到epoch數沒道理他就不能 03/30 16:51

→ goldflower: 拿來挑其他超參數 03/30 16:51

→ goldflower: 2. 你挑完超參數後你就能期待你已經找到很不錯的model 03/30 16:52

→ goldflower: 所以放進去當然是可以除非你validation分佈特別怪 03/30 16:52

→ goldflower: 但validation分布特別怪的話你的training應該就GG惹 03/30 16:53

→ goldflower: 3. 當然不一定R 你今天上班路線每天都會撿到一百塊 03/30 16:56

→ goldflower: 所以你都挑那個時間出門但是還是可能被別人撿走R 03/30 16:57

→ goldflower: 4. 我很廢所以不要cue我 QQ 03/30 16:57

推 galapous: 塞回去不就本末倒置，validation set 就是用來避免 03/31 12:56

→ galapous: overfitting，你塞回去 train 你怎麼知道你 train 多久 03/31 12:56

→ galapous: 不會 overfitting 03/31 12:57

推 goldflower: 樓上可以參考下田神機器學習基石validation那部分 03/31 17:15

→ goldflower: 比較直覺的想法就是當你選擇好超參數後如果你認為 03/31 17:20

→ goldflower: 加入validation會導致overfitting 也就是你相信 03/31 17:20

→ goldflower: validation在母體當中偏向雜訊那麼也就代表你整個 03/31 17:21

→ goldflower: training過程完全是不可信的 03/31 17:21

→ goldflower: 那麼你當初選出來的超參數就是不可信任的 03/31 17:23

推 goldflower: 上述筆誤 training過程改成validation才對 03/31 17:26

推 goldflower: 呃我說比較直覺是對我比較直覺不知道其他人如何XD 03/31 17:36

→ ACMANIAC: 回樓上，假設你 train 10 epoch 收斂，超過就 overfit- 04/01 11:54

→ ACMANIAC: 那你怎知道 train + val 幾個 epoch 不會 overfitting? 04/01 11:55

→ ACMANIAC: 還是直接設定 10 ? 訓練樣本不同，收斂情形會相同嗎？ 04/01 11:57

推 goldflower: 你都知道10個了那就只訓練10不就好了 04/01 12:57

→ goldflower: 資料越多越難overfitting 04/01 12:58

→ goldflower: 而你在validation的時候你已經找出一組超參數使得他 04/01 12:59

→ goldflower: 在validation上也運作的不錯所以收斂情形也不會差太 04/01 12:59

→ goldflower: 多如果收斂情形差很多那你當初根本沒有選擇到這組 04/01 12:59

→ goldflower: 超參數的機會 04/01 12:59

→ lucien0410: g大果然懂很多 04/01 13:38

→ lucien0410: g大我的理解是如果train在epoch k收斂, train+val應 04/03 01:18

→ lucien0410: 該會在epoch k的時候收斂. 這樣對嗎？ 04/03 01:18

推 goldflower: 我們只能"希望"如此經驗上可能不會差太多 04/03 12:48

→ lucien0410: 這可以是一個實證問題吧 paired t-test 可以搞定 04/03 13:22

→ lucien0410: 一組train 一組train加val 04/03 13:24

推 goldflower: 雖然我沒看過這樣做的不過或許可以吧拿training 04/03 15:37

→ goldflower: error差何時顯著這樣看? 04/03 15:37

→ lucien0410: 手機推文吃掉我的符號了 04/03 16:35

→ lucien0410: 如果train在epoch k收斂, train+val應該會在 04/03 16:37

→ lucien0410: 在epoch >= k的時候收斂. 這樣對嗎？ 04/03 16:38

推 goldflower: 直覺上來說是這樣數學上的證明要交給高手了@@ 04/03 23:20

→ goldflower: 如果小於就收斂的話就代表validation的部分在w的超空 04/03 23:20

→ goldflower: 間中提供了更好的梯度方向那就回到上面我們可能 04/03 23:21

→ goldflower: 挑不到這組美妙的超參數 04/03 23:21

推 goldflower: 恩...似乎也不一定挑不到小於就收斂我目前想不到 04/03 23:26

→ goldflower: 太好的解釋 04/03 23:26

→ lucien0410: g大真的是高手 04/04 00:49

[爆卦]k fold cross validation實作是什麼？優點缺點精華區懶人包

為什麼這篇k fold cross validation實作鄉民發文收入到精華區：因為在k fold cross validation實作這個討論話題中，有許多相關的文章在討論，這篇最有參考價值！作者lucien0410 (lucein)看板DataScience標題Re: [問題] Valid...

你可能也想看看

搜尋相關網站

#1Machine Learning-交叉驗證(Cross Validation)-找到KNN中 ...

#2[Day 26] 交叉驗證K-Fold Cross-Validation - iT 邦幫忙

#3[Day 25] 交叉驗證Cross-Validation 簡介 - iT 邦幫忙

#4【機器學習】交叉驗證Cross-Validation

#5K-fold Validation如何使用?

#6使用光敏電阻和機器學習來判斷會議室狀態-2 - CH.Tseng

#7k折交叉验证k-fold cross-validation 翻译

#8Keras中实现K折交叉验证

#9k-Fold Cross-Validation（交叉驗證） - Claire's Blog

#10交叉验证(Cross-validation)概述及常见交叉验证方法

#11交叉驗證- 維基百科，自由的百科全書

#1210折交叉验证

#13不同设备机器学习算法10折交叉验证结果一样吗十 ...

#14AllenYL-Notebook/機器學習理論1-2_基礎知識2.md at master

#15交叉验证Cross-validation - stardsd

#16Model Validation

#17KNN算法实现及其交叉验证 - 腾讯云

#18想打造最強模型，訓練資料集的選擇差很大 - 知勢

#19應用集成學習分類模型預測銀行客戶之行銷成效

#20Scikit-Learn實作: Cross Validation and Grid Search

#21图解机器学习中的12 种交叉验证技术

#22Cross Validation交叉验证- 机器学习

#23什么是交叉检验（K-fold cross-validation）

#24李宏毅_ML_Lecture_2

#25Python 機器學習與深度學習實作

#26資訊科學與工程研究所 - 國立交通大學

#27應用集成學習分類模型預測銀行客戶之行銷成效

#28折交叉验证折数确定方法初探

#29機器學習-Cross Validation交叉驗證Python實現

#30交叉验证(Cross Validation)方法思想简介

#31k-fold python的問題包括PTT、Dcard、Mobile01，我們都能 ...

#32【文末赠书】临床预测模型交叉验证及Bootstrap原理及实战教程

#332. 機器學習簡介

#34巨量資料分析師-中級考試說明

#35運用大數據機器學習方法預測臺灣經濟成長率*

#36機器學習基石學習筆記(4)：機器可以怎麼學得更好?

#37机器学习中的交叉验证（cross-validation）

#38[Python] ML WITH SCIKIT Learn (Model Selection)

#39智財法院邀于天立副教授談人工智慧之發展

#40機器學習 - I am Fukuball

#41泛化误差及交叉检验- leon_kbl

#42Re: [問題] Validation set 到底在做什麼? - 看板DataScience

#43用R執行KNN分析

#44交叉验证，模型选择（cross validation）

#45sklearn 交叉验证- OSCHINA - 中文开源技术交流社区

#46利用機器學習於中文法律文件之標記、案件分類及量刑預測 ...

#47朝陽科技大學資訊工程系碩士論文

#482022LSTM K fold cross validation-智慧型手機整理開箱使用推薦

#49機器學習-- Model Selection - MARK CHANG'S BLOG

#50Decision Tree 決策樹| CART, Conditional Inference ... - Hsuan

#51什麼是交叉檢驗？

#52國立臺灣大學理學院地理環境資源學系碩士論文以深度學習 ...

#53機器學習】... - NTU Data Analytics Club 臺大資料分析與決策社

#54libsvm交叉验证与网格搜索（参数选择） - 冰河的博客

#55图像分类（下）

#56藤原栗子工作室: 8月2017

#57R_programming - (8)決策樹(Decision Tree)

#58國家發展委員會編著中華民國109 年12 月

#59交叉验证：评估估算器的表现- 模型选择和评估-- sklearn

#60【机器学习】（18）使用sklearn实现交叉验证

#61指標和驗證

#62机器学习（Machine Learing）

#63October | 2015 - ZHANG RONG

#64基于全局数据混洗的小样本数据预测方法

#65Cross Validation – CHENYUAN

#66R_programming_決策樹(Decision Tree)

#677種交叉驗證（Cross-validation）技術簡介（附代碼示例）

#68关于k-fold交叉验证的介绍

#69Python機器學習筆記（九）：準備平時考- 將數據集區分為訓練 ...

#70Machine Learning A-Z (Python & R in Data Science Course)

#71[深度概念]·K-Fold 交叉验证(Cross-Validation)的理解与应用

#72機器學習爲什麼需要交叉驗證？怎麼使用k-fold cross ...

#73Scikit-learn 詳解與企業應用：機器學習最佳入門與實戰