作者BBBB4 (B4)
看板Soft_Job
標題[請益] 做Data Science 要點的技能和順序?
時間Tue Oct 24 22:28:06 2017
小弟四中數學系學碩,主修統計
自認R很熟,python 也稍有涉略
各種統計方法、機器學習、深度學習都還算熟
也做過幾個產學合作專案
這陣子都在面試data science 相關職缺研替
在純軟面試時
除了問到一些對於資料的想法
還問更多演算法、時間複雜度的問題
結果答得七零八落的
但是在製造業和工研院就比較比較看重做過的專案
總之,原本以為自己讀的科系和所學應該很適合這個行業
在面試的時候才被打醒的感覺
是不是應該資結演算法連同C/C++一起重學
還是有什麼技能應該再去加強的?
另外再偷渡一個問題
其實小弟比較想做服務業、軟體業相關的資料分析
不過相較起來研替開相關職缺大多還是在工廠或是工研院
不然就是名額少少很競爭的軟體業
這樣的話去當三年的研替早早進入職場好
還是忍一年當替代役,空閒的時候自己練功呢?
謝謝各位不吝賜教了
-----
Sent from JPTT on my iPhone
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.138.238.83
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1508855288.A.D2D.html
→ MOONY135: 缺都滿了 10/24 22:33
推 ldkrsi: 純軟真DM的缺也少啊 很多都簡報嘴砲缺 10/24 22:35
推 kkmoon5566: 金融業啊 10/24 22:40
推 lukelove: cs 10/24 22:43
推 Morphee: 不太相信 熟是多熟 只要夠強 一堆公司找 10/24 23:01
推 drajan: Entrylevel缺越來越競爭,趕緊拿到高質量的業界經驗最重要 10/24 23:02
→ BBBB4: 熟不熟的確難評斷,面試時被問到的問題都是結果導向,幾乎 10/24 23:32
→ BBBB4: 不問基於什麼理論或是性質使用什麼方法,也剛好沒考我熟悉 10/24 23:32
→ BBBB4: 的語言,所以實在很難知道我的程度到底到了他們的哪個程度 10/24 23:32
→ BBBB4: 。 10/24 23:32
→ BBBB4: 有朋友大學畢業去資策會上課,在旅遊業還是媒體就能談到4萬 10/24 23:35
→ BBBB4: 多,過一年就有近6萬,這些也算是entry level 嗎?還是這些 10/24 23:35
→ BBBB4: 資歷對於未來跳槽沒幫助呢? 10/24 23:35
推 smallchocho: 面試是程度3分運氣7分,多面試是不敗真理 10/24 23:50
推 wrt: 業界就是結果導向,問理論只有滿足高學歷的虛榮心而已。ML你 10/24 23:54
→ wrt: 只要參數會tune好才真正可以幫到公司賺錢。就像台積從10nm到7 10/24 23:54
→ wrt: nm也就是tune參數,其他理論paper就只有滿足虛榮心好棒棒而已 10/24 23:54
→ wrt: 。但有趣的是面試時主管會希望問一堆原理,那你要小心他可能 10/24 23:54
→ wrt: 不是很務實的主管,未來工作可能會一直煩你一些不重要的東西 10/24 23:54
推 sttagomantis: 都要刷題保險吧.. 有些面試官會認為那是基本功 10/25 00:58
推 lukelove: 都還算熟要怎麼證明 有投論文或比賽拿牌嗎 10/25 02:27
→ b29308188: 原來ML只要會tune參數....真是大開眼界 10/25 07:37
→ wrt: 歡迎趕快畢業後進入業界體會XD 10/25 08:27
噓 starcraftiii: 這篇大概是第2839284說自己對該領域很熟的 10/25 08:31
推 sing10407: tsmc只是tune參數,三星都哭暈了 10/25 08:39
→ yolasiku: 我也對R 被問到什麼 我都回R我不會 10/25 08:50
推 wrt: 要進步,處理人的事情比處理理論的事情難上許多。要處理人的 10/25 08:51
→ wrt: 事情就是要讓上面心安跟信任,所以沒一定理論基礎很難達到這 10/25 08:51
→ wrt: 樣啦。還是那句話,大部分研究就是滿足虛榮心。 10/25 08:51
推 iiiii: 裝熟魔人?! 10/25 09:08
推 lovdkkkk: 你答不好的部份的確是重點 總不能跑下去才知道要三個月 10/25 09:15
→ lovdkkkk: 或者資料餵下去才發現記憶體會爆掉 10/25 09:16
推 Wush978: 你在意的事情只是門檻,把那些知識補足了以後就過了 10/25 09:46
→ Wush978: CS的相關技能,以Data Scientist來說不用點到太深 10/25 09:47
→ Wush978: 畢竟CS能力超過門檻之後,對工作成效的幫助就不大了 10/25 09:47
→ Wush978: 數學背景,去自修點演算法不難,演算法複雜度也不難 10/25 09:48
→ leica13: 找工作的經驗下來,Data Scientist 還是以點了一些統計 10/25 09:55
→ leica13: 技能的 CS 人為優先,點一些 CS 的數學人比較不被重視。 10/25 09:56
推 senjor: 因為一般職缺不會只讓你作Data,還會要你寫其他程式... 10/25 10:01
→ senjor: 專門只處理Data Science的職缺其實沒有想像中的好找。 10/25 10:02
→ Argos: ML當然能只會tune 但台灣只會tune就夠啦 XD 10/25 10:57
→ Argos: 不 10/25 10:57
推 b29308188: ML業界怎麼架data pipeline, feature engineering, 和10/25 13:41
→ b29308188: 整個ML system的設計(feedback, 分散式的架構...) 都很10/25 13:41
→ b29308188: 重要吧10/25 13:41
→ stitchris: 台灣缺的是碼農, data science所會的和programming還是10/25 14:16
→ stitchris: 有差距, 去國外讀個PhD吧10/25 14:16
推 wwwc: 看到大部分研究是滿足虛榮心 笑了10/25 20:03
推 lldavuull: 把資料結構,演算法讀熟10/25 21:19
推 lldavuull: 最相關的科系是資料所,看資料所考科缺什麼就補什麼10/25 21:44
→ jameszhan: 碩畢就敢說對dl熟 是要笑死人嗎10/25 22:19
推 Huffman: 沒博班就謙虛一點10/25 22:23
那我更正一下,相較於資料結構跟演算法,這些統計、機器學習、深度學習的數學理論,相
對熟稔。不過如果大家還是認為這樣不夠謙虛,可以把我當作略懂,只是聽過這些名詞,再
給我些建議,謝謝
→ rupcj8: 不過你應該要把公司和問什麼都講清楚才知道是不是你的問題10/25 22:26
→ rupcj8: 畢竟台灣真的要請做data science的大概也沒幾間認真的10/25 22:27
1.給定AB等長向量,A為連續變數,B為0/1,怎麼用最有效率的方法找到A中適合的切分點,並給予A新的0/1預測,使得與B對應的error rate最小,其時間複雜度為何?
2.在streaming data中,怎麼快速的歲時更新資料中的第90百分位數
我能確定這家是認真在做Data Science
噓 THEWORLDS: DS妳會的那點屁東西根本沒用 很熟? 叫你用最簡單的語言10/25 23:43
您的DS是指Data science 還是Data Scientist?還有您說學什麼東西沒屁用?想多瞭解,謝
謝
→ THEWORLDS: 你這種被民間公司問倒的就去銀行業養老比較實在10/25 23:44
就是被問倒才來板上問相關職務的各位應該怎麼準備比較好,謝謝
→ THEWORLDS: 人家自動把東西給你妳不用去寫爬蟲輕鬆太多10/25 23:45
→ THEWORLDS: ds熟的話隨便都能領8萬以上 銀行大概可開到6萬10/25 23:45
→ THEWORLDS: 這行比較特別 技術面試只要能過不管你學歷多少都能進來10/25 23:46
→ THEWORLDS: 相反的技術面試沒過的基本上就10/25 23:46
推 lukelove: 果然在這熟這個字不能用阿, 尤其血統不對的10/26 00:10
※ 編輯: BBBB4 (223.138.238.83), 10/26/2017 01:05:10
※ 編輯: BBBB4 (223.138.238.83), 10/26/2017 01:08:20
※ 編輯: BBBB4 (223.138.238.83), 10/26/2017 01:16:04
推 hanshsu: 程式怎樣叫過門檻啊?10/26 01:59
推 swedrf0112: 可以試著找找 roc curve & youden index 搭配 search10/26 07:42
→ swedrf0112: 演算法 應該能回答你的問題... 印象中 categorical/s10/26 07:42
→ swedrf0112: urvival 課上應該有提...吧XD10/26 07:42
我們的categorical 和survival都在找分佈找檢定統計量,而且當時回答統計跟機器學習的方法,他就說不是要這個答案,單純就是演算法
推 lance8537: 果然掉出一堆兇宅 有自信錯了嗎? 就你最屌?10/26 08:30
※ 編輯: BBBB4 (223.141.230.201), 10/26/2017 08:53:03
→ robber1234: 研替要做好幾年,慎選. 沒有找到就乾脆當兵你會謝謝我 10/26 09:49
推 qseft12345: 真的熟工具比較有用,臺灣多得是熟工具再學點統計就 10/26 10:02
→ qseft12345: 好,統計再強工具不熟在"這行"似乎沒什麼用 10/26 10:02
推 moondark: 你沒有問題 有問題的是那些沒有統計背景聽不懂的面試者 10/26 15:15
→ moondark: 換個場景比如說是生物統計類的工作 10/26 15:17
→ moondark: 就變成反過來 變成只會演算法的人生不出東西被嗆沒貢獻 10/26 15:18
→ moondark: 只是這種工作會給有生物背景的人優先 沒有領域知識不行 10/26 15:20
推 moondark: 直接把資料科學那套丟到嚴謹假設的統計研究裡就是死亡 10/26 15:23
→ moondark: 稀疏資料有稀疏資料自己的玩法 10/26 15:25
→ moondark: 結論就是你找錯工作類別 別找程式設計師的工作 10/26 15:26
→ moondark: 但你想找的工作缺領域知識在檯面上很少很少幾乎沒有 10/26 15:27
→ moondark: 也許可以考慮轉行 找更重視數學的工作? 但這我不懂 10/26 15:28
→ moondark: 請其他人補充 10/26 15:28
推 lukelove: 簽博 10/26 20:38
推 clsmbstu: 借標題問個:如果是點了一些統計和一些CS的生醫人呢... 10/27 14:37
推 wxtn: 目前在公司看到 懂ML理論的人無法解決問題 陷入空轉狀態 10/27 21:58
→ wxtn: 不禁開始思考真正有用的data science到底怎麼定義... 10/27 21:59
推 fuvincent: 有些人不知道在兇什麼 10/27 23:35
→ fuvincent: 原po加油,別理一些無聊人 10/27 23:35
→ eesu: 路過 蠻好奇你指的熟DL數學理論是指? 10/28 00:39
→ prag222: 都產學合作了還來這問題?這邊 純資料分析的不多吧 霸歌 10/28 16:29
→ prag222: 乾脆去數學版問不是比較快 進職場依樣先從資料處理入手吧 10/28 16:30
噓 profiles: 現在這些資料科學家職缺,變成一堆不太會寫程式的學生 10/28 20:24
→ profiles: 的救贖 10/28 20:24
→ THEWORLDS: 都沒屁用,我指的是在妳身上,有用不可能被刷掉 10/29 02:31
→ THEWORLDS: 每次都面試這種自以為會很熟的屁孩真的蠻賭爛的 10/29 02:32
→ THEWORLDS: 理論熟的人一大堆,做不出來就不要說妳多熟,熟會做不 10/29 02:32
→ THEWORLDS: 出來? 一堆掛cs外國畢業的考實做翻船的我見過不少 10/29 02:33
→ THEWORLDS: 當然如果你是數學系的倒演算法公式的話我還免強可接受 10/29 02:33