[爆卦]資料科學家在幹嘛是什麼?優點缺點精華區懶人包

為什麼這篇資料科學家在幹嘛鄉民發文收入到精華區:因為在資料科學家在幹嘛這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者applehpsh ()看板Soft_Job標題Re: [請益]資料分析/科學的工作是不是幾乎都...

資料科學家在幹嘛 在 PanSci 泛科學 Instagram 的最讚貼文

2020-11-19 00:44:58

#科基百科 追著死線跑(或是被死線追著跑)的我們,覺得時間這個酷 guy,好像能掌握但其實根本不可能 www 為了享受被時間追著跑的刺激感(完全不對!),於是乎科學家找到了有史以來最短的時間,並以「仄秒」(zeptoseconds,縮寫 zs)作為它的單位。 _ 埃及化學家亞米德.澤維爾(英文轉...


※ 引述《HWSH (光的夜生活)》之銘言:
: 小弟去年從國立臺北大學統計系畢業
: 計畫先工作個兩三年再去申請國外研究所
: 目前即將服完兵役 本來是希望年後可以開始上班
: 最近幾天開始找工作 履歷卻一直被已讀
: 感到一點小小的「挫折」
: 看了一下應徵者狀況 六七成都是碩博
: 唉學歷拚不過別人真的是硬傷
: 真的沒有一些初階的資料科學家助理工作可以做做看嘛哈哈
: 我很樂意從Data Cleansing的工作做起
: 交代一下背景
: 大概是大三決定要走資料科學家這條路
: 接觸coding到現在大概兩年
: 最常用的是R跟SAS
: 有去修資工的資結跟演算法
: 會一點C跟Matlab
: 最近在看線上課程學python
: 英文聽說讀寫沒問題
: SQL還真的完全沒碰過(滿多職缺都有要求)
: Deep learning幾乎沒有頭緒(只知道ML)
: Hadoop跟Spark只知道是在幹嘛的也沒有實際操作過
: 唉唉真的是太嫩了
: 想請版上的前輩大大們點一盞明燈提供一點建議
: 謝謝謝謝 用力鞭沒關係

身為這一塊的弱弱從業人員給你建議

我覺得你心態可能要改

資料科學家 70%以上的時間都在做data cleansing

但你好像搞錯狀況了 以為這種東西是初階的工作

但是實際上並不是這樣 實戰經驗上需要想辦法增進把資料清整時間到可以拿去建模

在台灣 有意願想做這方面的公司在過去對於資料的管理上都很不嚴謹

你看到的會是雜亂無章又一堆莫名其妙的資料

光是處理資料encoding的問題就夠你燒腦燒時間的 更別說還有一堆雜事

如果你以為資料科學家只要爽爽地建模就好了那真的是太天真了

加上從你內文中沒接觸過SQL 沒玩過Deep learning 好像也不會爬蟲

資料視覺化的工具也沒提到會不會

ML到底接觸多深也不知道 要走資料這塊只會R卻不會python 也是硬傷

勸你先去了解一下R和Python彼此的優缺點

另外有沒有實際上玩過什麼專案也看不出來

講白了如果我部門開缺你來應徵 我還真不知道有什麼誘因讓你進來一同工作

有個建議是如果真的想增進實力

上去Kaggle看看其他人在幹嘛 同樣的dataset你能不能做出跟人家一樣的結果

或是去挑個競賽區的試試看自己做出來的結果到哪


另外就是最近吹很大的各種相關“前景”請審慎看待不要一頭熱

有時候實務面上跟這些投機客炒作的泡泡還是有不小的落差


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.121.188
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1518108879.A.FB1.html
wilson85771: 推這篇 02/09 01:56
jerry771210: 推推 02/09 02:13
TAKADO: 10-15年前,大家都在跟風玩data warehousing 炒作data min 02/09 02:54
TAKADO: ing種下的惡果啊,看過一堆奇葩系統各種沒建pk fk constra 02/09 02:54
TAKADO: ins,沒有正規化,各種垃圾資料狂塞猛送,然後現在抱著這 02/09 02:54
TAKADO: 些資料要來玩AI。 02/09 02:54
laba5566: 嘴砲>>>>>>>狗屁ML+資料分析 不會嘴走這行是找死 02/09 08:52
testPtt: nosql就是讓你這樣玩阿 02/09 09:40
lichai: 正解… 02/09 09:43
Abhoth: 樓上TA大的回覆深有同感QQ 02/09 11:29
drajan: 你真的懂data warehouse嗎?:) 正規化是要看場合來使用的 02/09 14:32
askia: 推,一看就知道是內行。學術界老是講一堆xxx方法、模型 02/09 19:26
askia: 但是真正的實務只有三個要點:清資料、清資料還是清資料 02/09 19:27
askia: 有乾淨的資料一切都好談,否則什麼都是屁。GIGO 02/09 19:27
MOONY135: 哈哈哈清潔工 02/09 20:14
lovdkkkk: 掃地僧4ni 02/09 21:01
vfgce: 資料分析用'資料庫正規化'會很想死吧...... 02/10 16:23
vfgce: 至於清資料也不用講得多神奇,主要是你對這個資料的了解... 02/10 16:24
vfgce: 知道怎麼用,那些有用,那些雜訊.... 02/10 16:24
vfgce: 資料分析常常是一個資料表拿來用,'正規化'反而造成麻煩... 02/10 16:27
TAKADO: 樓上幾樓說的沒錯 DW根本沒有正規化的問題 02/10 16:46
TAKADO: 但是在那個大家都在玩DW的年代一堆公司DB都剛起步 02/10 16:47
TAKADO: 然後看是凹MIS去學或找便宜工作室幫忙弄 02/10 16:47
TAKADO: 然後就出現了因為OLTP->DW時 ETL亂寫進不去 02/10 16:48
TAKADO: 但是DW是顧問開的 然後只好operational DB做去正規化到1NF 02/10 16:50
TAKADO: 或是把DB跟DW混在一起做撒尿牛丸 設計成star-schema 02/10 16:53
TAKADO: 這樣就沒有轉資料的問題了,大家都開心 02/10 16:54
TAKADO: 如果資料是靠爬蟲或是open data去撈還好 02/10 16:56
TAKADO: 如果是抱著整個資料庫來的挺多雷 裡面各種世界奇觀都有 02/10 16:57
shiauji: 推樓上大大跟這篇 02/11 10:18
sailoruranu: 推 我之前做report也都一直在整理資料 老是有莫名奇 02/11 14:01
sailoruranu: 妙的資料會被放進db 02/11 14:01

你可能也想看看

搜尋相關網站