為什麼這篇big data中文鄉民發文收入到精華區:因為在big data中文這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者donaldknuth (RoN)看板book標題Re: [心得] 大數據 Big Data時間...
big data中文 在 Simon Shen 沈旭暉 Instagram 的精選貼文
2020-05-24 09:23:11
📖 CEO未來對話關於大數據的對談,談及這本書《Everybody Lies》,有網友問有沒有中文版,就是這本 ▶️ 每人都在說謊:Radica創辦人Francis Kwok談大數據未來 https://www.youtube.com/watch?v=M8n-ia3MFgQ #bigdata #e...
稍稍加註點東西。
書上提到有三點改變,其實在顛覆統計學概念。
1. 樣本=母體:以往的統計學,常常因為成本考量關係,就會以樣本數來推敲母體,
但在Big Data後,因為資料量夠多,多到足以代表你所觀察D的母體。
2. 精準度:在Big Data會發生不同來源的資料,也會有結構性與非結構性等不同類型資料
,這會發生資料容忍度等問題,書中提醒不要過份在意準確,試著接受混亂和不確定性。
3.相關性:以往質性分析都會找變數提假設,說明這已經受到先入為主的偏見影響,而且
作者點出找到因果關係是人類直覺的本能,覺得這點還滿有趣的。
除了這三點改變以外,其它章節都有點料,像是三種價值:資料、技術、思維,從這又延
伸出資料持有人、資料專家,以及擁有Big data思維的人,書中最後面提到風險及管控,
可以再翻翻,肯定會有收獲。
補點挫見,就醬子了!XD
※ 引述《fantasy361 (旋律)》之銘言:
: 嗯......這本書真的叫這個名字,中文跟英文都是。
: 不得不承認我原本因為這個名字不想買它,感覺就很雷XDD
: 不過,簡略翻過之後還是買了,看完之後評價算是中等偏上。
: 整本書的主軸圍繞著所謂的「巨量資料」,顧名思義就是非常大量的資料,
: 內容主要就是以實例來講述我們如何以跟以往不同的思維跟方式來運用巨量資料。
: 其中的例子,我看Google跟Amazon就佔了一半吧XD
: 比較多人知道且運用巨量資料的例子大概是reCAPTCHA了,把驗證碼跟古籍數位化
: 連接起來,整個就是很有創意跟遠見的想法。
: 而所謂處理巨量資料的思維講穿了也就兩點:
: 1. 樣本即為主體 → 克服了過去資料收集不易的統計盲點。
: 2. 相關性 >> 因果關係 → 能解決問題勝過費時費力找到原因。
: ** 並不是說因果關係得被捨棄,而是在巨量資料的前提下,找出相關性遠比找出
: 因果關係來的有效率。
: 最後引用書中一段話作結:
: 「雖然因果關係常常難以判定,甚至可能造成誤導,但人們一向習慣試著找出各種事物
: 的原因。但在巨量資料的世界中,我們不一定要堅守著因果關係;相反的,
: 是要從資料中找出事物的模式,以及彼此的相關性,再從中取得創新而寶貴的見解。
: 從事物彼此的相關性當中,我們可能無法了解某件事『為何如此』,
: 但卻能知道事情『正是如此』。」
: 謝謝各位:D
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.166.120.93