【@businessfocus.io】美國動大工程破解武漢實驗室數據 或未能提供高質評估結果
.
CNN援引多名消息人士披露,美國情報部門已獲取來自中國武漢實驗室的大量新冠病毒基因數據。當局目前正安排人力,並動用美國國家能源部數十台超級計算機對此進行研究和分析,一旦成功破譯,這些數據將可能是揭開新...
【@businessfocus.io】美國動大工程破解武漢實驗室數據 或未能提供高質評估結果
.
CNN援引多名消息人士披露,美國情報部門已獲取來自中國武漢實驗室的大量新冠病毒基因數據。當局目前正安排人力,並動用美國國家能源部數十台超級計算機對此進行研究和分析,一旦成功破譯,這些數據將可能是揭開新冠病毒溯源的關鍵。
.
美國總統拜登曾在5月要求情報部門在90天內調查新冠病毒溯源,如今僅剩不及半個月的時間。消息人士指出,情報部門獲得這些數據正是調查計劃的一部分,情報人員希望這些數據將有助於解開新冠病毒如何從動物傳播到人體的謎團,這對於確認新冠病毒是否是從武漢實驗室洩漏至關緊要。
.
報導指出,情報部門獲得的海量數據包含了從中國武漢實驗室研究的病毒樣本中提取的基因藍圖。不過報導稱,目前不確定情報部門是如何及何時獲得這些數據的,但參與創建和處理這些基因數據的計算機一般會連接到外部的雲端伺服器上,因此不排除有可能是黑客入侵系統拿到的,最終落入美國情報部門手中。
.
情報部門要將大量原始數據轉譯為可用資訊並非易事。當局需要依賴能源部國家實驗室的超級電腦,以確保擁有足夠的計算能力。此外,該基因測序數據涉及中文術語,情報部門需要尋找背景安全可靠、熟悉中文,且具備豐富經驗的科學家,來研究這些複雜的數據。消息人士指出,「顯然,有些科學家已經通過了安全審查,但既會說中文又背景安全的科學家是非常小的群體,這提升了研究難度。」
.
報導提及,美國情報人員一直在尋找武漢病毒研究所處理過的「2.2萬份病毒樣本」數據,但中國官員2019年9月從國際基因資料庫上刪除相關數據後,便未有重新提供。WHO早前亦呼籲中國配合展開第二階段病毒溯源調查,並批評中方在第一階段調查時未有提交所有重要數據。中方則表示,當時已向WHO展示了所有早期病人數據,但礙於隱私規定才沒有讓專家拷貝拍照。
.
有研究人員質疑該2.2萬份病毒樣本是否真實存在,或是還有科學家尚不知情的任何基因資料。另一方面,這2.2萬個樣本是否包含在今次情報部門所獲得的數據中,也尚未得知。
.
同時,知情人士指出,雖然破解這些病毒的基因定序數據,能夠使科學家分辨新冠變種病毒之間的差異,並提供科學家有關病毒如何進化或變異的線索,包括病毒是否有被人類操縱的跡象。不過,即使成功填補缺失的基因聯繫,依然不足以證明引起新冠病毒到底是來自於實驗室還是自然界,情報部門仍然需要拼揍起其他背景線索,才有可能證明「疫情源頭」。因此,情報部門幾乎不可能在拜登要求的90天內給出結論。
.
高階情報官員透露,目前為止情報部門內部在關於疫情起源的「實驗室外洩論」與「自然起源論」看法仍存分歧。CNN上月16日報導稱,多數研究新冠肺炎及調查疫情起源的科學家都表示,按照現有證據,強烈支持新冠病毒「自然起源論」。至於拜登政府,去年曾試圖淡化「實驗室外洩論」,但如今立場轉變,認為「實驗室外洩論」是病毒溯源的關鍵拼圖。另外,一些研究人員、情報官員和共和黨內保守派認為,武漢研究所的研究人員可能在實驗室中對病毒進行了基因改造,實驗意外令研究人員被意外感染,並在他們的社區中傳播。
.
面對美國不斷放風,中國外交部態度強硬,強烈譴責美方「散布新冠病毒溯源虛假信息」,此外,官媒亦反擊,質疑新冠病毒是來自美軍的實驗室,並要求WHO徹查。中央電視台譴責美方,在面對新冠病毒問題還有重重疑團還沒解開,例如美軍生物實驗室究竟發生了甚麼、電子煙肺炎的真相是甚麼等。中新社亦指美國近期大搞溯源恐怖主意,試圖將中國與新冠病毒起源連結一起;對於遭受外界質疑的美軍德特里克堡實驗室則保持沉默。
.
Text by BusinessFocus Editorial
.
#BF環球視野
.
@businessfocus.io 瞭解更多商業財經資訊
.⠀
#money #investment #business #finance #life #startup #startups #management #company #expert
計算樣本數 在 玩遊戲不難,做營運好難 Facebook 的最佳解答
【💡💡營運小教室-第32堂】🕹 A/B測試 重點分享 🕹
.
🔎文章同步部落格:https://bit.ly/3rPadlk
(圖文同步、畫好重點,閱讀更方便)
.
最近這兩週我在研究A/B測試,
何謂A/B測試我就直接引用文章內的話:
「針對某一需要改進的功能、頁面或是產品,提供兩種或以上的方案,合理分配流量,將不同方案发布給不同用戶。在運行一段時間後,結合各項指標和科學的統計方法,對比實驗數據做出決策,將最優方案更新給全量用戶。」
.
因此,A/B測試在現今網路行業中被用的相當頻繁,
Google更是把A/B測試視為圭臬,
大到一個功能,
小到一個按鈕的顏色都要做A/B測試,
也因為Google進行了大量的A/B測試,
把用戶旅程(user journey)中每個節點的轉換率一步步提高,
使得每次產品功能或是頁面的改動更符合多數用戶需求,
自然效能與績效就能極大化,
其他像是臉書、亞馬遜等電商公司,
都是將A/B測試納入必要的工作項目內。
.
專門在做這工作的人,
現在也有個很新穎的職務名稱叫成長駭客(Growth Hacker),
大家到104人力銀行搜尋就知道其工作內容,
這邊不贅述。
(注意,A/B測試只是成長駭客內的其中一個工作項目,並非成長駭客就只做A/B測試,差很多)
.
遊戲業坦白說在營運上不太會進行A/B測試,
因為用戶幾乎都從雙平台上下載遊戲,
如果要做A/B測試就只能在雙平台上著手,
新產品或許還能這樣做,
但對既有產品來說就不切實際點,
因此A/B測試通常會出現在廣告的買量測試中。
.
以下分享我自己在A/B測試上的心得分享:
.
1⃣A/B測試不代表一次只能測試兩個,你想測試2個以上也行,主要是得確認每個群體樣本數要夠多,如果樣本數太少,達不到性效度的話,做出來的結果就沒有參考價值。
.
2⃣如何確認有足夠的樣本數呢?身為營運人員,自家的營運數據自己最清楚,可以透過這個網站輸入母體大小,就會自動算出要多少樣本數才能達到統計顯著性。
👉https://zh.surveymonkey.com/mp/sample-size-calculator/
.
3⃣假設是投放廣告,如果不曉得母體會有多少,那可以用以下免費工具來反推,例如你想要達到的轉換率是1%提升到5%,這個頁面就可以幫你計算出兩個群體各自要曝光幾次才足夠,就能判斷預算會花多少。
👉https://clincalc.com/stats/samplesize.aspx
.
4⃣會需要計算上述的原因主要有兩個,一個是預算問題,另一個是在不確定風險下,建議做足夠樣本數就好。
👉舉例來說,如果今天某款遊戲每月付費玩家有10,000人,如果想改動一個功能,可能一開始會想到的做法是隨機5,000人分配到不同群組(也就是A/B測試為50% / 50%)。
.
但這樣就會有一個風險,萬一這個改動是失敗的,等於就會直接影響到5,000人,那在A/B測試期間,可能就開始蒙受不小的營收損失,或是等不到信效度出現就提早結束測試,因此如果能事前估出足夠的樣本數,就能降低上述風險。
.
以10,000人這例子,丟到頁面內,只要370人的樣本就能達到統計顯著性了,不用分到50% / 50%這麼多,只要5%就足夠了,這樣即使A/B測試不理想,也只會影響到那5%付費用戶。
.
5⃣要確保兩個群體是完全獨立,而非交集,如果有交集,就會影響分析結果。
👉這點比較吃技術的工,技術要能夠確保實驗對象進入A/B測試時會被隨機分派到不同群體內,如果因為裝置過多、版本不同等因素而導致有部分用戶既是A群體、也在B群體的話,那就會導致數據判讀出現錯誤。
.
6⃣不要在一個A/B測試還沒做完情況下,又緊接著做另一個A/B測試,除非能確定這兩個A/B測試是完全不相干,不然不但在分析時不容易分清楚每個群體,也很容易影響整個數據的分析。
.
7⃣做出來的結果到底有沒有達到統計顯著性,可以把數據輸入到這個網頁內,非常方便。
👉https://abtestguide.com/calc/
.
8⃣A/B 測試前,可以先執行A/A測試,先確認目前的隨機分配中有沒有其他的變異數,確保這兩個群體的整個營運數據夠乾淨。
👉由於測試的是群體內有沒有其他變因,而非方案本身,因此在流量分配上就能夠以50% / 50%進行。
.
以上就是我對於A/B 測試目前的經驗與心得分享,
如果要再探討下去絕對有更多的理論基礎與分析模組,
我自己也還在學習摸索中,
日後如果有甚麼心得或是勘誤,
我會持續更新在這篇文章中,
如果你有其他心得或是已經發現錯誤的地方,
也歡迎分享給我。
.
🔎參考資料:A/B 測試要測多久?從統計顯著與檢定力看廣告測試結果
https://bit.ly/3CcQAIL
.
🔎延伸閱讀:谷歌是怎么用A/B測試的
https://bit.ly/3lr6KYZ
計算樣本數 在 The News Lens 關鍵評論網 Facebook 的最佳貼文
【COVID-19藥物臨床試驗結果為何不一致?透過「病毒動力學模型」找答案】
回顧先前的抗病毒藥物試驗,大部份都沒有達到本篇研究提出的樣本數水準,而且也沒有詳細針對病人症狀發生時間的長度設定收案的規定。
不過,研究使用的是傳統的病毒動力學模型,可能無法完全反映病毒動力學的詳細機制,在參數設定和模型結構上都需要再校正,才能有更可靠的樣本數計算。
#新冠肺炎 #武漢肺炎 #疫苗 #疫情 #防疫 新興科技媒體中心
計算樣本數 在 Facebook 的最佳解答
在天氣風險有些預報服務中已經有運用到 AI 的技術,預報品質也大幅精進,不過還是需要氣象預報員主觀的預測,尤其是天氣預報中,極端值是大家最關心的,百年一遇或幾十年一遇的極端條件,就樣本數來說太少,不容易做得到比物理模式來得好。
我有時也很怕 AI 專家來看天氣,有些太輕忽了天氣的原理,把我們工作說得很像是傳產一樣,結果由純 AI 專家做的天氣 AI 常常是一個『災難』,還是比不上預報員的主觀判斷。我們就有好幾個導入AI失敗的經驗,但沒有失敗哪會有成功?
但我相信,隨著 AI 的普及及計算能力進步,我們預測當中的 AI 預測方式輔助會越來越有可看性。