[爆卦]poc專案是什麼?優點缺點精華區懶人包

雖然這篇poc專案鄉民發文沒有被收入到精華區:在poc專案這個話題中,我們另外找到其它相關的精選爆讚文章

在 poc專案產品中有3篇Facebook貼文,粉絲數超過3,992的網紅台灣物聯網實驗室 IOT Labs,也在其Facebook貼文中提到, 訓練AI模型,要多少數據?拆解企業人工智慧專案為何難落地 2020.12.09 by 若水AI Blog 企業導入AI似乎已成為一種趨勢,但是訓練AI模型,需要多少數據?其背後的商業命題與成本又該如何解決?帶你來一起窺探AI專案背後的秘密! 企業的AI專案在釐清問題本質、找到命題之後,首先...

poc專案 在 Study with Willow Instagram 的最佳解答

2021-09-10 21:54:11

. 主要是總結一下上學期我修的課程、其他事務和一些小心得! - 📚課程部分 我這學期一共修了六堂課17學分。整體覺得不會太重,讓我在能掌握每一科的同時也有時間去做其他事,也拿到相當好的成績。 我一直都不是喜歡選很多課的人,原因是覺得這樣都不會學得太精實,反而整個學期過去都不知道學到什麼。相較之下,我...

poc專案 在 數位外交研究室 Digital Diplomacy Lab Instagram 的最佳貼文

2021-09-16 10:22:16

#研究室日常|大揭密!你看過我們的年報了嗎?今天來帶大家透過我們這本 #全台第一本數位外交年報,看看年報幕後推手、數位外交小隊員怡柔,如何親身體會 #普通人也能參與外交! 🌍 從外國人的提問開始,想更認識台灣 大學時就讀犯罪防治學系的怡柔,畢業後沒有投入相關領域,而是先到國外的法商度假村工作兩年...

  • poc專案 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文

    2020-12-14 12:01:59
    有 0 人按讚

    訓練AI模型,要多少數據?拆解企業人工智慧專案為何難落地

    2020.12.09 by 若水AI Blog

    企業導入AI似乎已成為一種趨勢,但是訓練AI模型,需要多少數據?其背後的商業命題與成本又該如何解決?帶你來一起窺探AI專案背後的秘密!

    企業的AI專案在釐清問題本質、找到命題之後,首先會面臨到一個問題:收集數據(Data Collection)和建立AI模型(Model Establishing),該以什麼作為評估基準?

    訓練一個AI數據模型,需要多少數據?

    訓練AI數據模型時,其實有三個要素,彼此互相影響。分別是: 商業問題的複雜度 、 AI模型複雜度 (Model Complexity),以及 數據複雜度 (Data Complexity)。

    因此,如果想知道需要多少訓練數據(Training Data),建議先釐清:這個AI專案到底要處理什麼問題,以及這個問題有多複雜?確定之後,再來判斷應該選用哪種程度的模型來做訓練。根據不同的商業命題複雜度,用不同複雜度的模型和精準數據彼此搭配,找出最佳平衡,才能讓AI專案順利落地。

    但光憑想像,很難評估實際的AI數據量和成效,所以開始AI的第一步,需要先透過POC概念驗證(Proof of Concept)實驗來找答案。

    簡單來說,就是針對不同複雜程度的商業問題,嘗試選用不同複雜度的模型搭配測試,直到模型跑出來的曲線,符合理想目標。

    一般狀態下,假設商業問題本身的複雜度很高,我們會預期要選擇複雜度較高的模型。但是如果數據量不足,那麼選擇複雜度較高的AI模型,反而會比用簡單的AI模型效果還差。(上圖左上、右上,分別代表複雜度10和複雜度50的問題,可以明顯看出複雜的模型曲線比較接近學習數據集(Dataset),但是在測試數據集上的誤差 Eout,反而比簡單模型還差了許多。)

    上圖的左下和右下,是以不同複雜度的模型去做POC,跑出來的結果曲線圖。藍色線代表的是學習數據(Training Data)成效,紅色線代表的是測試數據(Testing Data)成效。最理想的POC目標,應該是兩條曲線很貼近彼此,而且位置越低越好。

    我們會發現,左下這張圖的兩條曲線雖然彼此貼近,但是就算增加數據,也無法降低誤差。這表示模型偏誤(Bias)高,效果不佳,應該要增加模型複雜度 (Model Complexity)。

    增加模型複雜度之後,就會像右下這張圖,藍色曲線(學習數據)雖然數值很低,但在學習數據不足的情況下(灰色區塊),紅色曲線(測試數據)卻「飄」得太高。這表示模型變異誤差(Variance)高,應該要增加學習數據。最後在慢慢增加模型複雜度以及學習數據之後,我們就可以達到理想的結果(兩條曲線很貼近彼此,而且位置越低越好)。

    數據哪裡來?發展AI人工智慧之前,先建立數據流

    先前我在文章裡提到,很多企業會急著開發AI模型,但AI專案落地經驗的三大關鍵之一,其實是先確認:是否已經準備好數據了?如果沒有這樣的能力,談AI落地其實有點好高騖遠。

    AI數據收集(Data Collection)最大的挑戰,在於針對不同型態的命題,會產生不同的AI數據需求,因此需要建立的「數據流」(Data Pipeline),AI數據處理 (Data Processing)和數據標註(Data Annotation)的模式及流程也會有所不同。

    發展AI之前,如果能建立起從數據收集(Data Collection)、數據處理(Data Processing)到AI模型學習的數據流(Data Pipeline),並確保可以順暢運行,實際訓練AI模型時才會省力很多。

    數據不夠或太多怎麼辦?

    Google開設的機器學習(Machine Learning)課程中,第一項原則就開宗明義地指出:「Don’t be afraid to launch a product without machine learning」。

    如果你的產品或業務不一定需要用到機器學習(Machine Learning),那就別用,除非你有AI數據。有數據,再來談機器學習(Machine Learning)。但在業界的實際狀況,大家不是沒有數據,而是只有一些些,這時候該怎麼辦?我會建議,先從小地方開始做起,也就是從POC專案著手。

    POC專案要有具體成效,除了要注意設計專案、實驗模型的指標(Metrics),企業最重要的是要先定義清楚:AI專案要達到什麼樣的指標,才算是成功?這樣最後做出來的成果,才會真正符合商業目標。

    如果今天不是沒有AI數據,而是數據很多,又該從何下手呢?

    我建議,嘗試減少訓練AI人工智慧時的「 數據大小 」和「 數據筆數 」。

    過去曾經處理過一個AI專案,數據多達2億筆。第一次實驗,把數據全部餵進AI模型,取得結果。第二次,只拿其中有代表性的500萬筆出來訓練人工智慧。

    猜猜結果如何?兩次實驗的表現,只差異不到1%。

    所以,如果企業對於AI數據的品質和數量有一定程度的自信根據,其實不用把數據全部餵進AI模型訓練(Model Training),只用有代表性的AI數據來訓練就可以了。市面上很多常見的AI工具(Cluster),可以做到這點,幫助省時省力。

    AI模型訓練,記得校準商業目標

    企業發展AI人工智慧的最終目的,還是希望能 達到商業目標,創造價值 。

    所以,訓練AI模型時,團隊如果不知道如何判斷哪個指標,對AI模型學習來說比較重要,建議回歸初心,重新釐清「 這個專案想達到的商業目標是什麼 」。

    比方,趨勢科技(Trend Micro)要開發一個能夠判斷電腦病毒的AI,但是勒索病毒(denial-of-access attack)和廣告病毒對客戶的傷害程度大不相同。這時候,工程師就會針對這個命題,餵給AI模型不同病毒種類的數據,讓它學會判斷不同病毒的重要性,分辨出哪些病毒比較嚴重不能有判斷錯誤,而哪些病毒比較無害,不一定要做到一百分。

    最常見的訓練方法,是用成本函數(Cost Function)的方式,訓練完再回去調整AI模型的評分(Rating),用加扣分的方式,告訴機器它的學習表現是好是壞,做對就加分,做錯就扣分。

    上述評分原則的制定,和企業的商業價值考量息息相關,所以一般在組織分工,會由PM專案團隊負責判斷哪些項目重要,請資料科學家設計在上述Cost Function裡面。

    很多人以為,AI人工智慧開發要做到很完美才行,但其實根據我們的經驗,只要AI開發成本符合預算、AI模型表現可接受(大約做到60–70分),而且結果有助於降低成本,就可以算是達到商業目標。反過來,即使AI模型表現非常好(高達90分),但成本卻遠超出預算,就不建議執行。

    另外,因為POC階段會做很多的實驗,需要拿兩個穩定且可以互相比較的基準做A/B Test,所以做好基礎建設非常重要。

    如果一個團隊裡面有三位工程師,但三個人做出來的結果都無法互相比較,那麼這個實驗就會變得霧裡看花,導致AI專案難以落地。

    AI數據小學堂:模型指標(metrics)

    在做模型實驗時,通常會用混淆矩陣(Confusion Matrix)的四種指標:TP(True Positive)、TN(True Negative)、FP(False Positive)、FN(False Negative),以及Count、Unique和Accuracy等等函數,來判斷這個模型的表現好不好。

    P或TN值,代表模型辨識的答案正確,和預期結果一致。例如:模型正確判斷出「這是一隻貓」、「這不是一隻貓」。而FP或FN值,則代表模型的判斷錯誤,例如「明明是貓,模型卻說不是貓」、「明明不是貓,模型卻說它是貓」。

    附圖:AI模型 若水國際
    AI模型的POC概念驗證實驗怎麼做?

    資料來源:https://www.bnext.com.tw/article/60440/ai-strategy-04?fbclid=IwAR1SOhjjGxypdGgOGfaBIl_a1IsZFJAQZ8J2aeDd98spbUfOdg7hiPQP7UA

  • poc專案 在 寶太太的人工智慧 Facebook 的精選貼文

    2020-12-03 07:18:42
    有 5 人按讚

    機器學習的日常營運,包括效能監控、誤判修補和模型更新都是重點,而營運標準的好壞沒有絕對。三個可以持續優化的面向,給大家參考:
    1. 透過「數據取樣」去提升時間及資源運用
    2. 從商業價值、成本取決停損線
    3. 摸著數據過河,透過小型POC專案測試,驗證是否可以達到商業目標門檻(從初始問題開始驗證)

  • poc專案 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答

    2020-07-09 20:02:28
    有 0 人按讚

    從數據孤島到數據驅動的企業轉型,掌握成功轉型的五大祕訣。

    2020.07.09

    本集收聽重點

    1. 如何定義轉型,企業該如何找到合適的人才,協助數位轉型?
    2. 什麼是data mindset?新世代人才該如何培養數據思維及數據溝通能力?
    3. 併購新創是一個海納數位人才的好方法嗎?大企業、中小企業在疫情後遇到什麼數位轉型的契機?
    4. 當數位轉型成為必要而非需要,如何提高轉型成功機率?

    「數位轉型是一個長期旅程,對企業來說,不僅僅是研發新產品、改變商業模式,更重要的是,將對的人放在對的位置,與時俱進的推動企業數位轉型腳步。」數位時代總主筆王志仁表示,數位轉型被許多企業認定為優先進行的工作,因為,它不僅是企業保持競爭力的基石,更是重塑未來的關鍵。

    不過,隨著時代的不同,企業關注的數位轉型議題不盡相同,例如,1980年代關注的文書系統、網路服務與電子郵件、1990年代側重的企業資源規劃、供應鏈管理與顧客關係管理等e化系統、2000年代興起的電子商務與社群軟體、2010年代崛起的行動網路服務,以及2020年代關注的數據驅動的數位轉型。從企業的發展樣貌,可以清楚看到,過去的E化與數位化應用讓每一個企業都擁有一定的數據資料,可惜,因為數據資料呈現孤島的狀態,不是以系統化的方式蒐集、儲存與管理,導致數據應用的效益達不到原先期望。因而企業需要重塑數位文化、組織與技能。

    想掌握後疫情新商機?數據驅動的數位轉型

    「過去10年,我們嘗試透過各種改變數位科技消費者行為與行銷通路以創造新的營收獲利,例如從電子商務轉變為行動商務,以及從數位行銷轉變成社群行銷等,但是,隨著數位科技的興起到普及,單純地透過數位科技凸顯企業差異化競爭力已不夠,需要透過數據分析型塑獨特的市場競爭力。」數據分析除有助於企業拉大與競爭對手的差距,也是進一步了解市場(客戶)需求的關鍵,對此,OYO資料科學家管其毅指出,隨著網路(流量)紅利的消失,顧客獲取成本越來越高,因此,需要透過數據分析掌握更精準的顧客資料與擬定個人化行銷方案。「在接下來的5年,企業數據力幾乎等同於競爭力,因此,如何讓企業的每一位員工都具備數據DNA,尤其關鍵。」

    曾協助許多企業透過數據分析進行數位轉型的Arm Treasure Data副總暨全球行銷長Tom Treanor進一步指出,許多企業都意識到數位轉型的重要性,但是,因為數位轉型極具挑戰性,且涉及跨部門、甚至是跨公司的合作,因此,不易開始,但是,新冠肺炎(COVID-19)疫情的爆發,讓全球企業不得不展開數位轉型腳步,在這個過程中,不少企業發現:堅強的數據分析能力不僅有助於推動數位轉型,更是提升企業既爭利的關鍵,因此,爭相強化企業的數據力。

    為協助企業快速掌握後疫情新商機,Tom不藏私地分享打造數據驅動數位轉型的五大訣竅:首先是確認企業要透過數位轉型解決那些問題,並且排定優先順序;其次是在企業高階主管的支持下建立負責推動數位轉型的專職團隊;再來是建立顧客數據平台(Customer Data Platform;CDP)進行多元數據分析,並且透過數據清理、儲存與分析等手法,掌握關鍵洞見;然後是透過一個又一個的專案驗證數位轉型成效與極大化轉型績效;最後,同時也是最重要的是,適時地透過外部夥伴提供新技術與新服務,讓企業的資料科學家與業務(Line of Business;LoB)專家可以更快、更好的進行溝通、協作。

    中小企業也能輕鬆展開數據驅動的數位轉型

    面對這一場「不轉型就等死」的危機,無論規模與產業,每一個企業都積極展開、或者是加速數位轉型腳步,在這個過程中,擁有相對充沛資金與資源的大型企業或許可以相對穩健的步伐進行數位轉型,但是,對資金與資源相對匱乏的中小企業,該如何是好?

    「中小企業在意的是,如何因應業務需求排定數位轉型的優先順序。」Tom以零售轉型為例指出,同樣是將線下實體銷售轉變為線上網路銷售,製造商與品牌業者的轉型方式就不同:前者需要的是虛擬通路平台,而後者要考慮的是建立品牌電商,確認優先順序後,接下來的重點是透過概念驗證(Proof of concept;PoC)專案選擇適合的數據分析平台與工具,在這個過程中,可以透過外部顧問提供協助,加速整個進程,同時,協助企業員工更快熟悉平台工具。「從我們的經驗來看,讓員工參與其中,是企業推動數位轉型專案的關鍵。」

    值得特別注意的是,在數位轉型的旅程中,無論是中小企業還是大型企業都會嘗試透過策略聯盟、甚至是收購的方式加快轉型步伐。

    總的來說,數據驅動的數位轉型趨勢將在未來5年達到高峰,在這個過程中,人才是關鍵,必須保持一定的彈性應變能力,才能與時俱進的掌握新思維,以新技能加速數位轉型,突圍創新局。

    資料來源:https://www.bnext.com.tw/article/58411/martech-digital-transformation?fbclid=IwAR1klfjL_KzBA19deawtSEnATv3zfApc4UEtxq4KJZAl7ct75FBppioE5c8

你可能也想看看

搜尋相關網站