[爆卦]Embedding 訓練是什麼?優點缺點精華區懶人包

雖然這篇Embedding 訓練鄉民發文沒有被收入到精華區:在Embedding 訓練這個話題中,我們另外找到其它相關的精選爆讚文章

在 embedding產品中有25篇Facebook貼文,粉絲數超過3,834的網紅eCloudvalley,也在其Facebook貼文中提到, The benefit from Data AI/ML solutions for the company can result in a lot of time and cost savings and analysis and research after data collection. W...

 同時也有2部Youtube影片,追蹤數超過94萬的網紅JSK-koubou,也在其Youtube影片中提到,Hello I made “Bench Grinder Tool Sharpening Jig”. This jig was made for the purpose of tailoring Japanese plane blades, but it can be used as a sharp...

embedding 在 Zatashah Instagram 的最佳解答

2021-07-05 14:31:17

Awww thank you what an honour for me. Yes #GirlWithTheTiffin that's me! 🥰🙌💖💖💖 And now you guys can own these beautiful sets by @komunititukangjahit to...

embedding 在 Zatashah Instagram 的最佳解答

2021-07-05 14:31:17

Awww thank you what an honour for me. Yes #GirlWithTheTiffin that's me! 🥰🙌 And now you guys can own these beautiful sets by @komunititukangjahit to he...

  • embedding 在 eCloudvalley Facebook 的最佳貼文

    2021-08-27 19:00:39
    有 5 人按讚

    The benefit from Data AI/ML solutions for the company can result in a lot of time and cost savings and analysis and research after data collection.

    With industry deregulation and the emergence of technologies such as 5G, PureTech Global is increasingly looking for ways to monetize products and services. As a result, the company launched its first AI project, embedding AI into their native workflows in order to leverage consumer data and provide more personalised and impactful apps that increase revenue for the company and its telco clients.

    eCloudvalley and PureTech collaborated on this project to understanding users' habits while finding the best time to send billing renewals, building a time-series forecasting model in six weeks, and even taking this extended inquiry to explore more potential business opportunities.

    Learn more PureTech Global, please clink in follow 👉 https://www.ecloudvalley.com/puretech-global/

  • embedding 在 Facebook 的最讚貼文

    2021-07-15 07:26:06
    有 629 人按讚

    四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!

    本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。

    不同的是,不是大公司、不是超大模型……

    一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。

    CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。

    瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。

    這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。

    ▎輕量化模型孟子?

    孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。

    包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。

    可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。

    孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。

    但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。

    CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。

    該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。

    騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。

    而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。

    因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。

    萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。

    因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。

    孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。

    相對已有的中文語言模型,孟子模型實現了多項突破性進展:
     1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
     2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
     3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。

    當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。

    ▎原理方法和應用?

    在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。

    具體有四方面:
     1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
     2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
     3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
     4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。

    基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。

    另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?

    瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:

     1) 數據增強:使用領域相關數據;
     2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
     3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
     4) 訓練優化:使用多種訓練目標,多角度提升模型能力;

    而且孟子還已經展開了垂直化領域應用。

    基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:

     1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
     2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。

    瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。

    並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。

    ▎瀾舟團隊?

    最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。

    瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。

    AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。

    周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
    而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。

    據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。

    值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。

    引用創新工場董事長兼CEO李開復最新分享來說:

    AI的發展可以按照兩個時間點劃分。

    第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。

    而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。

    「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。

  • embedding 在 走近動物園 Approaching the zoo Facebook 的最佳解答

    2021-06-15 20:30:54
    有 186 人按讚

    【新五大自由】
    #動物園設計
    #豐富化

    2017年,著名動物園設計者Jon Coe在波蘭弗蘿茨瓦夫(Wroclaw)動物園設計研討會上針對動物園內的豐富化提出了「New Five Freedoms(新五大自由)」這一概念,很好的詮釋了現代動物園面對豐富化應抱有的態度,同時,也是在施作豐富化時應當納入考量的重要執行依據。不過要注意,與其他新興的動物園觀念一樣,新五大自由絕非必須恪守的真理,但它提供我們一個途徑來審視目前的照養工作、為了更好的未來做打算。

    網路上目前還能找到當時的投影片「Embedding Environmental Enrichment Into Zoo Animal Facility Design 」,這邊就簡單地向各位舉例說明新五大自由的內容以及我的個人解讀。

    新五大自由認為動物園的豐富化應該賦予動物以下「自由」:

    • Achieve Competence: 有效的展現正常功能
    比如讓猛禽有進行長距離飛行的機會、提供根據物種覓食行為設計的特殊供餐裝置、替會游泳的動物設置不同深淺的水池鼓勵探索。
    But,前提是確保動物具備相應的能力,比如許多因為硬體缺失而被迫習慣地棲生活的靈長類動物,要讓牠們Achieve Competence就不只是搭好棲架這麼簡單,而是要花心思讓動物能循序漸進的「意識到」己身未被發掘的可能性,進而接受嶄新的生活型態。

    • Have Choice: 擁有選擇的「權利」與能力
    比如在展場的多個空間設置餵食點、爬蟲類的展缸內營造溫度梯度、讓動物能夠自由的進出前後場甚至動物園的不同區塊,並盡力在前後場提供相仿的條件。
    But,前提是動物並非「被迫」做出選擇,比如有些動物園會提供包括貓熊在內的怕熱物種具有降溫功能的人造岩塊,但這些設備往往有暴露於觀察點的前提,這使得動物只要想降溫,就不免必須付出承受視覺壓力的代價,仍有許多改善空間。

    • Take Control: 擁有影響事件進程的「權力」”
    比如讓大象在使用淋浴系統時,不是只能被動的接受30秒淋浴而是可以自主延長、授權動物能夠隨時終止訓練、自主決定接受訓練的時機。
    But,這個權力並非無限上綱的,不能讓動物覺得只要鬧脾氣就能心想事成、為所欲為,像是不能因為動物挑食就把具有重要營養價值的品項替換為高糖分的精緻食物、也不能因為海獺寶寶一下水就發飆就不教導牠游泳。

    • Experience Variety: 獲得多樣化的體驗、屏除同質化與單調
    比如提供企鵝有多種波浪模式的造浪系統、建立可交替使用的豐富化項目庫、進行混養並藉由不同物種的交互關係持續提供新鮮刺激。
    But,重點是豐富化的物品不是放進去就算了,否則再怎麼多樣、新奇的東西也很快就會被動物棄之如敝屣;同時也要記得評估不同物品的效用(不過效用不該單憑顯著度來評斷),提供後續參考。

    • Engage Complexity: 獲得接觸複雜體驗的機會
    比如提供靈長類、海洋哺乳類符合物種特性的設施甚至認知圖(Cognitive Map)來解決複雜任務的機會、讓具社會性的物種能生活在成員多樣且功能健全的群體中。
    But,難度同樣需要循序漸進,否則隨之而來的挫折感將帶給動物負面的福利體驗;也要注意任務的設計必須量身打造,因為不同物種體驗這個世界的方式不同,自然會發展出不同的追求。
    -----------------------------------------------------------------------------
    最後,如果有動物園的相關人士看到這邊,我想說,有改善的心是好的,但需要搞清楚方向、接納新知,同時認識到改變需要時間,就現狀而言台灣的動物園不可能一步到位,但努力並不會白費。「自尊心不該比動物重要」,豐富化的重點不是自不自然、美不美觀,有用、能用才是重點,現場人員跟遊客,所有用心感覺過的人都能看得出來,面對特定人士非理性的質疑,動物園該做的不是妥協而是提供正確觀念,共勉之。

  • embedding 在 JSK-koubou Youtube 的精選貼文

    2020-03-29 20:12:37

    Hello

    I made “Bench Grinder Tool Sharpening Jig”.
    This jig was made for the purpose of tailoring Japanese plane blades, but it can be used as a sharpening jig for various tools.

    Click here for this workbench and router sled plan
    https://jisaku-koubou.com/downloads/bench-grinder-jig
    【Plan List】
    https://jsk-koubou.stores.jp/


    Angle can be adjusted from 0 ° to 50 °.
    Can be used for cutting edges of 20 ° or less due to the round whetstone
    The jig can be easily attached and detached by embedding the aluminum frame into the grinder installation table.

    【JIG】
    Circular Saw Slide Guide
    https://youtu.be/M1xYKw5FP-0
    Drill Press( Drill Guide )
    https://youtu.be/n-neSE8mwDg
    Belt sander
    https://youtu.be/KaojkUzeEJU
    Workbench
    https://youtu.be/cpnR1txnPGM

  • embedding 在 Pl penguin lab Youtube 的最佳解答

    2018-04-20 23:17:39

    Kickstarter Page:
    http://www.dragonsdelusion.com

    we are working on an animation kickstarter project “Dragon’s Delusion”, which is a sci-fi animated feature in collaboration with some of the best animators in Hong Kong. The team was inspired by the Warring States period in ancient China, and reinvents the story by embedding modern tokens into the scenes, which takes the audience to a familiar yet unknown world in search of soul, identity and destiny.
    We have launched a crowdfunding campaign for the production of a full-length animated film. Please enjoy the new pilot and support us on Kickstarter. We really want to reach more people in the world, It would be great if you can help us share the news :)

    This is not just an animation, this is also an untold secret of our soul!