[爆卦]中文摘要生成是什麼?優點缺點精華區懶人包

雖然這篇中文摘要生成鄉民發文沒有被收入到精華區:在中文摘要生成這個話題中,我們另外找到其它相關的精選爆讚文章

在 中文摘要生成產品中有9篇Facebook貼文,粉絲數超過0的網紅,也在其Facebook貼文中提到, 四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人! 本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。 不同的是,不是大公司、不是超大模型…… 一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。 CLUE榜單近年來由巨頭——騰訊...

  • 中文摘要生成 在 Facebook 的最讚貼文

    2021-07-15 07:26:06
    有 629 人按讚

    四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!

    本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。

    不同的是,不是大公司、不是超大模型……

    一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。

    CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。

    瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。

    這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。

    ▎輕量化模型孟子?

    孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。

    包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。

    可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。

    孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。

    但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。

    CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。

    該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。

    騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。

    而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。

    因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。

    萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。

    因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。

    孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。

    相對已有的中文語言模型,孟子模型實現了多項突破性進展:
     1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
     2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
     3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。

    當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。

    ▎原理方法和應用?

    在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。

    具體有四方面:
     1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
     2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
     3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
     4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。

    基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。

    另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?

    瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:

     1) 數據增強:使用領域相關數據;
     2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
     3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
     4) 訓練優化:使用多種訓練目標,多角度提升模型能力;

    而且孟子還已經展開了垂直化領域應用。

    基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:

     1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
     2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。

    瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。

    並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。

    ▎瀾舟團隊?

    最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。

    瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。

    AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。

    周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
    而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。

    據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。

    值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。

    引用創新工場董事長兼CEO李開復最新分享來說:

    AI的發展可以按照兩個時間點劃分。

    第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。

    而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。

    「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。

  • 中文摘要生成 在 軟體開發學習資訊分享 Facebook 的最佳貼文

    2020-07-06 09:21:59
    有 2 人按讚

    今天的開源報報內容摘要

    ✅ 前端工程師面試問題集錦
    ✅ 使用 SQL 查詢 git 儲存庫
    ✅ Stack Overflow 的終端機介面
    ✅ 在瀏覽器中使用截圖建立漂亮的原型
    ✅ 簡單而又極簡的伺服器儀表盤
    ✅ 基於Gin + Vue + Element UI的前後端分離許可權管理系統鷹架
    ✅ 適用於前端/全端開發人員的Node.js無服務器框架
    ✅ 用於 PostgreSQL 的有害負載生成器
    ✅ 一種將映像檔從一個容器 registry 同步到另一個容器的工具
    ✅ OpenLDAP Docker 映像檔
    ✅ 用於 Flutter 應用程式的 Firebase 外掛集合
    ✅ 使用 C# 和 XAML 開發行動、桌面和 WebAssembly 應用程式
    ✅ 一個 Electron 開發樣板,包括 TypeScript,React,Jest 和 ESLint
    ✅ 使用 Python 建立電影鋼鐵人中的人工智慧助手(JARVIS)
    ✅ 在後端完全構建為 JSON 檔案的資料庫軟體
    ✅ 支援包括中文、日文、韓文和泰文在內的40多種語言的即用 OCR
    ✅ 針對雲端,AI和區塊鏈應用程式的高效能,可擴展且經過硬體最佳化的WebAssembly 虛擬機器

    https://softnshare.com/opensource-news-161/

  • 中文摘要生成 在 國家衛生研究院-論壇 Facebook 的最佳貼文

    2020-06-02 17:30:00
    有 14 人按讚

    ➥本文是法國聖特拉斯堡大學醫院(Hôpitaux Universitaires de Strasbourg Strasbourg)的醫師報告一位感染Covid-19的病人被診斷出發生免疫性血小板減少紫斑症(Immune thrombocytopenic purpura,ITP)的病程。


    一位65歲的婦女,本身有高血壓以及自體免疫甲狀腺低能症(Autoimmune hypothyroidism),至急診就醫的4天前開始出現倦怠、發燒、乾咳和腹部不適等症狀。在體溫正常的情況下,病人的呼吸速度每分鐘28次,血氧飽和度為89%,理學檢查發現肺部兩側呼吸音減弱並在基底部有痰音(reales),腹部檢查正常。


    實驗室檢查顯示白血球數、血紅素(14.2 gm/dl)、血小板數(183,000/uL)均正常;C反應蛋白值升高至55 mg/L,肝功能測試顯示膽汁淤積(cholestasis); 以口咽拭子檢測Covid-19呈陽性;胸部電腦斷層掃描顯示肺部有毛玻璃樣變化。


    患者住院後開始接受靜脈注射抗生素(amoxicillin–clavulanic acid)、低分子量肝素(low-molecular weight heparin)和氧氣的治療。但在住院後第4天,病患下肢出現紫斑(圖1)及流鼻血等症狀。血液檢查發現只有血小板數減少(66,000/uL),因此停用肝素和抗生素。在第5天,血小板數下降為16,000 /uL,第7天的血小板數持續降至8000 /uL。


    其他的檢查包括:PT及APTT均正常,纖維蛋白原(fibrinogen)為5 g/L(正常範圍2至4 g/L),週邊血液抹片檢查顯示紅血球碎片(schistocytes)不到1%;甲狀腺過氧化物酶抗體(thyroid peroxidase antibodies)升高至245 U/ml(正常值<35 U/ml);此外並未檢測到抗血小板抗體或抗核抗體。


    病患因此開始接受免疫球蛋白治療。48小時後,血小板數降至1,000 /uL,而且紫斑的範圍擴大,所以醫師又再給予第二次的免疫球蛋白治療。


    骨髓檢查顯示細胞數正常,而血小板的前身細胞(即巨核母細胞,megakaryocytes)數目增加,其他的erythroblast 和granulocyte 細胞皆正常,也沒有血球吞噬的情形。


    住院後第9天病患出現頭痛症狀,電腦斷層檢查發現腦部有輕微蜘蛛網膜下出血(subarachnoid hemorrhage)。當日的血小板數為2000 /uL,因此病患開始接受類固醇及促血小板生成劑 eltrombopag的治療。


    住院後第10天,病患頭痛症狀減輕,血小板數上升至10,000 /uL,其他的檢查數值都正常。第13天血小板數恢復至139,000 /uL,同時紫斑也消失。


    作者認為,Covid-19可能是導致該病患發生免疫性血小板減少紫斑症的原因之一,提醒醫師對此類與Covid-19相關的併發症需要保持警惕。


    ■ 🔔 【譯者補充】
    1. 病毒感染可能是誘發免疫性血小板減少紫斑症的原因,常見的感染包括:巨細胞病毒(cytomegalovirus)、Epstein-Barr病毒、麻疹(measles)、德國麻疹(rubella)、水痘(chickenpox)、黴漿菌(mycoplasma)等。其他在成人如:HIV、C型肝炎病毒(HCV)也常是造成繼發性ITP的原因。


    2. 幾篇針對Covid-19的病例報告分析發現,有許多重症及死亡的病例會出現凝血功能異常及泛發性血管內血液凝固症(Disseminated Intravascular Coagulation,DIC)的情況。患者血氧值下降也被懷疑是因為肺部微血管阻塞,造成換氣-灌流異常而導致。此外,病患或因需要長時間臥床,或是本身長期服用賀爾蒙治療,都可能增加靜脈栓塞(venous thromboembolism, VTE)的風險。因此,某些醫院會對Covid-19病患使用抗凝劑治療。少數幾篇病例報告也顯示,對Covid-19重症病患給予抗凝劑(肝素)治療,可以改善血氧濃度及整體的臨床表現。本文中醫師也曾在一開始為病患注射低分子量肝素。(「財團法人國家衛生研究院」齊嘉鈺醫師 摘要整理 ➥http://forum.nhri.org.tw/covid19/virus/j868/ )


    📋 Immune Thrombocytopenic Purpura in a Patient with Covid-19 (2020/04/30)+中文摘要轉譯
    ■ Author:
    Abrar-Ahmad Zulfiqar, Noël Lorenzo-Villalba, Patrick Hassler, et al.
    ■ Link:
    (The New England Journal of Medicine) https://www.nejm.org/doi/full/10.1056/NEJMc2010472


    🔔豐富的學術文獻資料都在【Covid-19 新冠肺炎資源網】
    http://forum.nhri.org.tw/covid19/


    #2019COVID19Academic
    衛生福利部
    疾病管制署 - 1922防疫達人
    疾病管制署
    國家衛生研究院-論壇

你可能也想看看

搜尋相關網站