《#驅魔禁區》時代在演變,神父同樣也要進化 (7.8/10)
#主頁部落格有圖文好讀版 @looryfilmnotes
《驅魔禁區》是一部科幻恐怖電影,由尼爾布洛姆坎普執導,演員卡莉波普、克里斯威廉馬丁主演,劇情講述年輕女子卡莉突然收到獄中母親陷入昏迷的通知,面對兩人過往的矛盾,卡莉依然決定前往...
《#驅魔禁區》時代在演變,神父同樣也要進化 (7.8/10)
#主頁部落格有圖文好讀版 @looryfilmnotes
《驅魔禁區》是一部科幻恐怖電影,由尼爾布洛姆坎普執導,演員卡莉波普、克里斯威廉馬丁主演,劇情講述年輕女子卡莉突然收到獄中母親陷入昏迷的通知,面對兩人過往的矛盾,卡莉依然決定前往探訪,沒想到卻意外接觸到一股不知名的超自然力量,喚醒懷抱著惡意的邪靈,揭露母女數十年來感情裂痕的恐怖根源。
南非出生的導演尼爾布洛姆坎普打從 2009 年首部長片《第九禁區》以來便以電影的獨特題材聞名,不管是《極樂世界》或《成人世界》,都成功打造出一個能讓觀眾瞬間產生高度興趣的科幻世界觀。而這次《驅魔禁區》同樣也是如此,作為他在疫情期間低調拍攝的最新作品,首次在片中加入了恐怖驚悚元素,究竟導演葫蘆是裡賣什麼藥?也引發廣大影迷們的好奇。
在《驅魔禁區》電影開場,我們能看到女主角卡莉正身處一個可怕的夢境。背景中能聽見卡莉的母親正在向她求救,然而當她循著聲音進到一棟建築物裡面時,卻發現原本還楚楚可憐的母親,突然以憤怒且詭異的神情朝著卡莉站的地面扔下一個點燃的打火機,瞬間在房間引發一場大火,讓卡莉隨即驚醒。為什麼她會做這樣的夢?《驅魔禁區》在對後續故事做出鋪陳的同時,也在觀眾心中埋下許多疑問。
隨著劇情的進展,觀眾也開始發現《驅魔禁區》女主角卡莉雖然有著一位名叫珊的好閨蜜,但受到母親曾經對她造成的創傷,其實這些年生活過得並不順遂。而這樣的狀態,直到卡莉接到許久不見的兒時玩伴馬丁的通知,得知她早已斷絕關係且正在獄中服刑的母親的近況,才讓《驅魔禁區》故事有了明確的發展方向。
因為多次自殘而昏迷的母親安琪拉,被某間藥廠選入參與一場醫學實驗,據他們表示這種「閉鎖症候群」是相當特殊的情況,雖然母親的身體無法動彈也不能自主呼吸,但大腦卻依然十分清醒也活動得相當劇烈,因此為了減緩病患的痛苦,《驅魔禁區》的藥廠開發出了一種能讓女主角卡莉進入母親大腦的的尖端科技,希望通過跟她進行溝通來找出治療病症的辦法。
你可以把這當作是一種不用戴 VR 眼鏡,而是有如《全面啟動》或柯南電影《貝克街亡靈》那樣直接把意識上傳到虛擬實境的技術。只不過《驅魔禁區》呈現這個由電腦建構出來的「擬真世界」的方式相當有意思,不僅畫面有著濃厚的電腦動畫風格、角色的 3D 建模偶爾會失真,周圍的背景與地面圖層也會隨著角色的走動逐步刷新。然而在這個充滿實驗性的概念背後,導演又想要講述一段怎樣的故事?
看著《驅魔禁區》女主角卡莉跟母親在她腦內擬真世界的首次接觸,觀眾除了能清楚感受到卡莉對於母親即便經過 20 年仍然無法消除的恨意之外,也能夠隱約察覺不對卡莉發洩情緒的惡毒言語做出任何反駁,只要她趕快離開的母親似乎有些苦衷。這種希望保護女兒、不想讓她涉入其中,但卻又無法把真相說出口的狀態,都讓觀眾在觀影過程中對她們曾經發生的事情更加感到好奇。
《驅魔禁區》故事時間點回到 20 年前,作為護理師的母親在一所神秘的療養院受傷後便性情大變,不僅放火燒了自己工作的安養院,還在教會的食物中下毒,最終導致數十人因此死亡,而作為女兒的卡莉也成為全鎮撻伐的對象。只不過就算知曉兩人的恩怨情仇,但卡莉在擬真世界看見的怪物與母親多次提及的那個「它」才是《驅魔禁區》人們必須面對的難題。
雖然卡莉受到惡靈糾纏而看見許多幻像,為《驅魔禁區》帶來許多恐怖驚悚的效果,但這部電影最有趣的地方,還是在於片中角色如何處理應對的方式。神父拿十字架對抗魔鬼我們都有看過,但以電腦的擬真世界來確認惡靈的真面目這可就稀奇了吧?時代在演變,神父同樣也要進化,不再只是用聖經、聖水和咒語來驅魔,更要試著運用科技、槍枝等武器。
只不過百密總有一疏,做了再多準備還是有可能會面臨失敗,因此《驅魔禁區》在有著如此創新的題材之下,最終還是必須讓因為得知真相而消除對母親怨恨與心結矛盾的女主角卡莉,試著用「老方法」來消滅造成這一切慘劇的惡魔,拯救母親、朋友和自己的性命來為整段故事做出收尾,雖然不禁讓人感到有些可惜,但也不影響《驅魔禁區》這部電影的主題。
一直以來,導演尼爾布洛姆坎普作品都有著特定的內部意涵,首部長片《第九禁區》藉由外星人降臨地球卻遭人類歧視排擠的情況,影射南非過往的種族隔離政策,第二部《極樂世界》講的是貧富差距和階層對立引發的矛盾衝突,《成人世界》則是對每個人的生命意義,以及人工智慧可能帶來的衝擊進行探討,而《驅魔禁區》儘管表面看起來沒有明確的核心,但實際上卻也跟《厲陰宅3:是惡魔逼我的》有著異曲同工之妙。
如果一個人被惡靈附身而犯下罪刑,那他應該要受到法律的懲罰?而另一方面,我們又該如何去知道犯人有沒有被惡靈給附身?《驅魔禁區》以能夠模擬大腦內部畫面的技術對卡莉母親進行測試,我想正是希望以客觀的角度去檢視和探討這項難題,並將其延伸到同樣也會讓人們行為出現異常的精神疾病之上,引發觀眾對於精神病患犯罪如何定罪這項議題的重視。
整體而言,《驅魔禁區》題材內容確實相當有趣,儘管不像是《第九禁區》那樣無懈可擊,但在導演獨具匠心的創意巧思之下,全片在講好一段恐怖故事的同時,也加入能夠引發觀眾興趣的科幻元素,不僅成功賦予《驅魔禁區》全新的樣貌,也為未來的恐怖電影開啟另一個能夠嘗試的方向,相信都足以讓觀眾看得滿意。
如何成為建模師 在 大詩人的寂寞投資筆記 Facebook 的最佳解答
「這裡是吳軍的《硅谷來信》第3季。這封信和你介紹一本書,中文名叫《成長的邊界》,作者是大衛·愛潑斯坦。這本書的英文名非常簡潔,就是一個單詞「Range」,我把它翻譯成「廣度」,後面我們也用《廣度》來稱呼這本書。
你可能知道有一本非常著名的書《異類》,分析成功者為什麼能夠成功。我們之前的來信里也提到過這本書。而這封信要和你介紹的《廣度》,恰恰提出了和《異類》針鋒相對的觀點。
簡單來說,《異類》提出了著名的「一萬小時定律」,強調「刻意練習」、成為專才的重要性;而《廣度》這本書就如它的標題所言,更強調「廣度」在成長和發展中起到的作用。接下來我們就分析一下這兩本書的觀點,談一談廣度和深度的問題。
愛潑斯坦為什麼反對「深度」?
先簡單介紹一下《異類》和《廣度》兩本書各自的主要觀點。《異類》一書中有三個非常鮮明的觀點,《廣度》主要針對前兩個,我們就重點談兩本書有交集的地方。
先來看《異類》的第一個觀點,就是大環境和起步的時間很重要。你生對了時代,就有更大的概率成功;甚至你生對了月份,一開始比同年級同學大了幾個月,容易成為孩子王,後來就更有可能成為領袖。《異類》的第二個觀點,就是著名的一萬小時定律,講什麼事情要做好,需要有一萬小時的練習。
針對這兩個觀點,《廣度》這本書又是怎麼說的呢?
《廣度》的第一個觀點,就是認為早期優勢或者說早期的刻苦練習對於長期發展來講幫助不大。《廣度》的第二個觀點,就是它的副標題,講在這個專業化的世界中,通才更能夠取勝。
簡而言之,《異類》強調起跑線上的優勢,一開始佔優,後面就越發展越好;而且強調人要投入大量練習,成為專業化的人才。《廣度》則認為,早期優勢沒有那麼大的作用,比起專業化,現在的世界更需要的是通才。
《異類》的觀點你應該很熟悉了,也是現在社會的一種主流觀點。這封信我們介紹《廣度》,就稍微展開看一下《廣度》的作者愛潑斯坦是怎麼論述他的意見的。愛潑斯坦從四個角度論述了自己的觀點。
首先,愛潑斯坦把世界上的事情分為兩類。第一類是規則明確的事情,比如學鋼琴、打高爾夫球、做銷售、編程序,成功的標準非常清晰。在這些事情上,一萬小時定律是成立的。
但是還有第二類事,就是大量規則不明確的事情,比如創業。我在之前的信中講過,成為億萬富翁比登上珠峰更難,因為後者目標清晰,訓練方式固定,而前者沒有可以遵循的通用標準。愛潑斯坦認為,對於這樣的事,就算投入大量時間練會了一個單一技能,意義也不大。愛潑斯坦還特別提醒,要警惕那種「因為自己手裡有了一個錘子,因此看什麼都是釘子」的思維方式。
其次,愛潑斯坦講專業人士的判斷未必就更可靠。有的專業人士過於相信自己的訓練和固有的方法,結果有時候表現甚至不如普通人。這樣的例子我們見過很多,比如對股票的預測,對選舉結果的預測等等。
愛潑斯坦還舉了一個很特殊的例子。他說一項研究發現,每年心臟病專家聚集起來開年會的時間段內,心臟病患者死亡率反而會降低。這項研究推測,可能是因為心臟病專家忙於開會,沒時間做手術,而手術本身有風險,因此手術總量減少帶來了患者死亡數量的減少。換句話說,有些患者不做手術可能還能活過這段時間,結果因為做手術反而喪命了。這個統計結果提示,專家的判斷也有可能是不準確的。
第三,愛潑斯坦認為,方向比毅力更重要。愛潑斯坦也承認毅力是個好東西,但一味堅持、永不言退,甚至一條道走到黑,卻未必是美德。
愛潑斯坦講,世界上成功的道路千千萬,你怎麼知道自己選的路就是對的呢?如果走在錯誤的道路上,那越有毅力可能越糟糕。
《廣度》這本書講了許多改變人生道路而成功的名人故事。其中我印象比較深的是梵高。梵高年輕時做過牧師、傳教士、店員、藝術品交易員,對每份工作梵高都做得很認真,但就是做不出成績。直到接近三十歲,梵高才開始學習繪畫,並且迷上繪畫藝術。我們知道,最終他是作為畫家而流芳百世的。
最後,愛潑斯坦還舉出了很多實際案例,說明很多成功人士不是只懂某個領域的專才,而是廣泛涉獵的通才。這樣的例子你肯定也能想到不少,我就不一一列舉了。
總之,通過上述分析,愛潑斯坦提出結論:面對複雜問題、特別是沒有明確衡量標準的問題時,廣度比深度更有用。人要懂得放棄和退讓,不要一根筋只知道往前走。後退一步看似多花了時間,但可能因為找到了正確的道路,反而省了時間。每一次拓寬人生道路的嘗試,只要處理得好,都會成為人生的閱歷,並不白走。愛潑斯坦舉了喬布斯的例子,講喬布斯當年旁聽的一門書法課,後來對他設計麥金托什電腦和其他產品發揮了作用,因為喬布斯對藝術的感悟在很大程度上來自於這門課。
要廣度還是要深度?
介紹完愛潑斯坦的觀點,問題來了:我們該信誰的呢?是《異類》作者格拉德威爾說的刻意練習、成為專才,還是愛潑斯坦說的多加嘗試、追求廣度?兩位作者都舉出了很多現實案例支持自己的觀點。當然可能你也會覺得,兩人的觀點並不完全矛盾,也可以並行不悖。
但我們在生活中要面對的問題往往更加實際。比如你剛下班,接下來有一個小時的自由時間,你到底應該做什麼?對此我們必須有一個選擇,因為做了這件事就不能做另一件。如何選擇呢?其實還是要回到理性的分析上來,而不是聽信任何現成的答案。
我常常講如果你不知道做什麼,就想一想你要成為什麼樣的人。我們不妨按廣度和深度兩個維度,把人分為四類。
第一類人,既沒有廣度,也沒有深度,這自然不是我們的目標。
第二類人,既有廣度,又有深度。這種人通常是天才,比如達芬奇、牛頓、愛迪生、喬布斯,還有用數學建模來進行投資的文藝復興公司創始人詹姆斯·西蒙斯等等。不過,這類人的數量在世界上可能連萬分之一、甚至百萬分之一都不到。我們雖然能講出不少這樣的名字,但這是因為他們站在聚光燈下,吸引了人們的目光。如果你在現實生活中看看身邊,這樣的人可能一個也找不到。當然,如果把要求放低一點,只說有一定深度和廣度的人,可能還是能找到一些的。
再看第三類人,有深度,沒有廣度。這種人我們身邊應該有不少,或許我們自己就屬於這一類。
第四類和第三類反過來,有廣度,沒有深度,這樣的人也比較多。
簡單分析一下:第一類人我們不用考慮;第二類人雖然你我都很嚮往,但很難成為這樣的人;那麼我們主要考慮的,就是在第三類和第四類中選擇。
接下來的問題就是,結合你自己的情況,要成為第三類或第四類,哪一種對你比較容易?此外,第三類和第四類人,在生活中哪一種相對更受歡迎、更容易成功?根據我自己的觀察,答案是第三類,也就是比起有廣度沒深度的人,還是有深度、但廣度有所欠缺的人更容易成功一些。
那麼,這是不是意味著我完全不贊成愛潑斯坦的看法呢?並非如此。我專門和你分享這本書,正是因為雖然愛潑斯坦和我的觀點不完全一致,但仍然給了我很有益的啓發和提醒。他提醒我們,做事不要死鑽牛角尖,要注意看方向,要找到適合自己的事情,要嘗試各種新東西。實際上,愛潑斯坦講的「廣度」也不是蜻蜓點水、多而不精,他也談到了在保持一顆開放心靈的同時,我們也要選擇某個領域往深里走。
怎麼讀書才能為我所用?
最後,借著《廣度》這本書,再和你談一下讀書這件事。我們在閱讀他人想法和接受他人經驗的時候,有一個很容易進入的誤區,就是當那些想法和經驗特別符合我們的胃口,我們就會非常順暢、甚至不假思索地接受它們。
有的人讀了《異類》這本書,聽到了一萬小時定律,覺得很有道理,然後就為自己簡單低水平的重復工作找到了理由;被其他人問起來,就抬出一萬小時定律當藉口。同樣的道理,有的人讀了《廣度》這本書,就為自己不能在一條路上深入找到了藉口,說自己是要成為通才。很多人說是讀書,只是不斷為自己找藉口而已。
實際上我們讀書的時候,對於作者的觀點,既不應該輕易接受,也不應當直接拒絕。不同視角、不同觀點的書,往往能給我們有益的啓發。
比如有人覺得一萬小時定律很有道理,但自己試了好像不靈,就不知所措了。這時你讀到《廣度》這本書,就會發現一萬小時定律要成立,還需要其他條件,比如只有對於可以清楚衡量、可以明確追蹤進步的目標,一萬小時定律才有效。這樣一來,兩本書中看似不同的觀點就起到了相互補充的作用。這就是為什麼我們要多讀書,而且要讀不同的書。
一本好書,不在於它的觀點都符合你的心意,而在於它能夠提供可靠的信息和視角,啓發你的思考。因此,即使我不完全贊同《廣度》的觀點,這本書仍然值得一讀。
小結
如果你自己讀這本書,也要記住我們讀它的目的是接受它的啓發,而不是聽了那些遙遠的故事就放棄努力。其實對於大多數人來說,比起廣度,更欠缺的還是毅力。成為通才並沒有錯,但更多人只是把「成為通才」當成了半途而廢的藉口。
當然,對於格拉德威爾和愛潑斯坦的觀點是如此,對於我的觀點,也是如此。我的結論應當是啓發你思考的材料,而不應該直接成為你的結論。瞭解了這兩本書,你更應當運用自己的理性去思考和審視,找到適合你自己的進步道路。」
如何成為建模師 在 財經主播/主持人 朱楚文 Facebook 的精選貼文
#讀書心得 #好書分享 #AI未來賽局
■【科技觀察:輝達黃仁勳驚世騙局的背後思考:關於AI二三事】
📍好讀網誌版:https://reurl.cc/xGR5Y1
AI到底能栩栩如生到什麼程度?
最近科技圈一大話題,應該就是 #Nvidia輝達創辦人黃仁勳的驚世騙局!事隔四個月,黃仁勳突然說,輝達GTC大會上演講的那一位,不是自己,而是 #AI虛擬影像!
媽呀,左看看右看看,真的看不出什麼破綻,這四個月沒人發現原來搞半天講話的人是假的,是AI分身,驚悚指數百分百!
話說為了要讓AI虛擬分身不會被識破,輝達也是煞費苦心,先幫黃仁勳拍了數千張照片,
甚至連背後的場景也製作了將近8000個3D物件,動用了34位3D設計師和15位軟體工程師才完成這場驚世騙局,讓數位老黃在演講時能有正確唇形而且在各種角度光線下都毫無破綻。
其實AI虛擬分身這樣在電影中才會看到的橋段,已經越來越可能成為我們的平凡日常,繼韓國去年底誕生首位AI主播之後,中國最近也有一位虛擬KOL「翎Ling」人氣超夯,
不僅特斯拉、時尚雜誌Vogue都搶著和他合作,目前微博粉絲人數在短短經營一年多已經有15萬人,比不少真人KOL還高!(真令人傷感…我…我檢討XD)
虛擬偶像的誕生,或許跟Z世代從出生就活在數位網路世界中有關,對他們來說,這或許就跟動漫人物差不多,有趣最重要!
不過真人透過AI變成虛擬分身這件事情,我覺得就比較值得三思考量,雖然技術大突破很令人開心,不過未來當任何人都可能被建模做出AI分身,
以後眼見為憑這句話可能不再可行,對我們一般人來說,要如何能辦別本尊而不受騙真的蠻不容易的。
試想,如果今天不肖人士盜用美國總統拜登肖像做成AI虛擬分身,對外散布錯誤的政策消息,例如要跟中國開戰(?),或是突然辭職(?)這種足以撼動國際政治和金融市場的假消息,將會造成多大的災難?
更不用說現在詐騙猖獗,不少KOL受害遭盜照片去推銷不實產品或投資,未來不只盜照片加群組,而是一個活生生假的你,在影片中說著可怕的錯誤的話,這想到就令人毛骨悚然(影片要怎麼辨真假怎麼澄清?)
這也是為何隨著AI技術進步,反而出現許多討論是否應該進行管制的聲浪,前一陣子看了一本書《AI未來賽局》,這本書是美國知名定量未來學家、史登商學院策略遠見教授Amy Webb(艾美‧韋伯)所寫,
他在2006年創辦未來今日機構(Future Today Institude),研究側重人工智慧、新興科技、數位媒體、以及科技帶來的影響和契機,對未來的預測被紐約時報、CNN等國際知名媒體特別報導,這本書也入選2019年金融時報與麥肯錫最佳商業書。
他在這本書寫得最精彩之處,就是對於AI的未來分別寫了三種預測情境:#樂觀、#務實、#災難,其中樂觀務實就不多說了,畢竟我們都知道AI能帶來的商業效益和生活便利性,但災難呢?
他寫得非常令人驚嚇,他認為當AI被不當人士作不當運用時,很可能成為控制人類的工具,甚至終結自由多元主義思考,讓專制極權成為主流,而人類難以掙脫。
也因此,他提出兩項警告,大聲呼籲 #AI應該是公共財,該由政府建立管制,而非各個私營企業各自發展作為生財工具,
另外他也特別強調目前AI發展正迅速把力量集中在少數人手中,未來強者越強,弱者越弱,而我們普羅大眾,無庸置疑,將會是弱者那一方。
他悲觀預測的論點會不會實現?這或許還有很多爭議空間,又或者我們也不該因噎廢食,從此對於AI抱持恐懼,這都不健康;
不過他所提出的擔憂與觀點,對照著AI如今已經可以以虛亂真,到底我們的社會,或者政府是不是應該更正視這樣的問題和超前佈署,又或者說,我們所有人,是不是應該先有這樣的心理準備,仍是很重要的。
科技總是跑在法律與社會制度之前,這也是科技能推動進步的力量,只是這股力量如果被不好的放大,對人類來說也可能是種災難,人類如何善用科技,而非被科技玩弄,真的是我們從古至今的課題啊。
如何成為建模師 在 Facebook 的最佳解答
四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。