【凱鈞的專家會客室】無聲世界裡的動人音符
當前持續處於新冠肺炎警戒時期,每日鎖定疫情指揮中心記者會,已成為多數民眾掌握疫情發展之即時方案,隨轉播畫面同時可見專業手語老師,同步進行即席翻譯。進而讓大家關注到,傳遞訊息時需細心透過多元管道與方式,才得以使所有觀者都能清楚接收正確的資訊,如此才能真正達到...
【凱鈞的專家會客室】無聲世界裡的動人音符
當前持續處於新冠肺炎警戒時期,每日鎖定疫情指揮中心記者會,已成為多數民眾掌握疫情發展之即時方案,隨轉播畫面同時可見專業手語老師,同步進行即席翻譯。進而讓大家關注到,傳遞訊息時需細心透過多元管道與方式,才得以使所有觀者都能清楚接收正確的資訊,如此才能真正達到「溝通」與「發佈」資訊之目的
此次特邀專業手語翻譯員 蕭匡宇老師,以身為疫情指揮中心記者會之御用手語翻譯員之視角,與我們分享「手語」的意義與重要性,及其學習的管道與方向建議,秉持著謹慎與尊重的態度,透過表情與手勢建立起雙向溝通橋樑,該語言看似靜默,但當下無聲更勝有聲!
🔸手語翻譯員 蕭匡宇
現任新北市手語翻譯暨聽打服務方案督導,並為中央流行疫情指揮中心手語翻譯員,及曾任政府單位手語翻譯員培訓班講師。具備手語翻譯證照資格,以機智沈著與精準到位的手語展現專業服務,經驗豐沛且言簡意賅,因而廣受各大活動青睞與信任
📌Q1.請問是在何種契機下牽起學習手語的緣分?
大學時,同學邀我參加手語社的活動,還記得當時在社團學了首「我的思念」的手語歌,它是首民歌。竟才發現歌詞原來可透過表情、手勢、動作與感受,演繹出動人的樂曲,整個人被深深吸引著,更對手語產生了興趣!加上王興嬙老師的課程既有趣又生動,於是立刻被圈粉成為了社團一員,王老師也成為我的手語啟蒙者
📌Q2從學習至成為專業手語翻譯老師,歷經了多長時間磨練?是否曾遇上瓶頸?
手語和學習其他語言一樣,都需持之以恆,且學無止境。每一個階段實際會遇到的困難截然不同,初學時基本就是從大量吸收手語單字開始,每個單字所代表的意涵,再加上手語必要的「表情」元素,對於長期倚賴口語配合聽覺溝通的我們,要改以臉部表情與手勢並用來傳達情感,且需真切揣摩與展現,這部分實為不易
📌Q3.於中央流行疫情指揮中心記者會上擔任手語翻譯時,為清楚表達語法而無法配戴口罩,這讓許多民眾擔心安危。在工作時,老師有何自保的防疫方法?
藉此順勢也與敬愛的讀者們說明,台灣聾人聯盟與全台22個聾人團體已發表聯合聲明,「由於手語是視覺語言,手語翻譯員的臉部表情,就如同口語的語氣或聲調,若臉部被遮蔽,將可能導致聾人無法讀取完整訊息。」專業手譯員於工作前,都進行謹慎風險評估,疫情記者會場地皆執行完善清消,所有參與人員皆配戴口罩,並維持社交距離,設有透明隔板等措施,手譯員經評估為安全清況後,才能拿下口罩執行翻譯工作
📌Q4.手語是聾人/聽障人士與外界溝通的重要管道,其傳達的方式,是透過單字串接成一段話,又或是採何種元素或邏輯進行完整的語義表達?
手語包含了手型、手勢(如同注音符號或是字母的概念)、表情(如同說話時的語氣,疑問、肯定、否定、喜、怒、哀、樂)、動作(意指力道的強弱、程度、重複性)、位置、方向等元素。而手語有其文法,與中文的語法邏輯不同,手語屬於相當視覺化的語種。像是表達「我寄信給大家」,在手語的呈現是將「寄信」這個手語,從自己往各方向重複比出去,而非逐字比出「我/寄/信/給/大/家」
📌Q5.全球語種多元,請問手語是採國際通用語法,又或各地皆有不同的傳達系統呢?不同地區的手語是否可直接進行溝通交流?
這可是手語疑難中的大哉問!其詞彙的形成,主要受在地文化、習俗及生活習慣所影響。由於各地種族文化及生活習慣存在差異,所以手語表達方式也各不相同
世界聾人聯盟(WFD)表示國際手語(International Sign)或IS,並不是一個真正的語言,不具備語言的完整特性,是基於不同國家的手語交流時存在溝通困難性,於是創作出來讓具有不同手語背景的聾人在特定國際場合、國際聾人事務活動(例如聽障奧運、世界聾人大會等)中藉以交流溝通的一種方式。其詞彙不多,需更靈活運用手語與動態視覺元素,但方法並不容易。多數時候仍各自使用當地的手語系統為主
📌Q6.若想學習手語,甚至目標成為手譯員,有何管道可進行學習與考核,以及需具備哪些特質?
先看學習目的是什麼,如果是想學手語歌或簡易基礎手語陶冶心性,可於電視、網路的相關應用資源,或社區大學、社團中的相關課程即可接觸;如果想進一步學習手語,可上網搜尋聽障團體、協會的手語班,多會規劃出初、中、高三階課程,由淺入深進行生活應用教學
📌Q7.身為專業手語老師,曾遇上的職業傷害或難忘的經驗?
有次在外地結束課程後,正當回程北上時,卻接到派案中心來電,表示警局有強盜現行犯需做筆錄,希望前去協助翻譯。我也就在疲累的狀態下,即刻重新提起精神前往支援。在進行筆錄翻譯過程中,這位聽障現行犯表示心臟痛不適,隨後警方便安排救護車送醫,經急診檢查果真發現為急性心肌梗塞,需立即進行心導管手術。而因手術過程中需使用X光機的透視導引,身為翻譯員的我,也就這樣穿上無菌衣,又再套上鉛衣跟著進到手術室,眼看這既是嫌犯又是病人的雙手被上銬,在意識清楚下進行手術。最後順利完成手術,當時醫師更表示,通常95%的患者多數容易錯過急救時機,這名嫌犯真是非常幸運!
待一切落幕回到家時,當時醫生的話言猶在耳,要是沒有選擇趕赴現場協助翻譯而是直接回家,那會是什麼結局?而我卻也因此真實參與了一個人的生死交關,每每想到這情境,就讓我久久無法自己,同時也慶幸做了對的決定!
#凱鈞的專家會客室
邏輯板通用 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
為了讓 AI 不斷打怪升級,DeepMind 打造「宇宙」
作者 雷鋒網 | 發布日期 2021 年 07 月 30 日 8:15 |
DeepMind 又給我們小驚喜。我們都知道,強化學習苦於類化能力差,經常只能針對單個任務從頭學習。
DeepMind之前開發的AlphaZero,儘管可以玩圍棋、西洋棋和日本將棋,但每種棋牌遊戲都只能從頭訓練。類化能力差也是AI一直被詬病為人工智障的一大原因。人類智慧的厲害之處,就在藉鑑之前經驗迅速適應新環境。
但類化能力不是一蹴而就,就像玩遊戲,也是先做簡單任務,逐步升級到複雜任務。《空洞騎士》(Hollow Knight)一開始只需要隨意走動揮刀砍怪,但噩夢級難度的「苦痛之路」關,沒有前面累積的技巧,只能玩寂寞。
多任務宇宙
DeepMind此次採用「課程學習」,讓智慧體於不斷擴展升級的開放世界學習。也就是說,AI新任務(訓練資料)是基於舊任務不斷生成。智慧體可盡情鍛鍊自己,簡單的如「靠近紫色立方體」,複雜點的如「靠近紫色立方體或將黃色球體放在紅色地板」,甚至和其他智慧體玩耍,如捉迷藏──「找到對方,且不要被對方發現」。
每個小遊戲存在世界小角落,千千萬萬個小角落拼成龐大的物理模擬世界,如下圖的幾何「地球」。總體來說這個世界的任務由三個要素構成,即任務=遊戲+世界+玩家,並根據三要素關係,決定任務的複雜度。
複雜度的判斷有四個維度:競爭性、平衡性、可選項、探索難度。
比如「搶方塊」遊戲,藍色智慧體需要把黃色方塊放到白色區域,紅色智慧體需要把黃色方塊放到藍色區域。這兩個目標矛盾,因此競爭性較強;同時雙方條件對等,平衡性比較高;因目標簡單,所以可選項少;DeepMind把探索難度評為中上,可能是因定位區域算較複雜的場景。
再如「球球喜歡和方塊一起玩」遊戲,藍色和紅色智慧體有共同目標,讓相同顏色的球體和方塊放在相近位置。
這時競爭性自然很低,平衡性毋庸置疑很高的;可選項比上面遊戲高很多;探索難度沒有定位區域,智慧體隨便把球體和方塊放哪都行,難度就變小了。
基於這四個維度,DeepMind打造超大規模「宇宙」任務空間,幾何「地球」也只是這宇宙的小角落,是四維任務空間的一點。DeepMind將「宇宙」命名為XLand,包含數十億個任務。
來看XLand的全貌,由一系列遊戲組成,每個遊戲在許多模擬世界進行,這些世界的拓樸和特徵平滑變化。
終生學習
數據有了,接下來得找到合適的算法。 DeepMind發現,目標注意代理(GOAT)可學習更通用的策略。
具體來說,智慧體輸入包括第一視角的RGB圖像、本體感覺以及目標。經過初步處理後,生成中間輸出,傳遞給GOAT模組,會根據智慧體目前目標處理中間輸出的特定部分,邏輯分析目標。
邏輯分析是指,每個遊戲可藉由一些方法,構建另一個遊戲,並限制策略的價值函數的最優值上限或下限。
DeepMind提出一個問題:對每個智慧體,什麼樣的任務是最好的?換句話說,打怪升級時,什麼樣的關卡設置才讓玩家順利升級為「真」高手,而不是一刀9999?
DeepMind的答案是,每個新任務都基於舊任務生成,「不會太難,也不會太容易」。其實恰好是讓人類學習時感覺「爽」的興奮點。
訓練開始時,太難或太容易的任務可能會鼓勵早期學習,但會導致訓練後期的學習飽和或停滯。不要求智慧體某任務非常優秀,而是鼓勵終身學習,即不斷適應新任務。所謂太難、太容易是較模糊的描述。需要量化方法,在新任務和舊任務之間彈性連接。
怎麼不讓智慧體做新任務時不適應而「暴死」?進化學習就提供很好的靈活性。總體來說,新任務和舊任務同時進行,且每個任務有多智慧體參與「競爭」。舊任務適應好的智慧體,會選拔到新任務繼續學習。
新任務中,舊任務的優秀智慧體權重、瞬間任務分佈、超參數都會複製,參與新一輪「競爭」。除了舊任務的優秀智慧體,還有很多新人參與,這就引進隨機性、創新性、靈活性,不用擔心「暴死」問題。
當然,因任務不斷生成、動態變化,一個任務可訓練不同長處的智慧體,並往不同方向演化(隨著智慧體相對性能和強健性進行)。最終每個智慧體都會形成擅長任務的集合,就像春秋戰國時期「百家爭鳴」。說打怪升級顯得格局小,簡直是模擬地球。
DeepMind表示,「這種組合學習系統的特性是,不最佳化有界性能指標,而是更新定義的通用能力範圍,這使智慧體開放式學習,僅受環境空間和智慧體的神經網路表達能力的限制。」
智慧初現
最終這複雜「宇宙」升級、進化、分流的智慧體長成了什麼優秀物種?DeepMind說,智慧體有很明顯的零樣本學習能力,比如使用工具、合圍、數數、合作+競爭等。
來看具體例子。首先智慧體學會臨機應變。目標有三個:
黑色金字塔放到黃色球體旁邊
紫色球體放到黃色金字塔旁邊
黑色金字塔放到橙色地板
AI一開始找到一個黑色金字塔,想拿到橙色地板(目標3),但搬運過程瞄見黃色球體,瞬間改變主意,「我可以實現目標1啦」,將黑色金字塔放到黃色球體旁邊。
第二個例子是,不會跳高,怎麼拿到高台上的紫色金字塔?智慧體需要想辦法突破障礙,取得高台上的紫色金字塔,高台周邊並沒有類似階梯、斜坡的路。
因不會跳高,所以智慧體「掀桌子」,把周邊幾塊豎起來的板子弄倒。然後一塊黑色石板剛好倒在高台邊,「等等,這不就是我要的階梯嗎?」這過程是否體現了慧體的智慧,還無法肯定,可能只是一時幸運。關鍵還是,要看統計數據。
經過5代訓練,智慧體在XLand的4千個獨立世界玩了約70萬個獨立遊戲,涉及340萬個獨立任務,最後一代每個智慧體都經歷2千億次訓練步驟。智慧體已能順利參與幾乎每個評估任務,除了少數即使人類也無法完成的任務。
DeepMind的研究,或許一定程度體現「密集學習」重要性。也就是說,不僅資料量要大,任務量也要大。這也使得智慧體在類化能力有很好表現,如資料顯示,只需對一些新複雜任務進行30分鐘集中訓練,智慧體就可快速適應,而從頭開始用強化學習訓練的智慧體根本無法學習這些任務。
往後我們也期待這「宇宙」更複雜和生機勃勃,AI經過不斷演化,不斷給我們帶來驚喜(細思極恐)的體驗。
資料來源:https://technews.tw/2021/07/30/deepmind_xland/
邏輯板通用 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
摩爾定律放緩 靠啥提升AI晶片運算力?
作者 : 黃燁鋒,EE Times China
2021-07-26
對於電子科技革命的即將終結的說法,一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續,也就意味著資訊技術的整棟大樓建造都將出現停滯,那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有的,但這波革命始終也沒有結束。AI技術本質上仍然是第三次科技革命的延續……
人工智慧(AI)的技術發展,被很多人形容為第四次科技革命。前三次科技革命,分別是蒸汽、電氣、資訊技術(電子科技)革命。彷彿這“第四次”有很多種說辭,比如有人說第四次科技革命是生物技術革命,還有人說是量子技術革命。但既然AI也是第四次科技革命之一的候選技術,而且作為資訊技術的組成部分,卻又獨立於資訊技術,即表示它有獨到之處。
電子科技革命的即將終結,一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續,也就意味著資訊技術的整棟大樓建造都將出現停滯,那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有,但這波革命始終也沒有結束。
AI技術本質上仍然是第三次科技革命的延續,它的發展也依託於幾十年來半導體科技的進步。這些年出現了不少專門的AI晶片——而且市場參與者相眾多。當某一個類別的技術發展到出現一種專門的處理器為之服務的程度,那麼這個領域自然就不可小覷,就像當年GPU出現專門為圖形運算服務一樣。
所以AI晶片被形容為CPU、GPU之後的第三大類電腦處理器。AI專用處理器的出現,很大程度上也是因為摩爾定律的發展進入緩慢期:電晶體的尺寸縮減速度,已經無法滿足需求,所以就必須有某種專用架構(DSA)出現,以快速提升晶片效率,也才有了專門的AI晶片。
另一方面,摩爾定律的延緩也成為AI晶片發展的桎梏。在摩爾定律和登納德縮放比例定律(Dennard Scaling)發展的前期,電晶體製程進步為晶片帶來了相當大的助益,那是「happy scaling down」的時代——CPU、GPU都是這個時代受益,不過Dennard Scaling早在45nm時期就失效了。
AI晶片作為第三大類處理器,在這波發展中沒有趕上happy scaling down的好時機。與此同時,AI應用對運算力的需求越來越貪婪。今年WAIC晶片論壇圓桌討論環節,燧原科技創始人暨CEO趙立東說:「現在訓練的GPT-3模型有1750億參數,接近人腦神經元數量,我以為這是最大的模型了,要千張Nvidia的GPU卡才能做。談到AI運算力需求、模型大小的問題,說最大模型超過萬億參數,又是10倍。」
英特爾(Intel)研究院副總裁、中國研究院院長宋繼強說:「前兩年用GPU訓練一個大規模的深度學習模型,其碳排放量相當於5台美式車整個生命週期產生的碳排量。」這也說明了AI運算力需求的貪婪,以及提供運算力的AI晶片不夠高效。
不過作為產業的底層驅動力,半導體製造技術仍源源不斷地為AI發展提供推力。本文將討論WAIC晶片論壇上聽到,針對這個問題的一些前瞻性解決方案——有些已經實現,有些則可能有待時代驗證。
XPU、摩爾定律和異質整合
「電腦產業中的貝爾定律,是說能效每提高1,000倍,就會衍生出一種新的運算形態。」中科院院士劉明在論壇上說,「若每瓦功耗只能支撐1KOPS的運算,當時的這種運算形態是超算;到了智慧型手機時代,能效就提高到每瓦1TOPS;未來的智慧終端我們要達到每瓦1POPS。 這對IC提出了非常高的要求,如果依然沿著CMOS這條路去走,當然可以,但會比較艱辛。」
針對性能和效率提升,除了尺寸微縮,半導體產業比較常見的思路是電晶體結構、晶片結構、材料等方面的最佳化,以及處理架構的革新。
(1)AI晶片本身其實就是對處理器架構的革新,從運算架構的層面來看,針對不同的應用方向造不同架構的處理器是常規,更專用的處理器能促成效率和性能的成倍增長,而不需要依賴於電晶體尺寸的微縮。比如GPU、神經網路處理器(NPU,即AI處理器),乃至更專用的ASIC出現,都是這類思路。
CPU、GPU、NPU、FPGA等不同類型的晶片各司其職,Intel這兩年一直在推行所謂的「XPU」策略就是用不同類型的處理器去做不同的事情,「整合起來各取所需,用組合拳會好過用一種武器去解決所有問題。」宋繼強說。Intel的晶片產品就涵蓋了幾個大類,Core CPU、Xe GPU,以及透過收購獲得的AI晶片Habana等。
另外針對不同類型的晶片,可能還有更具體的最佳化方案。如當代CPU普遍加入AVX512指令,本質上是特別針對深度學習做加強。「專用」的不一定是處理器,也可以是處理器內的某些特定單元,甚至固定功能單元,就好像GPU中加入專用的光線追蹤單元一樣,這是當代處理器普遍都在做的一件事。
(2)從電晶體、晶片結構層面來看,電晶體的尺寸現在仍然在縮減過程中,只不過縮減幅度相比過去變小了——而且為緩解電晶體性能的下降,需要有各種不同的技術來輔助尺寸變小。比如說在22nm節點之後,電晶體變為FinFET結構,在3nm之後,電晶體即將演變為Gate All Around FET結構。最終會演化為互補FET (CFET),其本質都是電晶體本身充分利用Z軸,來實現微縮性能的提升。
劉明認為,「除了基礎元件的變革,IC現在的發展還是比較多元化,包括新材料的引進、元件結構革新,也包括微影技術。長期賴以微縮的基本手段,現在也在發生巨大的變化,特別是未來3D的異質整合。這些多元技術的協同發展,都為晶片整體性能提升帶來了很好的增益。」
他並指出,「從電晶體級、到晶圓級,再到晶片堆疊、引線接合(lead bonding),精準度從毫米向奈米演進,互連密度大大提升。」從晶圓/裸晶的層面來看,則是眾所周知的朝more than moore’s law這樣的路線發展,比如把兩片裸晶疊起來。現在很熱門的chiplet技術就是比較典型的並不依賴於傳統電晶體尺寸微縮,來彈性擴展性能的方案。
台積電和Intel這兩年都在大推將不同類型的裸晶,異質整合的技術。2.5D封裝方案典型如台積電的CoWoS,Intel的EMIB,而在3D堆疊上,Intel的Core LakeField晶片就是用3D Foveros方案,將不同的裸晶疊在一起,甚至可以實現兩片運算裸晶的堆疊、互連。
之前的文章也提到過AMD剛發佈的3D V-Cache,將CPU的L3 cache裸晶疊在運算裸晶上方,將處理器的L3 cache大小增大至192MB,對儲存敏感延遲應用的性能提升。相比Intel,台積電這項技術的獨特之處在於裸晶間是以混合接合(hybrid bonding)的方式互連,而不是micro-bump,做到更小的打線間距,以及晶片之間數十倍通訊性能和效率提升。
這些方案也不直接依賴傳統的電晶體微縮方案。這裡實際上還有一個方面,即新材料的導入專家們沒有在論壇上多說,本文也略過不談。
1,000倍的性能提升
劉明談到,當電晶體微縮的空間沒有那麼大的時候,產業界傾向於採用新的策略來評價技術——「PPACt」——即Powe r(功耗)、Performance (性能)、Cost/Area-Time (成本/面積-時間)。t指的具體是time-to-market,理論上應該也屬於成本的一部分。
電晶體微縮方案失效以後,「多元化的技術變革,依然會讓IC性能得到進一步的提升。」劉明說,「根據預測,這些技術即使不再做尺寸微縮,也會讓IC的晶片性能做到500~1,000倍的提升,到2035年實現Zetta Flops的系統性能水準。且超算的發展還可以一如既往地前進;單裸晶儲存容量變得越來越大,IC依然會為產業發展提供基礎。」
500~1,000倍的預測來自DARPA,感覺有些過於樂觀。因為其中的不少技術存在比較大的邊際遞減效應,而且有更實際的工程問題待解決,比如運算裸晶疊層的散熱問題——即便業界對於這類工程問題的探討也始終在持續。
不過1,000倍的性能提升,的確說明摩爾定律的終結並不能代表第三次科技革命的終結,而且還有相當大的發展空間。尤其本文談的主要是AI晶片,而不是更具通用性的CPU。
矽光、記憶體內運算和神經型態運算
在非傳統發展路線上(以上內容都屬於半導體製造的常規思路),WAIC晶片論壇上宋繼強和劉明都提到了一些頗具代表性的技術方向(雖然這可能與他們自己的業務方向或研究方向有很大的關係)。這些技術可能尚未大規模推廣,或者仍在商業化的極早期。
(1)近記憶體運算和記憶體內運算:處理器性能和效率如今面臨的瓶頸,很大程度並不在單純的運算階段,而在資料傳輸和儲存方面——這也是共識。所以提升資料的傳輸和存取效率,可能是提升整體系統性能時,一個非常靠譜的思路。
這兩年市場上的處理器產品用「近記憶體運算」(near-memory computing)思路的,應該不在少數。所謂的近記憶體運算,就是讓儲存(如cache、memory)單元更靠近運算單元。CPU的多層cache結構(L1、L2、L3),以及電腦處理器cache、記憶體、硬碟這種多層儲存結構是常規。而「近記憶體運算」主要在於究竟有多「近」,cache記憶體有利於隱藏當代電腦架構中延遲和頻寬的局限性。
這兩年在近記憶體運算方面比較有代表性的,一是AMD——比如前文提到3D V-cache增大處理器的cache容量,還有其GPU不僅在裸晶內導入了Infinity Cache這種類似L3 cache的結構,也更早應用了HBM2記憶體方案。這些實踐都表明,儲存方面的革新的確能帶來性能的提升。
另外一個例子則是Graphcore的IPU處理器:IPU的特點之一是在裸晶內堆了相當多的cache資源,cache容量遠大於一般的GPU和AI晶片——也就避免了頻繁的訪問外部儲存資源的操作,極大提升頻寬、降低延遲和功耗。
近記憶體運算的本質仍然是馮紐曼架構(Von Neumann architecture)的延續。「在做處理的過程中,多層級的儲存結構,資料的搬運不僅僅在處理和儲存之間,還在不同的儲存層級之間。這樣頻繁的資料搬運帶來了頻寬延遲、功耗的問題。也就有了我們經常說的運算體系內的儲存牆的問題。」劉明說。
構建非馮(non-von Neumann)架構,把傳統的、以運算為中心的馮氏架構,變換一種新的運算範式。把部分運算力下推到儲存。這便是記憶體內運算(in-memory computing)的概念。
記憶體內運算的就現在看來還是比較新,也有稱其為「存算一體」。通常理解為在記憶體中嵌入演算法,儲存單元本身就有運算能力,理論上消除資料存取的延遲和功耗。記憶體內運算這個概念似乎這在資料爆炸時代格外醒目,畢竟可極大減少海量資料的移動操作。
其實記憶體內運算的概念都還沒有非常明確的定義。現階段它可能的內涵至少涉及到在儲記憶體內部,部分執行資料處理工作;主要應用於神經網路(因為非常契合神經網路的工作方式),以及這類晶片具體的工作方法上,可能更傾向於神經型態運算(neuromorphic computing)。
對於AI晶片而言,記憶體內運算的確是很好的思路。一般的GPU和AI晶片執行AI負載時,有比較頻繁的資料存取操作,這對性能和功耗都有影響。不過記憶體內運算的具體實施方案,在市場上也是五花八門,早期比較具有代表性的Mythic導入了一種矩陣乘的儲存架構,用40nm嵌入式NOR,在儲記憶體內部執行運算,不過替換掉了數位週邊電路,改用類比的方式。在陣列內部進行模擬運算。這家公司之前得到過美國國防部的資金支援。
劉明列舉了近記憶體運算和記憶體內運算兩種方案的例子。其中,近記憶體運算的這個方案應該和AMD的3D V-cache比較類似,把儲存裸晶和運算裸晶疊起來。
劉明指出,「這是我們最近的一個工作,採用hybrid bonding的技術,與矽通孔(TSV)做比較,hybrid bonding功耗是0.8pJ/bit,而TSV是4pJ/bit。延遲方面,hybrid bonding只有0.5ns,而TSV方案是3ns。」台積電在3D堆疊方面的領先優勢其實也體現在hybrid bonding混合鍵合上,前文也提到了它具備更高的互連密度和效率。
另外這套方案還將DRAM刷新頻率提高了一倍,從64ms提高至128ms,以降低功耗。「應對刷新率變慢出現拖尾bit,我們引入RRAM TCAM索引這些tail bits」劉明說。
記憶體內運算方面,「傳統運算是用布林邏輯,一個4位元的乘法需要用到幾百個電晶體,這個過程中需要進行資料來回的移動。記憶體內運算是利用單一元件的歐姆定律來完成一次乘法,然後利用基爾霍夫定律完成列的累加。」劉明表示,「這對於今天深度學習的矩陣乘非常有利。它是原位的運算和儲存,沒有資料搬運。」這是記憶體內運算的常規思路。
「無論是基於SRAM,還是基於新型記憶體,相比近記憶體運算都有明顯優勢,」劉明認為。下圖是記憶體內運算和近記憶體運算,精準度、能效等方面的對比,記憶體內運算架構對於低精準度運算有價值。
下圖則總結了業內主要的一些記憶體內運算研究,在精確度和能效方面的對應關係。劉明表示,「需要高精確度、高運算力的情況下,近記憶體運算目前還是有優勢。不過記憶體內運算是更新的技術,這幾年的進步也非常快。」
去年阿里達摩院發佈2020年十大科技趨勢中,有一個就是存算一體突破AI算力瓶頸。不過記憶體內運算面臨的商用挑戰也一點都不小。記憶體內運算的通常思路都是類比電路的運算方式,這對記憶體、運算單元設計都需要做工程上的考量。與此同時這樣的晶片究竟由誰來造也是個問題:是記憶體廠商,還是數文書處理器廠商?(三星推過記憶體內運算晶片,三星、Intel垂直整合型企業似乎很適合做記憶體內運算…)
(2)神經型態運算:神經型態運算和記憶體內運算一樣,也是新興技術的熱門話題,這項技術有時也叫作compute in memory,可以認為它是記憶體內運算的某種發展方向。神經型態和一般神經網路AI晶片的差異是,這種結構更偏「類人腦」。
進行神經型態研究的企業現在也逐漸變得多起來,劉明也提到了AI晶片「最終的理想是在結構層次模仿腦,元件層次逼近腦,功能層次超越人腦」的「類腦運算」。Intel是比較早關注神經型態運算研究的企業之一。
傳說中的Intel Loihi就是比較典型存算一體的架構,「這片裸晶裡面包含128個小核心,每個核心用於模擬1,024個神經元的運算結構。」宋繼強說,「這樣一塊晶片大概可以類比13萬個神經元。我們做到的是把768個晶片再連起來,構成接近1億神經元的系統,讓學術界的夥伴去試用。」
「它和深度學習加速器相比,沒有任何浮點運算——就像人腦裡面沒有乘加器。所以其學習和訓練方法是採用一種名為spike neutral network的路線,功耗很低,也可以訓練出做視覺辨識、語言辨識和其他種類的模型。」宋繼強認為,不採用同步時脈,「刺激的時候就是一個非同步電動勢,只有工作部分耗電,功耗是現在深度學習加速晶片的千分之一。」
「而且未來我們可以對不同區域做劃分,比如這兒是視覺區、那兒是語言區、那兒是觸覺區,同時進行多模態訓練,互相之間產生關聯。這是現在的深度學習模型無法比擬的。」宋繼強說。這種神經型態運算晶片,似乎也是Intel在XPU方向上探索不同架構運算的方向之一。
(2)微型化矽光:這個技術方向可能在層級上更偏高了一些,不再晶片架構層級,不過仍然值得一提。去年Intel在Labs Day上特別談到了自己在矽光(Silicon Photonics)的一些技術進展。其實矽光技術在連接資料中心的交換機方面,已有應用了,發出資料時,連接埠處會有個收發器把電訊號轉為光訊號,透過光纖來傳輸資料,另一端光訊號再轉為電訊號。不過傳統的光收發器成本都比較高,內部元件數量大,尺寸也就比較大。
Intel在整合化的矽光(IIIV族monolithic的光學整合化方案)方面應該是商業化走在比較前列的,就是把光和電子相關的組成部分高度整合到晶片上,用IC製造技術。未來的光通訊不只是資料中心機架到機架之間,也可以下沉到板級——就跟現在傳統的電I/O一樣。電互連的主要問題是功耗太大,也就是所謂的I/O功耗牆,這是這類微型化矽光元件存在的重要價值。
這其中存在的技術挑戰還是比較多,如做資料的光訊號調變的調變器調變器,據說Intel的技術使其實現了1,000倍的縮小;還有在接收端需要有個探測器(detector)轉換光訊號,用所謂的全矽微環(micro-ring)結構,實現矽對光的檢測能力;波分複用技術實現頻寬倍增,以及把矽光和CMOS晶片做整合等。
Intel認為,把矽光模組與運算資源整合,就能打破必須帶更多I/O接腳做更大尺寸處理器的這種趨勢。矽光能夠實現的是更低的功耗、更大的頻寬、更小的接腳數量和尺寸。在跨處理器、跨伺服器節點之間的資料互動上,這類技術還是頗具前景,Intel此前說目標是實現每根光纖1Tbps的速率,並且能效在1pJ/bit,最遠距離1km,這在非本地傳輸上是很理想的數字。
還有軟體…
除了AI晶片本身,從整個生態的角度,包括AI感知到運算的整個鏈條上的其他組成部分,都有促成性能和效率提升的餘地。比如這兩年Nvidia從軟體層面,針對AI運算的中間層、庫做了大量最佳化。相同的底層硬體,透過軟體最佳化就能實現幾倍的性能提升。
宋繼強說,「我們發現軟體最佳化與否,在同一個硬體上可以達到百倍的性能差距。」這其中的餘量還是比較大。
在AI開發生態上,雖然Nvidia是最具發言權的;但從戰略角度來看,像Intel這種研發CPU、GPU、FPGA、ASIC,甚至還有神經型態運算處理器的企業而言,不同處理器統一開發生態可能更具前瞻性。Intel有個稱oneAPI的軟體平台,用一套API實現不同硬體性能埠的對接。這類策略對廠商的軟體框架構建能力是非常大的考驗——也極大程度關乎底層晶片的執行效率。
在摩爾定律放緩、電晶體尺寸微縮變慢甚至不縮小的前提下,處理器架構革新、異質整合與2.5D/3D封裝技術依然可以達成1,000倍的性能提升;而一些新的技術方向,包括近記憶體運算、記憶體內運算和微型矽光,能夠在資料訪存、傳輸方面產生新的價值;神經型態運算這種類腦運算方式,是實現AI運算的目標;軟體層面的最佳化,也能夠帶動AI性能的成倍增長。所以即便摩爾定律嚴重放緩,AI晶片的性能、效率提升在上面提到的這麼多方案加持下,終將在未來很長一段時間內持續飛越。這第三(四)次科技革命恐怕還很難停歇。
資料來源:https://www.eettaiwan.com/20210726nt61-ai-computing/?fbclid=IwAR3BaorLm9rL2s1ff6cNkL6Z7dK8Q96XulQPzuMQ_Yky9H_EmLsBpjBOsWg
邏輯板通用 在 毛毛遊戲城堡 Facebook 的最佳解答
((開團))推薦給準備開始學習自己吃飯的寶寶
🔺下單網址→ https://tomali.tw/bhlpk
#本團獨家滿額贈
滿$2000送 水清淨全方位抗菌液-30ml乙瓶 (可累贈)
🔥莫莉媽大推--Minikoioi寶寶&小童適用的矽膠短吸管! 2入一組還附專用清洗工具~ 連多多、牛奶方瓶都可以用 只有17cm,另外 固齒器有出新的OREO哦! 超級療癒可愛♥
🔥tidy TOT #防髒吸盤圍兜 圍兜底部直接就有吸盤,可以吸在餐桌上,不怕東西掉到衣服上、或從餐椅中間縫縫狂掉了! 有防潑水、而且好洗又快乾! 附小收納袋,可以直接收納成小小的放包包帶出門,去餐廳就不用怕把人家餐椅地板搞到髒兮兮了! #也有短袖版哦
/
三大品牌 --寶寶自主進食的安全餐具用品
◎英國tidy TOT寶寶BLW防髒托盤
◎土耳其minikoioi矽膠吸盤餐具
◎美國lil Sidekick萬用防掉帶
/
⭐英國tidy TOT防髒托盤圍兜組
✅圖文分享→ https://reurl.cc/p63Xa
這組很適合在家讓小朋友學吃飯使用,以前我們真的都是地上舖報紙、舖麻將紙,吃完再清地面這樣。有這個防髒托盤就不用這麼麻煩,可以拿去水槽沖洗乾淨晾乾、下一餐繼續用,環保又實用!
打開就是一個超大桌面,讓初學寶寶盡情發揮,想怎麼吃就怎麼吃、不再掉到桌下到處都是,同品牌還有長版防髒圍兜,適合1~3歲左右、長度到膝蓋的設計,不管是吃飯、當烘培小幫手、幫忙洗碗,還是玩顏料、盡情塗鴉,通通都很方便!
還有外出吸盤型防髒圍兜,圍兜底部直接就有吸盤,可以吸在餐桌上,有附收納袋 方便出門攜帶 輕薄不佔空間,不怕食物從餐椅中間縫縫狂掉了!
-
⭐土耳其品牌Minikoioi--寶寶學習矽膠餐具
✅圖文分享→ https://reurl.cc/Ov5E3
Minikoioi推出一系列自主學習餐具,都是專為"第一次自己進食"所設計及研發,符合孩子的進食邏輯、以柔軟的食用級矽膠為主要材質,不只軟Q不傷寶寶嬌嫩的肌膚、也便於媽咪事後的清理
全系列通通都是食品級矽膠材質↓↓
🥣不勒頸的 #X型立體矽膠圍兜
🥣防滑附蓋的 #矽膠吸盤碗
🥣初學者最需要的防滑矽膠 #分隔淺餐盤
🥣不怕戳傷牙齦的 #副食品學習湯匙
🥣柔軟好握尺寸適中的 #寶寶自主學習杯
🥣適合幼童~兒童長度 #矽膠吸管
他們家很厲害X型立體圍兜,最大的優點就是不會勒脖子!!
因為它不是透過傳統繞頸的方式來固定圍兜,固定的位置是在寶寶的背後
Minikoioi的全系列餐具都是使用矽膠材質,因為有蠻多寶寶會對乳膠過敏的,矽膠的耐熱溫度達200多度,是一個很安全、也很好清潔消毒的材質,可進消毒鍋、可以直接煮沸消毒、也可以進洗碗機。唯獨不能使用紫外線消毒哦!
-
⭐風靡媽媽圈! 美國lil Sidekick 防掉帶
✅圖文分享→https://reurl.cc/LA5Xe
萬用防掉帶也是寶寶時期必備好物! 幾乎可以綁任何東西,從胖胖的水杯、到細細的畫筆或叉匙,綁緊緊才不會一直被寶寶丟地上,推車上很重要的玩偶、奶嘴等都可以綁著,才不會一不留神就掉在路上! 而且它是一條可以當固齒器啃的醫療用矽膠材質,一條多用,可以綁也可以啃!!
獨家雙向突扣設計,不易被孩童拆解,全長約59公分可繫在任何地方,例如推車、汽座、揹巾、餐椅與媽媽包等,小至奶嘴、湯匙甚至蠟筆,大至水杯、安撫娃娃都能輕鬆套牢!
美國製造生產Made in USA 選用通過美國FDA食品藥物管理局認證,醫療用矽膠材質不含任何雙酚A過敏原-天然乳膠及有毒物質!
可供寶貝作為固齒器使用,清潔也相當容易,可直接清水沖洗或放入洗碗機,安全、易清洗、通用性高、環保可回收哦!
-
📣本團客服資訊
✦ 客服電話:(03) 462-5551
✦ FB粉絲頁: 朶玫黎Tomali 育兒生活多美麗
✦ 客服信箱:info@tomali.com.tw
✦ 客服時間: 週一至週五,9am-6pm
🔺以上請擇一管道詢問 / 勿重覆詢問
📣本團出貨時間
現貨商品 將於結團後7天開始陸續出貨
預購商品 預計於 六月下旬 開始出貨
若訂單中同時有現貨及預購商品,將分成兩批出貨,運費只計算一次。
📣本團運費
每筆訂單運費80元,訂單滿1800元免運(外島訂單一律收取運費100元)
-
5/5~5/11 寶寶自主餐具團
🔺下單網址→ https://tomali.tw/bhlpk
#本團獨家滿額贈
滿$2000送 水清淨全方位抗菌液-30ml乙瓶 (可累贈)