雖然這篇類比訊號定義鄉民發文沒有被收入到精華區:在類比訊號定義這個話題中,我們另外找到其它相關的精選爆讚文章
在 類比訊號定義產品中有22篇Facebook貼文,粉絲數超過3萬的網紅Analog Devices台灣亞德諾半導體股份有限公司,也在其Facebook貼文中提到, 新聞搶先報:ADI無線BMS助力Lotus重新定義電動車機動性 Analog Devices, Inc. (Nasdaq: ADI)宣佈英國知名品牌Lotus汽車計畫在其下一代電動車(EV)架構中採用ADI的無線電池管理系統(無線BMS)。ADI的無線BMS憑藉不斷提升的設計彈性、更高的電池可維護...
類比訊號定義 在 Analog Devices台灣亞德諾半導體股份有限公司 Facebook 的最佳貼文
新聞搶先報:ADI無線BMS助力Lotus重新定義電動車機動性
Analog Devices, Inc. (Nasdaq: ADI)宣佈英國知名品牌Lotus汽車計畫在其下一代電動車(EV)架構中採用ADI的無線電池管理系統(無線BMS)。ADI的無線BMS憑藉不斷提升的設計彈性、更高的電池可維護性及更輕量而獲得Lotus青睞。此次合作將助力Lotus安全穩步擴展其未來電動車平台,持續突破設計和技術邊界。
ADI無線BMS技術省去傳統線束,減少高達90%的線束和15%的電池組體積。此外,並提高設計彈性及可製造性,同時不影響電池使用壽命內的里程數和充電精度。ADI 無線BMS簡化了電池組的裝配與拆卸過程,確保快速高效地移除,並修復故障電池電芯。
Lotus 動力與底盤工程總監Richard Lively表示:「我們與ADI密切合作將無線BMS整合至全新的輕量化電動車架構(LEVA)中,未來,所有Lotus 電動車均將基於此架構設計。無線BMS透過省去傳統線束協助Lotus 提供輕量化解決方案,在優化車輛性能的同時,也契合我們『以優秀技術賦予卓越性能』的品牌理念。」
Lotus 汽車車身架構的設計目標是使其發揮超高性能。無線BMS的設計彈性讓Lotus 的工程師在進行車輛設計時能夠更自由,使電池組融入整車設計,而非讓整車設計去適應電池組。此外,ADI的無線BMS可最大化每個電芯的能量利用率,進而優化車輛續航里程,其與Lotus 對耐久性的專注要求一致。
ADI電動汽車事業部總經理Roger Keen表示:「Lotus 在製造高性能、持久耐用的賽車和道路車輛方面享有盛名,其多款車型榮登經典之列。我們攜手重新設想了可能性,為電動車產業開發了一款變革性方案:全新的超輕量化傳動架構和無線電池管理系統,在協助汽車達到優異性能的同時,也為環境的永續發展和低碳地球作出貢獻。」
此外,電池必須能跟上Lotus 汽車的使用壽命。無線BMS能夠測量電池組健康狀態,簡化裝配和拆卸過程,確保故障的電芯能快速高效地拆卸並修復。由於電池模組是軟體可編程的,因此可實現快捷的線上升級,使得道路車輛與賽車的維護更加輕鬆快捷。電芯控制器與電池模組作為一可維護單元使用,可進一步簡化服務模式。
欲瞭解ADI無線BMS詳情,請瀏覽:www.analog.com/electrification
欲瞭解Lotus 汽車詳情,請瀏覽:www.lotuscars.com/en-US/
Analog Devices 簡介
Analog Devices, Inc. (NASDAQ: ADI)於現代數位經濟之中心發揮重要作用,憑藉種類豐富之類比與混合訊號、電源管理、RF、數位與感測技術,將現實世界之現象轉化為具行動意義的洞察。ADI為全球12.5萬家客戶提供服務,涵蓋工業、通訊、汽車與消費市場之產品超過7.5萬種。ADI公司總部位於麻塞諸塞州威明頓市。更多資訊請瀏覽:www.analog.com 。
關於Lotus
Lotus 汽車全球總部位於英國諾福克郡海瑟爾,是賽車和超級跑車生產營運、Lotus 先進性能中心和Lotus 指標性的2.2英里測試跑道的所在地。Lotus 汽車打造高性能賽車,成就賽道上的成功傳奇,其賽車曾斬獲13年國際汽聯世界一級方程式錦標賽冠軍及其他多項冠軍殊榮。Lotus 於2021年7月推出全新的Emira跑車,為其最後一款高階汽油動力賽車,首批客戶預定車輛將於2022年交付。2019年7月,Lotus 推出了全球首款全電動英國超級跑車Evija,客戶車輛交付將於2021年開始。
類比訊號定義 在 Facebook 的最佳貼文
⭐️sMeet上市 智聯服務搶攻資通訊技術系統整合的商機
2021年疫情出乎預期未能休止,也使得在家工作、遠距教學與電競娛樂等需求不墜,推升PC相關的產業動能,宏碁集團交出一張亮麗的成績單,此次專訪宏碁集團創辦人/智榮基金會董事長施振榮先生,以及智聯服務(Acer Synergy Tech)韓政達總經理,探詢以資通訊技術為主的系統整合商業模式,同時提供客戶在空間場域運用的建置實力。
智聯服務成立於2017年,前身是宏碁的新竹分公司,長期深耕台灣半導體產業客戶,是宏碁集團組織的第三波改造的關鍵要角之一,並於2020年底完成上櫃掛牌,登上台灣資本市場的舞台,其所看到的市場在於企業積極推動數位轉型以及跨領域合作的風潮方興未艾之際,對於網路建置、維運和IT服務的需求正排山倒海而來,大多數的企業要培養足夠的資訊人才實在力有未逮,因此讓系統整合外包服務商找到重要的利基,智聯的出線呈現以資通訊技術為核心的專業系統整合公司正開始嶄露頭角,也成功創造出自身的價值。
2020年也是COVID-19(新冠肺炎)疫情全球肆虐的開端,居家上班所推動的視訊會議系統成為各方角逐的重點市場,考量到資訊安全與長期營運成本的要求,宏碁集團投注資源走入內部自行開發的道路,sMeet的視訊會議系統於焉誕生,施振榮受訪時特別強調sMeet的「s」就是指Security,安全性是視訊會議系統最重要的考量,他從系統開始研發時就一直參與實際的測試,這段期間由他主持的多項會議更幾乎是天天使用sMeet,一直到產品經一年多的完整測試後,終於決定2021年要正式上市。
打造「巨架構微服務」的整合平台
施振榮探究國內軟體產業的發展,認為軟體公司要擺脫小打小鬧的格局,一定要走向國際市場,做B2B的生意模式是台灣產業界的基本宿命,因為台灣本地消費市場規模太小,軟體的成功要能夠容易複製以造成數量上的取勝,他所看重的是sMeet做為資通訊基礎架構的水平整合平台的商機,隨著多樣化的智慧型應用的大量開發與創造,搭配台灣的硬體優勢相輔相成,打造出「巨架構微服務」的整合平台,這個商機值得台灣廠商好好珍惜。
宏碁集團歷經要「分」才會拚的階段,在1990年代,集團內的大型硬體製造子公司分拆獨立,各自努力於品牌與製造的國際競爭與征途上,但是今天需要回頭來看所謂要「合」才能贏的機會,過去電子製造與代工的利潤捉襟見肘只有3~4%,今天透過軟體系統的整合後,他認為新型態的軟硬體系統整合的商機浮現,拜少量多樣化的趨勢之賜,勢必推升軟體所驅動的資通訊系統整合的獲利模式。
以施振榮的角度來看,集團內的戰將們要從各司其職與各擅勝場的角色上,一起揪團打國際盃,這才可以看到成功的契機,他提出「新微笑曲線」的概念,即是跨領域合作,共創價值,而軟體做為資通訊系統整合的平台正充滿著新的商機,以下是他的趨勢專訪。
Q1:您如何看待台灣科技產業進入軟體的挑戰?台灣的軟體公司要如何經營才能成功?
施:說到台灣軟體產業的挑戰,軟體的成功的關鍵是要憑藉著規模與數量的加乘效益與實力,我在80年代擔任台北巿電腦公會理事長時,台灣的軟體產業隨著電腦硬體設備進入台灣時就已經起步,早期的軟體公司是以軟體系統整合(SI)的概念為主,起步時與當年的硬體產業所面對的挑戰不相上下,但是因一直無法發揮數量與規模上的效益,所以營運比較辛苦,如同當年全球最大的軟體服務公司為例,也是異常艱辛;就我的觀察,當年以軟體廠商來做系統整合為主的服務,比不上以硬體為主的系統整合商來的吃香,但是今天有機會看到翻轉的契機了。
軟體成功的兩大推力是規模與國際化的能力
鑒於軟體產業的辛苦,早期我在1990年代的初期任台北市電腦公會的理事時,因為重視軟體的潛力發展,所以特別在電腦展中提供免費的攤位給軟體公司來參展,做為一種軟體產品展示與國際化的推展,那時候很清楚的知道,台灣市場不夠大,客觀條件不足,軟體要能夠成功有兩大關鍵的力量,首先需要借助電腦硬體的規模經濟,再者就是讓軟體能國際化的兩個主要的推動力量,目前在台灣幾個重要的軟體廠商的成功經驗,也看到初期採用與PC一起搭售組合(Bundle)的策略提供成功的關鍵,大批量與消費者重複使用的經驗,促成軟體成功的機制。
我認為電腦的硬體系統是一個載具的概念,台灣因為硬體製造的實力堅強而容易進入國際領域競爭,國際級的軟體巨擘實力強勁,但是一談到硬體的載具,那一定會找台灣來合作,所以我們的軟體企業除非在某些特定領域,否則一般都會避開硬碰硬的對決競爭,因此宏碁選的軟體發展策略是不去妨礙硬體生意的發展實力,而是找到可以展現整合硬體優勢的軟體商機,這個新領域中我看到台灣進入的強項在於工程師技術與台灣健保醫療系統所帶來的優勢。
展望未來,面對國際分工與趨於複雜化的現實,為了掌握未來的機會,一個具備彈性功能、成本優勢,以服務為導向的生意模式,加上探索智慧醫療、智慧農業、智慧製造,以及智慧城鄉等應用,我預測獲利三成、四成的新事業體會快速應運而生。
Q2:今天宏碁如何在軟體市場上找到發展的契機?
施:宏碁的轉型過程中,我們認為諸如sMeet等軟體的發展機會,首先就是先制定出廣泛(Universal)的產品規格,可以藉由大小通吃與兼容並蓄的產品規劃能力,做出能與最多的硬體相搭配,我從2013年重回宏碁的時候,就推動宏碁大舉朝向通訊與智慧醫療兩大主流的方向來推動宏碁務實的市場發展轉型,當中智慧醫療靠的是跨領域的整合,而通訊則是靠軟體整合。
通訊與智慧醫療市場是宏碁所看到的美好未來
首先,通訊系統與軟體息息相關,舉凡主流的數位交換機與VOIP等系統都是用電腦與軟體所搭建而成,今天用軟體來定義一切是電腦產業的大勢所趨,過去以類比訊號為主的PBX系統承受從電腦與整合軟體所帶來的強大市場壓力,智聯的sMeet是先整合視訊的功能,接續也會將語音訊號加以整合在內,這也是為了進入通訊系統的起手式,所以宏碁朝下一世代的通訊系統發展是早已經確定。
sMeet視訊會議軟體的最佳賣點就是安全性的要求,兼具使用雲架構(Cloud Based)或內部部署(On-Premise)的架構來滿足不同的安全性的需求,這也整合宏碁過去發展BYOC自建雲服務的寶貴經驗,不斷探索使用筆記型電腦等級的系統來搭建一個私有雲系統的可能,分散式網路還是有小而美的實用性上的好處,再者,sMeet使用上也兼顧企業內部高敏感性機密的視訊會議需求,以及同仁商務差旅在外的視訊會議方便性之需,所以我的sMeet提供兩種不同的雲端網路的配置,來提供我做到隨時隨地參與視訊會議,也可以在緊密安全性下進行企業內的重要會議。
Q3:您如何看待sMeet所打造的商業模式的變革?
施:宏碁集團在陳俊聖執行長上任後積極轉型,針對旗下各主要事業做了較為明顯的區分,希望商用市場能夠靠著旗下各個小虎分進合擊,組成了以商用布局為主的宏碁聯合艦隊之姿,透過產業下游的系統整合服務,將上游的品牌產品也一起打進終端應用的客戶群,這也是智聯目前正積極努力的方向。
開放sMeet的API模組 搭建新的產業合作的模式
這個專訪的第二部份是聚焦於sMeet的產品與市場的推廣動態。以下是智聯服務韓政達總經理的觀點。
Q4:請韓總經理說明一下sMeet的產品特點。
韓:sMeet是一個後疫情時代的產品,需要慎密的商業模式以滿足遠距應用的需求,由於市面上視訊會議軟體競爭非常劇烈,sMeet在產品面需要具備後發先至的優點,最主要的利基點就是善用雲架構打造三個產品的優勢,第一,資訊安全的優勢,因為使用宏碁BYOC的私有雲技術,兼顧頻寬與資訊加密的優勢,讓企業保持高度的資安防護的能力,而且在架構上的成本非常具有優勢,降低導入成本。
第二,4K高畫質影像品質,拜私有雲技術之賜,充足的頻寬可以讓企業內視訊會議使用4K解析度影像品質,大幅提高與會者的使用者體驗,第三,容易使用,在PC上善用以瀏覽器為主的方便性,雖然手機仍需要App下載,但是整個使用介面簡單明瞭,無需訓練課程就可以使用。
為了打造更多的使用範例,針對疫情肆虐下的日常,目前sMeet團隊為台灣上市櫃公司打造董事會專屬sMeet視訊會議系統,而且完全依照證管會的法規要求所設計的專屬應用,再者,從大量的sMeet場域實地測試的經驗中,目前已經有許多新的使用範例正在運行,相關的應用也有更多的產業殷切的探詢,尋思為了讓sMeet能夠成為更多重要應用的關鍵溝通工具,目前已經著手制定彈性sMeet的API軟體模組,整合到不同專業系統中,讓更多的產業可以從中得到最大的效益,搭建新的產業合作的模式,強化以服務為導向的企業文化的貫徹。
Q5:請韓總經理說明一下sMeet的市場發展動態與上市的計畫。
韓:智聯是宏碁集團的新群龍計劃的一個企業內部創業的成果,雖然現在資本額不大,但是在宏碁集團的大家庭下,分享宏碁集團的重要的資產,也就是Acer的品牌價值,以及集團下的重要的人脈與人才的資源,以我親身經歷而言,於2021年初,智聯參與競標一個北歐國家的漁業公司的業務案,由於充分獲得Acer歐洲辦公室的協助,迅速解決問題,讓我們一舉打敗日本電信巨擘的競爭者,做到小蝦米打敗大鯨魚的致勝成果,取得成功。
有了這個初試啼聲的成功之後,我們積極利用sMeet的API來進行產業界的垂直整合應用的發展,目前瞄準包括銀行的線上開戶系統,甚至是大專院校或專業訓練單位的線上教學系統等新的嘗試,都讓sMeet在新興應用上創造商機,在國際市場上,透過宏碁集團在當地公司地協助,持續串連集團優勢資源,瞄準重要的營收貢獻產業,目前智聯是sMeet全球代理商,負責行銷與提供在地化服務的任務,目前已經在美國設立子公司,並陸續在北美各州成立區域型辦公室,並期盼進一步朝向一家國際服務公司前進,把好的人才推向全世界,走向全球。
類比訊號定義 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
摩爾定律放緩 靠啥提升AI晶片運算力?
作者 : 黃燁鋒,EE Times China
2021-07-26
對於電子科技革命的即將終結的說法,一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續,也就意味著資訊技術的整棟大樓建造都將出現停滯,那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有的,但這波革命始終也沒有結束。AI技術本質上仍然是第三次科技革命的延續……
人工智慧(AI)的技術發展,被很多人形容為第四次科技革命。前三次科技革命,分別是蒸汽、電氣、資訊技術(電子科技)革命。彷彿這“第四次”有很多種說辭,比如有人說第四次科技革命是生物技術革命,還有人說是量子技術革命。但既然AI也是第四次科技革命之一的候選技術,而且作為資訊技術的組成部分,卻又獨立於資訊技術,即表示它有獨到之處。
電子科技革命的即將終結,一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續,也就意味著資訊技術的整棟大樓建造都將出現停滯,那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有,但這波革命始終也沒有結束。
AI技術本質上仍然是第三次科技革命的延續,它的發展也依託於幾十年來半導體科技的進步。這些年出現了不少專門的AI晶片——而且市場參與者相眾多。當某一個類別的技術發展到出現一種專門的處理器為之服務的程度,那麼這個領域自然就不可小覷,就像當年GPU出現專門為圖形運算服務一樣。
所以AI晶片被形容為CPU、GPU之後的第三大類電腦處理器。AI專用處理器的出現,很大程度上也是因為摩爾定律的發展進入緩慢期:電晶體的尺寸縮減速度,已經無法滿足需求,所以就必須有某種專用架構(DSA)出現,以快速提升晶片效率,也才有了專門的AI晶片。
另一方面,摩爾定律的延緩也成為AI晶片發展的桎梏。在摩爾定律和登納德縮放比例定律(Dennard Scaling)發展的前期,電晶體製程進步為晶片帶來了相當大的助益,那是「happy scaling down」的時代——CPU、GPU都是這個時代受益,不過Dennard Scaling早在45nm時期就失效了。
AI晶片作為第三大類處理器,在這波發展中沒有趕上happy scaling down的好時機。與此同時,AI應用對運算力的需求越來越貪婪。今年WAIC晶片論壇圓桌討論環節,燧原科技創始人暨CEO趙立東說:「現在訓練的GPT-3模型有1750億參數,接近人腦神經元數量,我以為這是最大的模型了,要千張Nvidia的GPU卡才能做。談到AI運算力需求、模型大小的問題,說最大模型超過萬億參數,又是10倍。」
英特爾(Intel)研究院副總裁、中國研究院院長宋繼強說:「前兩年用GPU訓練一個大規模的深度學習模型,其碳排放量相當於5台美式車整個生命週期產生的碳排量。」這也說明了AI運算力需求的貪婪,以及提供運算力的AI晶片不夠高效。
不過作為產業的底層驅動力,半導體製造技術仍源源不斷地為AI發展提供推力。本文將討論WAIC晶片論壇上聽到,針對這個問題的一些前瞻性解決方案——有些已經實現,有些則可能有待時代驗證。
XPU、摩爾定律和異質整合
「電腦產業中的貝爾定律,是說能效每提高1,000倍,就會衍生出一種新的運算形態。」中科院院士劉明在論壇上說,「若每瓦功耗只能支撐1KOPS的運算,當時的這種運算形態是超算;到了智慧型手機時代,能效就提高到每瓦1TOPS;未來的智慧終端我們要達到每瓦1POPS。 這對IC提出了非常高的要求,如果依然沿著CMOS這條路去走,當然可以,但會比較艱辛。」
針對性能和效率提升,除了尺寸微縮,半導體產業比較常見的思路是電晶體結構、晶片結構、材料等方面的最佳化,以及處理架構的革新。
(1)AI晶片本身其實就是對處理器架構的革新,從運算架構的層面來看,針對不同的應用方向造不同架構的處理器是常規,更專用的處理器能促成效率和性能的成倍增長,而不需要依賴於電晶體尺寸的微縮。比如GPU、神經網路處理器(NPU,即AI處理器),乃至更專用的ASIC出現,都是這類思路。
CPU、GPU、NPU、FPGA等不同類型的晶片各司其職,Intel這兩年一直在推行所謂的「XPU」策略就是用不同類型的處理器去做不同的事情,「整合起來各取所需,用組合拳會好過用一種武器去解決所有問題。」宋繼強說。Intel的晶片產品就涵蓋了幾個大類,Core CPU、Xe GPU,以及透過收購獲得的AI晶片Habana等。
另外針對不同類型的晶片,可能還有更具體的最佳化方案。如當代CPU普遍加入AVX512指令,本質上是特別針對深度學習做加強。「專用」的不一定是處理器,也可以是處理器內的某些特定單元,甚至固定功能單元,就好像GPU中加入專用的光線追蹤單元一樣,這是當代處理器普遍都在做的一件事。
(2)從電晶體、晶片結構層面來看,電晶體的尺寸現在仍然在縮減過程中,只不過縮減幅度相比過去變小了——而且為緩解電晶體性能的下降,需要有各種不同的技術來輔助尺寸變小。比如說在22nm節點之後,電晶體變為FinFET結構,在3nm之後,電晶體即將演變為Gate All Around FET結構。最終會演化為互補FET (CFET),其本質都是電晶體本身充分利用Z軸,來實現微縮性能的提升。
劉明認為,「除了基礎元件的變革,IC現在的發展還是比較多元化,包括新材料的引進、元件結構革新,也包括微影技術。長期賴以微縮的基本手段,現在也在發生巨大的變化,特別是未來3D的異質整合。這些多元技術的協同發展,都為晶片整體性能提升帶來了很好的增益。」
他並指出,「從電晶體級、到晶圓級,再到晶片堆疊、引線接合(lead bonding),精準度從毫米向奈米演進,互連密度大大提升。」從晶圓/裸晶的層面來看,則是眾所周知的朝more than moore’s law這樣的路線發展,比如把兩片裸晶疊起來。現在很熱門的chiplet技術就是比較典型的並不依賴於傳統電晶體尺寸微縮,來彈性擴展性能的方案。
台積電和Intel這兩年都在大推將不同類型的裸晶,異質整合的技術。2.5D封裝方案典型如台積電的CoWoS,Intel的EMIB,而在3D堆疊上,Intel的Core LakeField晶片就是用3D Foveros方案,將不同的裸晶疊在一起,甚至可以實現兩片運算裸晶的堆疊、互連。
之前的文章也提到過AMD剛發佈的3D V-Cache,將CPU的L3 cache裸晶疊在運算裸晶上方,將處理器的L3 cache大小增大至192MB,對儲存敏感延遲應用的性能提升。相比Intel,台積電這項技術的獨特之處在於裸晶間是以混合接合(hybrid bonding)的方式互連,而不是micro-bump,做到更小的打線間距,以及晶片之間數十倍通訊性能和效率提升。
這些方案也不直接依賴傳統的電晶體微縮方案。這裡實際上還有一個方面,即新材料的導入專家們沒有在論壇上多說,本文也略過不談。
1,000倍的性能提升
劉明談到,當電晶體微縮的空間沒有那麼大的時候,產業界傾向於採用新的策略來評價技術——「PPACt」——即Powe r(功耗)、Performance (性能)、Cost/Area-Time (成本/面積-時間)。t指的具體是time-to-market,理論上應該也屬於成本的一部分。
電晶體微縮方案失效以後,「多元化的技術變革,依然會讓IC性能得到進一步的提升。」劉明說,「根據預測,這些技術即使不再做尺寸微縮,也會讓IC的晶片性能做到500~1,000倍的提升,到2035年實現Zetta Flops的系統性能水準。且超算的發展還可以一如既往地前進;單裸晶儲存容量變得越來越大,IC依然會為產業發展提供基礎。」
500~1,000倍的預測來自DARPA,感覺有些過於樂觀。因為其中的不少技術存在比較大的邊際遞減效應,而且有更實際的工程問題待解決,比如運算裸晶疊層的散熱問題——即便業界對於這類工程問題的探討也始終在持續。
不過1,000倍的性能提升,的確說明摩爾定律的終結並不能代表第三次科技革命的終結,而且還有相當大的發展空間。尤其本文談的主要是AI晶片,而不是更具通用性的CPU。
矽光、記憶體內運算和神經型態運算
在非傳統發展路線上(以上內容都屬於半導體製造的常規思路),WAIC晶片論壇上宋繼強和劉明都提到了一些頗具代表性的技術方向(雖然這可能與他們自己的業務方向或研究方向有很大的關係)。這些技術可能尚未大規模推廣,或者仍在商業化的極早期。
(1)近記憶體運算和記憶體內運算:處理器性能和效率如今面臨的瓶頸,很大程度並不在單純的運算階段,而在資料傳輸和儲存方面——這也是共識。所以提升資料的傳輸和存取效率,可能是提升整體系統性能時,一個非常靠譜的思路。
這兩年市場上的處理器產品用「近記憶體運算」(near-memory computing)思路的,應該不在少數。所謂的近記憶體運算,就是讓儲存(如cache、memory)單元更靠近運算單元。CPU的多層cache結構(L1、L2、L3),以及電腦處理器cache、記憶體、硬碟這種多層儲存結構是常規。而「近記憶體運算」主要在於究竟有多「近」,cache記憶體有利於隱藏當代電腦架構中延遲和頻寬的局限性。
這兩年在近記憶體運算方面比較有代表性的,一是AMD——比如前文提到3D V-cache增大處理器的cache容量,還有其GPU不僅在裸晶內導入了Infinity Cache這種類似L3 cache的結構,也更早應用了HBM2記憶體方案。這些實踐都表明,儲存方面的革新的確能帶來性能的提升。
另外一個例子則是Graphcore的IPU處理器:IPU的特點之一是在裸晶內堆了相當多的cache資源,cache容量遠大於一般的GPU和AI晶片——也就避免了頻繁的訪問外部儲存資源的操作,極大提升頻寬、降低延遲和功耗。
近記憶體運算的本質仍然是馮紐曼架構(Von Neumann architecture)的延續。「在做處理的過程中,多層級的儲存結構,資料的搬運不僅僅在處理和儲存之間,還在不同的儲存層級之間。這樣頻繁的資料搬運帶來了頻寬延遲、功耗的問題。也就有了我們經常說的運算體系內的儲存牆的問題。」劉明說。
構建非馮(non-von Neumann)架構,把傳統的、以運算為中心的馮氏架構,變換一種新的運算範式。把部分運算力下推到儲存。這便是記憶體內運算(in-memory computing)的概念。
記憶體內運算的就現在看來還是比較新,也有稱其為「存算一體」。通常理解為在記憶體中嵌入演算法,儲存單元本身就有運算能力,理論上消除資料存取的延遲和功耗。記憶體內運算這個概念似乎這在資料爆炸時代格外醒目,畢竟可極大減少海量資料的移動操作。
其實記憶體內運算的概念都還沒有非常明確的定義。現階段它可能的內涵至少涉及到在儲記憶體內部,部分執行資料處理工作;主要應用於神經網路(因為非常契合神經網路的工作方式),以及這類晶片具體的工作方法上,可能更傾向於神經型態運算(neuromorphic computing)。
對於AI晶片而言,記憶體內運算的確是很好的思路。一般的GPU和AI晶片執行AI負載時,有比較頻繁的資料存取操作,這對性能和功耗都有影響。不過記憶體內運算的具體實施方案,在市場上也是五花八門,早期比較具有代表性的Mythic導入了一種矩陣乘的儲存架構,用40nm嵌入式NOR,在儲記憶體內部執行運算,不過替換掉了數位週邊電路,改用類比的方式。在陣列內部進行模擬運算。這家公司之前得到過美國國防部的資金支援。
劉明列舉了近記憶體運算和記憶體內運算兩種方案的例子。其中,近記憶體運算的這個方案應該和AMD的3D V-cache比較類似,把儲存裸晶和運算裸晶疊起來。
劉明指出,「這是我們最近的一個工作,採用hybrid bonding的技術,與矽通孔(TSV)做比較,hybrid bonding功耗是0.8pJ/bit,而TSV是4pJ/bit。延遲方面,hybrid bonding只有0.5ns,而TSV方案是3ns。」台積電在3D堆疊方面的領先優勢其實也體現在hybrid bonding混合鍵合上,前文也提到了它具備更高的互連密度和效率。
另外這套方案還將DRAM刷新頻率提高了一倍,從64ms提高至128ms,以降低功耗。「應對刷新率變慢出現拖尾bit,我們引入RRAM TCAM索引這些tail bits」劉明說。
記憶體內運算方面,「傳統運算是用布林邏輯,一個4位元的乘法需要用到幾百個電晶體,這個過程中需要進行資料來回的移動。記憶體內運算是利用單一元件的歐姆定律來完成一次乘法,然後利用基爾霍夫定律完成列的累加。」劉明表示,「這對於今天深度學習的矩陣乘非常有利。它是原位的運算和儲存,沒有資料搬運。」這是記憶體內運算的常規思路。
「無論是基於SRAM,還是基於新型記憶體,相比近記憶體運算都有明顯優勢,」劉明認為。下圖是記憶體內運算和近記憶體運算,精準度、能效等方面的對比,記憶體內運算架構對於低精準度運算有價值。
下圖則總結了業內主要的一些記憶體內運算研究,在精確度和能效方面的對應關係。劉明表示,「需要高精確度、高運算力的情況下,近記憶體運算目前還是有優勢。不過記憶體內運算是更新的技術,這幾年的進步也非常快。」
去年阿里達摩院發佈2020年十大科技趨勢中,有一個就是存算一體突破AI算力瓶頸。不過記憶體內運算面臨的商用挑戰也一點都不小。記憶體內運算的通常思路都是類比電路的運算方式,這對記憶體、運算單元設計都需要做工程上的考量。與此同時這樣的晶片究竟由誰來造也是個問題:是記憶體廠商,還是數文書處理器廠商?(三星推過記憶體內運算晶片,三星、Intel垂直整合型企業似乎很適合做記憶體內運算…)
(2)神經型態運算:神經型態運算和記憶體內運算一樣,也是新興技術的熱門話題,這項技術有時也叫作compute in memory,可以認為它是記憶體內運算的某種發展方向。神經型態和一般神經網路AI晶片的差異是,這種結構更偏「類人腦」。
進行神經型態研究的企業現在也逐漸變得多起來,劉明也提到了AI晶片「最終的理想是在結構層次模仿腦,元件層次逼近腦,功能層次超越人腦」的「類腦運算」。Intel是比較早關注神經型態運算研究的企業之一。
傳說中的Intel Loihi就是比較典型存算一體的架構,「這片裸晶裡面包含128個小核心,每個核心用於模擬1,024個神經元的運算結構。」宋繼強說,「這樣一塊晶片大概可以類比13萬個神經元。我們做到的是把768個晶片再連起來,構成接近1億神經元的系統,讓學術界的夥伴去試用。」
「它和深度學習加速器相比,沒有任何浮點運算——就像人腦裡面沒有乘加器。所以其學習和訓練方法是採用一種名為spike neutral network的路線,功耗很低,也可以訓練出做視覺辨識、語言辨識和其他種類的模型。」宋繼強認為,不採用同步時脈,「刺激的時候就是一個非同步電動勢,只有工作部分耗電,功耗是現在深度學習加速晶片的千分之一。」
「而且未來我們可以對不同區域做劃分,比如這兒是視覺區、那兒是語言區、那兒是觸覺區,同時進行多模態訓練,互相之間產生關聯。這是現在的深度學習模型無法比擬的。」宋繼強說。這種神經型態運算晶片,似乎也是Intel在XPU方向上探索不同架構運算的方向之一。
(2)微型化矽光:這個技術方向可能在層級上更偏高了一些,不再晶片架構層級,不過仍然值得一提。去年Intel在Labs Day上特別談到了自己在矽光(Silicon Photonics)的一些技術進展。其實矽光技術在連接資料中心的交換機方面,已有應用了,發出資料時,連接埠處會有個收發器把電訊號轉為光訊號,透過光纖來傳輸資料,另一端光訊號再轉為電訊號。不過傳統的光收發器成本都比較高,內部元件數量大,尺寸也就比較大。
Intel在整合化的矽光(IIIV族monolithic的光學整合化方案)方面應該是商業化走在比較前列的,就是把光和電子相關的組成部分高度整合到晶片上,用IC製造技術。未來的光通訊不只是資料中心機架到機架之間,也可以下沉到板級——就跟現在傳統的電I/O一樣。電互連的主要問題是功耗太大,也就是所謂的I/O功耗牆,這是這類微型化矽光元件存在的重要價值。
這其中存在的技術挑戰還是比較多,如做資料的光訊號調變的調變器調變器,據說Intel的技術使其實現了1,000倍的縮小;還有在接收端需要有個探測器(detector)轉換光訊號,用所謂的全矽微環(micro-ring)結構,實現矽對光的檢測能力;波分複用技術實現頻寬倍增,以及把矽光和CMOS晶片做整合等。
Intel認為,把矽光模組與運算資源整合,就能打破必須帶更多I/O接腳做更大尺寸處理器的這種趨勢。矽光能夠實現的是更低的功耗、更大的頻寬、更小的接腳數量和尺寸。在跨處理器、跨伺服器節點之間的資料互動上,這類技術還是頗具前景,Intel此前說目標是實現每根光纖1Tbps的速率,並且能效在1pJ/bit,最遠距離1km,這在非本地傳輸上是很理想的數字。
還有軟體…
除了AI晶片本身,從整個生態的角度,包括AI感知到運算的整個鏈條上的其他組成部分,都有促成性能和效率提升的餘地。比如這兩年Nvidia從軟體層面,針對AI運算的中間層、庫做了大量最佳化。相同的底層硬體,透過軟體最佳化就能實現幾倍的性能提升。
宋繼強說,「我們發現軟體最佳化與否,在同一個硬體上可以達到百倍的性能差距。」這其中的餘量還是比較大。
在AI開發生態上,雖然Nvidia是最具發言權的;但從戰略角度來看,像Intel這種研發CPU、GPU、FPGA、ASIC,甚至還有神經型態運算處理器的企業而言,不同處理器統一開發生態可能更具前瞻性。Intel有個稱oneAPI的軟體平台,用一套API實現不同硬體性能埠的對接。這類策略對廠商的軟體框架構建能力是非常大的考驗——也極大程度關乎底層晶片的執行效率。
在摩爾定律放緩、電晶體尺寸微縮變慢甚至不縮小的前提下,處理器架構革新、異質整合與2.5D/3D封裝技術依然可以達成1,000倍的性能提升;而一些新的技術方向,包括近記憶體運算、記憶體內運算和微型矽光,能夠在資料訪存、傳輸方面產生新的價值;神經型態運算這種類腦運算方式,是實現AI運算的目標;軟體層面的最佳化,也能夠帶動AI性能的成倍增長。所以即便摩爾定律嚴重放緩,AI晶片的性能、效率提升在上面提到的這麼多方案加持下,終將在未來很長一段時間內持續飛越。這第三(四)次科技革命恐怕還很難停歇。
資料來源:https://www.eettaiwan.com/20210726nt61-ai-computing/?fbclid=IwAR3BaorLm9rL2s1ff6cNkL6Z7dK8Q96XulQPzuMQ_Yky9H_EmLsBpjBOsWg