3/18-4/10太陽花學運六週年🌻
太陽花學運(318學運 佔領國會事件)
發生在2014年 為期將近一個月
是大學生和公民團體發起的社會運動
也是1980年代以來最大規模的公民不服從運動
為了捍衛臺灣的民主法治「自己的國家自己救」
3/17下午 國民黨立委張慶忠以30秒宣布完成
原本應逐條審...
3/18-4/10太陽花學運六週年🌻
太陽花學運(318學運 佔領國會事件)
發生在2014年 為期將近一個月
是大學生和公民團體發起的社會運動
也是1980年代以來最大規模的公民不服從運動
為了捍衛臺灣的民主法治「自己的國家自己救」
3/17下午 國民黨立委張慶忠以30秒宣布完成
原本應逐條審查的《海峽兩岸服務貿易協議》
引發長期關注議題的學生及社運團體不滿
除了缺乏透明度的黑箱作業有爭議
服貿被認為會使臺灣經濟更依賴中國
臺灣主權更容易受到中國的政治壓力影響
害怕臺灣會變成第二個香港(服貿就是賣臺協議)
這種想法不是在反送中後才出現 當時就很擔心了
3/18晚上 立法院首次被佔領
學生開始長達二十幾天佔領立法院的行動
而全國性的聲援及抗議人數快速上升
各行各業湧入立法院前靜坐抗議
讓大家在教室外上了一堂真正的公民課
3/21「當獨裁成為事實 革命就是義務」
這句話被噴在立法院外牆上
3/23晚上 部分群眾決定佔領行政院
因總統馬英九及行政院長江宜樺拒絕退回服貿
群眾想以此行動加強施壓政府的力道
這引發學運人士的正反意見爭論
更把學運推升至與國民黨政府正面衝突的層次
行政院被佔領後 馬江兩人要求增派鎮暴警察支援
並下令強制暴力驅離 群眾遭到警察攻擊而頭破血流
(雖然沒有港警可怕 但還是很惡劣)
3/24凌晨 警方持續展開驅離與逮捕行動
鎮暴水車向群眾噴灑強力水柱 行政院被清場一空
部分媒體以血腥鎮壓來形容驅離行動
國家濫用暴力 違反比例原則 就是犯罪行為
但江宜樺反而手無寸鐵的群眾提告欸
(2016年民進黨執政才對學運人士全面撤告)
江因此被台大政治系學生稱為「一流教授 三流政客」
政治果然是照妖鏡 他最近受訪時 甚至毫無悔意的說
「驅離太陽花群眾,我不僅不後悔,
而且我覺得我再也沒有下過比這個,更正確的決定」
3月30日 在凱達格蘭大道上舉辦反服貿遊行
標語為「捍衛民主 退回服貿 人民站出來」
活動呼籲民眾穿著黑色衣服(黑衫軍 黑潮)
3月31日 有了針對國民黨立委的 割闌尾計畫
最後因罷免門檻過高 藍委沒能被淘汰
(蔡正元 吳育昇 林鴻池 黃昭順 林國正 蔡錦隆)
在學運後期出現 返還國會運動(反反服貿運動)
也就是反對學運的運動 參與者主要來自泛藍團體
像是4月1日的白狼張安樂國會示威事件
4月6日 立法院長王金平有所讓步
表態支持《兩岸協議監督條例》立法
推遲《海峽兩岸服務貿易協議》的審查
4月7日 學生宣布 已完成階段性任務
同意於4月10日晚上退出立法院
而當天有紀念臺獨人士鄭南榕的活動
-
太陽花學運的數項訴求為
退回《海峽兩岸服務貿易協議》
建立海峽兩岸協議監督機制(立法時應納入民間版)
先立法再審查 召開公民憲政會議等
多數訴求與臺灣的特殊地位有關
導致學運被視為實質上的臺獨運動
對臺灣的政治生態產生巨大影響
年輕人對於臺灣獨立的認同感快速上升
我認識的多數人都是此時才覺醒
不過也有至今沒打算清醒的少數人
在學運之後 間接促成2014年九合一大選
及2016年總統大選 國民黨的完全潰敗
幸好當時太陽花學運出現了
不然臺灣極可能已經被溫水煮青蛙的賣給中國
大概就不會有2016年的總統大選了
比起野百合學運是對抗一個中國黨
太陽花學運要一次對抗兩個中國黨
雖然政治環境比以前自由 網路比以前方便
使這次學運比更容易得到人們的支持
但對抗兩個中國黨 學運人士壓力可能更大吧
真心佩服主導學運的勇者們(例如林飛帆 陳為廷)
話說鹿茸 香蕉 太陽餅 因為學運被封為臺灣新三寶
馬英九 邱毅 蕭家淇 江宜樺 成為服貿F4
他們的失言成為學運最有話題的笑柄
因為學運出現很多表達訴求的藝術創作
被視為美學與政治的實踐案例 是很有創意的學運
太陽花居然六年了 時光飛逝
想當年去參與歷史時 覺得社運管制人潮
比跨年疏散人潮還有秩序 超厲害
(圖滑到後面有以前學運時拍的照片)
-
部分學運人士在2015年組成時代力量
提出進步價值 公開透明 臺灣獨立等主張
目標是在立法院扮演關鍵的改革勢力
防止民進黨腐化的監督角色 及本土左派的制衡力量
時力原本是政壇明日之星
卻因為政黨核心價值不夠明確
(政治主張跟民進黨相去不遠)
而產生黨內的路線之爭(是否親綠)
最後導致多人退黨(例如林昶佐 洪慈庸)
時力成為黃國昌黨(就像民眾黨是柯文哲黨)
想成為超越藍綠的第三勢力(不當小綠)
時力在2016年取得5席立委席次 到2020年剩3席
因為時力已變質與式微 再加上票被民眾黨瓜分
-
柯旗化:「臺灣一定會獨立,
為了要迎接臺灣獨立的日子,我才活著。」
這句完全是我的心聲 也是我想繼續活下去的原因
你有可能不太認識柯旗化
但很可能讀過他出的新英文法教科書
他是經歷過白色恐怖的人
而他的自傳叫做《臺灣監獄島》
活在中國陰影下的臺灣 其實還是監獄島
希望會有見證臺灣變成自由島的一天!
#太陽花學運 #318學運 #台灣 #台灣獨立 #台獨 #反服貿 #反黑箱 #反送中 #公民不服從 #社會運動 #立法院 #行政院 #民進黨 #時代力量 #林飛帆 #陳為廷 #黃國昌 #賴品妤 #吳崢 #鄭南榕 #柯旗化 #國民黨 #馬英九 #江宜樺 #鹿茸 #香蕉 #太陽餅 #插畫系列☀ #政治即生活👄 #sixmouths👄
生態系的組成層次 在 WorkFace Taipei Facebook 的最讚貼文
【創變夜回顧】抽象的美感進化就交由文字風景來實現!
🎙justfont 多媒體設計師 陳巧育 Seed Chen
8月的 #WorkFace 主題例會中,我們邀請台灣字體設計領頭新創 justfont 的多媒體設計師 巧育,和我們一起討論在近幾年備受關注的「美感素養」議題中, justfont 如何從 #黃金圈 的定義企業核心理念,並逐步推行於各項專案企劃中,讓具有創變精神的「進化」概念在美感意識中落實展現!
👉讓我們一起回顧精彩的線上創造時刻...
justfont認為這個時代每個人都是字型的使用者,不論是跟客戶進行的簡報或是自己使用的履歷,從微觀來看每個人創造的記憶片刻,都是由選擇使用的文字所組成,而宏觀來說街上的每一眼風景,也都是不同的字型組成,如何成就更好的文字風景,是justfont推廣字型知識、字型教育的核心初衷!
在字體教育的溝通上,justfont以分級漏斗的形式,分別向一般大眾、設計美學與媒體傳播和字體設計專業人員,三個不同層次的溝通受眾,傳達由淺而深的文字意識議題,從字體與日常的應用,到認識字型與配合意圖的美學字型應用能力,最終希望培養出專業的字體設計師,從廣泛的文字設計生態系著手,健全造字與字體設計專業的產業...
👊點開留言處閱讀更多!
#WorkFaceTaipei #週四例會 #創變夜回顧
#創變者社群 #進化
生態系的組成層次 在 媽媽監督核電廠聯盟 Facebook 的最讚貼文
塑化、鋼鐵業的大麻煩!歐美開徵「碳稅」箭在弦上 台灣還有哪些沒準備好?(08/09/2021 今周刊)
歐盟與美國在近期釋放出將課徵碳稅的計畫,歐盟甚至提出全球第一個「碳邊境稅」計畫,尤其是對低環保標準國家的水泥、鋼鐵、鋁等產品課徵碳稅,一旦通過此法案,開徵碳稅將從2026年起分階段實施;此外,美國國會也正在研究推動對高碳排進口產品開徵碳稅的可能性,以實現減少溫室氣體排放的目標。
以出口貿易為主的台灣製造業可謂壓力山大!尤其是塑化、鋼鐵,甚至是資通訊產業強烈意識到,在整個製造生產環節,必須大幅降低他們的排碳指數,提高乾淨能源的使用,必要時必須投資於新的碳權交易作為避險工具。簡言之,降低碳排對於台灣的一級製造業而言,將攸關企業的國際競爭力及未來的行業發展。
隨著全球碳中和壓力和公司內部對ESG的日益關注,企業或機構投資人正在轉向進入碳排放交易市場。在歐洲,碳權交易基金市場是過去一年表現最好的商品市場之一,僅次於木材。歐洲碳權價格在過去一年中漲了數倍,並創下歷史新高。下圖是國際知名KraneShares全球碳權ETF價格走勢。
既然世界各國已經陸續訂出碳中和的達標時間表,那麼完整的碳權交易市場框架,建構企業對於碳權供給與需求的平台,將可以促進整個碳權市場的交易效率以及價格透明度,最終達到碳中和的目標。
完整交易市場框架 有助於企業碳權買賣
國際碳權交易的合約規格,基本上分為兩種(Carbon Credit)類型,一是自願減排(VER),在非規範或自願市場中交換的碳抵減;二是經認證的減排(CER),通過監管框架創建的排放單位(或信用額度)。基於此兩大類碳權規格,所謂完整的碳權交易市場框架,必須包含三個層次的交易市場。
1、除碳(或碳抵消)現貨市場(Carbon Offset Spot Market Place):主要目的是解決產業的碳權供需買賣、碳權國際認證問題及協助企業找到各種潔淨能源、技術資源等等。
2、碳衍生品交易市場(Carbon Derivative Exchange):主要目的是碳權價格發現及投資機構(或企業)的避險需求。
3、數字化的綠色金融交易所(Digital Green Finance Exchange):主要目的是容易進行跨國碳權買賣、加速碳權市場發行及交易效率、降低交易成本。
第一層是市場除碳(或碳抵消)現貨市場,例如北歐的Puro.Earth、新加坡今年5月剛成立的Climate Impact X(簡稱CIX)交易所,以及上海環境能源交易所,這三家交易所都屬於碳權現貨交易市場。首先我們來介紹Puro.Earth。
Puro.earth是世界上第一個提供工業除碳工具的市場,這些工具可通過開放的線上平台進行驗證和交易。該平台已經為一些世界領先的公司提供除碳服務,包括微軟和SEB(瑞典北歐斯安銀行)等等。
今年6月,美國那斯達克併購了這個除碳交易平台。那斯達克與Puro.earth的合作,將使全球企業能夠進入一個獨特的除碳市場,並使Puro.earth能夠通過那斯達克網路和技術平台,創建一個全球化、透明和經過認證的除碳現貨市場。
Puro.earth擁有嚴格的碳權驗證流程和驗證除碳方法的可信度,那斯達克將與 Puro.earth合作,通過建立一個由產業、學術界、買方和供應商代表組成的外部諮詢委員會,進一步加強對綠能與新除碳技術方法的檢驗。Puro.earth是世界上第一個專注於除碳的B2B市場。
至於Climate Impact X是一家由星展銀行、新加坡交易所、渣打銀行和淡馬錫聯合成立的碳權交易市場。Climate Impact X主要包含兩項服務功能,一是提供企業投資自然保育計畫;二是提供企業交易大規模高品質碳權的交易場所,該交易平台主要服務對象是跨國公司和機構投資人。
今年5月,新加坡金融管理局局長孟文能(Ravi Menon)在媒體表示,CIX有望解決東南亞「碳權交易市場分散」、「市場流動性低且碳權品質堪慮」的問題。
國家級碳權交易平台上路 中國進一步實現碳中和
第三家是近期開始交易標準化碳權合約的上海環境能源交易所。2021年7月7日,中國國務院常務會議審議決定7月擇機啟動中國碳排放權交易的標準交易合約。最後,中國國家級碳權交易平台於7月16日正式開市。
上海環境能源交易所在其官網上發文表示,根據生態環境部相關規定,碳排放權交易機構負責組織開展全國碳排放權集中統一交易。全國碳排放權交易機構成立前,由上海環境能源交易所承擔全國碳排放權交易系統帳戶開立和運行維護等具體工作。
中國為實現碳達峰、碳中和目標又邁出實質一步,此次選擇發電行業作為碳市場的優先實施行業,後續石化、化工、建材、鋼鐵、有色、造紙、航空等高排放行業亦將陸續跟進。
第二層市場是碳衍生品交易市場,例如那斯達克商品交易所(Commodities Traded on Nasdaq),這是那斯達克在北歐的單一金融能源市場。在2010年11月1日之前,它被稱為「北方池」(Nord Pool)。
「北方池」是歐盟最大的電力衍生品交易所,也是歐盟排放限額(EUAs)和全球認證減排(CER)交易的第二大交易所,這個交易所提供各類能源的衍生品交易,例如天然氣、潔淨綠能等等,主要提供企業及機構進行期貨、選擇權避險買賣。
第三層市場是數字化綠色金融交易所,例如持有新加坡合規交易所牌照的Cyberdyne Tech Exchange (CTX)。CTX是獲得新加坡金融管理局批准的牌照並受其管制的數位資產及綠色金融交易所。該交易所成立於2018年,為合格的資產所有者和機構投資人,提供全方位服務基礎設施,包括資產型及綠色金融產品通證的初次發行、二級交易、結算和托管。
總部位於新加坡的CTX交易所,其目標是成為全球綠色金融中心,以及成為第一家為發行商和投資者提供碳足跡揭露的交易所。就在5月份,CTX獲得了新加坡金融管理局批准的資本市場服務牌照,及認可市場運營商牌照。鏈聞媒體曾報導,CTX即將推出的資產支持代幣交易所,預計開啓其專有的碳中和代幣(CNTs)跨境交易。
世界主要先進工業生產大國,陸續訂出碳中和的具體實現目標及時間表,台灣在加速邁向碳中和的過程,必須考慮完善整體碳權交易市場框架,一次到位、具體佈署。產業、金融機構、碳資產管理公司、諮詢機構、主管機關、碳權監測機構共同合作,才能有效協助企業面對未來減碳的挑戰,以及達到碳中和甚至零排碳的目標!
完整內容請見:
https://www.businesstoday.com.tw/article/category/183012/post/202108090001
♡
生態系的組成層次 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
摩爾定律放緩 靠啥提升AI晶片運算力?
作者 : 黃燁鋒,EE Times China
2021-07-26
對於電子科技革命的即將終結的說法,一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續,也就意味著資訊技術的整棟大樓建造都將出現停滯,那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有的,但這波革命始終也沒有結束。AI技術本質上仍然是第三次科技革命的延續……
人工智慧(AI)的技術發展,被很多人形容為第四次科技革命。前三次科技革命,分別是蒸汽、電氣、資訊技術(電子科技)革命。彷彿這“第四次”有很多種說辭,比如有人說第四次科技革命是生物技術革命,還有人說是量子技術革命。但既然AI也是第四次科技革命之一的候選技術,而且作為資訊技術的組成部分,卻又獨立於資訊技術,即表示它有獨到之處。
電子科技革命的即將終結,一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續,也就意味著資訊技術的整棟大樓建造都將出現停滯,那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有,但這波革命始終也沒有結束。
AI技術本質上仍然是第三次科技革命的延續,它的發展也依託於幾十年來半導體科技的進步。這些年出現了不少專門的AI晶片——而且市場參與者相眾多。當某一個類別的技術發展到出現一種專門的處理器為之服務的程度,那麼這個領域自然就不可小覷,就像當年GPU出現專門為圖形運算服務一樣。
所以AI晶片被形容為CPU、GPU之後的第三大類電腦處理器。AI專用處理器的出現,很大程度上也是因為摩爾定律的發展進入緩慢期:電晶體的尺寸縮減速度,已經無法滿足需求,所以就必須有某種專用架構(DSA)出現,以快速提升晶片效率,也才有了專門的AI晶片。
另一方面,摩爾定律的延緩也成為AI晶片發展的桎梏。在摩爾定律和登納德縮放比例定律(Dennard Scaling)發展的前期,電晶體製程進步為晶片帶來了相當大的助益,那是「happy scaling down」的時代——CPU、GPU都是這個時代受益,不過Dennard Scaling早在45nm時期就失效了。
AI晶片作為第三大類處理器,在這波發展中沒有趕上happy scaling down的好時機。與此同時,AI應用對運算力的需求越來越貪婪。今年WAIC晶片論壇圓桌討論環節,燧原科技創始人暨CEO趙立東說:「現在訓練的GPT-3模型有1750億參數,接近人腦神經元數量,我以為這是最大的模型了,要千張Nvidia的GPU卡才能做。談到AI運算力需求、模型大小的問題,說最大模型超過萬億參數,又是10倍。」
英特爾(Intel)研究院副總裁、中國研究院院長宋繼強說:「前兩年用GPU訓練一個大規模的深度學習模型,其碳排放量相當於5台美式車整個生命週期產生的碳排量。」這也說明了AI運算力需求的貪婪,以及提供運算力的AI晶片不夠高效。
不過作為產業的底層驅動力,半導體製造技術仍源源不斷地為AI發展提供推力。本文將討論WAIC晶片論壇上聽到,針對這個問題的一些前瞻性解決方案——有些已經實現,有些則可能有待時代驗證。
XPU、摩爾定律和異質整合
「電腦產業中的貝爾定律,是說能效每提高1,000倍,就會衍生出一種新的運算形態。」中科院院士劉明在論壇上說,「若每瓦功耗只能支撐1KOPS的運算,當時的這種運算形態是超算;到了智慧型手機時代,能效就提高到每瓦1TOPS;未來的智慧終端我們要達到每瓦1POPS。 這對IC提出了非常高的要求,如果依然沿著CMOS這條路去走,當然可以,但會比較艱辛。」
針對性能和效率提升,除了尺寸微縮,半導體產業比較常見的思路是電晶體結構、晶片結構、材料等方面的最佳化,以及處理架構的革新。
(1)AI晶片本身其實就是對處理器架構的革新,從運算架構的層面來看,針對不同的應用方向造不同架構的處理器是常規,更專用的處理器能促成效率和性能的成倍增長,而不需要依賴於電晶體尺寸的微縮。比如GPU、神經網路處理器(NPU,即AI處理器),乃至更專用的ASIC出現,都是這類思路。
CPU、GPU、NPU、FPGA等不同類型的晶片各司其職,Intel這兩年一直在推行所謂的「XPU」策略就是用不同類型的處理器去做不同的事情,「整合起來各取所需,用組合拳會好過用一種武器去解決所有問題。」宋繼強說。Intel的晶片產品就涵蓋了幾個大類,Core CPU、Xe GPU,以及透過收購獲得的AI晶片Habana等。
另外針對不同類型的晶片,可能還有更具體的最佳化方案。如當代CPU普遍加入AVX512指令,本質上是特別針對深度學習做加強。「專用」的不一定是處理器,也可以是處理器內的某些特定單元,甚至固定功能單元,就好像GPU中加入專用的光線追蹤單元一樣,這是當代處理器普遍都在做的一件事。
(2)從電晶體、晶片結構層面來看,電晶體的尺寸現在仍然在縮減過程中,只不過縮減幅度相比過去變小了——而且為緩解電晶體性能的下降,需要有各種不同的技術來輔助尺寸變小。比如說在22nm節點之後,電晶體變為FinFET結構,在3nm之後,電晶體即將演變為Gate All Around FET結構。最終會演化為互補FET (CFET),其本質都是電晶體本身充分利用Z軸,來實現微縮性能的提升。
劉明認為,「除了基礎元件的變革,IC現在的發展還是比較多元化,包括新材料的引進、元件結構革新,也包括微影技術。長期賴以微縮的基本手段,現在也在發生巨大的變化,特別是未來3D的異質整合。這些多元技術的協同發展,都為晶片整體性能提升帶來了很好的增益。」
他並指出,「從電晶體級、到晶圓級,再到晶片堆疊、引線接合(lead bonding),精準度從毫米向奈米演進,互連密度大大提升。」從晶圓/裸晶的層面來看,則是眾所周知的朝more than moore’s law這樣的路線發展,比如把兩片裸晶疊起來。現在很熱門的chiplet技術就是比較典型的並不依賴於傳統電晶體尺寸微縮,來彈性擴展性能的方案。
台積電和Intel這兩年都在大推將不同類型的裸晶,異質整合的技術。2.5D封裝方案典型如台積電的CoWoS,Intel的EMIB,而在3D堆疊上,Intel的Core LakeField晶片就是用3D Foveros方案,將不同的裸晶疊在一起,甚至可以實現兩片運算裸晶的堆疊、互連。
之前的文章也提到過AMD剛發佈的3D V-Cache,將CPU的L3 cache裸晶疊在運算裸晶上方,將處理器的L3 cache大小增大至192MB,對儲存敏感延遲應用的性能提升。相比Intel,台積電這項技術的獨特之處在於裸晶間是以混合接合(hybrid bonding)的方式互連,而不是micro-bump,做到更小的打線間距,以及晶片之間數十倍通訊性能和效率提升。
這些方案也不直接依賴傳統的電晶體微縮方案。這裡實際上還有一個方面,即新材料的導入專家們沒有在論壇上多說,本文也略過不談。
1,000倍的性能提升
劉明談到,當電晶體微縮的空間沒有那麼大的時候,產業界傾向於採用新的策略來評價技術——「PPACt」——即Powe r(功耗)、Performance (性能)、Cost/Area-Time (成本/面積-時間)。t指的具體是time-to-market,理論上應該也屬於成本的一部分。
電晶體微縮方案失效以後,「多元化的技術變革,依然會讓IC性能得到進一步的提升。」劉明說,「根據預測,這些技術即使不再做尺寸微縮,也會讓IC的晶片性能做到500~1,000倍的提升,到2035年實現Zetta Flops的系統性能水準。且超算的發展還可以一如既往地前進;單裸晶儲存容量變得越來越大,IC依然會為產業發展提供基礎。」
500~1,000倍的預測來自DARPA,感覺有些過於樂觀。因為其中的不少技術存在比較大的邊際遞減效應,而且有更實際的工程問題待解決,比如運算裸晶疊層的散熱問題——即便業界對於這類工程問題的探討也始終在持續。
不過1,000倍的性能提升,的確說明摩爾定律的終結並不能代表第三次科技革命的終結,而且還有相當大的發展空間。尤其本文談的主要是AI晶片,而不是更具通用性的CPU。
矽光、記憶體內運算和神經型態運算
在非傳統發展路線上(以上內容都屬於半導體製造的常規思路),WAIC晶片論壇上宋繼強和劉明都提到了一些頗具代表性的技術方向(雖然這可能與他們自己的業務方向或研究方向有很大的關係)。這些技術可能尚未大規模推廣,或者仍在商業化的極早期。
(1)近記憶體運算和記憶體內運算:處理器性能和效率如今面臨的瓶頸,很大程度並不在單純的運算階段,而在資料傳輸和儲存方面——這也是共識。所以提升資料的傳輸和存取效率,可能是提升整體系統性能時,一個非常靠譜的思路。
這兩年市場上的處理器產品用「近記憶體運算」(near-memory computing)思路的,應該不在少數。所謂的近記憶體運算,就是讓儲存(如cache、memory)單元更靠近運算單元。CPU的多層cache結構(L1、L2、L3),以及電腦處理器cache、記憶體、硬碟這種多層儲存結構是常規。而「近記憶體運算」主要在於究竟有多「近」,cache記憶體有利於隱藏當代電腦架構中延遲和頻寬的局限性。
這兩年在近記憶體運算方面比較有代表性的,一是AMD——比如前文提到3D V-cache增大處理器的cache容量,還有其GPU不僅在裸晶內導入了Infinity Cache這種類似L3 cache的結構,也更早應用了HBM2記憶體方案。這些實踐都表明,儲存方面的革新的確能帶來性能的提升。
另外一個例子則是Graphcore的IPU處理器:IPU的特點之一是在裸晶內堆了相當多的cache資源,cache容量遠大於一般的GPU和AI晶片——也就避免了頻繁的訪問外部儲存資源的操作,極大提升頻寬、降低延遲和功耗。
近記憶體運算的本質仍然是馮紐曼架構(Von Neumann architecture)的延續。「在做處理的過程中,多層級的儲存結構,資料的搬運不僅僅在處理和儲存之間,還在不同的儲存層級之間。這樣頻繁的資料搬運帶來了頻寬延遲、功耗的問題。也就有了我們經常說的運算體系內的儲存牆的問題。」劉明說。
構建非馮(non-von Neumann)架構,把傳統的、以運算為中心的馮氏架構,變換一種新的運算範式。把部分運算力下推到儲存。這便是記憶體內運算(in-memory computing)的概念。
記憶體內運算的就現在看來還是比較新,也有稱其為「存算一體」。通常理解為在記憶體中嵌入演算法,儲存單元本身就有運算能力,理論上消除資料存取的延遲和功耗。記憶體內運算這個概念似乎這在資料爆炸時代格外醒目,畢竟可極大減少海量資料的移動操作。
其實記憶體內運算的概念都還沒有非常明確的定義。現階段它可能的內涵至少涉及到在儲記憶體內部,部分執行資料處理工作;主要應用於神經網路(因為非常契合神經網路的工作方式),以及這類晶片具體的工作方法上,可能更傾向於神經型態運算(neuromorphic computing)。
對於AI晶片而言,記憶體內運算的確是很好的思路。一般的GPU和AI晶片執行AI負載時,有比較頻繁的資料存取操作,這對性能和功耗都有影響。不過記憶體內運算的具體實施方案,在市場上也是五花八門,早期比較具有代表性的Mythic導入了一種矩陣乘的儲存架構,用40nm嵌入式NOR,在儲記憶體內部執行運算,不過替換掉了數位週邊電路,改用類比的方式。在陣列內部進行模擬運算。這家公司之前得到過美國國防部的資金支援。
劉明列舉了近記憶體運算和記憶體內運算兩種方案的例子。其中,近記憶體運算的這個方案應該和AMD的3D V-cache比較類似,把儲存裸晶和運算裸晶疊起來。
劉明指出,「這是我們最近的一個工作,採用hybrid bonding的技術,與矽通孔(TSV)做比較,hybrid bonding功耗是0.8pJ/bit,而TSV是4pJ/bit。延遲方面,hybrid bonding只有0.5ns,而TSV方案是3ns。」台積電在3D堆疊方面的領先優勢其實也體現在hybrid bonding混合鍵合上,前文也提到了它具備更高的互連密度和效率。
另外這套方案還將DRAM刷新頻率提高了一倍,從64ms提高至128ms,以降低功耗。「應對刷新率變慢出現拖尾bit,我們引入RRAM TCAM索引這些tail bits」劉明說。
記憶體內運算方面,「傳統運算是用布林邏輯,一個4位元的乘法需要用到幾百個電晶體,這個過程中需要進行資料來回的移動。記憶體內運算是利用單一元件的歐姆定律來完成一次乘法,然後利用基爾霍夫定律完成列的累加。」劉明表示,「這對於今天深度學習的矩陣乘非常有利。它是原位的運算和儲存,沒有資料搬運。」這是記憶體內運算的常規思路。
「無論是基於SRAM,還是基於新型記憶體,相比近記憶體運算都有明顯優勢,」劉明認為。下圖是記憶體內運算和近記憶體運算,精準度、能效等方面的對比,記憶體內運算架構對於低精準度運算有價值。
下圖則總結了業內主要的一些記憶體內運算研究,在精確度和能效方面的對應關係。劉明表示,「需要高精確度、高運算力的情況下,近記憶體運算目前還是有優勢。不過記憶體內運算是更新的技術,這幾年的進步也非常快。」
去年阿里達摩院發佈2020年十大科技趨勢中,有一個就是存算一體突破AI算力瓶頸。不過記憶體內運算面臨的商用挑戰也一點都不小。記憶體內運算的通常思路都是類比電路的運算方式,這對記憶體、運算單元設計都需要做工程上的考量。與此同時這樣的晶片究竟由誰來造也是個問題:是記憶體廠商,還是數文書處理器廠商?(三星推過記憶體內運算晶片,三星、Intel垂直整合型企業似乎很適合做記憶體內運算…)
(2)神經型態運算:神經型態運算和記憶體內運算一樣,也是新興技術的熱門話題,這項技術有時也叫作compute in memory,可以認為它是記憶體內運算的某種發展方向。神經型態和一般神經網路AI晶片的差異是,這種結構更偏「類人腦」。
進行神經型態研究的企業現在也逐漸變得多起來,劉明也提到了AI晶片「最終的理想是在結構層次模仿腦,元件層次逼近腦,功能層次超越人腦」的「類腦運算」。Intel是比較早關注神經型態運算研究的企業之一。
傳說中的Intel Loihi就是比較典型存算一體的架構,「這片裸晶裡面包含128個小核心,每個核心用於模擬1,024個神經元的運算結構。」宋繼強說,「這樣一塊晶片大概可以類比13萬個神經元。我們做到的是把768個晶片再連起來,構成接近1億神經元的系統,讓學術界的夥伴去試用。」
「它和深度學習加速器相比,沒有任何浮點運算——就像人腦裡面沒有乘加器。所以其學習和訓練方法是採用一種名為spike neutral network的路線,功耗很低,也可以訓練出做視覺辨識、語言辨識和其他種類的模型。」宋繼強認為,不採用同步時脈,「刺激的時候就是一個非同步電動勢,只有工作部分耗電,功耗是現在深度學習加速晶片的千分之一。」
「而且未來我們可以對不同區域做劃分,比如這兒是視覺區、那兒是語言區、那兒是觸覺區,同時進行多模態訓練,互相之間產生關聯。這是現在的深度學習模型無法比擬的。」宋繼強說。這種神經型態運算晶片,似乎也是Intel在XPU方向上探索不同架構運算的方向之一。
(2)微型化矽光:這個技術方向可能在層級上更偏高了一些,不再晶片架構層級,不過仍然值得一提。去年Intel在Labs Day上特別談到了自己在矽光(Silicon Photonics)的一些技術進展。其實矽光技術在連接資料中心的交換機方面,已有應用了,發出資料時,連接埠處會有個收發器把電訊號轉為光訊號,透過光纖來傳輸資料,另一端光訊號再轉為電訊號。不過傳統的光收發器成本都比較高,內部元件數量大,尺寸也就比較大。
Intel在整合化的矽光(IIIV族monolithic的光學整合化方案)方面應該是商業化走在比較前列的,就是把光和電子相關的組成部分高度整合到晶片上,用IC製造技術。未來的光通訊不只是資料中心機架到機架之間,也可以下沉到板級——就跟現在傳統的電I/O一樣。電互連的主要問題是功耗太大,也就是所謂的I/O功耗牆,這是這類微型化矽光元件存在的重要價值。
這其中存在的技術挑戰還是比較多,如做資料的光訊號調變的調變器調變器,據說Intel的技術使其實現了1,000倍的縮小;還有在接收端需要有個探測器(detector)轉換光訊號,用所謂的全矽微環(micro-ring)結構,實現矽對光的檢測能力;波分複用技術實現頻寬倍增,以及把矽光和CMOS晶片做整合等。
Intel認為,把矽光模組與運算資源整合,就能打破必須帶更多I/O接腳做更大尺寸處理器的這種趨勢。矽光能夠實現的是更低的功耗、更大的頻寬、更小的接腳數量和尺寸。在跨處理器、跨伺服器節點之間的資料互動上,這類技術還是頗具前景,Intel此前說目標是實現每根光纖1Tbps的速率,並且能效在1pJ/bit,最遠距離1km,這在非本地傳輸上是很理想的數字。
還有軟體…
除了AI晶片本身,從整個生態的角度,包括AI感知到運算的整個鏈條上的其他組成部分,都有促成性能和效率提升的餘地。比如這兩年Nvidia從軟體層面,針對AI運算的中間層、庫做了大量最佳化。相同的底層硬體,透過軟體最佳化就能實現幾倍的性能提升。
宋繼強說,「我們發現軟體最佳化與否,在同一個硬體上可以達到百倍的性能差距。」這其中的餘量還是比較大。
在AI開發生態上,雖然Nvidia是最具發言權的;但從戰略角度來看,像Intel這種研發CPU、GPU、FPGA、ASIC,甚至還有神經型態運算處理器的企業而言,不同處理器統一開發生態可能更具前瞻性。Intel有個稱oneAPI的軟體平台,用一套API實現不同硬體性能埠的對接。這類策略對廠商的軟體框架構建能力是非常大的考驗——也極大程度關乎底層晶片的執行效率。
在摩爾定律放緩、電晶體尺寸微縮變慢甚至不縮小的前提下,處理器架構革新、異質整合與2.5D/3D封裝技術依然可以達成1,000倍的性能提升;而一些新的技術方向,包括近記憶體運算、記憶體內運算和微型矽光,能夠在資料訪存、傳輸方面產生新的價值;神經型態運算這種類腦運算方式,是實現AI運算的目標;軟體層面的最佳化,也能夠帶動AI性能的成倍增長。所以即便摩爾定律嚴重放緩,AI晶片的性能、效率提升在上面提到的這麼多方案加持下,終將在未來很長一段時間內持續飛越。這第三(四)次科技革命恐怕還很難停歇。
資料來源:https://www.eettaiwan.com/20210726nt61-ai-computing/?fbclid=IwAR3BaorLm9rL2s1ff6cNkL6Z7dK8Q96XulQPzuMQ_Yky9H_EmLsBpjBOsWg