[爆卦]算術與邏輯單元是什麼?優點缺點精華區懶人包

雖然這篇算術與邏輯單元鄉民發文沒有被收入到精華區:在算術與邏輯單元這個話題中,我們另外找到其它相關的精選爆讚文章

在 算術與邏輯單元產品中有3篇Facebook貼文,粉絲數超過3,992的網紅台灣物聯網實驗室 IOT Labs,也在其Facebook貼文中提到, 軟體吞噬硬體的 AI 時代,晶片跟不上演算法的進化要怎麼辦? 作者 品玩 | 發布日期 2021 年 02 月 23 日 8:00 | 身為 AI 時代的幕後英雄,晶片業正經歷漸進持續的變化。 2008 年之後,深度學習演算法逐漸興起,各種神經網絡滲透到手機、App 和物聯網。同時摩爾定律卻...

  • 算術與邏輯單元 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文

    2021-03-08 16:45:22
    有 1 人按讚

    軟體吞噬硬體的 AI 時代,晶片跟不上演算法的進化要怎麼辦?

    作者 品玩 | 發布日期 2021 年 02 月 23 日 8:00 |

    身為 AI 時代的幕後英雄,晶片業正經歷漸進持續的變化。

    2008 年之後,深度學習演算法逐漸興起,各種神經網絡滲透到手機、App 和物聯網。同時摩爾定律卻逐漸放緩。摩爾定律雖然叫定律,但不是物理定律或自然定律,而是半導體業發展的觀察或預測,內容為:單晶片整合度(積體電路中晶體管的密度)每 2 年(也有 18 個月之說)翻倍,帶來性能每 2 年提高 1 倍。

    保證摩爾定律的前提,是晶片製程進步。經常能在新聞看到的 28 奈米、14 奈米、7 奈米、5 奈米,指的就是製程,數字越小製程越先進。隨著製程的演進,特別進入10 奈米後,逐漸逼近物理極限,難度越發增加,晶片全流程設計成本大幅增加,每代較上一代至少增加 30%~50%。

    這就導致 AI 對算力需求的增長速度,遠超過通用處理器算力的增長速度。據 OpenAI 測算,從 2012 年開始,全球 AI 所用的演算量呈現等比級數增長,平均每 3.4 個月便會翻 1 倍,通用處理器算力每 18 個月至 2 年才翻 1 倍。

    當通用處理器算力跟不上 AI 演算法發展,針對 AI 演算的專用處理器便誕生了,也就是常說的「AI 晶片」。目前 AI 晶片的技術內涵豐富,從架構創新到先進封裝,再到模擬大腦,都影響 AI 晶片走向。這些變化的背後,都有共同主題:以更低功耗,產生更高性能。

    更靈活

    2017 年圖靈獎頒給電腦架構兩位先驅 David Petterson 和 John Hennessy。2018 年圖靈獎演講時,他們聚焦於架構創新主題,指出演算體系結構正迎來新的黃金 10 年。正如他們所判斷,AI 晶片不斷出現新架構,比如英國 Graphcore 的 IPU──迥異於 CPU 和 GPU 的 AI 專用智慧處理器,已逐漸被業界認可,並 Graphcore 也獲得微軟和三星的戰略投資支援。

    名為 CGRA 的架構在學界和工業界正受到越來越多關注。CGRA 全稱 Coarse Grained Reconfigurable Array(粗顆粒可重構陣列),是「可重構計算」理念的落地產物。

    據《可重構計算:軟體可定義的計算引擎》一文介紹,理念最早出現在 1960 年代,由加州大學洛杉磯分校的 Estrin 提出。由於太過超前時代,直到 40 年後才獲得系統性研究。加州大學柏克萊分校的 DeHon 等將可重構計算定義為具以下特徵的體系結構:製造後晶片功能仍可客製,形成加速特定任務的硬體功能;演算功能的實現,主要依靠任務到晶片的空間映射。

    簡言之,可重構晶片強調靈活性,製造後仍可透過程式語言調整,適應新演算法。形成高度對比的是 ASIC(application-specific integrated circuit,專用積體電路)。ASIC 晶片雖然性能高,卻缺乏靈活性,往往是針對單一應用或演算法設計,難以相容新演算法。

    2017 年,美國國防部高級研究計劃局(Defence Advanced Research Projects Agency,DARPA)提出電子產業復興計劃(Electronics Resurgence Initiative,ERI),任務之一就是「軟體定義晶片」,打造接近 ASIC 性能、同時不犧牲靈活性。

    照重構時的顆粒分別,可重構晶片可分為 CGRA 和 FPGA(field-programmable gate array,現場可程式語言邏輯門陣列)。FPGA 在業界有一定規模應用,如微軟將 FPGA 晶片帶入大型資料中心,用於加速 Bing 搜索引擎,驗證 FPGA 靈活性和演算法可更新性。但 FPGA 有局限性,不僅性能和 ASIC 有較大差距,且重程式語言門檻比較高。

    CGRA 由於實現原理差異,比 FPGA 能做到更底層程式的重新設計,面積效率、能量效率和重構時間都更有優勢。可說 CGRA 同時整合通用處理器的靈活性和 ASIC 的高性能。

    隨著 AI 演算逐漸從雲端下放到邊緣端和 IoT 設備,不僅演算法多樣性日益增強,晶片更零碎化,且保證低功耗的同時,也要求高性能。在這種場景下,高能效高靈活性的 CGRA 大有用武之地。

    由於結構不統一、程式語言和編譯工具不成熟、易用性不夠友善,CGRA 未被業界廣泛使用,但已可看到一些嘗試。早在 2016 年,英特爾便將 CGRA 納入 Xeon 處理器。三星也曾嘗試將 CGRA 整合到 8K 電視和 Exynos 晶片。

    中國清微智慧 2019 年 6 月量產全球首款 CGRA 語音晶片 TX210,同年 9 月又發表全球首款 CGRA 多模態晶片 TX510。這家公司脫胎於清華大學魏少軍教授起頭的可重構計算研究團隊,從 2006 年起就進行相關研究。據芯東西 2020 年 11 月報導,語音晶片 TX210 已出貨數百萬顆,多模組晶片 TX510 在 11 月也出貨 10 萬顆以上,主要客戶為智慧門鎖、安防和臉部支付相關廠商。

    先進封裝上位

    如開篇提到,由於製程逼近物理極限,摩爾定​​律逐漸放緩。同時 AI 演算法的進步,對算力需求增長迅猛,逼迫晶片業在先進製程之外探索新方向,之一便是先進封裝。

    「在大數據和認知計算時代,先進封裝技術正在發揮比以往更大的作用。AI 發展對高效能、高吞吐量互連的需求,正透過先進封裝技術加速發展來滿足。 」世界第三大晶圓代工廠格羅方德平台首席技術專家 John Pellerin 聲明表示。

    先進封裝是相對於傳統封裝的技術。封裝是晶片製造的最後一步:將製作好的晶片器件放入外殼,並與外界器件相連。傳統封裝的封裝效率低,有很大改良空間,而先進封裝技術致力提高整合密度。

    先進封裝有很多技術分支,其中 Chiplet(小晶片/芯粒)是最近 2 年的大熱門。所謂「小晶片」,是相對傳統晶片製造方法而言。傳統晶片製造方法,是在同一塊矽晶片上,用同一種製程打造晶片。Chiplet 是將一塊完整晶片的複雜功能分解,儲存、計算和訊號處理等功能模組化成裸晶片(Die)。這些裸晶片可用不同製程製造,甚至可是不同公司提供。透過連接介面相接後,就形成一個 Chiplet 晶片網路。

    據壁仞科技研究院唐杉分析,Chiplet 歷史更久且更準確的技術詞彙應該是異構整合(Heterogeneous Integration)。總體來說,此技術趨勢較清晰明確,且第一階段 Chiplet 形態技術較成熟,除了成本較高,很多高端晶片已經在用。

    如 HBM 儲存器成為 Chiplet 技術早期成功應用的典型代表。AMD 在 Zen2 架構晶片使用 Chiplet 思路,CPU 用的是 7 奈米製程,I/O 使用 14 奈米製程,與完全由 7 奈米打造的晶片相比成本約低 50%。英特爾也推出基於 Chiplet 技術的 Agilex FPGA 系列產品。

    不過,Chiplet 技術仍面臨諸多挑戰,最重要之一是互連介面標準。互連介面重要嗎?如果是在大公司內部,比如英特爾或 AMD,有專用協議和封閉系統,在不同裸晶片間連接問題不大。但不同公司和系統互連,同時保證高頻寬、低延遲和每比特低功耗,互連介面就非常重要了。

    2017 年,DARPA 推出 CHIPS 戰略計劃(通用異構整合和 IP 重用戰略),試圖打造開放連接協議。但 DARPA 的缺點是,側重國防相關計畫,晶片數量不大,與真正商用場景有差距。因此一些晶片業公司成立組織「ODSA(開放領域特定架構)工作組」,透過制定開放的互連介面,為 Chiplet 的發展掃清障礙。

    另闢蹊徑

    除了在現有框架內做架構和製造創新,還有研究人員試圖跳出電腦現行的范紐曼型架構,開發真正模擬人腦的計算模式。

    范紐曼架構,數據計算和儲存分開進行。RAM 存取速度往往嚴重落後處理器的計算速度,造成「記憶體牆」問題。且傳統電腦需要透過總線,連續在處理器和儲存器之間更新,導致晶片大部分功耗都消耗於讀寫數據,不是算術邏輯單元,又衍生出「功耗牆」問題。人腦則沒有「記憶體牆」和「功耗牆」問題,處理訊息和儲存一體,計算和記憶可同時進行。

    另一方面,推動 AI 發展的深度神經網路,雖然名稱有「神經網路」四字,但實際上跟人腦神經網路運作機制相差甚遠。1,000 億個神經元,透過 100 萬億個神經突觸連接,使人腦能以非常低功耗(約 20 瓦)同步記憶、演算、推理和計算。相比之下,目前的深度神經網路,不僅需大規模資料訓練,運行時還要消耗極大能量。

    因此如何讓 AI 像人腦一樣工作,一直是學界和業界積極探索的課題。1980 年代後期,加州理工學院教授卡弗·米德(Carver Mead)提出神經形態工程學的概念。經過多年發展,業界和學界對神經形態晶片的摸索逐漸成形。

    軟體方面,稱為第三代人工神經網路的「脈衝神經網路」(Spike Neural Network,SNN)應運而生。這種網路以脈衝信號為載體,更接近人腦的運作方式。硬體方面,大型機構和公司研發相應的脈衝神經網路處理器。

    早在 2008 年,DARPA 就發起計畫──神經形態自適應塑膠可擴展電子系統(Systems of Neuromorphic Adaptive Plastic Sc​​alable Electronics,簡稱 SyNAPSE,正好是「突觸」之意),希望開發出低功耗的電子神經形態電腦。

    IBM Research 成為 SyNAPSE 計畫的合作方之一。2014 年發表論文展示最新成果──TrueNorth。這個類腦計算晶片擁有 100 萬個神經元,能以每秒 30 幀的速度輸入 400×240pixel 的影片,功耗僅 63 毫瓦,比范紐曼架構電腦有質的飛躍。

    英特爾 2017 年展示名為 Loihi 的神經形態晶片,包含超過 20 億個晶體管、13 萬個人工神經元和 1.3 億個突觸,比一般訓練系統所需的通用計算效率高 1 千倍。2020 年 3 月,研究人員甚至在 Loihi 做到嗅覺辨識。這成果可應用於診斷疾病、檢測武器和爆炸物及立即發現麻醉劑、煙霧和一氧化碳氣味等場景。

    中國清華大學類腦計算研究中心的施路平教授團隊,開發針對人工通用智慧的「天機」晶片,同時支持脈衝神經網路和深度神經網路。2019 年 8 月 1 日,天機成為中國第一款登上《Nature》雜誌封面的晶片。

    儘管已有零星研究成果,但總體來說,脈衝神經網路和處理器仍是研究領域的方向之一,沒有在業界大規模應用,主要是因為基礎演算法還沒有關鍵性突破,達不到業界標準,且成本較高。

    附圖:▲ 不同製程節點的晶片設計製造成本。(Source:ICBank)
    ▲ 可重構計算架構與現有主流計算架構在能量效率和靈活性對比。(Source:中國科學)
    ▲ 異構整合成示意動畫。(Source:IC 智庫)
    ▲ 通用處理器的典型操作耗能。(Source:中國科學)

    資料來源:https://technews.tw/2021/02/23/what-to-do-if-the-chip-cannot-keep-up-with-the-evolution-of-the-algorithm/?fbclid=IwAR0Z-nVQb96jnhAFWuGGXNyUMt2sdgmyum8VVp8eD_aDOYrn2qCr7nxxn6I

  • 算術與邏輯單元 在 OSSLab Geek Lab Facebook 的最佳解答

    2020-12-19 01:04:03
    有 47 人按讚

    新款NVIDIA RTX 3080的CUDA核心數量比2080TI增加了一倍,
    但破解密碼性能提升了2倍嗎?
    https://blog.passware.com/the-new-nvidia-rtx-3080-has-double-the-number-of-cuda-cores-but-is-there-a-2x-performance-gain/

    著名密碼破解軟體公司Passware測試最新的RTX 3080顯卡破解密碼效能,RTX 3080擁有8,704個CUDA內核,實作對比 RTX 2080 Ti 4352個CUDA核心.但性能竟然沒有提升多少!!!

    這是因為 Nvidia 算CUDA Cores是以SM(Streaming Multiprocessor)的FP32 ALU(算術邏輯單元)的數量變成二倍。
    但在密碼破解應用中僅使用INT32單元,與RTX 2080Ti相比,RTX 3080中INT32 運算單元總數量保持不變

    但再看競爭對手Elcomsoft的說法
    https://blog.elcomsoft.com/2020/12/breaking-passwords-with-nvidia-rtx-3080-and-3090/
    認為RTX3080 效能有大幅表現..

    那還有得參考比較嗎? OSSLab Geek Lab去查開源破解軟體Hashcat性能 . 發現:
    Device #1: GeForce RTX 2080 Ti, 2816/11264 MB allocatable, 68MCU Speed.#1.........: 50515.3 MH/s (44.51ms)

    Device #1: GeForce RTX 3080, 9044/10017 MB, 68MCU
    Speed.#1.........: 54033.1 MH/s (41.92ms)
    這方面來講 似乎Passware與Hashcat測試結果接近,再加上3080短期天價,我們認為若非合Elcomsoft Distributed Password Recovery應用情境,確實不用先買3080卡.

    1.在特殊應用情境、軟體、硬體必需整體看待.就算廠商只賣你純硬體但若不夠專業,自然無法搭配最佳效能.

    2.做技術要客觀分析狀況而不是堅持某些品牌,技術手法主見.
    要多項分析後,以技術為本位風格才能解決高難度技術難題.

    #OSSLab #資料救援 #勒索病毒 #GPU #AI

    二張卡Hashcat性能比較出處
    https://gist.github.com/Chick3nman/bb22b28ec4ddec0cb5f59df97c994db4
    https://gist.github.com/binary1985/c8153c8ec44595fdabbf03157562763e
    測試指令
    * --benchmark-all
    * --optimized-kernel-enable

  • 算術與邏輯單元 在 臨床心理師的腦中小劇場 Facebook 的精選貼文

    2019-10-05 12:35:07
    有 67 人按讚

    【腦中小劇場 小行星贈書場 用一道光 照亮孩子的銀河】
        
    這是我有史以來,第一次推書推得如此驕傲。
      
    原因很簡單,這是我女兒最喜歡的刊物。
      
    即便無法像朝氣蓬勃的職能老師,露出燦爛的笑容對著鏡頭比YA,一世人留在月刊封底上被孩子崇拜,但至少也算沾上了邊。於是多年後的某天,我也能自豪地跟女兒說「開玩笑,你老爸我當年可是推薦過小行星的」,然後女兒就會回說「是喔,等下借我錢」之類討厭的話。
      
    我是個喜歡說故事的人,而女兒通常是那位被迫入席的苦主,如何把故事說得鮮活,除了口才,就是素材。我口才普通,因此很仰賴素材。素材來源不外乎我的糗事和讀本,幸虧我小時候是個魯蛇,幹過的糗事不勝計數,而這些糗事最大的作用是去神格化,讓女兒產生一種她和老爸平起平坐的感受。但糗事講多了難免有失威信,一直被她抓到把柄也不是辦法,因此我只能向讀本求援。
      
    喜歡伴讀的家長都知道,市面讀本品質良莠不齊,譯文故事占比最多,即便是國產原創故事,有時也難逃說教先行的窠臼。因此若讀到沒什麼勁的故事,我便會不自覺地把情節連回自己的糗事,然後我的記憶就會開始混淆,女兒就會真的以為我這輩子沒幹過什麼正經事,想想都覺得恐怖。
      
    好的讀本,創意與流暢度是基本配備,若能加入知識元素,為孩子建構知識體系,則會嚴重加分!因為此時讀本便不再只是讀本,而是幫助孩子面向世界的刊物。
      
    因此,決定一本刊物去留的,就是「門面」+「內容」。
      
    值得慶幸的是,到目前為止,小行星始終維持著雙贏的水準,而這樣的水準,讓它在創刊第三年得到了金鼎獎。
      
    孩子跟男人一樣,都是看門面行動的。「賣相」是引發孩子閱讀興趣最重要的關鍵,也是家長能否被吸引的條件,封面夠不夠水準,拿在手上有沒有光環,決定了孩子指尖的動向。孩子願意伸手去翻開第一頁,閱讀這件事才能成立,這一點,小行星拿到了門票。
      
    首先,它的美術設計十分有質感,從封面字體設計,到內文圖樣編排,都表現出一種活潑的態度,同時也是對舊讀本古板套路的切割。無論是寫實的知識或幻想的故事,皆能恰如其分地呈現出該有的畫風,全彩印刷下重本,絕非以照片隨意剪裁,或混雜黑白內頁的做法所能比擬。進入知識之前,若有一條體面而不浮誇的通道,或許會讓孩子更有進場的慾望。
      
    再來是內容,小行星標榜內文配合兒童認知功能發展,架構絕不含糊。針對認知功能部分,我先做個簡單的說明,身為臨床心理師,魏氏兒童智力量表第四版(WISC-Ⅳ)是我們最常用來評估兒童認知能力的工具,工具本身將智商劃分為四個面向,細分如下:
        
    ◎ 語文理解能力(語文邏輯,一般常識)

    ◎ 知覺推理能力(空間視覺,圖像推理)

    ◎ 工作記憶能力(短期記憶,算術能力)

    ◎ 處理速度能力(符號與文字配對能力)
      
    這四類認知功能,小行星一舉涵蓋。
      
    小行星月刊四冊一光碟,四菜一湯,誠意份量俱足,閱讀主題貫通(每月都有固定主題,本月主題為「聲音」)。這四冊分別為小行星讀本、知識讀本、小偵探創意遊戲書,以及親子天下baby,各自承載了不同的任務,簡介如下:
      
    【小行星讀本】

    涵蓋範圍:語文理解能力
      
    小行星讀本是份量最重的主菜,建議由親子共讀。該冊知識類別多元,學齡前孩童閱讀後可順勢與國小教材接軌,小劇場在此將知識類別整理如下,括號內容為單元名稱:
      
    ● 國語(幼年童話、讀首小詩、故事摩天輪)
    ● 英文(英文童謠)
    ● 自然科學(小小探索家、動物新鮮事)
    ● 社會(台灣好好玩、世界大不同)
    ● 健康(身體怎麼了)
    ● 藝術(STEAM這樣玩)P.S. STEAM = Science, Technology, Engineering, Art, Mathematics,意思是結合科學、技術、工程、藝術,以及數學的跨學科教學方法
    ● 音樂(故事音樂盒)
      
    除了一般常識以外,小讀本還有《情緒劇場》與《腦筋急轉彎》兩個單元,這是我最看重的內容,在此把它們歸類為「社交互動能力」,這是發展歷程的重要環節。
      
    這兩個單元的用意為探索孩子的「心智理論」(Theory of Mind,一種能夠推論自己或他人心理狀態的能力),心智理論是同理心的培養基礎,它能協助孩子辨識社交線索,學習人際應對,從而理解社會的運作歷程。小行星利用各種常見的生活困境與社交兩難,編纂成故事或選擇題,引導孩子選出合適的選項。
      
    【知識讀本】

    涵蓋範圍:語文理解能力
      
    這是一本份量相對輕薄短小的輕食,全彩印刷,可隨身攜帶。主題與小行星讀本一脈相承,朝生活知識延伸,內容獨立成篇,份量適中,適合睡前來一篇,家長伴讀絕無負擔。
      
    【小偵探 創意遊戲書】

    涵蓋範圍:知覺推理、工作記憶、處理速度能力
      
    這是孩子每個月最期待的,也最受歡迎的配菜。之所以取名小偵探,可想而知,內容肯定與「推理」有關。
      
    每一期,小偵探都會拓展一條全新的故事線,以尋找失物為主軸,邀請孩子一同進行推理。過程中涉及了算術、圖樣配對、邏輯推敲、短期記憶,甚至手作能力,解謎需要的技能,小讀本沒提及的「數學」能力,在這本遊戲書中,通通替孩子訓練了一回。靠的不是花俏的玩具,而是精心設計的關卡,利用懸疑的情節誘發孩子的學習興趣,並附贈過關貼紙提升成就感。
      
    數學與邏輯通常是讓孩子頭痛的學科,但在這裡,小偵探不僅能培養孩子對推理故事的興趣,還能讓數學變得親切,化身破案的幫手。
      
    【親子天下baby】
      
    這是整份套餐的甜點,也是獻給家長的開箱說明,簡言之,這就是家長版的讀本。該冊以家長立場與教養視野,重現與小行星讀本相同的單元主題,內容強調專業育兒知識,由醫師、教師、職能治療師以及心理師等專家領銜撰文,深入探討家長所面臨的教養難題,並提出相關的解套方案。
      
    身為家長,小行星送給我們最珍貴的禮物,不是它澎派的份量,而是它讓孩子開始「主動要求閱讀」。在書本式微,文字被影音淹沒的時代,小行星用圖文為我們和孩子搭了一座橋。家長只需要走過去,發出聲音,未知的宇宙便蔚然成形,邊界會開始擴張,而唯一能掌權的,是孩子的想像力。
      
    倘若孩子是顆行星,親子共讀的時刻,就是那道溫柔的光。當光芒穿過星系,照亮的不是周身的黑暗,而是銀河的幅員。世界很大,但順著這道光,他們可以開始學著丈量。
      
    往後,孩子的人生還有許多關卡,記得讓孩子知道,我們可以是他身後的牆,也可以是他眼前的光。
      
    現在只要在本文下方留言,就有機會得到《小行星幼兒誌》這份兒童啟蒙月刊,感謝 親子天下 贊助十月號月刊「五套」,每套價值450元,這絕對是有史以來中獎機率最高的一次!歡迎各位家長與讀者一起來抽獎,或將贈書訊息分享給身邊的家長朋友們!若你只想單純抒發感想,不參加抽獎,小劇場也非常歡迎你留言。
      
    ※ 留言格式:" 就是你了,讓我們一起陪孩子看書吧 ___________(請tag一至三位朋友,家長身分更優)
    ※ 贈書方式:針對符合留言格式者,隨機抽出五人,共贈書五套
    ※ 活動期限:即日起至10/9(三)23:59截止
    ※ 獲獎名單:將於10/10(四)公布於本文留言區,請獲獎者於三日內私訊回覆郵遞區號、地址、姓名、電話等資訊,未如期回覆視同放棄
    ※ 考量郵寄成本,本活動限台澎金馬地區朋友參與

    #小行星幼兒誌
    #感謝 沛智心理治療所 牽線
    #想再進一步認識小行星的讀者們
    #記得觀看小劇場的第一則回覆留言喔

你可能也想看看

搜尋相關網站