[爆卦]標準產業分類代碼是什麼?優點缺點精華區懶人包

雖然這篇標準產業分類代碼鄉民發文沒有被收入到精華區:在標準產業分類代碼這個話題中,我們另外找到其它相關的精選爆讚文章

在 標準產業分類代碼產品中有4篇Facebook貼文,粉絲數超過3,992的網紅台灣物聯網實驗室 IOT Labs,也在其Facebook貼文中提到, 汽車軟體深度報告:汽車軟體產業鏈及未來趨勢分析 北京新浪網 10-01 20:00 來源:未來智庫 關鍵結論 電動智能趨勢下,汽車逐步由機械驅動向軟體驅動過渡。近年 SDV(軟體定義汽車)概念逐步被行業認知,根源在於「汽車如何體現差異化」問題的變遷,隨著電 動化帶來的汽車電子構架革新,汽車硬體...

  • 標準產業分類代碼 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文

    2020-10-21 18:27:58
    有 0 人按讚

    汽車軟體深度報告:汽車軟體產業鏈及未來趨勢分析

    北京新浪網 10-01 20:00
    來源:未來智庫

    關鍵結論

    電動智能趨勢下,汽車逐步由機械驅動向軟體驅動過渡。近年 SDV(軟體定義汽車)概念逐步被行業認知,根源在於「汽車如何體現差異化」問題的變遷,隨著電 動化帶來的汽車電子構架革新,汽車硬體體系將逐漸趨於一致,軟體成為定義 汽車的關鍵,行業更具想像空間。即造車壁壘已經由從前的上萬個零部件拼合 能力演變成將上億行代碼組合運行的能力。本文通過對汽車軟體行業的系統性 梳理,幫助讀者把握行業成長中的投資機會。

    我們提出零部件賽道三維篩選框架,基於起點(單車價值量)-持續時間(產品生 命周期)-斜率(產品升級速度)三維體系評價細分零部件的市場空間,軟體平均單車價值量由傳統車的 200 美元,提升至 2025 年新能源汽車的 0.23 萬美元,進 一步至 2025 年新能源汽車的 1.8 萬美元。未來十年軟體市場復合增速為 9%,2030 年 500 億美元空間,57%的增量來自於 ADAS 及 AD 軟體。

    軟體如何定義汽車價值?百年汽車工業面臨由機械機器向電子產品過渡的新變 局。汽車「駕駛感」及車機 APP 化的功能實現發生在我們看不到的隱秘角落— —上百的電子控制單元循環執行軟體代碼功能塊,通過高性能的中央計算單元, 與硬體體繫結合以解析駕駛員需求,邏輯運算後向機械部件發送相應響應指令。

    汽車軟體成為未來汽車構架重要組成部分。而整車電子電氣構架提供的硬體、 操作系統實現的管理功能、基礎軟體平台構架實現的抽象化為 SDV 不可或缺的 三大關鍵部分,軟硬體的分離(研發分離、功能發佈分離)成為實現 SDV 基礎。

    發展史與整車廠戰略。汽車軟體隨產業技術升級持續迭代:1970 年代的簡單發 動機控制演算法→1980 年代中央計算單元創新→1990 年代信息娛樂系統創新→ 2000 年代安全系統→2010 年代開始向全新汽車電子構架及軟體系統演變。不 同於以前依靠多個 ECU 由部件供應商主導的無獨立軟體產品概念時代,主機廠 愈發需具備軟體的管理能力及核心軟體設計能力。整車廠中特斯拉引領車載軟 件行業最高技術,大眾重金重塑軟體架構,整車廠關乎開發周期、賦予附加值、 構架實現、軟體變現模式以及操作系統切入等問題上仍未進行標準化定義,卻 為影響行業發展的關鍵所在。

    產業鏈機遇。新科技、軟體公司湧入帶動供應鏈管理的扁平化、邊界模糊化, 帶動供應鏈生態體系變革。供應模式上,預計 Tier1 與整車廠之間將採取兩種合作方式,其一,整車廠主導軟體,Tier1 負責硬體生產;其二,整車廠定義軟 件框架規範標準,Tier1 供應符合標準的相關軟體。盈利模式上,偏向製造業邏 輯的大部分汽車硬體由於堆橋數量將受到限制,終將會進入產業穩態階段,往 介面及功能上的標準化發展,維持較穩定的利潤率水平;軟體由於迭代周期快 且行業特性帶來的標準化程度低,賦予汽車新盈利模式。現階段特斯拉三大付 費模式打開車企軟體變現想像空間,開發基礎平台收許可費、供應功能模塊按 Royalty 收費及定製化的二次開發均為未來軟體供應商主流打法。

    推演的 5 大未來趨勢。汽車終將成為搭載「差異化元素」的通用化平台。一方 面,ECU 功能模塊里循環迭代的代碼驅動汽車執行動作反饋;另一方面,車載 娛樂信息系統 APP 化吸引第三方開發者入場。海量數據將在車內流轉,關於賦 能域控制器、定位車機系統的各項軟體性能升級,包括功能中心化、乙太網應 用、整車 OTA 升級、信息交互上雲及深層次的信息安全防禦等,或將帶來汽車 軟體一系列發展機遇。

    SDV 新階段:軟體如何定義汽車價值

    百年汽車工業面臨由機械機器向電子產品過渡的新變局。跨入駕駛室,安靜的 啟動、柔中帶剛的加速、平穩過渡的剎車等為代表的汽車「駕駛感」逐步由機 械驅動向軟體驅動過渡,這一套功能的實現發生在我們看不到的隱秘角落—— 上百的電子控制單元循環執行軟體代碼功能塊,通過高性能的中央計算單元, 與硬體體繫結合以解析駕駛員需求,邏輯運算後向機械部件發送相應響應指令。近年來,SDV(Software Define Vehicles,即軟體定義汽車)概念逐步被整車 廠認知,根源在於「汽車如何體現差異化」問題的變遷,隨著電動化帶來的汽 車電子構架革新,汽車硬體體系將逐漸趨於一致,整車廠很難在硬體上打造差 異化,此時軟體成為定義汽車的關鍵,即造車壁壘已經由從前的上萬個零部件 拼合能力演變成將上億行代碼組合運行的能力。

    汽車軟體為未來汽車構架重要組成部分

    汽車軟體與硬體體系發生分化。近幾十年隨汽車構架升級、性能與用戶操作感 需求逐年提升,汽車軟硬體數量爆發,並愈發複雜化。在硬體方面,電控單元 數量迅速增長,於 2010 年面臨增速放緩的拐點(主要受整車成本與控制器數 量平衡的影響),2025 年隨行業集中式電子電氣架構趨勢持續推進,電控單元 邁向集成化從而控制器數量將較為平穩。在軟體方面,各大主機廠軟體功能體 系越做越大,其中「功能函數」作為軟體體系中的最小單元,其單車數量持續 增大,控制器內部的功能函數複雜度提升,疊加智能座艙新增的應用型軟體需 求,軟體重要性愈發凸顯。2010 年(增速放緩的硬體數量 VS. 急劇攀升的軟 件數量)與 2025 年(硬體產業成型 VS.軟體加速迭代塑造汽車差異性)為汽車 軟硬體發展中兩個重要的分水嶺。

    汽車複雜的運作需軟硬體結合進行。無論是駕駛艙對汽車電子功能的調用,抑 或汽車與駕駛員和環境互動,均可抽化為軟硬體密切配合的模型,即駕駛員的 需求與汽車功能反應之間存在著複雜的控制鏈條:駕駛員通過機械硬體或部分 虛擬按鈕輸入期望(例如通過車載按鈕、踏板等輸入型機械硬體給出期望)→ 駕駛員動作轉換為電子信號傳入電控單元→執行器控制控制對象達到駕駛員的 需求→感測器向電控系統持續反饋控制達成的具體情況,軟體邏輯持續運算向 執行器發出指令,最終達成駕駛員的期望要求。以剎車輔助駕駛為例,在駕駛 員剎車信號不足或過慢的情況下,內置的一套軟體邏輯將被激活,讓制動系統 自動做出減速相應。在電控單元中快速進行的一次次軟體迭代循環,為汽車正 常運作的基石。

    SDV 研發工具鏈仍以 V 流程為主。汽車研發系統過程能拆解為軟體、硬體、執 行器及感測器 4 大部分。與傳統車相同,V 模型為車企主流的開發流程,從產 品設計、子系統設計、控制器驗證及系統驗證等階段均有相對應的工具鏈進行 支撐,涵蓋從系統到軟體以及集成后的一系列測試等內容。SDV 模式下對工具 鏈的應用具部分變化:一方面,硬體愈發通用化,研發會集中在作為功能集群 的 ECU 開發上;另一方面,車的各種功能實現盡量靠軟體實現。

    Step 1:產品設計階段。此階段核心為分析和拆解需求。由消費者的需求、車 型安全及性能的剛性需求以及法律法規需求定義出軟體的基礎構架,以及定義 出各大功能模塊。

    Step 2:子系統設計階段。步驟為由系統構架需求定義軟硬體構架設計。關乎 軟體系統部分在這一步雛形初顯,能將技術問題具體化,例如定義軟體能實現 的功能、軟體功能模塊的分離、如何跟對應的控制器配合等。

    Step 3:控制器驗證階段。完成硬軟體及控制器集成,代碼成型并迭代測試。

    Step 4:系統驗證階段。測試軟硬體在整車上的裝載使用情況。

    SDV不可或缺的三大關鍵部分——電子電氣架構、操作系統、軟體平台

    整車電子電氣構架為硬體基礎。汽車電子電氣架構(Electronic and Electrical Architecture,文中簡稱 EEA)最初由德爾福公司提出,以博世經典的五域分類 拆分整車為動力域(安全)、底盤域(車輛運動)、座艙域/智能信息域(娛樂信 息)、自動駕駛域(輔助駕駛)和車身域(車身電子)等 5 個子系統。後續演變 成車企所定義的一套整合方式,可形象看作人體結構中的骨架部分,後續需要 「器官」、「血液」和「神經」進行填充。具體到汽車上來說,EEA 把汽車中的 各類感測器、ECU(電子控制單元)、線束拓撲和電子電氣分配系統完美地整合 在一起,完成運算、動力和能量的分配,實現整車的各項智能化功能。博世曾 經將汽車電子電氣架構劃分為三個大階段:傳統分散式電子電氣架構-域控制器 電子電氣架構-集中式電子電氣架構:

    (1)傳統分散式的電子電氣架構:主要用在 L0-L2 級別車型,此時車輛主要由 硬體定義,採用分散式的控制單元,專用感測器、專用 ECU 及演算法,資源協同 性不高,有一定程度的浪費。產業鏈分工上,車型架構由整車廠定義,實現核 心功能的 ECU 及其軟體開發由 Tier 1 完成。

    (2)域控制器電子電氣架構:從 L3 級別開始,通過域控制器的整合,分散的 車輛硬體之間可以實現信息互聯互通和資源共享,軟體可升級,硬體和感測器 可以更換和進行功能擴展。屬於過渡形態,ECU 仍承擔大部分功能實現,整車 廠將參與部分域控制器的開發。

    (3)集中式電子電氣架構:以特斯拉 Model 3 領銜開發的集中式電子電氣架構 基本達到了車輛終極理想——也就是車載電腦級別的中央控制架構。此時集成 化趨勢將消減大部分 ECU,主機廠將逐漸主導原本屬於 Tier 1 參與的軟體部分 (預計以直接開發模式或定義規範標準后讓供應商參與),其目標是設計簡單的 軟體插件和實現物理層變化的本地化。

    操作系統實現管理功能。車載操作系統(Car-OS)承擔著管理車載電腦硬體與 軟體資源的程序的角色。20 世紀 90 年代伊始,汽車上基於微控制晶元的嵌入 式電子產品的應運興起,需加入相關的軟體架構以實現分層化,即汽車電子產 品均需要搭載嵌入式操作系統。從產品品類上,汽車電子產品可歸納為兩類, 一是以儀錶,娛樂音響、導航系統為代表的車載娛樂信息系統;二是主管車輛 運動和安全防護的電控裝置。兩者對比而言,電控系統更強調安全性和穩定性, 因此應用於電控單元 ECU 的嵌入式操作系統標準更為嚴格。未來操作系統發展 面臨兩大趨勢,一是以 OSEK、AUTOSAR 為典型代表的操作系統標準聯盟將 定義統一的技術規範;二是智能網聯趨勢下數據融合度提升,由於各個部件的 安全標準等級不一從而整車上存在多種操作系統的運用,通常引入虛擬機管理 (可提供同時運行多個獨立操作系統的環境),如在智能座艙 ECU 中同時運行 Android(車載電子操作系統)和 QNX(電控操作系統)。

    基礎軟體平台構架是實現抽象化的關鍵所在。從定義上,軟體架構為軟體系統 定義了一個高級抽象(軟體表達行為、屬性、相互作用、集成方式及約束均在 此架構上體現)。而 SDV 核心內涵是能夠通過軟體作用,動態地改變構架網路 節點之間的聯結或分離狀態,從而定義汽車不同的功能組成。基礎軟體平台需 具備三方面要求:一是可靠性,能保證汽車功能實現的實時和安全;二是通用 性,適用於不同車型和不同的操作系統上;三是網構架節點易於更換聯結方式。AUTOSAR 是全球各大整車廠、供應商聯合擬定開放式標準化的軟體架構,其 使得不同結構的電子控制單元的介面特徵標準化,從而軟體具更優的可擴展性 及可移植性,降低重複性工作,縮短開發周期。

    汽車軟硬體分離為 SDV 基礎

    軟硬體的分離涵蓋研發分離、功能發佈分離兩方面。軟硬體分離為實現 SDV 基 礎,電動化趨勢簡化造車流程,未來汽車硬體的研發、製造更偏向於流水線過 程,而軟體發展逐步具互聯網的快速迭代趨勢傾向。汽車軟硬體分離概念由此 而生,其包含兩方面內容,一方面,由於開發周期(汽車硬體 5-7 年的開發周 期 vs. 軟體 2-3 年的開發周期)及技術領域(偏向製造業 vs.偏向互聯網)的 差別,汽車軟硬體在開發上、供應上逐漸分開。另一方面,軟體的功能發佈可 以與車型完成分離,新軟體不僅適用於新車,仍可快速發佈到已量產車型上, 增強車型硬體的使用長尾期。

    軟硬體分離在功能升級及工藝裝配上具優勢。基於軟硬體分離的新構架體系在 車型功能升級及製造模式上發生變化。功能升級上,新的擴充功能由軟體定義 通過雲端直接升級,無需再在硬體層面進行驗證;工藝製造上,與軟體分離后 的電子電氣構架不同於現階段「八爪魚」式的複雜構造,更易於自動化裝配。

    當前車企實現更新的方式——硬體冗餘,後續依靠更新升級。

    (1)硬體預置:傳統汽車定價由硬體及性能決定。而 SDV 模式下,相同硬體 的車型通過不同的軟體配置決定車與車之間不同的功能與體驗。車企在車型設 計之初需提前定義軟硬體,SOP 時將具備擴展功能的冗餘硬體預裝,後續將通 過付費型軟體升級或者功能開放回收成本。以特斯拉的 AutoPilot 為例,冗餘的 預設硬體將通過後期持續的軟體升級調動功能,為新創收模式。

    (2)性能預置:性能預置分為兩個方面,控制器算力預留,為更多的軟體功能 和演算法預留空間。隨智能駕駛趨勢,車載算力大幅提升,由於無法預估後續所 需算力的極限,通常在實際情況中會預留算力空間。性能預留,通常在各性能 硬體上做事先預留,以應付如加速性能提升,續航里程提升,圖像的清晰度提 升,音響效果提升等升級事項。例如 2018 年 6 月,美國權威雜誌《消費者報 告》發現, Model3 剎車距離比皮卡福特 F-150 要長。ElonMusk 接受了《消 費者報告》的批評並承諾通過 OTA 儘快解決此問題。此後在不到一周時間, 特斯拉通過一次 OTA 升級解決了該個問題,《消費者報告》重新測試后發現, 升級后的 Model3 剎車距離縮短了 5.8 米。

    追溯發展史:汽車軟體的前世

    汽車軟體隨產業技術升級持續迭代:1970 年代的簡單發動機控制演算法(軟體嵌 入應用模式)→1980 年代中央計算單元創新(顯示車輛基本信息)→1990 年 代信息娛樂系統創新(GPS、自適應巡航控制出現)→2000 年代安全系統(出 現高級駕駛員輔助駕駛概念)→2010 年代開始向全新汽車電子構架及軟體系統 演變(電子化和軟體化,出現無人駕駛概念)。

    1980 年代之前,汽車僅搭載車燈、啟動機、火花塞等簡易電子設備,並未運用 任何軟體部分。整車電子設備通信及電能供給依靠銅導線傳輸。部分豪華車裝 置僅由收音機為核心部件的車載娛樂系統。

    1970 年代,發動機系統具備演算法功能。出現點火系統、電子燃油噴射等裝置, 軟體直接嵌入應用使用,軟體之間無關聯具獨立性。

    1980 年代隨 IT 技術起步,電子電氣化革命在傳統機械部件上進行創新。油耗 及行駛距離等信息可在車內做電子化顯示,搭載軟體的電控單元開始出現,如 防抱死系統 ABS、車輛穩定系統 ESP、電子變速箱等電子系統誕生,新功能由 嵌入式軟體的演算法控制,CAN 及 LIN 匯流排解決不同控制器之間的通信問題。

    1990 年代,信息娛樂系統持續創新,軟體成為汽車重要部分。汽車軟體構架愈 發分散,出現 GPS 及自適應巡航控制等較高階的電子組件及軟體。同時,不同 控制器間持續延長的通信匯流排成為車企後續進行成本管控的重要一環。

    2000 年代,安全系統推出,軟體開始主導汽車創新。「高級輔助駕駛概念」在 此階段興起,例如駕駛員未及時反應的障礙物可以系統運算下汽車自發停車規 避。此時的軟體系統更為高階,行業引入 AUTOSAR 標準軟體構架。車型方面, 電子化特徵明顯,賓士 S 級轎車車型電控單元超 80 個,通信匯流排近 2000 條。

    2010 年開始,汽車電動化帶來電子電氣構架、汽車軟體新變局。智能駕駛、車 聯網概念引入,造車新勢力、互聯網企業等多玩家參與進造車環節,以特斯拉 為代表的整車廠重新定義軟體系統,新創 OTA 新升級模式。

    產業鏈機遇:SDV重塑市場格局

    新科技、軟體公司的湧入帶動了供應鏈管理的扁平化、邊界模糊化,推動產業 競爭要素髮生本質變化,帶動供應鏈生態體系變革。在傳統封閉式供應鏈的汽 車製造商在整條供應鏈中只負責一個環節,主要擔任汽車研發製造的角色。而 在新生態體系中,汽車軟硬體分離重塑產業格局,主機廠、供應商以及互聯網 企業均參與進汽車新生態體系,從汽車全生命周期覆蓋整個產業鏈條。

    供應模式轉變,主機廠、供應商及互聯網企業入局

    SDV 軟體開發模式下,不同於以前依靠多個 ECU 由部件供應商主導的無獨立 軟體產品概念時代,主機廠愈發需具備軟體的管理能力及核心軟體設計能力, 並引入供應商及互聯網企業參與此環節。在軟體領域,預計未來 Tier1 與整車 廠之間將採取兩種合作方式:

    其一,整車廠主導整車軟體部分,Tier1 負責硬體生產。在傳統車企巨頭入場燃 油車領域 100 多年的歷史里,造車流水線仍以機械製造為主,Tier1 以分擔主機 廠重資產角色存在,通常與整車廠車型生產周期形成相應配套。而在智能化時 代,軟體主要以輕資產模式運轉,出於掌握核心技術考量通常為主機廠所主導。其二,整車廠定義軟體框架規範標準,Tier1 供應符合此標準的相關軟體。瞬息 萬變的技術導致車企研發容錯率下降。尤其對新入場的造車勢力而言,若在前 1~2 款車連續失敗,大概率將面臨淘汰。因此對部分在技術儲備、研發及資金 實力較弱的主機廠而言,可在其定義軟體標準後由 Tier1 進行對應的開發配套。

    盈利模式轉換,將逐漸由硬體逐漸向軟體傾斜

    硬體發展具天花板效應,軟體持續賦予車型新附加值。以經過 15 年發展的手機 產業鏈為例,硬體體系隨處理器性能持續提升、攝像頭像素及攝像頭個數持續 增加、屏幕材質與大小升級,其產業增速趨緩,硬體盈利模式逐漸固化。而隨 蘋果 iPhone 產品橫空出世定義軟體附加值新模式,小米做低手機硬體利潤並將 其定位於功能載體,至此軟體與服務成為手機產業鏈盈利模式的重要來源。對 標至汽車,偏向造業模式的傳統車具較固定的盈利模式,從而車企具較穩定的 利潤率,而目前在汽車電子電氣化架構趨勢下,軟體有多樣性應用的空間,無 論硬體抑或軟體體系均包含升級或新生環節,盈利模式尚未定型。而長遠來看, 偏向製造業邏輯的大部分汽車硬體由於堆橋數量將受到限制,終將會進入產業 穩態階段,往介面及功能上的標準化發展,維持較穩定的利潤率水平;軟體由 於迭代周期快且行業特性帶來的標準化程度低,賦予汽車新盈利模式。

    特斯拉已構築初階車企軟體盈利模式。矽谷出身的特斯拉已證實一條軟體大規 模變現的可行性路徑,分為 FSD 付費、軟體應用商城及訂閱服務三種模式:

    (1)FSD 付費模式:特斯拉車型在售出后標配 Autopilot 輔助駕駛功能,而實 現自動泊車、智能召喚的 FSD 全自動駕駛功能需付費使用。FSD 單價並未固 定,過去一年內特斯拉 FSD 售價經過三次提價(國外 8000 美元,國內 6.4 萬 元),成為特斯拉利潤的重要來源。以 2019 年 36.7 萬輛的交付量計算(30 萬 輛 Model3,6.7 萬輛 ModelS/X),假定 35%的 FSD 裝載率,6500 美元的 ASP, 則軟體收入近 8.3 億美元(其毛利率大概率高於 80%)。

    (2)軟體應用商城:類似手機應用商城,可即時購買性能升級軟體包(包括輔 助駕駛功能、FSD 及各類性能升級包),通過 OTA 進行升級。

    (3)訂閱服務:2019Q4 推出定價 9.9 美元/月的車聯網高級連接服務,包括流 媒體、卡拉 OK、影院模式等功能。2020Q2,特斯拉宣布計劃在年底推出定價 100 美元/月的 FSD 套件訂閱服務,為 FSD 的使用提供另一選擇。

    對於第三方汽車軟體供應商,盈利模式仍不明晰,參考手機產業模式及目前行 業發展情況,預計其未來有望採用以下 3 種主流盈利模式:

    (1)受主機廠委託,開發基礎平台並收取許可費用。

    (2)供應功能模塊按汽車出貨量 Royalty收費(按銷售量和單價一定比例分成)。

    (3)基於車企平台為其做定製化的二次開發,並收取費用。

    市場空間:未來十年軟體市場復合增速為 9%,2030 年 500 億美元空間

    軟體市場進入快速擴張期。包括系統軟體和應用軟體在內的軟體系統將在智能 化趨勢中,由低基數實現快速擴張,據麥肯錫預計,軟體在 D 級車整車價值中 所佔的比例有望在 2030 年達到 30%,將成為未來汽車行業最重要的領域。

    市場規模方面:電動智能化趨勢下硬體發展周期領先於軟體,增量市場彈性小 於軟體。據麥肯錫,2020-2030 年汽車軟體和 E / E 架構市場預計復合年增長 7%, 從目前的 2380 億美元增長至 2030 年的 4690 億美元。拆分來看,2020-2030 年軟體市場規模(操作系統、中間件及功能軟體)復合增速為 9%(由 2020 年 的 200 億美元,增長至 2025 年的 370 億美元,進一步增長至 2030 年的 500 億美元)。2020-2030 年動力系統市場規模復合增速為 15%,主要受動力源更 迭拉動。在硬體方面,ECU/DCU、感測器以及其他電子元件的復合增速分別為 5%、8%及 3%。軟體的應用帶動汽車集成及驗證環節革新,2020-2030 年集成 及驗證市場規模復合增速為 10%。

    單車價值量方面:汽車軟硬體實現分離后兩者的發展模式將出現分化。其中硬 件體系的價值量隨模塊化、集成化發展,在規模化降本過程中其單車價值量增 長將較為平緩或略下降態勢;而軟體體系迭代速度快,在其對附加值模式的持 續探索下,價值量將持續上行。據麥肯錫預計,汽車中軟體單車價值量增速最 大,純電動車型將由 2025 年的 0.23 萬美元增長 7倍至 2030 年的 1.82 萬美元。同期 ECU/DCU、感測器、動力系統(除電池)及其他電子器件增速分別為 37%、 27%、-7%、5%。此外,在豪華車及主打智能化車型上,軟體的價值量佔比及絕對值將處較高水平。

    汽車結構方面:全球汽車軟體與硬體內容結構正發生著重大變化,軟體驅動逐 漸成為主導。據麥肯錫預測,2016年軟體驅動佔比從 2010年的 7%增長到 10%, 預計 2030 年軟體驅動的佔比將達到 30%,屆時硬體驅動佔比僅為 41%。

    軟體內容方面:應用型軟體為汽車軟體發展主力,ADAS 及 AD 軟體為主要增 量。據麥肯錫預測,2020-2030 年一體化軟體、驗證型軟體及功能性軟體市場 規模復合增速分別為 9%、10%、10%,其中功能性型軟體佔據汽車軟體半壁江 山(結構上佔比 6 成)。2020-2030 年按軟體功能劃分的市場規模中,最大增量 為 ADAS 及 AD 軟體,佔市場規模增量的 57%;信息娛樂、安全及聯網相關軟 件次之,占 20%;操作系統和中間件、車身和動力系統相關軟體、動力總成和 底盤相關軟體分別佔據 10%、10%、2%。

    整車廠戰略思路:軟體為必爭之地

    在汽車構架三步走過程中——傳統分散式電子電氣架構-域控制器電子電氣架 構-集中式電子電氣架構,主機廠將逐漸主導原本由 Tier 1 包攬的定製軟體部分, 軟硬體進行拆分發包的趨勢近年來愈發明顯。車企和互聯網軟體企業紛紛入局, 特斯拉引領車載軟體行業最高技術,大眾計劃緊跟,組建 5 千名軟體工程師開 發旗下所有車型統一的操作系統「vw.OS」,汽車屬性已然將逐漸由代步工具轉換 為移動的第三空間(例如未來的娛樂、辦公場所)。現階段整車廠與 Tier 1 的合 作模式仍在探索中,關乎開發周期、賦予附加值、構架實現、軟體變現模式以 及操作系統切入等問題上仍未進行標準化定義,卻為影響行業發展的關鍵所在。

    特斯拉在軟體層面最大亮點是OTA 升級模式

    特斯拉創整車 OTA 升級先河。其升級主要在兩個方面:一方面,將軟體升級發 送到車輛內的車載通訊單元,更新車載信息娛樂系統內的地圖和應用程序以及 其他車機類軟體。例如升級車機的運算速度、屏幕操作流暢度,運行高畫質游 戲以及增強可視化效果等,屬於駕駛艙內「看得見」的升級。另一方面,以直 接將軟體增補程序傳送至有關的電子控制單元(ECU),為 Autopilot 持續引入 及優化新功能。例如提升時速、修復駕駛漏洞等。軟硬體分離開發、硬體性能 冗餘的設計思路是實現 OTA 的必要條件,隨法規放開、演算法逐漸完善,特斯拉 以 OTA 升級軟體模式逐步解鎖新運用功能。此外,特斯拉顛覆車載軟體盈利模 式,以 6.4 萬元的 FSD 選裝軟體包定價、2000 美元的「 Acceleration Boost」 動力性能加速升級包獨創軟體付費的商業模式。

    集中式電子電氣架構提供 OTA 基礎。特斯拉的整車 OTA 升級需要其超前的汽 車電子電氣架構做配套配合,傳統車企分散式電子電氣架構中 ECU 數量龐大, 單個 ECU RAM 內存容量有限,同時供應商的底層代碼和嵌入軟體差別較大, 難以完成整車功能的統一更新。而特斯拉採用集中式的電子電氣架構,分為 CCM(中央計算模塊,整合ADAS 及 IVI 域功能)、BCM LH(左車身控制模塊)、 BCM RH(右車身控制模塊)三個部分,2015 款的 Model S 大約有 15 個 ECU, 此後發佈的 Model 3 則直接通過 Hardware3.0 和三個車身控制器執行來控制行 駛、轉向和停止等功能,集中的架構和高算力的控制模塊支撐了特斯拉整車 OTA 升級。目前特斯拉已經可以通過 OTA 的方式實現改善車輛的底盤、信息娛樂、 電池續航、ADAS 乃至自動駕駛等多項功能,讓車的功能迭代更加靈活和便捷, 最終變成一台可以不斷進化的智能終端。

    OTA 升級過程需數據網路配合,其安全性尤為重要。特斯拉 OTA 升級即指將程序從主機廠伺服器更新到指定 ECU,主要步驟為:車輛與伺服器通過蜂窩網 絡進行安全連接,將待更新的固件傳輸至車輛遠程信息處理系統及 OTA Manager,OTA Manager 將固件分發至需更新的 ECU 並管理更新過程,更新 完畢後向伺服器發送確認信息。整個 OTA 升級過程面臨安全考驗,騰訊科恩實 驗室曾實現對特斯拉的無物理接觸遠程攻擊,並將漏洞情況報告給特斯拉以做 修復。OTA 模式的信息安全(信息包加密及隔離)及功能安全(車輛狀態信息 傳輸)需得到足夠保障。

    特斯拉 OTA 依然屬於行業標杆,傳統車企追趕特斯拉在研發 OTA 過程中仍面 臨困境。具先發優勢的特斯拉在 OTA 對動力和底盤系統有效升級層面、用戶體 驗、系統成熟和穩定性方面均處於行業領先地位,引領傳統車企和造車新勢力 跟隨布局,但仍面臨較多困難,體現在三個方面:其一,需投入較大的人力、 物力、財力,考驗主機廠研發實力;其二,OTA 打破固有的經銷商提供增值服 務的模式,利潤蛋糕重新切分具一定阻力;其三,OTA 安全性和穩定性上要求 較高,主機廠需理解部分互聯網領域技術。

    大眾重塑軟體架構,推行 vw.OS 規劃

    曾囿於軟體問題車型延遲交付。在特斯拉軟體技術快速迭代壓力下,大眾加緊 開發基礎架構,或因為開發過於倉促等因素,曾多次發生軟體問題,如新一代 純電動汽車 ID.3 因為軟體開發延遲造成交付時間推遲,新款高爾夫也曾因為倉 促上馬新技術(全數字座艙)於車輛中發現軟體問題而臨時停售。

    大眾已著手構建軟體架構體系。為抗衡特斯拉及科技巨頭等新勢力的布局,大 眾愈發重視汽車軟體開發業務。2020 年 1 月 1 日起,大眾集團所有軟體開發工 作被集中至獨立新部門——Car.Software(2019 年 6 月份成立)。Car.Software 分為「互聯汽車和設備平台」「智能車身和駕駛艙」「自動駕駛」「車輛運動和能源」以 及「數字業務和出行服務」五個業務單元,其所有功能都將用於開發 vw.OS 車機 系統。一系列車型軟體問題出現后,寶馬製造工程高級副總裁 Dirk Hilgenberg 加入成為 Car.Software 負責人。此外大眾也對智能駕駛研發體系進行重組,如 拆分 L4 智能駕駛研發部分、合併各部門自動輔助駕駛研發。

    大眾軟體計劃的內在驅動力來源於兩個方面:

    其一:汽車軟體代碼愈發複雜。大眾曾做過統計,汽車軟體的行代碼遠大於其 他應用終端(汽車軟體 1 億行代碼 VS. Facebook 8 千萬行代碼 VS. PC 電腦 4 千行代碼 VS. 飛機 2.5 千萬行代碼 VS. 谷歌瀏覽器 1 千萬行代碼),是智能 手機的 10 倍。2020 年整車代碼量有望超 2 億行,達 L5 級智能駕駛代碼量有 望超 10 億行。

    其二:汽車成為複雜的聯網設備,軟體將扮演重要角色。在大眾傳統車型上僅 需約 70 個 ECU,功能相對較為分散。而在未來的集成化計算單元體系下,軟 件的重要性將愈發凸顯,與 ECU 配合定義汽車功能,涵蓋操作系統、基礎軟體 以及其他應用軟體的車載軟體大眾均會自主開發。

    大眾對研發投入、人員安排及軟體化目標做出規劃:

    投入方面,大眾集團將在未來三到五年內投入 90 億美元(約合人民幣 630 億 元)資金進行軟體開發。員工方面,不同於製造環節的裁員情況,數字化部門 員工由 5000 名再次擴編至 1 萬人。軟體化目標方面,內部研發軟體佔比由不 足 10%提升到 60%以上,同時提出「8 合 1 目標」(將現有的 8 個電子平台整 合為一個平台)。2025 年前,所有新車型將使用 vw.OS 操作系統和定製的雲服 務(大眾與微軟合作),軟體在汽車創新中佔據 90%份額。

    汽車軟體的未來推演

    若考慮對汽車開發的終極假想,汽車最終會成為搭載「差異化元素」的通用化 平台。以目前視角,差異化元素涵蓋智能座艙(人與車互動的生態系統,包括 包括全液晶儀錶、車聯網、車載信息娛樂系統 IVI、ADAS、HUD、AR、AI、全 息、氛圍燈、智能座椅等方面)及智能駕駛(L1~L5 級智能駕駛等級)領域。而差異化元素主要由車型全新的電子電氣架構和軟體兩方面定義,一方面,ECU 里的功能模塊持續循環迭代的代碼驅動汽車執行最適宜的動作反饋;另一方面, 車載娛樂系統越發 APP 化吸引較多第三方開發者入場。海量數據在車內流轉, 其深層次的安全防禦(檢測和防禦網路攻擊)愈發重要。經過產業趨勢推演, 提出以下 5 大汽車軟體趨勢預判。

    趨勢 1.往車輛集中式電子電氣架構發展,功能中心化

    集中式電子電氣架構為終極構架體系。以域控制器為代表產品的跨域集中式電 子電氣架構再往後走,就是集成化程度更高的車輛集中式電子電氣架構—— Vehicle computer and zone concept(車載電腦),終極階段為 Vehicle cloud computing(車雲計算)。未來車輛通過用高性能的中央計算單元取代現在常用 的分散式計算的架構,將實現「軟體定義車輛」的終極目標。再此過程 ECU 的整合過程持續提升,應用程序完全從硬體中抽象出來,控制單元概念最終被 智能節點計算網路接棒。

    趨勢2.更高傳輸性能的乙太網作為主幹網路承擔信息交換任務

    乙太網作為車內通信網路大勢所趨。隨車內數據傳輸總量及對傳輸速度要求持 續提升,以及在跨行業的標準協議需求驅動下,支撐更多應用場景、更高速的 乙太網有望取代 CAN(主要用於車載控制數據傳輸,最大帶寬 1MB/s)、LIN(低 成本通用串列匯流排,主要用於車門、天窗及座椅控制)、Most(主要用於發數據 包)等傳統汽車車內通信網路成為車內通信網路。在對同樣的 ECU 的軟體進行 更新時,CAN 模式下的傳輸時間是乙太網的 30 倍。因此,乙太網的運用趨勢 得到主流整車廠(如寶馬、通用等)及半導體公司(如博通、恩智浦等)認可, 均推出符合乙太網的應用元件。未來趨勢上,乙太網並非能一蹴而就完全替代 CAN、LIN,預計多種通信模式將在較長一段時間內共存——CAN、LIN 用於傳 感器和執行器等封閉低級網路間的數據傳輸;乙太網(取代 MOST 等技術)用 於域控制器及子部件間的信息交換。

    趨勢3.OTA 空中升級模式普及

    OTA 由特斯拉引領,向全行業普及。由特斯拉最先推行的 OTA 升級功能模塊 能持續修復汽車軟體缺陷、解決部分故障、解鎖或引入新功能以滿足用戶需求, 成為汽車軟體發展的主流趨勢。按照升級對象的不同,OTA 可分為 FOTA(硬 件在線升級)、SOTA(軟體在線升級)兩個大類,其中 FOTA 主要針對基礎硬 件和汽車底層安全相關功能的升級需求,例如剎車系統、制動系統及 BMS 等;SOTA 主要對座艙娛樂系統進行升級。對 ECU 而言,其內部為備份軟體準備了 額外區域空間,以備當前運行程序出現故障或升級中發生斷錯誤時自動滾回備 份軟體系統,防止車輛出現安全事故。

    趨勢4.汽車在雲端交換信息

    更為靈活的雲服務是 SDV 載體。從早期的機械時代過渡到目前的硬體時代,在 進一步進化至未來的軟體時代,汽車的功能實現方式持續演變,隨著客戶的個 性化定製需求日益增加,加之雲計算對智能、靈活和自動化的天然要求,由「軟 件定義」來操控硬體資源成為更合適的解決方案,未來大部分汽車功能在雲端 運行,為車企轉型提供聯接使能、數據使能、生態使能和演進使能。因此,在 雲計算的計算、存儲和網路等各方面的基礎設施上,均呈現出從軟硬體捆綁, 到硬體+閉源軟體,再到白盒硬體+開源軟體的演進趨勢。而雲服務也成為 AI、 智能汽車、大數據等新興科技實現商業化落地的載體(例如特斯拉在雲服務載 體上進行 OTA 升級)。近年來雲服務市場實現爆髮式增長,而車載環節尚處於 發展初期,後續增量空間大。

    趨勢5.信息安全領域需深層次防禦

    汽車電子的運用及智能網聯化趨勢推進車載信息安全要求提升。汽車脫離孤立 單元后,隨之而來的是攻擊面的新增,一方面車輛聯網后其數據面臨被盜取、 泄露風險,另一方面電控系統普及后存在轉向、剎車等關鍵功能被外部控制的 可能性(例如破解車機、T-Box、網管后,向 CAN 發送惡意指令)。即接入汽車控制終端的 APP、網路系統、ECU 代碼均可能成為新攻擊向量。雲(車聯網 平台)-管(車聯網基礎設施)-端(車載智能及聯網設備)均存在信息安全問 題,將造成車輛功能性安全隱患:

    (1)雲端與管端:接送關鍵數據的中央互聯網關直接連接至車企後台,部分第 三方公司被允許數據訪問。目前網聯實現通常會通過 APP 實現應用層功能(例 如解鎖車門、調用空調功能等),此時存在手機端與雲端的通信過程,且應用程 序供應商能直接訪問開放的相關數據介面。通過雲端和對外通信管端能對車機 端直接進行攻擊。

    (2)車機端:當功能系統被授權時,黑客能對CAN匯流排發送相關指令控制ECU。騰訊道恩實驗室曾對特斯拉 Model S 進行過無物理破解實驗,以 Wifi 熱點接入 向車載娛樂系統植入軟體取得車機許可權,在破解網關后能控制其多個電控單元。

    為抵禦外部攻擊需建立深層次的安全防禦系統,嚴控與功能安全及數據連接。汽車的防護措施隨交互信息增多其力度持續提升。車企安全團隊通常基於雲-管 -端對症建立安全防禦系統以應對外部攻擊:

    (1)雲端:車載終端是汽車安全架構的核心,主要注意 T-BOX(用於車端和 外界通信)和 OBD(用於將汽車外部設備連接到 CAN 匯流排)兩大塊的信息防 護。實時進行入侵檢測,防止 DDos 攻擊。

    (2)管端:汽車在未來將頻繁接入和退出網路節點,存在被篡改信息的風險。通常需要對通訊過程及傳輸數據進行加密,採用專門的 APN 接入網路。

    (3)車機端:加強安全固件驗簽及防 root 機制,管理介面並建立監控體系。此外,可在車輛功能模塊上單設安全晶元對數控進行校驗。

    部分第三方供應商能參與至信息安全環節。汽車安全防禦對於以特斯拉、蔚來、 小鵬等為代表的有互聯網基因的造車新勢力來說,擁有一定先天的優勢。包括 特斯拉在成立之初便組建了來自谷歌、微軟等互聯網企業的 40 人的網路安全專 家,小鵬和蔚來與阿里、騰訊等互聯網廠商進行深度合作,未來華為等供應商 是此領域的預備軍。目前網路安全系統仍缺乏標準的信息安全方案,原本的汽 車軟硬體供應商難以以統一標準滿足不同整車廠的信息安全要求,並且在測試 階段很難直接接入車企平台進行網路安全試驗。預計未來行業將有提供信息安 全方案、網路安全模塊以及某一特定領域防禦系統的第三方軟體供應商出現。

    投資建議和推薦標的

    百年汽車工業面臨由機械機器向電子產品過渡的新變局,在我們看不到的隱秘 角落——上百的電子控制單元循環執行軟體代碼功能塊,通過高性能的中央計 算單元,與硬體體繫結合以解析駕駛員需求,邏輯運算後向機械部件發送相應 響應指令。近年來,SDV(軟體定義汽車)概念逐步被整車廠認知,根源在於 「汽車如何體現差異化」問題的變遷,硬體體系將逐漸趨於一致,軟體成為定 義汽車的關鍵,即造車壁壘已經由從前的上萬個零部件拼合能力演變成將上億 行代碼組合運行的能力。

    SDV 趨勢下汽車軟硬體分離重塑市場格局,盈利模式由硬體向持續賦予附加值 的軟體傾斜。主機廠愈發需具備軟體的管理能力及核心軟體設計能力,並引入 供應商及互聯網企業參與此環節,開發基礎平台並收取許可費用、供應功能模 塊按汽車出貨量 Royalty 收費及基於車企平台做定製化的二次開發均為未來主 流的軟體供應商盈利模式。預計 2030 年 500 億美元市場空間,復合增速 9%。

    汽車最終會成為搭載「差異化元素」的通用化平台。一方面,ECU 里的功能模 塊持續循環迭代的代碼驅動汽車執行最適宜的動作反饋;另一方面,車載娛樂 信息系統越發 APP 化吸引較多第三方開發者入場。海量數據在車內流轉,其深 層次的安全防禦(檢測和防禦網路攻擊)愈發重要。關於賦能域控制器、定位 車機系統的各項軟體性能升級,包括車內乙太網應用、整車 OTA 升級、信息交 互上雲及深層次的信息安全防禦等,或將帶來一系列發展機遇。

    資料來源:https://m.news.sina.com.tw/article/20201001/36497492.html?fbclid=IwAR1zWwTMiTHwfLyqZ7Qx698UjYwI3v0c-hs3gXdy560Rf5BgAS4Ts4QLbOQ

  • 標準產業分類代碼 在 李開復 Kai-Fu Lee Facebook 的最讚貼文

    2020-07-08 18:00:23
    有 315 人按讚

    來自創新工場大灣區人工智慧研究院的兩篇論文入選了自然語言處理領域(NLP)頂級學術會議 ACL 2020 。
    這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各資料集上的分數全部刷至新高,在工業中也有著可觀的應用前景。

    本文來自創新工場公眾號
    ……………………………………………………………………

    創新工場兩篇論文入選ACL 2020,將中文分詞性能刷至新高

    “土地,我的金箍棒在哪裡?”
    “大聖,你的金箍,棒就棒在,特別配你的髮型。”

    感謝神奇的中文分詞,給我們帶來了多少樂趣。豐富多變的中文行文,給人的理解造成歧義,也給AI分詞帶來挑戰。

    近日,自然語言處理領域(NLP)頂級學術會議 ACL 2020 (https://acl2020.org/)正在火熱舉行。

    令人振奮的是,來自創新工場大灣區人工智慧研究院的兩篇論文入選。這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各資料集上的分數全部刷至新高,在工業中也有著可觀的應用前景。

    分詞及詞性標注是中文自然語言處理的基本任務,尤其在工業場景對分詞有非常直接的訴求,但當前沒有比較好的一體化解決方案,而且中文分詞普遍存在歧義和未登錄詞的難題。

    基於此,兩篇論文各自提出了“鍵-值記憶神經網路的中文分詞模型”和“基於雙通道注意力機制的分詞及詞性標注模型”,將外部知識(資訊)創造性融入分詞及詞性標注模型,有效剔除了分詞“噪音”誤導,大幅度提升了分詞及詞性標注效果。

    兩篇文章的作者有:華盛頓大學博士研究生、創新工場實習生田元賀,創新工場大灣區人工智慧研究院執行院長宋彥,創新工場科研合夥人張潼,創新工場CTO兼人工智慧工程院執行院長王詠剛等人。

    ACL(The Association for ComputationalLinguistics)國際計算語言學協會是自然語言處理領域影響力最大、最具活力的國際學術組織之一,自1962年創立以來已有58年歷史,其每年夏天舉辦的年會是該領域學術頂會。

    與往年不同的是,受新冠疫情影響,ACL2020全部轉為線上進行,不過這絲毫沒有減弱熱度。根據之前公佈的資料,今年大會投稿數量超過3000篇,共接收 779 篇論文,包括 571 篇長論文和 208 篇短論文,接收率為 25.2%,在全球疫情衝擊下反而是有史以來最盛大的一屆ACL會議,創新工場的技術大牛們也頂著時差連續數晚熬夜參會。

    ▌利用記憶神經網路,將中文分詞性能刷到歷史新高

    中文分詞目的是在中文的字序列中插入分隔符號,將其切分為詞。例如,“我喜歡音樂”將被切分為“我/喜歡/音樂”(“/”表示分隔符號)。

    中文語言因其特殊性,在分詞時面臨著兩個主要難點。一是歧義問題,由於中文存在大量歧義,一般的分詞工具在切分句子時可能會出錯。例如,“部分居民生活水準”,其正確的切分應為“部分/居民/生活/水準”,但存在“分居”、“民生”等歧義詞。“他從小學電腦技術”,正確的分詞是:他/從小/學/電腦技術,但也存在“小學”這種歧義詞。

    二是未登錄詞問題。未登錄詞指的是不在詞表,或者是模型在訓練的過程中沒有遇見過的詞。例如經濟、醫療、科技等科學領域的專業術語或者社交媒體上的新詞,或者是人名。這類問題在跨領域分詞任務中尤其明顯。

    對此,《ImprovingChinese Word Segmentation with Wordhood Memory Networks》這篇論文提出了基於鍵-值記憶神經網路的中文分詞模型。

    該模型利用n元組(即一個由連續n個字組成的序列,比如“居民”是一個2元組,“生活水準”是一個4元組)提供的每個字的構詞能力,通過加(降)權重實現特定語境下的歧義消解。並通過非監督方法構建詞表,實現對特定領域的未標注文本的利用,進而提升對未登錄詞的識別。

    例如,在“部分居民生活水準”這句話中,到底有多少可能成為詞的組塊?單字可成詞,如“民”;每兩個字的組合可能成詞,如“居民”;甚至四個字的組合也可能成詞,例如“居民生活”。

    把這些可能成詞的組合全部找到以後,加入到該分詞模型中。通過神經網路,學習哪些詞對於最後完整表達句意的幫助更大,進而分配不同的權重。像“部分”、“居民”、“生活”、“水準”這些詞都會被突出出來,但“分居”、“民生”這些詞就會被降權處理,從而預測出正確的結果。
    在“他從小學電腦技術” 這句話中,對於有歧義的部分“從小學”(有“從/小學”和“從小/學”兩種分法),該模型能夠對“從小”和“學”分配更高的權重,而對錯誤的n元組——“小學”分配較低的權重。

    為了檢驗該模型的分詞效果,論文進行了嚴格的標準實驗和跨領域實驗。

    實驗結果顯示,該模型在5個資料集(MSR、PKU、AS、CityU、CTB6)上的表現,均達了最好的成績(F值越高,性能越好)。(注:所選擇的五個資料集是中文分詞領域目前全世界唯一通用的標準資料集)

    創新工場大灣區人工智慧研究院執行院長宋彥表示,與前人的模型進行比較發現,該模型在所有資料集上的表現均超過了之前的工作,“把中文分詞領域廣泛使用的標準資料集上的性能全部刷到了新高。”

    在跨領域實驗中,論文使用網路博客資料集(CTB7)測試。實驗結果顯示,在整體F值以及未登陸詞的召回率上都有比較大提升。

    ▌“雙通道注意力機制”,有效剔除“噪音”誤導

    第二篇論文《Joint ChineseWord Segmentation and Part-of-speech Tagging via Two-way Attentions ofAuto-analyzed Knowledge》提供了一種基於雙通道注意力機制的分詞及詞性標注模型。

    中文分詞和詞性標注是兩個不同的任務。詞性標注是在已經切分好的文本中,給每一個詞標注其所屬的詞類,例如動詞、名詞、代詞、形容詞。詞性標注對後續的句子理解有重要的作用。

    在詞性標注中,歧義仍然是個老大難的問題。例如,對於“他要向全班同學報告書上的內容”中,“報告書”的正確的切分和標注應為“報告_VV/書_N”。但由於“報告書”本身也是一個常見詞,一般的工具可能會將其標注為“報告書_NN”。

    句法標注本身需要大量的時間和人力成本。在以往的標注工作中,使用外部自動工具獲取句法知識是主流方法。在這種情況下,如果模型不能識別並正確處理帶有雜音的句法知識,很可能會被不準確的句法知識誤導,做出錯誤的預測。

    例如,在句子“他馬上功夫很好”中,“馬”和“上”應該分開(正確的標注應為“馬_NN/上_NN”)。但按照一般的句法知識,卻可能得到不準確的切分及句法關係,如“馬上”。

    針對這一問題,該論文提出了一個基於雙通道注意力機制的分詞及詞性標注模型。該模型將中文分詞和詞性標注視作聯合任務,可一體化完成。模型分別對自動獲取的上下文特徵和句法知識加權,預測每個字的分詞和詞性標籤,不同的上下文特徵和句法知識在各自所屬的注意力通道內進行比較、加權,從而識別特定語境下不同上下文特徵和句法知識的貢獻。

    這樣一來,那些不準確的,對模型預測貢獻小的上下文特徵和句法知識就能被識別出來,並被分配小的權重,從而避免模型被這些有噪音的資訊誤導。

    即便在自動獲取的句法知識不準確的時候,該模型仍能有效識別並利用這種知識。例如,將前文有歧義、句法知識不準確的句子(“他馬上功夫很好”),輸入該雙通道注意力模型後,便得到了正確的分詞和詞性標注結果。

    為了測試該模型的性能,論文在一般領域和跨領域分別進行了實驗。

    一般領域實驗結果顯示,該模型在5個資料集(CTB5,CTB6,CTB7,CTB9,Universal Dependencies)的表現(F值)均超過前人的工作,也大幅度超過了斯坦福大學的 CoreNLP 工具,和伯克利大學的句法分析器。

    即使是在與CTB詞性標注規範不同的UD資料集中,該模型依然能吸收不同標注帶來的知識,並使用這種知識,得到更好的效果。

    而在跨領域的實驗中,和斯坦福大學的CoreNLP 工具相比,該模型也有近10個百分點的提升。

    ▌主動引入和分辨知識,實現中文分詞技術突破

    中文分詞在中國科研領域已經有幾十年的歷史。最初的中文分詞是基於詞典構建,詞典的好壞會直接影響到最後分析的效果。如果某個新詞在詞典裡沒有,那麼模型是死活都分不出來的。

    這種方式的局限性還在於,詞典和分詞兩件事情中間始終有一條鴻溝,儘管詞典可以編撰得非常全面,但在處理分詞的時候,因為每一句話都有上下文語境,往往會產生多種不同的切分方法,從而無法有效地在當前語境下對分詞結構進行恰當的指導。

    從2003年開始,分詞方法出現了新的突破。研究人員提出了打標籤的方式,通過給每一個字打詞首、詞尾、詞中的標籤,不再需要構建詞典,大幅度提升了未登錄詞的召回效果。

    到了2014年左右,深度學習和神經網路開始被廣泛應用到中文分詞中,打標籤的模型從之前的淺層學習變成了深度學習,但演算法本質沒有發生變化,所以提升作用並不太大。

    近兩年,學界開始研究怎麼在打標籤的過程中加入外部知識和資訊。創新工場的這兩篇文章就是沿著這個路徑,用記憶神經網路的方式記錄對分詞結果有影響的 n元組,並引入對詞性標注有影響的句法知識,將分詞結果和自動獲得的知識銜接起來,既發揮了神經網路的優勢,也把知識的優勢用上,實現了分詞技術上小而有效的改進和突破。

    宋彥表示,“從技術創新的角度,我們的貢獻主要有兩點。一是在現有技術的基礎上,建立了一個一體化的模型框架,使用非監督方法構建詞表,並把知識(資訊)融入進來,使用更高層次的句法知識,來幫助詞性標注,起到'他山之石,可以攻玉’的效果。”

    “二是主動吸收和分辨不同的外部知識(資訊)。通過鍵-值記憶神經網路和雙通道注意力機制,進行動態權重的分配,能夠有效分辨知識,區分哪些是有效的,哪些是無效的。雖然這些知識是自動獲取的、不準確的,但‘三個臭皮匠,頂個諸葛亮’,經過有效利用,總能湊出一些有用的資訊。如何實現模型的主動吸收和分辨,就變得更加重要。”

    據瞭解,今年的ACL大會,在分詞領域一共收錄了18篇論文,創新工場人工智慧工程院同時有2篇入選,也表現出ACL官方對這一貢獻的認可。

    ▌具備跨領域分詞能力,提升工業應用效率

    中文分詞和詞性標注是最底層的應用,對於接下來的應用和任務處理非常重要。例如對於文本分類、情感分析,文本摘要、機器翻譯等,分詞都是不可或缺的基本“元件”。

    宋彥表示,做此項研究的目的是主要為了拓展其工業場景的應用,正確的分詞能夠平衡公司應用開發的效率和性能,同時方便人工干預及(預)後處理。

    這也是創新工場人工智慧工程院的努力方向之一。工程院成立於2016年9月,宗旨是銜接科技創新和行業賦能,做嫁接科研和產業應用的橋樑,為行業改造業務流程、提升業務效率。

    工程院下設北京總部、南京研究院和大灣區研究院。大灣區研究院再下設資訊感知和理解實驗室,專注于對自然語言處理(NLP)領域的研究。執行院長宋彥本人也有超過15年的NLP領域的科研經驗。

    “在工業場景使用的時候,跨領域的模型能力是一個非常直接的訴求。”宋彥表示,在某個領域的訓練模型,大概率也需要應用到其他領域。

    “如何在新領域缺少資料,或者新領域只有少量未標注資料的情況下,實現模型的冷開機,依然是項巨大的挑戰。如果能利用外部知識,提高模型性能,就能有效地召回很多在訓練集中沒有出現過的新詞。”

    例如搜尋引擎的廣告系統,最初也是通過組詞匹配的方式,在某個特定領域訓練其分詞模型,但在進入一個新的領域時,例如從新聞領域進入醫療領域或體育領域,效果往往會大打折扣,甚至頻頻出錯。

    而使用跨領域特性後,廣告系統在進入新領域時,便無需額外的資料,就可以對它進行比較準確的分詞和標注,從而有效匹配廣告和客戶,大大提升系統運行的效率和穩定性。

    目前,這兩篇論文的工具都已經開源,在下面兩個連結中,可以找到對應的所有代碼和模型,各位朋友可按需自取:

    分詞工具:https://github.com/SVAIGBA/WMSeg
    分詞及詞性標注工具:https://github.com/SVAIGBA/TwASP

  • 標準產業分類代碼 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文

    2020-05-21 09:20:58
    有 0 人按讚

    AI加持的物聯網:實現你對未來生活的一切幻想

    2020年05月13日16:21 電子產品世界

    人工智能和物聯網密不可分。人工智能的整個想法是從物聯網設備捕獲更多可行的數據,就像我們自己的人類意識一樣,人工智能可以依靠與人類相似的感覺來將他們的思維過程與我們的物理世界聯繫起來。

    準確地說,人工智能更多是關於使機器具有智能行為,物聯網的功能是使這些機器連接起來。

    物聯網幫助AI感知世界

    物聯網提供了對傳感器的便捷訪問,從而使AI感知到世界—— 紅外“眼睛”使AI可以“看到”熱量變化,以及標準的對象檢測、計數和分類;超聲波“聽覺”,可以訪問超出人類頻譜的頻率範圍;加速度計可捕捉“觸覺”運動,其細節要比我們自己的指尖好得多;顆粒和化學傳感器提供了靈敏的“鼻子”。在許多不同的地方,獲得比我們人類更多的感覺輸入。

    通過物聯網捕獲數據的能力在過去五年中爆炸性的大規模發展,傳感器現已應用於幾乎所有領域,這表明可以從每個事物或流程中實時收集無限多個數據。物聯網設備是製造環境以及客戶服務部門中數據收集過程的第一線,任何具有芯片組的設備都可以連接到網絡並開始24/7流數據傳輸。

    AI增強了這些物聯網驅動的感覺輸入的感知和意義。物聯網有效地測量並指示物理數據屬性,而AI是使您能夠感知物理數據代表什麼的大腦。

    低成本分佈式、計算功能(雲)的廣泛可用性、開源軟件的發展、機器學習的進步以及移動驅動的先進微電子(ARM)功能的出現,為最終連接提供了許多點,使AI成為現實。

    隨著廉價傳感器和低成本網絡連接的出現,物聯網設備的數量正在激增。根據Gartner的調查,到2020年,全球將有超過200億台互聯設備。物聯網設備的持續激增導致需要存儲和保留的數據激增,但物聯網領域的進步仍然受到可計算數據的速度和效率以及價值提取的約束。企業被這些設備產生的海量數據所淹沒,他們希望人工智能來幫助管理這些設備,並從這些大量的數據中獲得更多的見地和智慧。

    有趣的是,當前人工智能技術的興起可能為當今數字世界所面臨的數據氾濫提供了解決方法。隨著這兩個領域的迅速創新發生,我們可以從它們的融合道路中期待什麼?

    AI幫助物聯網實現想像

    2016年7月,軟銀斥資243億英鎊收購了微芯片巨頭ARM。軟銀總裁孫正義認為,物聯網將引領下一輪技術爆炸,他指出:“物聯網與人工智能之間的關係就像眼睛和大腦使生物進化的關係。物聯網正在爆炸”。

    從1956年人工智能學科被正式提出至今,人工智能的技術一直在不斷發展,但直到近幾年物聯網產業逐步走向成熟後,人工智能的發展才迎來了又一次發展的春天。如今,利用AI來幫助進行實時分析的互聯設備已經面世,並且廣泛採用的趨勢正在上升。例如Nest等智能恆溫器,它們利用AI來學習用戶的溫度偏好並相應地調整能源使用。

    另外,通過顯式編程編寫算法的傳統方法太耗時且容易出錯,以至於許多物聯網設備都無法理解。為了有效地分析IoT數據,企業正在轉向基於機器學習的AI來尋找模式和相關性,以實現IoT的承諾。

    在企業部門中,AI已經通過幫助實時決策制定了標誌。AI的功能對於企業同時有效處理與這些組件相關的事務(時間、金錢和風險)特別有價值。這可以包括銷售預測,信息管理和各種形式的自動化。

    調查顯示,近一半(49%)的受訪者已經在他們的物聯網應用中使用人工智能。物聯網和AI方向的機會繼續增長。現在,業界將這種融合稱為“ AIoT”。最後一次如此大的融合發生在1990年代後期,手機和互聯網的碰撞改變了人類歷史的進程,人工智能與物聯網的融合將帶來更大範圍的類似革命。

    硬件製造商和解決方案提供商已經在全力以赴,以利用這種技術融合併在不斷發展的工業環境中處於有利地位。諸如亞馬遜之類的創新公司正在為員工提供即將過時的工作職能方面的培訓和再教育機會,這種技術的融合正在推向市場。

    實際意義上來說,AI在某種程度上可以幫助物聯網出現的突發情況進行迅速應對,這才是當今互聯網時代的智能優勢。我們可以看到在許多問題出現的時候,解決方案也相應出現,這些解決方案的計算能力也將隨著人類的需求的改變而進行延伸和發展。

    人工智能在發展的早期,由於數據量少、運算速度跟不上等原因,一直發展比較緩慢。但近二年隨著物聯網的發展,促進了大數據和雲計算技術的發展,雲計算和大數據技術的進步,又使物聯網產生的大量數據的存儲和計算沒有了後顧之憂,而AI技術可以使這些數據發揮更大的作用。

    物聯網、大數據、雲計算的發展為AI的發展提供了豐富的數據,而AI的發展也使得物聯網時代變得更加智慧。但是,對AI和IoT的全面優化還相距遙遠,在解決問題和信息可以改善所有利益相關者成果的情況下,這兩種技術現在正在跨行業組合。

    隨著物聯網、人工智能的相互促進和滲透,各個行業也發生了一些變化,智能製造、智慧城市、智慧交通、智慧工廠、智能家居等大批“智能化”的新業態不斷出現。

    揭秘AI和物聯網的力量

    你對AI和物聯網如何統治科技世界有了解嗎?以下是一些重要的統計數據:

    · Gartner表示,到2022年,將有80%的企業物聯網項目將AI作為主要組成部分。

    · 41%的消費者認為人工智能將改善他們的生活。

    · 每秒有127個IoT設備連接到互聯網。

    · Statista報告稱,到2025年,預計全球將有440億個IoT設備。

    物聯網和人工智能的結合正在改變許多行業以及企業與客戶之間的關係。企業現在可以通過物聯網收集數據並將其轉化為有用和有價值的信息。

    當今企業在人工智能和物聯網方面面臨的共同挑戰是物聯網數據的應用、可訪問性和分析。如果您有來自各種來源的數據池,您可以使用這些數據進行一些統計分析。但是,如果你想在預測未來事件中採取積極主動的行動,一個企業需要學習如何辨別這種數據和分析過程。

    企業正在以多種不同的方式實施支持人工智能的物聯網系統:有關解決方案公司開始提供打包好的代碼和模板,其中包括針對特定應用領域(如航運和物流、製造、能源、環境、建築和設施運營)的測試模型;其他公司正在創建客戶解決方案,構建和培訓自己的模型,利用雲供應商的外部CPU能力。

    隨著消費者、企業和政府開始在各種環境中部署物聯網,我們的世界將發生巨大變化。它已經迅速地改變了從零售到供應鏈再到醫療保健的一切。

    人工智能驅動的物聯網對各個行業的影響:

    · 智能建築:智能傳感器通過預防火災、洪水或短路等事故來預測事件並提高安全性。

    · 智能家居:智能家居的出現旨在為我們的生活提供一個機會,讓我們的設備無論在哪裡都能被控制。在美國,智能家居市場預計到2021年將覆蓋28%的家庭。

    · 航空飛機:傳感器已經在飛機上被用來監測和預防各種錯誤和風險,甚至在它們發生之前。

    · 石油勘探:這種類型的機器在無法正常工作時會給公司造成巨大損失,大多數石油工業公司傾向於在石油鑽探機械上投入大量資金。得益於物聯網,智能傳感器現在可以很容易地連接到機器上。這樣做意味著提供預防性維護分析,從而降低運營成本。

    · 自動駕駛:自動駕駛系統結合了專用硬件,可以實現GPS、聲納、攝像機和前視雷達,從而可以充分利用數據並將其耦合到神經網絡體系結構中。這就像一個自封閉系統,可以從傳感器收集信息,並進一步使用神經網絡模型來確定汽車運動的下一個變化。

    · 健康監測系統:構建醫療設備來監測、診斷身體狀況。用傳感器收集信息,AI來預測身體狀況。

    · 智能電網:利用物聯網設備和傳感器網格的優勢,它們可以在系統中收集和傳輸數據,從而可以自動調節電流。可以實時將問題通知遠程管理器,如果有問題可以立即採取行動。

    · 供應鏈:解決運營物流網絡的複雜性,正確實施AI可以幫助公司做出更明智、更迅速的決策。通過預測期望值,他們可以調整貨物數量並將貨物調配到預計最大需求的位置,降低運營成本。

    · 智能倉庫:智能倉庫是完全自動化的設施,其中大部分工作是通過自動化或軟件來完成的。在此過程中繁瑣的任務得以簡化,操作變得更具成本效益。阿里巴巴和亞馬遜已經通過使用自動化改造了他們的倉庫。亞馬遜最近推出了自動裝箱客戶訂單的機器。在亞馬遜倉庫中,機器人與人類並肩工作以提高生產力和效率。

    物聯網設備的普及正使未來成為一個緊密相連、即時獲取信息的世界。現在需要人工智能來管理所有這些設備,並理解這些設備返回的數據。從某種程度上講,人工智能和物聯網是互利共生的,並將繼續保持相互交織的關係向前發展。

    資料來源:https://tech.sina.com.cn/roll/2020-05-13/doc-iirczymk1423034.shtml

你可能也想看看

搜尋相關網站