[爆卦]深度學習影像辨識原理是什麼?優點缺點精華區懶人包

雖然這篇深度學習影像辨識原理鄉民發文沒有被收入到精華區:在深度學習影像辨識原理這個話題中,我們另外找到其它相關的精選爆讚文章

在 深度學習影像辨識原理產品中有12篇Facebook貼文,粉絲數超過3,992的網紅台灣物聯網實驗室 IOT Labs,也在其Facebook貼文中提到, 機器學習識別特徵阻絕代測 上鏈回送監理資料庫防竄改 人臉辨識加酒精鎖阻酒駕 串區塊鏈上傳比對告警 2021-05-24社團法人台灣E化資安分析管理協會元智大學多媒體安全與影像處理實驗室 本文將介紹酒精防偽人臉影像辨識系統,結合了人臉辨識、酒精鎖以及區塊鏈應用,以解決酒駕問題,並透過監控系統避免...

 同時也有1部Youtube影片,追蹤數超過8萬的網紅范琪斐,也在其Youtube影片中提到,人臉辨識,就是用科技計算的方式,來比較臉部視覺特徵,藉此鑑定身分的一種電腦技術。 其實我們可以把人臉辨識想像成是一套演算法,各種不同的廠商或公司可能會有不同的演算規則。但整體的邏輯是一樣的,通常會先偵測人臉、然後進行臉部校正與擷取特徵、再進行比對工作。 當攝影機拍到你的時候,它第一步也會先切成一...

  • 深度學習影像辨識原理 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文

    2021-05-29 18:18:27
    有 0 人按讚

    機器學習識別特徵阻絕代測 上鏈回送監理資料庫防竄改

    人臉辨識加酒精鎖阻酒駕 串區塊鏈上傳比對告警

    2021-05-24社團法人台灣E化資安分析管理協會元智大學多媒體安全與影像處理實驗室

    本文將介紹酒精防偽人臉影像辨識系統,結合了人臉辨識、酒精鎖以及區塊鏈應用,以解決酒駕問題,並透過監控系統避免代測狀況發生。且利用區塊鏈不可修改的特性,將車輛與人臉資料串上區塊鏈,以確保駕駛人的不可否認性。

    長長期以來「酒駕」都是一個很嚴肅且必須被重視的議題,儘管在2019年立法院修法酒駕及拒絕酒測的罰則,但是抱持僥倖心態的人還是數不勝數,導致因酒駕釀成車禍的悲劇還是一再重演,讓不少的家庭因此破滅。

    據統計,從2015年到2018年的酒駕取締件數都逾10萬件,而因為酒駕車禍的死亡人數逾百人。在2019年酒駕新制上路以後,2020年警方酒駕取締件數有明顯下降至約6萬件,雖然成功達到嚇阻效果,但是死亡人數仍與去年前年持平,可見離完全遏止酒駕還有很長的路需要努力。

    立法院於2018年三讀通過了「道路交通管理處罰條例部分條文修正案」,酒駕者必須重新考照,並且只能駕駛具有酒精鎖(Alcohol Interlock)的車輛,所謂酒精鎖,屬於車輛點火自動鎖定裝置,在汽車發動前必須進行酒測,通過才能將汽車發動,而且在每45分鐘至60分鐘後酒精鎖系統就會要求駕駛人在一定時間內進行重新酒測,以便防範在行車過程中有飲酒的情況發生,若駕駛人未遵守其要求,車子就會強制熄火並鎖死,必須回酒精鎖服務中心才能將鎖解開。

    由於法案的方式無法完全遏止酒駕,因此許多創新科技或是企業致力於研究相關科技來解決酒駕的問題。

    其中本田(Honda)汽車與日立(Hitachi)公司研發出手持型酒精含量檢測裝置,讓駕駛人必須在駕駛之前都先進行酒測,若酒精濃度超標就會將汽車載具上鎖,藉此避免酒駕意外或事故發生,且該技術結合了智慧鑰匙功能,若偵測到酒測值超標,車輛中的顯示面板將會發出警告訊號告知駕駛人,避免酒駕上路之問題。

    另一方面則是解決酒精殘值之問題,因為有許多駕駛人都會認為,休息一下後,身體也無感到不適,即駕車出門,等到駕駛人被警方臨檢時才知道酒測未通過,因此收到罰單,甚至是吊銷駕照處罰等。

    根據醫學研究指出,酒精是在人體體內由肝臟代謝,實際代謝時間必須看體質以及飲酒量而定。台灣酒駕防制社會關懷協會建議,喝酒後至少要10至20小時後再駕車比較安全。多數人無具備酒精代謝時間的觀念,導致駕駛人貿然上路,待意外發生或罰單臨頭時,已經為時已晚。

    背景知識說明

    本文介紹的方法為酒精鎖結合攝影鏡頭進行人臉辨識,並將人臉特徵資料與車輛資料串上區塊鏈,並利用區塊鏈不可篡改的特性,來避免駕駛人在解鎖酒精鎖時發生他人代測的問題。

    由於人臉辨識技術具備防偽性、身分驗證的特性,因此將酒精鎖的技術結合人臉辨識,便可確認為駕駛本人。

    何謂人臉辨識

    人臉辨識技術屬於生物辨識的一種,基於人工智慧、機器學習、深度學習等技術,將大量人臉的資料輸入至電腦中做為模型訓練的素材,讓電腦透過演算法學習人類的面部特徵,藉以歸納其關聯性最後輸出人臉的特徵模型。

    目前人臉辨識技術已經遍佈在日常生活之中,其應用面廣泛,最為常見的應用即為智慧型手機的解鎖、行動支付如LINE Pay、Apple Pay等,其他應用還包括行動網路銀行、網路郵局、社區大樓門禁管理系統、企業監控系統、機場出入關、智能ATM、中國天眼系統等。一般來說,人臉辨識皆具備以下幾個特性:

    ‧ 普遍性:屬於任何人皆擁有的特徵。

    ‧ 唯一性:除本人以外,其他人不具相同的特徵。

    ‧ 永續性:特徵不易隨著短時間有大幅的改變。

    ‧ 方便性:人臉辨識容易實施,設備容易取得,如相機鏡頭。

    ‧ 非接觸性:不須直接接觸儀器,也可以進行辨識,這部分考量到衛生問題以及辨識速度。

    人臉辨識透過人臉特徵的分析比對進行身分的驗證,別於其他生物辨識如虹膜辨識、指紋辨識,無須近距離接觸,也可以精準地辨識身分,且具有同時辨識多人的能力。因應新冠肺炎疫情肆虐全球,人臉辨識技術也被用來管理人來人往的人流。人臉辨識的儀器可以搭配紅外線攝影機來測量人體體溫,在門禁進出管制系統中,利於提高管理效率,有效掌握到進出人員的身分,以及幫助衛生福利部在做疫調時更容易掌握到確診病患行經的足跡。

    人臉辨識的步驟

    人臉辨識的過程與步驟,包括人臉偵測、人臉校正、人臉特徵值的摘取,進行機器學習與深度學習、輸出人臉模型,從影像中先尋找目標人臉,偵測到目標後會將人臉進行預處理、灰階化、校正,並摘取特徵值,接著人臉資料交給電腦進行機器學習與深度學習運算,最後輸出已訓練好的模型。相關辨識的步驟,如圖1所示。

    人臉偵測

    基於Haar臉部檢測器的基本思想,對於一個一般的正臉而言,眼睛周圍的亮度較前額與臉頰暗、嘴巴比臉頰暗等其他明顯特徵。基於這樣的模式進行數千、數萬次的訓練,所訓練出的人臉模型,其訓練時間可能為幾個小時甚至幾天到幾周不等。利用已經訓練好的Haar人臉特徵模型,可以有效地在影像中偵測到人臉。

    Python中的Dilb函式庫提供了訓練好的人臉模型,可以偵測出人臉的68個特徵點,包括臉的輪廓、眉毛、眼睛、鼻子、嘴巴。基於這些特徵點的資料就能夠進行人臉偵測,如圖2~4所示。圖中左上角的部分是偵測到的分數,若分數越高,代表該張影像就越可能是人臉,右側括弧中的編號代表子偵測器的編號,代表人臉的方向,其中0為正面、1為左側、2為右側。

    人臉的預處理

    偵測到人臉後,要針對圖片進行預處理。通常訓練的影像與攝影鏡頭拍出來的照片會有很大的不同,尤其會受到燈光、角度、表情等影響,為了改善這類問題,必須對圖片進行預處理以減少這類的問題,其中訓練的資料集也很重要:

    ‧ 幾何變換與裁剪:將影像中的人臉對齊與校正,將影像中不重要的部分進行裁切,並旋轉人臉,並使眼睛保持水平。

    ‧ 針對人臉的兩側用直方圖均衡化:可以增強影像中的對比度,可以改善過曝的影像或是曝光不足的問題,更有效地顯示與取得人臉目標的特徵點。

    ‧ 影像平滑化:影像在傳遞的過程中若受到通道、劣質取樣系統或是受到其他干擾導致影像變得粗糙,藉由使用圖形平滑處理,可以減少影像中的鋸齒效應和雜訊。

    人臉特徵摘取

    關於人臉特徵摘取,相關的技術說明如下:

    ‧ 歐式距離:人臉辨識是一個監督式學習,利用建立好的人臉模型,將測試資料和訓練資料進行匹配,最直觀的方式就是利用歐式距離來計算所有測試資料與訓練資料之間的距離,選擇差距最小者的影像作為辨識結果。由於人臉資料過於複雜,且需要大量的訓練集資料與測試集資料,會導致計算量過大,使辨識的速度過於緩慢,因此需要透過主成分分析法(Principal Components Analysis,PCA)來解決此問題。

    ‧ 主成分分析法:主成分分析法為統計學中的方法,目的是將大量且複雜的人臉資料進行降維,只保留影像中的主成分,即為影像中的關鍵像素,以在維持精確度的前提下加快辨識的速度。先將原本的二維影像資料每列資料減掉平均值,並計算協方差矩陣且取得特徵值與特徵向量,接著將訓練集與測試集的資料進行降維,讓新的像素矩陣中只保留主成分,最後則將降維後的測試資料與訓練資料做匹配,選擇距離最近者為辨識的結果。由於影像資料經過了降維的步驟,因此人臉辨識的速度將會大幅度地提升。

    ‧ 卷積神經網路:卷積神經網路(Convolutional Neural Network,CNN)是一種神經網路的架構,在影像辨識、人臉辨識至自駕車領域中都被廣泛運用,是深度學習(Deep Learning)中重要的一部分。主要的目的是透過濾波器對影像進行卷積、池化運算,藉此來提取圖片的特徵,並進行分類、辨識、訓練模型等作業。在人臉辨識的應用中,首先會輸入人臉的影像,再透過CNN從影像提取像素特徵並轉換成特定形式輸出,並用輸出的資料集進行訓練、辨識等等。

    何謂酒精鎖

    酒精鎖(圖5)是一種裝置在車輛載體中的配備,讓駕駛人必須在汽車發動前進行酒測,通過後才能將車輛發動。且每隔45分鐘至60分鐘會發出要求,讓駕駛人在時間內再次進行檢測。

    根據歐盟經驗,提高罰款金額以及吊銷駕照只有在短期實施有效,只有勸阻的效果,若在執法上不夠嚴謹,被吊照者會轉變成無照駕駛,因此防止酒駕最有效的方法就是強制讓駕駛人無法上路,這就是「酒精鎖」的設計精神。

    在本國2020年3月1日起酒駕新制通過後,針對酒駕犯有了更明確且更嚴厲的規定,在酒駕被吊銷駕照者重考後,一年內車輛要裝酒精鎖,未通過酒測者無法啟動,且必須上15小時的教育訓練才能重考,若酒駕累犯三次,要接受酒癮評估治療滿一年、十二次才能重考。

    許多民眾對於「酒精鎖」議論紛紛,懷疑是否會發生找其他人代吹酒精鎖的疑慮,為防範此問題,酒精鎖在啟動後的五分鐘內重新進行吹氣,且汽車在行駛期間的每45至60分鐘內,便會隨機要求駕駛重新進行酒測,如果沒有通過測量或是沒有測量,整合在汽車智慧顯示面板的酒精鎖便會發出警告,並勸告駕駛停止駕車。

    對於酒精鎖的實施,目前無法完全普及到每一台車子,而且對於沒有飲酒習慣的民眾而言,根本是多此一舉,反而增加不少麻煩給駕駛。若還有每45~60分鐘的隨機檢測,會導致多輛汽車必須臨時停靠路邊進行檢測,可能加劇汽車違規停車的發生頻率。

    認識區塊鏈

    區塊鏈技術是一種不依賴於第三方,透過分散式節點(Peer to Peer,P2P)來進行網路數據的存儲、交易與驗證的技術方法。本質上就是一個去中心化的資料庫,任何人在任何時間都可以依照相同的技術標準將訊息打包成區塊並串上區塊鏈,而這些被串上區塊鏈的區塊無法再被更改。區塊鏈技術主要依靠了密碼學與HASH來保護訊息安全,也是賦予區塊鏈技術具有高安全性、不可篡改性以及去中心化的關鍵。區塊鏈相關概念,如圖6所示。

    區塊鏈的原理與特性

    可以將區塊鏈想像成是一個大型公開帳本,網路上的每個節點都擁有完整的帳本備份,當產生一筆交易時,會將這筆交易廣播到各個節點,而每個節點會將未驗證的交易HASH值收集至區塊內。接著,每個節點進行工作量證明,選取計算最快的節點進行這些交易的驗證,完成後會把區塊廣播給到其他節點,其他節點會再度確認區塊中包含的交易是否有效,驗證過後才會接受區塊並串上區塊鏈,此時就無法再將資料進行篡改。

    關於區塊鏈的特性,可分成以下四部分做說明:

    1. 去中心化:區塊鏈其中一個最重要的核心宗旨,就是「去中心化」,區塊鏈採用分散式的點對點傳輸,該概念架構中,節點與節點之中沒有所謂的中心,所有的操作都部署在分散式的節點中,而無須部署在中心化機構的伺服器,一筆交易或資料的傳輸不再需要第三方的介入,因此又可以說每個節點就是所謂的「中心」。這樣的結構也加強了區塊鏈的穩定性,不會因為其中的部分節點故障而癱瘓整個區塊鏈的結構。

    2. 不可篡改性:透過密碼學與雜湊函數的運用來將資料打包成區塊並上鏈,所有區塊都有屬於它的時間戳記,並依照時間順序排序,而所有節點的帳本資料中又記錄了完整的歷史內容,讓區塊鏈無法進行更改或是更改成本很高,因此使區塊鏈具備「不可篡改性」,並且同時確保了資料的完整性、安全性以及真實性。

    3. 可追溯性:區塊鏈是一種鏈式的資料結構,鏈上的訊息區塊依照時間的順序環環相扣,這便使得區塊鏈具有可追溯的特性。可追本溯源的特性適用在廣泛的領域中,如供應鏈、版權保護、醫療、學歷認證等。區塊鏈就如同記帳帳本一般,每筆交易記錄著時間和訊息內容,若要進行資料的更改,則會視為一筆新的交易,且舊的紀錄仍會存在無法更動,因此仍可依照過去的交易事件進行追溯。

    4. 匿名性:在去中心化的結構下,節點與節點之間不分主從關係,且每個節點中都擁有一本完整的帳本,因此區塊鏈系統是公開透明的。此時,個人資料與訊息內容的隱私就非常重要,區塊鏈技術運用了HASH運算、非對稱式加密與數位簽章等其他密碼學技術,讓節點資料在完全開放的情況下,也能保護隱私以及用戶的匿名性。

    區塊鏈與酒精鎖

    由於區塊鏈的技術具備去中心化、記錄時間以及不可篡改的特性,且更加強酒精鎖的檢測需要身分驗證的保證性。當進行酒精鎖檢測解鎖時,系統記錄駕駛人吹氣時間以及車輛的相關資訊,還有人臉特徵資料打包成區塊並串上區塊鏈。因此,在同一時間當監控系統偵測到當前駕駛人與吹氣人不同時,此時區塊鏈中所記錄的資料便能成為一個強而有力的依據,同時也能讓其他的違規或違法事件可以更容易進行追溯。

    酒駕防偽人臉辨識系統介紹

    為了解決酒精鎖發生駕駛人代測的問題,酒精鎖產品應導入具有身分驗證性的人臉辨識技術。酒駕防偽人臉辨識系統即為駕駛人在進行酒精鎖解鎖時,要同時進行人臉辨識,來確保駕駛人與吹氣人為同一人。

    在駕駛座前方的位置會安裝攝影鏡頭,作為駕駛的監控裝置。進行酒測吹氣的人臉資料將會輸入到該系統中的資料庫儲存,並將人臉資料以及酒測的時間戳記打包成區塊串上區塊鏈,當汽車已經駛動時,攝影鏡頭將會將當前駕駛人畫面傳回系統進行人臉比對驗證。如果驗證成功,會將通過的紀錄與時間戳一同上傳至區塊鏈,若是系統偵測到駕駛人與吹氣人為不同對象,系統將發出警示要求駕駛停車並重新進行檢測,並同時將此次異常的情況進行記錄上傳到區塊鏈中。

    如果駕駛持續不遵循系統指示仍持續行駛,該系統會將區塊鏈的紀錄傳送回給開罰的相關單位,並同時發出警報以告知附近用路人該車輛處於異常情況,應先行迴避。且該車輛於熄火後,酒精鎖會將車輛上鎖,必須聯絡酒精鎖廠商或酒精鎖服務中心才能解鎖。相關的系統概念流程圖,如圖7所示。

    區塊鏈打包上鏈模擬

    在進行酒測解鎖完畢以及進行人臉資料儲存後,會透過CNN將影像轉換輸出成128維的特徵向量作為人臉資料的測量值,接著將128個人臉特徵向量資料取出,並隨著車輛資訊一起打包到同一個區塊,然後串上區塊鏈。取出的人臉特徵資料,如圖8所示。

    要打包成區塊和上鏈的內容,包括了人臉特徵資料、車牌號碼、酒測解鎖時間點等相關輔助資料,接著透過雜湊函數將相關的資料打包成區塊。以車牌號碼ABC-1234為例,圖9顯示將車輛資料和人臉資料進行區塊鏈的打包,並進行HASH運算。

    將人臉資料和車輛相關資料作為一次的交易內容,並打包區塊,經過HASH後的結果如圖10所示,其中prev_hash屬性代表鏈結串列指向前一筆資料,由於這是實作模擬情境,並無上一筆資料,其中messages屬性代表內容數,一筆代表車牌資料,另一筆則為人臉資料。time屬性則代表區塊上鏈的時間點,代表車輛解鎖的時間點。

    情境演練說明

    話說小禛是一間企業的上班族,平時以開車為上下班的交通工具,他的汽車配置了酒駕防偽影像辨識系統,以下模擬小禛下班後準備開車的情境。

    已經下班的小禛今天打算從公司開車回家,當小禛上車準備發動車子時,他必須先拿起安裝在車上的酒測器進行吹氣,並將臉對準攝影鏡頭讓系統取得小禛的人臉影像。小禛在汽車發動前的人臉影像,如圖11所示。

    待攝影鏡頭偵測到小禛的人臉後,接著系統便會擷取臉上五官的68個特徵點,如圖12所示。然後,相關數據再透過CNN轉換輸出成128維的特徵向量作為人臉資料的測量值,如圖13所示。

    酒精鎖通過解鎖後,車輛隨之發動,解鎖成功的時間點將會記錄成時間戳記,隨著影像與相關資料串上區塊鏈。在行駛途中,設置在駕駛座前方的鏡頭將擷取目前駕駛的人臉,以取得駕駛人的128維人臉特徵向量測量值,並且與汽車發動前所存入的人臉資料進行比對,藉以判斷目前的駕駛人與剛才的吹氣人臉是否為同一位駕駛。當驗證通過後,也會再將通過的紀錄與時間戳上傳至區塊鏈中,如此一來,區塊鏈的訊息內容便完整記載了這一次駕車的紀錄,檢測通過的示意圖如圖14所示。

    系統通過辨識後,便確認了駕駛人的身分與吹氣人一致。且透過時戳的紀錄和區塊鏈的輔助,也確保了駕駛的不可否認性。若有其他違規事件發生時,區塊鏈的紀錄便成為一個強而有力的依據來進行追溯。

    如此一來,便可以預防小禛喝酒卻找其他人代吹酒測器的情況發生。在駕駛的途中,如果有需要更換駕駛人,必須待車輛靜止時,從車載系統發出更換駕駛要求,再重新進行酒測以及重複上述流程,才可以更換駕駛人。如果沒有按照該流程更換駕駛,系統將視為異常情況。

    結語

    酒駕一直是全球性的問題,將有高機率導致重大交通事故,造成人員傷亡、家庭破碎,進而醞釀後續更多的社會問題,皆是酒駕所引發的不良效益。為了解決酒駕的問題,各個國家都有不同的酒駕標準或是法律規範,但是大部分國家的規範和制度都只有嚇阻作用卻無法完全遏止。在不同的國家防止酒駕的方式不盡相同,有的國家如新加坡,透過監禁及鞭刑來遏止酒駕犯,又或者是薩爾瓦多,當發現酒駕直接判定死刑,這樣的制度雖嚇阻力極強,但是若讓其他國家也跟進,會造成違憲或是違反人權等問題。因此,各國都在酒駕的問題方面紛紛投入研究,想要達到零酒駕的社會。

    為達成此理想,本文介紹了基於區塊鏈的酒駕防偽辨識系統,利用酒精鎖搭配人臉辨識技術以及區塊鏈技術,使有飲酒的駕駛人無法發動汽車。且該系統搭載在行車電腦中,結合攝影鏡頭的監控對駕駛進行酒測防制管理,將人臉資料、酒精鎖、解鎖時間點與相關資訊打包成區塊並上鏈。基於區塊鏈技術內容的不易篡改,可加強駕駛人的不可否認性,當汽車發生異常情況時,便能利用有效且可靠的依據進行追溯。人工智慧和物聯網時代已經來臨,透過酒駕防偽辨識系統來改善酒駕問題,在未來能夠普及並結合法規,智慧汽車以及智慧科技的應用將會帶給人們更安全、更便利的社會。

    附圖:圖1 人臉辨識的步驟。
    圖2 人臉特徵點偵測(正臉)。
    圖3 人臉特徵點偵測(左側臉)。
    圖4 人臉特徵點偵測(右側臉)。
    圖5 酒精鎖。 (圖片來源:https://commons.wikimedia.org/wiki/File:Guardian_Interlock_AMS2000_1.jpg with Author: Rsheram)
    圖6 區塊鏈分散式節點的概念圖。
    圖7 系統概念流程圖。
    圖8 取出人臉128維特徵向量。
    圖9 儲存車輛相關資料及人臉資料到區塊。
    圖10 HASH後及打包成區塊的結果。
    圖11 汽車發動前小禛的人臉影像。
    圖12 小禛的人臉影像特徵點。
    圖13 小禛的人臉特徵向量資料。
    圖14 系統通過酒測檢測者與駕駛人為同一人。

    資料來源:https://www.netadmin.com.tw/netadmin/zh-tw/technology/CC690F49163E4AAF9FD0E88A157C7B9D

  • 深度學習影像辨識原理 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

    2021-05-28 14:39:22
    有 1 人按讚

    跨界圍攻:「AI 視覺」公司已集體殺入智能駕駛圈

    2021-05-22
    雷鋒網

    如今的智能汽車賽道,說挨肩迭背也不為過。

    新勢力派引領變革,最為二級市場所看好;泛網際網路派占流量高地,擅技術遷移;傳統車企派根基夯實,品牌名聲享譽在外。

    甚至財大氣粗的某地產派也曾放下豪言――力爭 3-5 年成為世界規模最大、實力最強的新能源汽車集團。

    如華山比武般,大俠們個個嚴陣以待,各方勢力黃巾高擎,左右開弓。

    你看看,前有行業鐵幕,中夾破釜沉舟之心,後是險峻江湖,哪還有初進牛犢的落腳之處?

    即便如此,在月前燥熱尚未消退的上海車展後,鮮少被提及的AI視覺公司還是擠了進來。

    看慣了巨頭們的聲勢浩蕩,轉身發現AI視覺企業們的入局講究一個循序漸進,起承轉合。

    而他們的悄然進入,也給智能駕駛領域增添了幾段新故事。

    海康威視:左手自研、右手投資

    AI安防老大哥海康,深耕智能駕駛市場履行一貫的低調風格。

    其對智能駕駛的綢繆始於2015年,當時海康內部計劃開展新業務,起初確定的業務有三:海康汽車電子、海康機器人、海康螢石。

    2016年7月,耗資1.5億的海康汽車技術正式成立。

    在此前後,海康還分別於2016年6月投資了威視汽車科技,2017年7月成立了海康汽車軟體。

    2018年是海康智能駕駛的上升之年,市場渠道、技術研發上均有突破。

    2018年2月,他們上線高級駕駛輔助系統、自動泊車APA+,同年又成功打入2019款保時捷卡宴的配置中。

    汽車產業以穩為重,鏈條長、利益盤根錯節,新入者切入並不容易,而海康卻出其不意一舉打入高端。

    數據顯示,截至2018年底,海康汽車已經通過了20家OEM的審核並成為其合格供應商,公司的主要客戶包括一汽集團、北京汽車、上汽榮威、上汽名爵、本田汽車等。

    其中,定點項目超過200個,已量產的項目超過100個,覆蓋500家渠道合作夥伴。

    成立子公司自研之外,投資也是海康較為看中的一大路徑。

    在成立汽車電子公司之前,海康就曾在2016年入股毫米波雷達企業森思泰克,並成為後者的第二大股東。

    2013年成立的森思泰克既是毫米波雷達第一批探路者,也是成績較為優秀的領軍企業之一。

    森思泰克創始人秦屹是英國海歸的雷達專家,在英從事雷達研發和製造十餘年。

    據悉,森思泰克所聚團隊成員中80%具有軍工背景,掌握雷達硬體、軟體和量產工藝等幾乎全部核心技術。

    據悉,森思泰克毫米波雷達在北京、石家莊設研發中心,在蕪湖設總廠,在杭州設車載事業部。

    石家莊,有軍工雷達大本營之稱,軍民毫米波雷達研發人才密集,且電科雷達研發54所和13所都在石家莊。

    森思泰克也頗為爭氣。

    2019年,思泰克首次實現大批量77GHz車載毫米波雷達國產化、突破國際巨頭壟斷。

    森思泰克的77GHz毫米波雷達成為國內首個真正實現「上路」的ADAS毫米波雷達傳感器。

    目前,森思泰克已成為紅旗、一汽、韓國現代、東風日產、長城、長安等國內外車企體系內供應商。

    海康與森思合作的高分毫米波成像雷達+視覺融合技術,或許將對壘低線束雷射雷達。

    大華股份:立足整車,三電、網聯、自動駕駛多點齊發

    零跑汽車脫胎於大華股份的汽車部門,獨立後獲得了大華股份的技術和資金支持。

    2015年,大華股份副董事長兼任大華股份CTO朱江明親自下場,成立零跑。

    經歷2019年新能源補貼大退坡,不少新勢力造車企業已經出現嚴重資金問題,且變現存疑。

    零跑汽車亦不例外。

    2018年,零跑虧損 3.07 億元後,2019 年上半年又持續虧損約 2 億元。

    2019年1月4日,零跑汽車第一款車S01上市,該車2019年全年交付約1000輛。

    對於連續虧損的零跑,唱衰論一直也在網上發酵。

    朱江明對此表示,「即使不融資,零跑也能再活三年。」他透露,大華股份將持續為零跑輸送資金,「當然我們希望能更多的融資,發展得更快些。」

    在經歷融資受阻後,2021年伊始,零跑官宣融資43億元,合肥政府投資平台亦在其中。

    今年年初,此前曾投資蔚來的合肥市政府與零跑方面簽訂戰略合作協議,未來合肥方面將對零跑B輪融資投資約20億元,並展開更多合作。

    現金流方面,從不被業界看好,到巨額融資的到帳,仿佛又讓市場看到了可能性。

    技術層面,零跑汽車稱自主研發了三電系統、智能網聯繫統、自動駕駛系統三大核心技術,並完全掌握自動駕駛核心硬體平台和算法技術,實現對自動駕駛感知、決策、執行層關鍵技術的自主化全覆蓋。

    產品層面,零跑汽車目前旗下擁有3款量產車型,分別為:零跑T03、零跑S01以及零跑C11。

    三款產品風格各異,銷量不一。

    2020年,零跑汽車官方消息稱,2020年累計銷量達11391輛,其中T03為主力軍,貢獻了10266輛。

    創始人朱江明也底氣頗足:「2023年零跑進入造車新勢力TOP3、2025年在國內新能源汽車市占率達到10%」。

    商湯:求精感知技術,並進艙內艙外

    與其他AI獨角獸相比,商湯在自動駕駛上布局較早,也更全面。

    2017年進軍自動駕駛,商湯的汽車產業布局可分為艙內(智能車艙)和艙外(智能駕駛)兩大層面。

    智能車艙層,基於前裝量產解決方案,以視覺感知技術為錨點,由點及面,覆蓋用戶從上車到用車的多個場景。

    商湯的SenseAuto Cabin智能車艙解決方案包括駕駛員感知系統、座艙感知系統、智能進入等等功能。

    據悉,在過去的兩年多時間裡,商湯已經拿下了30多個國內外頭部夥伴的智能車艙定點量產項目,覆蓋車輛總數超過1300萬輛,其中10 余個項目已經實現了量產交付。

    智能駕駛層,商湯選擇與主機廠合作,做汽車廠商(OEM)及一級供應商(Tier1)的解決方案供應商。

    在自動駕駛感知、決策和執行三大要素中,汽車廠商和Tier1占據重要角色。

    2017年,商湯與OEM廠商本田簽訂了為期5年的長期合作協議,研發適合乘用車場景的L4級自動駕駛方案。

    2018年,商湯完成杭州、上海半開放場地內實現無接管自動駕駛。2019年,在日本落地「AI自動駕駛公園」,將用於自動駕駛汽車的研發和測試,並面向公眾開放。

    商湯的自動駕駛業務定位,是以視覺為主,其他元素為輔。

    視覺之外,商湯在高精度地圖和雷射雷達、毫米波雷達等方面皆有技術儲備。

    通過搭配多種不同傳感器,實現感知、分析預測、決策規劃控制、城市級三維地圖重建及無人車高精度定位能力等技術功能。

    目前,商湯對自動駕駛技術進行了多次疊代,形成了一套較為成熟的智能駕駛方案:SenseAuto Pilot智能駕駛解決方案,聚焦 L2+ 級高級輔助駕駛至L4級自動駕駛創新,並在上海車展首次發布SenseAuto Pilot-P駕駛領航方案。

    軟體之外,2019年3月,商湯還推出首款原創機器人SenseRover X自動駕駛小車,這是款針對自動駕駛的教學產品。

    奧比中光:戰投+自研,兩條腿走路

    奧比中光是AI初創企業中對智能汽車投入最多的公司之一。

    作為一家AI 3D感知技術方案提供商,成立於2013年的奧比中光現今已在3D傳感領域深耕近8年。

    3D傳感作為人工智慧領域最核心的視覺感知技術,融合了晶片、算法、光學、軟體等多交叉學科技術,是人工智慧時代感知識別、新型人機互動等最為核心的技術載體。

    除3D結構光外,奧比中光在雙目、iTOF、dTOF、雷射雷達等主流3D視覺感知技術領域也有長遠布局。

    早在2018年,奧比中光就投資雷射雷達晶片級解決方案提供商飛芯電子。

    飛芯電子成立於2016年,是一家專注於光電設備、雷射雷達研發、集成電路設計的高新技術企業。

    成立僅2年,飛芯電子獲得了博世等注資。

    據悉,飛芯電子以研發、生產雷射雷達系統及核心晶片為主要業務,客戶群體主要面向國內外汽車、機器人、無人機等生產研發廠商。

    飛芯電子稱,其針對行業痛點,採用了連續波載調製或相干外差探測方案,利用焦平面點雲測距技術,滿足較高的空間解析度和較大的視場角,探測距離可超過200m,且無需複雜昂貴的機械掃描裝置,不斷提高系統可靠性,也使獲得的圖像更為清晰。

    2019年4月,奧比中光成立車載3D視覺傳感方案提供商奧銳達。

    奧銳達的業務重心在智能座艙,產品包括ToF攝像頭模組、雷射雷達等硬體以及3D ToF智能座艙方案。

    承襲了奧比中光的3D視覺感知技術,奧銳達可為智能汽車帶來DMS、OMS、手勢識別、人臉識別、身份驗證等多種3D化智能功能。

    其金融級安全的3D人臉識別方案,保護駕乘人員的信息安全;通過3D-ToF 攝像頭,實現多區域手勢控制;同時,智能汽車還可以通過3D信息,判斷駕乘人員體型、座艙內位置等。

    近日,奧銳達還發布了為智能汽車量身定製的3D ToF智能座艙方案。

    虹軟:主攻艙內,走軟硬一體之路

    2018年,為應對手機市場見頂飽和,虹軟正式將業務從智慧型手機領域拓展至智能汽車、IoT等領域,一舉橫向突進自動駕駛市場。

    虹軟科技創始人兼CEO鄧暉曾表示,未來每輛汽車裡都有10個以上的攝像頭,智能座艙將成為智能駕駛視覺AI的重點應用場景。

    與其手機定位一樣,虹軟的智能汽車走軟硬一體解決方案,力圖做車載視覺一站式解決方案的供應商。

    從招股書看,截至2018年底,虹軟科技的「汽車等loT產品」的業務收入僅367.95萬元,占比不足1%。

    與多數視覺企業加裝雷射雷達等技術不同,虹軟的的自動駕駛解決方案完全基於視覺層面,且核心聚焦在車內智能。

    虹軟科技的智能駕駛視覺解決方案,包括車內安全駕駛預警、駕駛員身份識別、車內安全輔助、輔助駕駛預警、自動泊車等眾多解決方案。

    2019年3月,虹軟入股開易(北京)科技,後者主營業務包括主動安全智能終端(ADAS+DMS+人臉識別)、SDK軟體服務以及硬體整體解決方案。

    2019年,虹軟在科創板上市。

    虹軟表示,其在計算機視覺領域積累深厚,融合其暗光高反差拍攝、防抖等影像視頻增強算法技術,即使在車內光線不佳、人臉角度多變、車輛晃動等特殊情況下,也能夠很好地完成車輛周圍環境監測和車內人員監測等功能。

    上市後,虹軟大力布局智能汽車及其他 IoT 智能設備領域,目前成效初現。

    據虹軟表示,智能汽車板塊2019年開始真正量產。

    數據顯示,2020年,智能駕駛視覺解決方案業務增長較快,實現營業收入6592.99萬元,同比增長310.61%。

    據悉,虹軟智能駕駛相關產品包括DMS(駕駛員識別系統)、ADAS(高級駕駛輔助系統)、BSD(盲區檢測系統)、OMS(乘客識別系統)、Interact(視覺互動系統)、Authenticate(生物認證)、AVM(3D環景監視系統)、AR HUD(AR抬頭顯示)和智能後備箱等各類以核心算法為基礎的相關軟體解決方案。

    高工智能汽車研究院數據顯示,DMS(駕駛員識別系統)的算法業務是其智能汽車業務的主要收入來源。

    虹軟今年透露,其智能駕駛業務已實現37+7個前裝車型定點開發(37款量產車型定點,7款車型預研),以提供純算法為主,公司直接與Tier1或整車廠簽約,涉及多家國內主流車企(含造車新勢力)及部分合資車企。

    格靈深瞳:最早入局,協同成長

    成立於2013年,格林深瞳是最早的一批AI視覺公司,也是最早一批投入自動駕駛的AI視覺公司。

    當年,格靈深瞳聯合英特爾研究院院長吳甘沙、國家智能車未來挑戰賽冠軍團隊負責人姜岩等一同創辦了一家專注於自動駕駛領域的公司――馭勢科技。

    2016年,馭勢科技在北京誕生,格靈深瞳作為投資方入股馭勢科技。

    過去五年,馭勢科技在洶湧潮水中奮力前行。

    2017年1月的CES,馭勢科技向世界推出了無人駕駛概念車「城市移動包廂」,該車型成為了全球第三款獲得紅點設計大獎的無人車。

    同年,這家公司分別在4月和6月,於白雲機場、杭州來福士率先展開面向普通公眾的無人駕駛商業化運營。

    今年1月21日,香港國際國際機場宣布,由馭勢科技與香港國際機場管理局共同研發的無人駕駛物流車將替代人力駕駛拖車,承擔往返機場和海天客運碼頭的行李運輸任務,意味著其在機場的運用已逐步上量。

    在過去的一年中,馭勢科技與長安民生物流、一汽物流、巴斯夫(BASF)等數十家企業建立了商業合作。

    據透露,在國內某豪華品牌車型上,馭勢科技提供的軟體算法也已前裝量產,並幫助該自主品牌率先推出 L3 級自動駕駛功能。去年馭勢科技交付了數百套「AI駕駛員」,實現年度業績同比增長150%。

    前不久,馭勢科技宣布完成累計超10億元人民幣的新一輪融資,在這場融資中馭勢科技獲得了國家資本的參投。

    馭勢科技在無人物流埋頭苦幹,潛心鑽研,其成績是在無人物流領域的業務布局幾乎占到了國內市場的70%。

    2016年誕生至今,馭勢科技經歷萬千辛酸,在密如繁星的棋子中探索出一條最優解法,以機場定式,在精進自我的路上捨命狂奔。

    而格林深瞳的自動駕駛之路,也隨著馭勢科技越走越遠。

    曠視:立足AI視覺,做車載全套解決方案

    2018年11月,曠視曾公開展示過車載AI視覺解決方案。

    彼時的曠視,其解決方案基於車載系統和駕駛過程的人臉解鎖、帳戶切換、駕駛員識別、多模態交互等功能為主,並收取相應軟體使用費和服務費。

    「人臉解鎖」可通過車外的攝像頭捕捉駕駛員人臉信息並進行身份的識別與確認,實現人臉解鎖車門、臨時授權人臉解鎖車門;

    通過車內的攝像頭實現刷臉啟動發動機、保險箱等,「帳戶切換」功能可通過人臉識別無感知精準識別駕駛員身份,配合車載智能系統,快速調整用戶預設的車輛各項個性化配置(座椅位置、反光鏡角度、空調溫度、音樂、燈光、導航等)。

    「駕駛員識別系統」可通過車內攝像頭,實時查看駕駛員駕駛狀態和行為,在駕駛員出現疲勞駕駛或分心駕駛跡象時觸發預警,保障行車安全。

    曠視曾表示,其與蔚來汽車實現了未來在智能汽車應用上的深度合作,真正的無人駕駛商用較遠,曠視聚焦對人類駕駛員的理解和輔助。

    的盧深視:基於3D視覺相機,為產業賦能

    的盧深視在智能汽車領域的角色,更多是與第三方合作的方式。

    作為三維視覺領域的佼佼者,的盧深視在高精度深度感知成像、三維實時高精度重建、三維跟蹤識別及感知等技術方向上深耕多年。

    上月,的盧深視出席了2021全球自動駕駛高峰論壇,並展示了其最新3D CV相機及其應用。

    的盧深視兩款自研3D CV相機,其在5米範圍誤差小於1mm,指標超越國際3D相機巨頭,量產良率達99%以上。

    基於前端低功耗嵌入式平台,兩款相機均可實現非接觸式精準識別,基於結構光原理,更可還原人臉高精度3D細節信息,通過人臉立體尺寸信息精準辨識人員身份,同時對於二維和三維攻擊識別正確率高達99.99%。

    多提一句,安全性上,可達金融級別。

    據悉,除了智能汽車領域,兩款相機也在智能家居、金融支付、智慧交通等領域展開布局。

    智能駕駛:AI視覺第二春

    AI視覺眾企入局智能駕駛賽道,並非跑題創作。

    其一,布局智能駕駛,是戰略向外牽引使然。

    自計算機視覺出走實驗室樊籠,AI安防、自動駕駛便拿到一大波投資人的「S卡」。

    當年AI落地之時,安防提供了絕佳的土壤,AI公司在此實現技術與產業的交融。

    期間,AI與安防彼此成就:

    安防向世界輸送的海大宇等驕子,幾乎主導了全球安防市場話語權,行業極速擴容,向城市各個領域蔓延。

    AI獨角獸們也從安防起家,並逐漸走向千行百業,邁向全域。

    左邊是AI安防成主要營收來源,右邊是AI安防逐漸占領一席之地。擺在入局者眼前的,是如何保持縱向持續增長的必答題。

    擺脫路徑依賴,尋找AI安防之外的市場,已是當務之急。

    如果說,過去五年,AI視覺公司的路徑是「通用AI SDK 重定製集成項目實施」的話,那麼未來五年,他們可嘗試「非標領域的標準市場 形成標準化產品 低成本規模化複製」的路子。

    非標領域的標準市場在哪?自動駕駛、醫療、晶片赫然在列。

    縱觀AI市場,目光所及賽道幾近全員虧損,掘金志認為,與高成本人力無關,因為虧損在放大;與硬體儲備也無關,因為可以OEM。

    核心在於:AI安防未能標準化,項目需求又無窮多。

    那就去標準化市場?有人問。

    標準化市場可以一夜之間把價格做到無窮低,但高額運營支出非AI企業所能承受。

    標準化市場上不去,定製化市場下不來,AI公司的突破口在哪?答案是:非標準化市場裡找到標準化路子。

    賽道上,自動駕駛正是明顯的非標領域的標準市場。與AI安防共通的是,智能駕駛初創企業也依賴資本輸入。

    但前者場景碎片化、項目定製化,產品標準化之路漫漫;後者以智能汽車為載體,技術上軟體定義、人機協同一旦成型,會一招吃遍天下鮮。

    眼下,不少智能駕駛新勢力已實現產品量產,並獲得一定規模的現金流。

    對於一眾搶灘的各路豪傑,AI視覺的入場似乎有些遲。

    但智能汽車賽道正熱、格局未定,智能汽車產業鏈長、細分領域繁雜,此時入場的AI視覺,你可以說它入場稍晚,但不能說它機遇不在。

    其二,自動駕駛或是計算機視覺技術應用必登之高峰。

    近幾年,機器學習持續深入,計算機視覺應用亦有了飛速進展。

    千山萬水跨越的人臉識別小山,是AI最成功,也最基礎的一環。

    真正的AI,是貫穿感知-決策-執行的長鏈條,這一點在自動駕駛上體現得尤為極致。

    感知層,通過各類硬體傳感器捕捉車輛的位置信息以及外部環境信息;

    決策層的「大腦」,基於感知層輸入的信息作環境建模,從而形成對全局的理解並作出決策判斷,再向車輛發出執行的信號指令;

    最後的執行層,將決策層的信號轉換為汽車的動作行為。

    自動駕駛技術是人工智慧、高性能晶片、通信技術、傳感器技術、車輛控制技術、大數據技術等多領域技術的結合體,落地難度之大,各路AI無不動容。

    計算機視覺應用場景萬千,自動駕駛無疑是極具挑戰性、最具想像力的一條。

    越是長在懸崖之巔的花,越讓人著迷。

    一直以來,在環境感知環節,存在AI視覺與雷射雷達技術路徑之爭。

    不管何種路徑更優,已經在視頻物聯領域經歷過殘酷驗證,AI技術儲備上,AI視覺企業們也已攢下不少經驗。

    狼多肉少,能吃幾成飽?

    「自動駕駛是很低級的行業嗎?所有人都想來分一杯羹。」

    這調侃入局者們聽了,大抵會覺得分外委屈。

    大多數困在第一道門檻,錢。

    「沒有200億不要造車」的聲量振聾發聵,造車明星蔚來也曾資金一度跌入谷底。

    雖說AI視覺公司除了大華的零跑汽車外,其他參與者目前都專注於智能駕駛硬體和系統,但這也是個昂貴的行當。

    不少企業本身依靠資本輸血,是否有更多資金和精力參與自動駕駛廝殺,是他們需要思考的問題。

    行業壁壘不容小覷。

    汽車產業發展百餘年才形成了一套嚴謹而完整的生產流程和制度,乃至於衍生出了一套基於安全的工業文明,不是後來者們在短短的幾年時間裡就能夠顛覆的。

    作為智能汽車的核心體現,自動駕駛技術遠未達到成熟的程度;車艙內的智能化體驗也還有豐富的想像空間。

    換言之,如果跨界選手想要在智能汽車的世界裡找到自己的一席之地,不僅要高度重視安全這一話題,還要擁有強大的軟體能力。

    但在前一輪前沿傳統主機廠以及蔚來、小鵬、理想等新造車勢力的人才軍備賽過後,新入局的玩家要如何吸納更多的專業人才?又如何權衡來自世界各地的人才的意見和建議,從而做出最終決策?

    與此同時,智能汽車的研發不是一件只要懂軟體就能夠做成功的事情。

    隨著電動化、智能化大潮的到來,造車的門檻看似降低了不少,但在這一過程中遇到的內因外因的難題,可能遠比想像中的要多。

    行業資源尚需積累。

    相比AI安防、智慧城市等領域,AI視覺跨界者在智能汽車領域品牌影響力和渠道資源不足,短期內,造血盈利能力較低。

    而且,AI視覺企業布局智能駕駛時間不一,技術雖有共性但終究有別,相較於大多數垂直企業,尚有諸多不足。

    故可見,過去幾年,即使AI視覺巨頭,步伐也較為謹慎,大多圍繞艙內智能、ADAS市場。

    如果說巨頭們跨界,自帶熱搜體質,AI視覺企業跨界的光彩,多少暗淡了些。

    前者身家優渥,拿著頂流體驗卡入場,高屋建瓴,後者更多是以小舟,涉鯨波。

    當然,隨著技術日進一桿,資源聚沙成塔,營收逐年增長,他們將投入包括但不限於研發、營銷、資本等層面,難保這一葉扁舟,哪天出其不意成為可遠航的重磅郵輪。

    莫道桑榆晚

    眾多跨界玩家湧入智能汽車,激發了新的生機。

    無論從何種角度來看,智能汽車的市場都蘊藏著無限機遇。

    這個市場需要鲶魚的存在。

    在新時代的風潮之下,我們固然期待看到不斷有實力強勁的新玩家們入局,留下中國智能汽車史上濃墨重彩的一筆。

    我們也殷切地希望,這是一片能夠承載百花齊放,充滿新的生機和活力的沃土,而不是拔苗助長的投機者的港灣。

    憑藉先發優勢,不少入局者或已暫列行業前位,但隨著各方力量的持續加碼,後來居上也並非不無可能。

    保持警惕,時刻成長。

    資料來源:https://www.chinahot.org/science/83632.html?fbclid=IwAR2Mm9ZU17srF7sCywqUPw-hmRAyGN_sN9XnL0_Q6mE4bUYwUpgGNX3wHps

  • 深度學習影像辨識原理 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

    2021-03-12 15:12:39
    有 1 人按讚

    【中鋼AI現場1:1千5百度高熱密閉生產環境如何監控?】高爐AI應用大剖析

    中鋼靠間接量測高爐生產數據,一步步打開黑盒子,運用AI即時監控爐況,提早預測異常生產狀況即時應變

    文/翁芊儒 | 2021-03-04發表
    攝影/洪政偉

    高爐之於鋼廠,是不可或缺的一環。飄洋渡海的鋼鐵原料從港口上岸後,會先由煉焦工廠製成焦炭、燒結工廠製成燒結礦與鐵礦,加入其他次要原料後,就會來到鋼鐵融煉的第一站,高爐。

    高爐的作用,就是透過一連串高溫熔融反應,將鋼鐵原料煉成鐵水。雖然說起來容易,實際上,高爐卻是一個複雜的煉鐵反應器。中鋼煉鐵廠高爐二課課長許雍達解釋,每一座高爐,都集合了非常多系統於一身,包括了爐體本身冷卻系統、熱風爐、原料輸送、出鐵、爐氣處理、頂壓回收發電、噴媒等環節,每個系統互相搭配,才能維持高爐穩定運作。

    這個系統中,真正煉製鐵之處,就是外觀形似巨大養樂多瓶的高爐爐身。其運作原理,是從上方加入煉鐵原料,以一層焦炭、一層燒結礦與鐵礦的方式,盡量將原料均勻散布其中,再透過周邊的熱風爐,將空氣加熱,從高爐下部的鼓風嘴鼓進高爐,來加熱、還原,將鐵礦石融煉成鐵水與爐渣。

    熔煉過程中,中鋼也透過鼓風嘴噴吹粉煤,來取代部分焦炭作為還原劑,可降低煉焦爐的負荷,並有利於爐熱調節;而爐內產生的高爐氣,也能在淨化後用來發電,並作為熱風爐及廠內的燃料,來達成節能、減少碳排放的效益。最後的鐵水與爐渣,則會分開取出,各自進行下一步的加工或販售。

    許雍達指出,這套高爐生產的做法,早從十多年前就持續運作至今,但在過去,高爐內部高溫、密閉且不易觀測,難以得知爐況是否符合預期,「比如原料一層一層加入之後,到底分佈均不均勻?又要如何在爐溫下降之前,提早預測來因應?」

    這些問題,隨著IoT與AI技術日漸成熟,中鋼開始蒐集更多生產數據,逐步翻轉過去熟悉的高爐運行操作。

    落地27項高爐智慧應用,更即時掌握高爐生產動態

    中鋼約從3年前開始,致力於研發高爐AI,不只開發高爐爐況監控的相關應用,也開發周邊設備的AI應用,比如原料輸送帶的預測維修、熱風爐生產效率與耗能監控、現場人員的安全監控等,截至今年初,已經完成27項高爐智慧應用的開發,依據應用的特性與適用場域,分散部署在4座高爐中。

    由於高爐本身就像是一個黑盒子,為了掌握高爐的生產狀況,中鋼在高爐上裝設了多種感測器,就是要靠各種生產數據,一步步將盒子打開。

    比如說,從高爐上方布料時,雖然是均勻旋轉布料,但實際布料情況還是會依據爐內氣流變化而改變,為了監控布料狀況並適時調整,中鋼在布料槽裝設了料面溫度儀與輪廓儀,來掌握布料形狀與高溫氣體的分布情形。在爐壁上,中鋼也裝測了溫度感測器,透過爐壁溫度變化頻率,來預測爐壁冷卻元件是否受侵蝕、內部是否結塊。

    不只如此,為了預測爐熱變化,中鋼量測出鐵口的鐵水溫度變化,參考操作條件、鐵渣的化性分析,開發AI預測未來爐熱;也運用爐溫爐壓分布的異常數值,找出發生管道流異常的可能性。透過更即時發現異常並自動預警,就是要讓產線人員盡早發現問題,才能提前調整生產參數來因應。

    而且,針對所有開發的生產數據監控與AI應用,中鋼開發了綜合爐況評分機制,能從原料分佈、氣流狀況、目前風量、鐵水產量、爐內溫度等生產狀況,為高爐當下的運行表現評分,讓產線人員可以更直覺、快速地的了解當前高爐爐況,「中鋼自己設定的目標,是要隨時大於89分以上,」許雍達說。

    克服AI落地挑戰,中鋼導入一站式生產數據監控平臺

    中鋼過去開發AI應用時,是由技術人員設法取得生產數據,開發出AI模型,再由IT單位開發成應用程式,個別部署到現場中控室的單機電腦中。

    許雍達指出,這個做法面臨了三大挑戰。首先,當時從生產環境蒐集到的資料,位於封閉式的生產系統中,為避免透過外部線路存取資料時,可能帶來的資安風險,「研究人員不能輕易的取得生產數據資料,分析費時費力。」

    再加上,每一支開發完成的應用程式,都必須部署到中控室的單機電腦中,透過視窗介面來呈現,在應用程式分散在多臺電腦的情況下,增加了電腦、網路的維護工作。不只如此,隨著蒐集到的資料量更大,AI分析也需要更大量的硬體運算需求,原有的主機資源逐漸不敷使用。

    這三大挑戰,讓中鋼在2019年底,率先在二號高爐場域,規劃建置AIoT智慧分析平臺,更找來研究部門、子公司中冠資訊共同研發,利用二號高爐在去年大修的期間,同步導入該場域。

    這套AIoT平臺最主要的目的,是要將分散部署在不同電腦的AI應用,整合到同一個Web平臺中,讓員工只要以瀏覽器開啟入口網站,登入帳密,就能一站式管理高爐所有的生產資訊。

    建置過程中,中鋼不只以Web介面重新設計AI應用儀表板,也將過去難以取得的生產數據整合到一個資料平臺,供技術人員更方便的分析取用資料,更建置了專屬AI應用的硬體資源,取代分散部署到電腦主機的方法。

    許雍達指出,AIoT平臺上線後,中控人員不只能即時查看重要的生產資訊,當高爐發生任何異常狀況,平臺也會自動觸發告警,並顯示操作指引,讓員工可以依照指示排除異常,將異常狀況可能帶來的傷害降到最低。

    比如說,當AI偵測到四號高爐的爐身發生結塊,就能利用過去一段時間的溫度變化,去推測結塊情形的演變,系統也會提供操作指引,來建議員工應使用哪一種應對模式,才不會導致結塊問題更嚴重。

    處置完成後,員工也可以直接在介面中回報,將此次事故處理過程提交出去,作為歷史維運紀錄,而且,過去類似事故的處理方法與結果,也會同步附件於操作指引的介面中,提供緊急處理時參閱。

    除了上線網頁版的AIoT監控平臺,中鋼也接續打造了行動裝置版本,只要安裝到手機上,具登入權限的中控人員,就能隨時隨地掌握生產即時動態,了解異常狀態資訊。

    今年初,二號高爐完成大修,這套AIoT平臺已經導入二號高爐場域中。中鋼也正在規劃,要將AIoT平臺導入其他座高爐中。許雍達表示,更長久的計畫,則是要開發煉焦、燒結兩大原料加工廠的智能模組,並且整合到AIoT平臺來監控運用,「這樣一來,我們在高爐的現場就能看到原料加工廠的生產數據,如果有異況,高爐也能同步調整、配合。」

    高爐AI應用大剖析

    「高爐出了問題,就得降風停產,如果能見微知著,在發生狀況前預先防範,就能降低損失產量的風險。」中鋼技術部門代理副總經理鄭際昭,一句話點出高爐AI的重要性。

    用AI煉鐵,導入27項高爐場域智慧應用,被中鋼視為第一個進化里程。27項應用中,中鋼不只開發高爐爐況分析監控,也開發周邊設備的AI應用,比如原料輸送帶的預測維修、熱風爐生產效率與耗能監控、現場人員的安全監控等。

    其中,高爐本身的爐況監測,更是AI開發的重點任務,因為高爐就像是一個黑盒子,為了掌控高爐的生產狀況,中鋼得在高爐上裝設多種感測器,以AI監控生產數據,才能提前發現問題,並及早因應。

    因此,在眾多應用中,中鋼特別介紹7項與高爐爐況分析相關的智慧應用,揭密1,500度高熱密閉的生產環境,如何靠AI監控。

    1 爐內布料情形監控

    技術關鍵 靠掃描感測儀器與熱像儀,偵測原料、粉塵、高溫氣體分佈狀況,並將資料視覺化

    效用 監控氣流是否穩定、布料形狀是否符合預期

    將原料從爐頂添加到高爐時,過去無法得知實際布料狀況,但現在,中鋼在爐頂布建掃描感測儀器,就能即時偵測原料在高爐內的分佈,同時透過爐內的熱像儀,掃描粉塵、高溫氣體的分佈,就能比對得知目前氣流是否穩定,布料形狀是否符合預期。中鋼也將量測到的數據,以視覺化的方式來呈現。

    2 管道流預警AI

    技術關鍵 透過AI判斷爐內壓力與溫度分布是否超過異常值,來預測管道流異常

    效用 提早預測管道流異常發生可能性,調整生產參數來因應

    一般來說,高爐運作的理想情況,是從下面鼓風,爐氣均勻往上傳遞,將原料還原熔融。但是,若爐氣無法穩定通過爐料,而是累積在某個區塊,就可能因為壓力蓄積過大往上竄出,造成爐頂洩壓閥排放,或造成設備損傷。「氣集中在一個地方,壓力大到一個程度就會往上衝,就好像人打嗝,不能等到衝上來,要想辦法及時拯救。」鄭際昭形容。

    為了提早發現管道流的情形,中鋼在高爐爐殼上設置壓力量測與溫度量測點,分別將溫度與壓力的分佈視覺化呈現,若結合兩者數值,發現壓力差超過異常值,或是局部溫度過高,AI判斷為管道流異常可能發生,「系統會發出預警,引導操作人員先降低風壓、風量,」中鋼煉鐵廠高爐二課課長許雍達表示,越早預測出管道流異常,就能越早調整生產參數,來避免管道流發生。

    3 爐壁厚度監測AI

    技術關鍵 透過爐壁探鑽深度與周圍壁面溫度變化的關聯性,訓練AI靠爐壁溫度變化,判斷爐壁厚薄

    效用 預測爐壁冷卻元件受損情形,安排檢修時程

    高爐爐壁冷卻元件(冷卻壁)若被蝕破,就可能造成嚴重的生產危機。然而,單從高爐外觀,無法得知爐壁冷卻元件被侵蝕的程度,中鋼以往只能定期量測來推斷爐壁狀況,定期檢修,來降低意外風險。

    要監測爐壁厚薄,中鋼在爐壁裝設測溫感測器,找出溫度與爐壁厚薄的關聯性。鄭際昭解釋,一般來說,爐壁變薄後,測得的爐壁溫度會升高,雖然鐵水在壁面結塊或脫落,也會造成可能造成溫度改變,但相較於正常爐壁狀況,溫度變化頻率會較為劇烈。

    因此,中鋼以探鑽點位附近的歷史溫度變化,結合實際探鑽的厚度訓練AI模型,再套用到高爐其他測溫點位上,來推測爐壁不同位置的侵蝕狀況。

    4 爐壁結塊預測AI

    技術關鍵 透過爐壁溫度變化頻率預測結塊情形

    效用 監測到爐壁溫度變化異常,提早因應避免結塊情形惡化

    高爐溫度一旦降低,就可能造成鐵水冷卻結塊、附著在爐壁上,若爐壁的結塊大量滑落,導致爐氣異常溢出,就可能發生操作上的危險,「許多高爐曾經因為高爐內部結塊過大,掉落時打到鼓風嘴,導致鼓風元件受損漏氣。」許雍達說。

    為了維持爐況穩定與操作安全,中鋼開發了爐壁結塊預測AI,當發現溫度變化波動越來越小,就能推測爐壁內部結塊,並提前調整高爐的生產條件,避免結塊情形更嚴重。

    許雍達表示,這套AI應用目前部署在三、四號高爐,因為這兩座高爐的爐內冷卻元件形式與一、二號高爐不同,更容易發生產生爐壁結塊問題,較有應用AI的急迫性。

    5 爐熱溫度預測AI

    技術關鍵 量測出鐵口的鐵水溫度變化,參考操作條件、鐵渣的化性分析,學習預測未來爐熱

    效用 預測未來2~4小時內的爐熱變化,提前調整生產參數來因應

    對於正在生產鐵水的高爐來說,必須維持一定的爐熱,高爐才能穩地熔煉鐵水,若溫度異常大幅下降,就可能造成爐冷危機,需花費許多時間調整加熱,一旦惡化至鐵水凝固無法排出,復原工作會很困難。

    「發生一次就是上億的損失,所以我們要盡可能避免走到這一步。」鄭際昭點出爐熱預測的重要性。

    中鋼在建立爐熱溫度預測AI時,就是透過量測出鐵口的鐵水溫度變化,參考操作條件、鐵渣的化性分析,學習預知未來2~4小時的爐熱趨勢,藉此訓練出爐熱預測的AI,若預測到未來爐熱可能下降,就能即時調整生產參數,微調風溫、噴煤量,來維持爐熱的穩定。

    6 鼓風嘴噴煤預警AI

    技術關鍵 透過大量鼓風嘴噴煤影像訓練AI判斷異常

    效用 自動化找出噴煤槍過短、噴煤口堵塞等異常影像,減少人力監控負擔

    中鋼透過在鼓風嘴噴吹粉煤,來減少原料焦炭的使用,同時,也能透過粉煤噴吹量來調節爐熱。不過,粉煤噴吹的狀況,過去需要人工監控,透過攝影機將風口影像傳輸到中控室,來監測是否發生噴嘴阻塞、或是噴煤槍設備耗損的情形,而且,需監控的影像還不只一個,光是二號高爐就有30個風口影像需要監控。

    為了減少人力的負擔,中鋼正在運用歷史監測影像,訓練影像辨識AI,來自動監診噴煤槍設備,找出噴煤槍過短、噴煤口堵塞等異狀。

    7 高爐原料粒徑分析AI

    技術關鍵 透過原料粒徑影像資料,訓練AI進行粒徑分析

    效用 即時辨識原料粒徑大小與分布,調整入料情形來降低燃料率

    將原料送入高爐時,若原料的粒徑大小符合預期、分布較平均,有助於爐況穩定、降低燃料率。中鋼甚至推算,高爐燃燒料率每減少1%,每年可以減少上億的燃料經費,因此,中鋼用AI來即時辨識原料的粒徑大小,即時計算進入到高爐原料粒徑分布,以及是否混雜到其他原料等情況,再根據分析結果來調整原料分布,有助於穩定爐況、降低燃料率。

    附圖:光是二號高爐,中鋼就投資約5,700萬元來建置智慧應用,投資的金額雖大,但帶來的效益更可觀,預估每年可以降低成本3,270萬元,減少排放溫室氣體2,217噸。(攝影/洪政偉)

    資料來源:https://www.ithome.com.tw/news/142938

  • 深度學習影像辨識原理 在 范琪斐 Youtube 的最讚貼文

    2020-01-04 22:00:04

    人臉辨識,就是用科技計算的方式,來比較臉部視覺特徵,藉此鑑定身分的一種電腦技術。

    其實我們可以把人臉辨識想像成是一套演算法,各種不同的廠商或公司可能會有不同的演算規則。但整體的邏輯是一樣的,通常會先偵測人臉、然後進行臉部校正與擷取特徵、再進行比對工作。

    當攝影機拍到你的時候,它第一步也會先切成一張一張的影格,然後去找到你的臉,就像是我們相機在拍照的時候,它不是會在臉旁邊出現一個框框讓你比較好對焦,這就是使用了人臉偵測的技術。

    也因為人臉其實有一些特徵,所系統會開始擷取一些我們臉上出具有「辨別度」的特徵,像是顴骨的形狀啦、眼窩的深度之類的,一張臉大約有80幾個識別點,但也因為拍攝時可能剛好低頭或轉頭,或是受到光線影響之類的,有些系統會在抓取特徵的時候也要進行校正,利用人中啊、眼睛啊或嘴角之類的作為錨點,將人臉校正到同一個比較基準。現在也有2D轉3D的技術,用3D模型來計算你不同角度應該是長什麼樣子。那抓出這些特徵以後呢,這個演算法會把你臉上用這些特徵畫出來的向量,轉換成編碼,於是你這個人獨特的特徵就可以用一串數字來代表,最後再送到資料庫進行比對。

    雖然人臉識別這個技術早再很多年前就已經開始發展,但是到這幾年因為電腦計算速度大幅加快、雲端技術成熟,才有較大的進展。而且這樣子一套演算法,還需要透過AI深度學習,模擬我們大腦神經網絡的運作,然後從大規模未標記的資料中學習,來建立出一套演算法、不斷優化出更好的模型。才能讓辨識度越來越準確。

    不過即使臉部辨識技術已經發展了一段時間,辨識準確度卻還是有待加強,美國國家標準暨技術研究院 (Nist) 的一項測試就發現,2014年到2018年期間,人臉辨識系統因為深度學習的技術,失敗率從4% 降到 0.2%。BUT!資料庫中的照片跟現實生活中可不一樣,每個人頭擺的角度、臉出現在畫面中的位置、拍攝光線、畫素、有沒有戴帽子、帶圍巾或變老,這些都會影響準確度。而且目前雙胞胎的辨識,還是一大難題。

    像是英國南威爾斯警方2017在歐洲足球冠軍賽期間,測試一款全新的AI臉部識別程序,可以搜尋比對資料庫裡面的50萬筆潛在罪犯資料,結果系統在17萬名觀眾當中,配對了2470人為潛在目標,但是錯誤率高達92%。

    Amazon 2016年推出影像辨識 AI 系統Rekognition,也曾經把28名國會議員辨識為罪犯,讓大家都嚇到吃手手。美國奧蘭多市政府也從 2017 年開始與 Amazon 合作進行先導計劃,在市內幾個地方架設監視器,實時進行人臉辨識,希望可以找出通緝犯等特定人士,幫助執法。不過在 15 個月的測試中,卻發現系統經常誤判,準確度常常出問題,後來在2019年終止這項合作。

    人臉辨識跟很多技術一樣,就是個雙面刃。雖然這項科技已經越來越進步,而且透過電腦的深度學習,讓判讀的準確度大大提升,但它仍然不像DNA那樣,正確度高達99.9%,可以作為決定性的判定標準。
    --------------------------------------

    《#范琪斐ㄉ寰宇漫遊》每週四晚間十點在 #寰宇新聞台 播出,沒跟上的也沒關係,歡迎訂閱我們的 YouTube 頻道 🔔#范琪斐ㄉ寰宇漫遊 🔔https://reurl.cc/ZvKM3 1030pm準時上傳完整版!

你可能也想看看

搜尋相關網站