[爆卦]深度學習模型訓練資料建立方法是什麼?優點缺點精華區懶人包

雖然這篇深度學習模型訓練資料建立方法鄉民發文沒有被收入到精華區:在深度學習模型訓練資料建立方法這個話題中,我們另外找到其它相關的精選爆讚文章

在 深度學習模型訓練資料建立方法產品中有18篇Facebook貼文,粉絲數超過3,992的網紅台灣物聯網實驗室 IOT Labs,也在其Facebook貼文中提到, 機器學習識別特徵阻絕代測 上鏈回送監理資料庫防竄改 人臉辨識加酒精鎖阻酒駕 串區塊鏈上傳比對告警 2021-05-24社團法人台灣E化資安分析管理協會元智大學多媒體安全與影像處理實驗室 本文將介紹酒精防偽人臉影像辨識系統,結合了人臉辨識、酒精鎖以及區塊鏈應用,以解決酒駕問題,並透過監控系統避免...

  • 深度學習模型訓練資料建立方法 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文

    2021-05-29 18:18:27
    有 0 人按讚

    機器學習識別特徵阻絕代測 上鏈回送監理資料庫防竄改

    人臉辨識加酒精鎖阻酒駕 串區塊鏈上傳比對告警

    2021-05-24社團法人台灣E化資安分析管理協會元智大學多媒體安全與影像處理實驗室

    本文將介紹酒精防偽人臉影像辨識系統,結合了人臉辨識、酒精鎖以及區塊鏈應用,以解決酒駕問題,並透過監控系統避免代測狀況發生。且利用區塊鏈不可修改的特性,將車輛與人臉資料串上區塊鏈,以確保駕駛人的不可否認性。

    長長期以來「酒駕」都是一個很嚴肅且必須被重視的議題,儘管在2019年立法院修法酒駕及拒絕酒測的罰則,但是抱持僥倖心態的人還是數不勝數,導致因酒駕釀成車禍的悲劇還是一再重演,讓不少的家庭因此破滅。

    據統計,從2015年到2018年的酒駕取締件數都逾10萬件,而因為酒駕車禍的死亡人數逾百人。在2019年酒駕新制上路以後,2020年警方酒駕取締件數有明顯下降至約6萬件,雖然成功達到嚇阻效果,但是死亡人數仍與去年前年持平,可見離完全遏止酒駕還有很長的路需要努力。

    立法院於2018年三讀通過了「道路交通管理處罰條例部分條文修正案」,酒駕者必須重新考照,並且只能駕駛具有酒精鎖(Alcohol Interlock)的車輛,所謂酒精鎖,屬於車輛點火自動鎖定裝置,在汽車發動前必須進行酒測,通過才能將汽車發動,而且在每45分鐘至60分鐘後酒精鎖系統就會要求駕駛人在一定時間內進行重新酒測,以便防範在行車過程中有飲酒的情況發生,若駕駛人未遵守其要求,車子就會強制熄火並鎖死,必須回酒精鎖服務中心才能將鎖解開。

    由於法案的方式無法完全遏止酒駕,因此許多創新科技或是企業致力於研究相關科技來解決酒駕的問題。

    其中本田(Honda)汽車與日立(Hitachi)公司研發出手持型酒精含量檢測裝置,讓駕駛人必須在駕駛之前都先進行酒測,若酒精濃度超標就會將汽車載具上鎖,藉此避免酒駕意外或事故發生,且該技術結合了智慧鑰匙功能,若偵測到酒測值超標,車輛中的顯示面板將會發出警告訊號告知駕駛人,避免酒駕上路之問題。

    另一方面則是解決酒精殘值之問題,因為有許多駕駛人都會認為,休息一下後,身體也無感到不適,即駕車出門,等到駕駛人被警方臨檢時才知道酒測未通過,因此收到罰單,甚至是吊銷駕照處罰等。

    根據醫學研究指出,酒精是在人體體內由肝臟代謝,實際代謝時間必須看體質以及飲酒量而定。台灣酒駕防制社會關懷協會建議,喝酒後至少要10至20小時後再駕車比較安全。多數人無具備酒精代謝時間的觀念,導致駕駛人貿然上路,待意外發生或罰單臨頭時,已經為時已晚。

    背景知識說明

    本文介紹的方法為酒精鎖結合攝影鏡頭進行人臉辨識,並將人臉特徵資料與車輛資料串上區塊鏈,並利用區塊鏈不可篡改的特性,來避免駕駛人在解鎖酒精鎖時發生他人代測的問題。

    由於人臉辨識技術具備防偽性、身分驗證的特性,因此將酒精鎖的技術結合人臉辨識,便可確認為駕駛本人。

    何謂人臉辨識

    人臉辨識技術屬於生物辨識的一種,基於人工智慧、機器學習、深度學習等技術,將大量人臉的資料輸入至電腦中做為模型訓練的素材,讓電腦透過演算法學習人類的面部特徵,藉以歸納其關聯性最後輸出人臉的特徵模型。

    目前人臉辨識技術已經遍佈在日常生活之中,其應用面廣泛,最為常見的應用即為智慧型手機的解鎖、行動支付如LINE Pay、Apple Pay等,其他應用還包括行動網路銀行、網路郵局、社區大樓門禁管理系統、企業監控系統、機場出入關、智能ATM、中國天眼系統等。一般來說,人臉辨識皆具備以下幾個特性:

    ‧ 普遍性:屬於任何人皆擁有的特徵。

    ‧ 唯一性:除本人以外,其他人不具相同的特徵。

    ‧ 永續性:特徵不易隨著短時間有大幅的改變。

    ‧ 方便性:人臉辨識容易實施,設備容易取得,如相機鏡頭。

    ‧ 非接觸性:不須直接接觸儀器,也可以進行辨識,這部分考量到衛生問題以及辨識速度。

    人臉辨識透過人臉特徵的分析比對進行身分的驗證,別於其他生物辨識如虹膜辨識、指紋辨識,無須近距離接觸,也可以精準地辨識身分,且具有同時辨識多人的能力。因應新冠肺炎疫情肆虐全球,人臉辨識技術也被用來管理人來人往的人流。人臉辨識的儀器可以搭配紅外線攝影機來測量人體體溫,在門禁進出管制系統中,利於提高管理效率,有效掌握到進出人員的身分,以及幫助衛生福利部在做疫調時更容易掌握到確診病患行經的足跡。

    人臉辨識的步驟

    人臉辨識的過程與步驟,包括人臉偵測、人臉校正、人臉特徵值的摘取,進行機器學習與深度學習、輸出人臉模型,從影像中先尋找目標人臉,偵測到目標後會將人臉進行預處理、灰階化、校正,並摘取特徵值,接著人臉資料交給電腦進行機器學習與深度學習運算,最後輸出已訓練好的模型。相關辨識的步驟,如圖1所示。

    人臉偵測

    基於Haar臉部檢測器的基本思想,對於一個一般的正臉而言,眼睛周圍的亮度較前額與臉頰暗、嘴巴比臉頰暗等其他明顯特徵。基於這樣的模式進行數千、數萬次的訓練,所訓練出的人臉模型,其訓練時間可能為幾個小時甚至幾天到幾周不等。利用已經訓練好的Haar人臉特徵模型,可以有效地在影像中偵測到人臉。

    Python中的Dilb函式庫提供了訓練好的人臉模型,可以偵測出人臉的68個特徵點,包括臉的輪廓、眉毛、眼睛、鼻子、嘴巴。基於這些特徵點的資料就能夠進行人臉偵測,如圖2~4所示。圖中左上角的部分是偵測到的分數,若分數越高,代表該張影像就越可能是人臉,右側括弧中的編號代表子偵測器的編號,代表人臉的方向,其中0為正面、1為左側、2為右側。

    人臉的預處理

    偵測到人臉後,要針對圖片進行預處理。通常訓練的影像與攝影鏡頭拍出來的照片會有很大的不同,尤其會受到燈光、角度、表情等影響,為了改善這類問題,必須對圖片進行預處理以減少這類的問題,其中訓練的資料集也很重要:

    ‧ 幾何變換與裁剪:將影像中的人臉對齊與校正,將影像中不重要的部分進行裁切,並旋轉人臉,並使眼睛保持水平。

    ‧ 針對人臉的兩側用直方圖均衡化:可以增強影像中的對比度,可以改善過曝的影像或是曝光不足的問題,更有效地顯示與取得人臉目標的特徵點。

    ‧ 影像平滑化:影像在傳遞的過程中若受到通道、劣質取樣系統或是受到其他干擾導致影像變得粗糙,藉由使用圖形平滑處理,可以減少影像中的鋸齒效應和雜訊。

    人臉特徵摘取

    關於人臉特徵摘取,相關的技術說明如下:

    ‧ 歐式距離:人臉辨識是一個監督式學習,利用建立好的人臉模型,將測試資料和訓練資料進行匹配,最直觀的方式就是利用歐式距離來計算所有測試資料與訓練資料之間的距離,選擇差距最小者的影像作為辨識結果。由於人臉資料過於複雜,且需要大量的訓練集資料與測試集資料,會導致計算量過大,使辨識的速度過於緩慢,因此需要透過主成分分析法(Principal Components Analysis,PCA)來解決此問題。

    ‧ 主成分分析法:主成分分析法為統計學中的方法,目的是將大量且複雜的人臉資料進行降維,只保留影像中的主成分,即為影像中的關鍵像素,以在維持精確度的前提下加快辨識的速度。先將原本的二維影像資料每列資料減掉平均值,並計算協方差矩陣且取得特徵值與特徵向量,接著將訓練集與測試集的資料進行降維,讓新的像素矩陣中只保留主成分,最後則將降維後的測試資料與訓練資料做匹配,選擇距離最近者為辨識的結果。由於影像資料經過了降維的步驟,因此人臉辨識的速度將會大幅度地提升。

    ‧ 卷積神經網路:卷積神經網路(Convolutional Neural Network,CNN)是一種神經網路的架構,在影像辨識、人臉辨識至自駕車領域中都被廣泛運用,是深度學習(Deep Learning)中重要的一部分。主要的目的是透過濾波器對影像進行卷積、池化運算,藉此來提取圖片的特徵,並進行分類、辨識、訓練模型等作業。在人臉辨識的應用中,首先會輸入人臉的影像,再透過CNN從影像提取像素特徵並轉換成特定形式輸出,並用輸出的資料集進行訓練、辨識等等。

    何謂酒精鎖

    酒精鎖(圖5)是一種裝置在車輛載體中的配備,讓駕駛人必須在汽車發動前進行酒測,通過後才能將車輛發動。且每隔45分鐘至60分鐘會發出要求,讓駕駛人在時間內再次進行檢測。

    根據歐盟經驗,提高罰款金額以及吊銷駕照只有在短期實施有效,只有勸阻的效果,若在執法上不夠嚴謹,被吊照者會轉變成無照駕駛,因此防止酒駕最有效的方法就是強制讓駕駛人無法上路,這就是「酒精鎖」的設計精神。

    在本國2020年3月1日起酒駕新制通過後,針對酒駕犯有了更明確且更嚴厲的規定,在酒駕被吊銷駕照者重考後,一年內車輛要裝酒精鎖,未通過酒測者無法啟動,且必須上15小時的教育訓練才能重考,若酒駕累犯三次,要接受酒癮評估治療滿一年、十二次才能重考。

    許多民眾對於「酒精鎖」議論紛紛,懷疑是否會發生找其他人代吹酒精鎖的疑慮,為防範此問題,酒精鎖在啟動後的五分鐘內重新進行吹氣,且汽車在行駛期間的每45至60分鐘內,便會隨機要求駕駛重新進行酒測,如果沒有通過測量或是沒有測量,整合在汽車智慧顯示面板的酒精鎖便會發出警告,並勸告駕駛停止駕車。

    對於酒精鎖的實施,目前無法完全普及到每一台車子,而且對於沒有飲酒習慣的民眾而言,根本是多此一舉,反而增加不少麻煩給駕駛。若還有每45~60分鐘的隨機檢測,會導致多輛汽車必須臨時停靠路邊進行檢測,可能加劇汽車違規停車的發生頻率。

    認識區塊鏈

    區塊鏈技術是一種不依賴於第三方,透過分散式節點(Peer to Peer,P2P)來進行網路數據的存儲、交易與驗證的技術方法。本質上就是一個去中心化的資料庫,任何人在任何時間都可以依照相同的技術標準將訊息打包成區塊並串上區塊鏈,而這些被串上區塊鏈的區塊無法再被更改。區塊鏈技術主要依靠了密碼學與HASH來保護訊息安全,也是賦予區塊鏈技術具有高安全性、不可篡改性以及去中心化的關鍵。區塊鏈相關概念,如圖6所示。

    區塊鏈的原理與特性

    可以將區塊鏈想像成是一個大型公開帳本,網路上的每個節點都擁有完整的帳本備份,當產生一筆交易時,會將這筆交易廣播到各個節點,而每個節點會將未驗證的交易HASH值收集至區塊內。接著,每個節點進行工作量證明,選取計算最快的節點進行這些交易的驗證,完成後會把區塊廣播給到其他節點,其他節點會再度確認區塊中包含的交易是否有效,驗證過後才會接受區塊並串上區塊鏈,此時就無法再將資料進行篡改。

    關於區塊鏈的特性,可分成以下四部分做說明:

    1. 去中心化:區塊鏈其中一個最重要的核心宗旨,就是「去中心化」,區塊鏈採用分散式的點對點傳輸,該概念架構中,節點與節點之中沒有所謂的中心,所有的操作都部署在分散式的節點中,而無須部署在中心化機構的伺服器,一筆交易或資料的傳輸不再需要第三方的介入,因此又可以說每個節點就是所謂的「中心」。這樣的結構也加強了區塊鏈的穩定性,不會因為其中的部分節點故障而癱瘓整個區塊鏈的結構。

    2. 不可篡改性:透過密碼學與雜湊函數的運用來將資料打包成區塊並上鏈,所有區塊都有屬於它的時間戳記,並依照時間順序排序,而所有節點的帳本資料中又記錄了完整的歷史內容,讓區塊鏈無法進行更改或是更改成本很高,因此使區塊鏈具備「不可篡改性」,並且同時確保了資料的完整性、安全性以及真實性。

    3. 可追溯性:區塊鏈是一種鏈式的資料結構,鏈上的訊息區塊依照時間的順序環環相扣,這便使得區塊鏈具有可追溯的特性。可追本溯源的特性適用在廣泛的領域中,如供應鏈、版權保護、醫療、學歷認證等。區塊鏈就如同記帳帳本一般,每筆交易記錄著時間和訊息內容,若要進行資料的更改,則會視為一筆新的交易,且舊的紀錄仍會存在無法更動,因此仍可依照過去的交易事件進行追溯。

    4. 匿名性:在去中心化的結構下,節點與節點之間不分主從關係,且每個節點中都擁有一本完整的帳本,因此區塊鏈系統是公開透明的。此時,個人資料與訊息內容的隱私就非常重要,區塊鏈技術運用了HASH運算、非對稱式加密與數位簽章等其他密碼學技術,讓節點資料在完全開放的情況下,也能保護隱私以及用戶的匿名性。

    區塊鏈與酒精鎖

    由於區塊鏈的技術具備去中心化、記錄時間以及不可篡改的特性,且更加強酒精鎖的檢測需要身分驗證的保證性。當進行酒精鎖檢測解鎖時,系統記錄駕駛人吹氣時間以及車輛的相關資訊,還有人臉特徵資料打包成區塊並串上區塊鏈。因此,在同一時間當監控系統偵測到當前駕駛人與吹氣人不同時,此時區塊鏈中所記錄的資料便能成為一個強而有力的依據,同時也能讓其他的違規或違法事件可以更容易進行追溯。

    酒駕防偽人臉辨識系統介紹

    為了解決酒精鎖發生駕駛人代測的問題,酒精鎖產品應導入具有身分驗證性的人臉辨識技術。酒駕防偽人臉辨識系統即為駕駛人在進行酒精鎖解鎖時,要同時進行人臉辨識,來確保駕駛人與吹氣人為同一人。

    在駕駛座前方的位置會安裝攝影鏡頭,作為駕駛的監控裝置。進行酒測吹氣的人臉資料將會輸入到該系統中的資料庫儲存,並將人臉資料以及酒測的時間戳記打包成區塊串上區塊鏈,當汽車已經駛動時,攝影鏡頭將會將當前駕駛人畫面傳回系統進行人臉比對驗證。如果驗證成功,會將通過的紀錄與時間戳一同上傳至區塊鏈,若是系統偵測到駕駛人與吹氣人為不同對象,系統將發出警示要求駕駛停車並重新進行檢測,並同時將此次異常的情況進行記錄上傳到區塊鏈中。

    如果駕駛持續不遵循系統指示仍持續行駛,該系統會將區塊鏈的紀錄傳送回給開罰的相關單位,並同時發出警報以告知附近用路人該車輛處於異常情況,應先行迴避。且該車輛於熄火後,酒精鎖會將車輛上鎖,必須聯絡酒精鎖廠商或酒精鎖服務中心才能解鎖。相關的系統概念流程圖,如圖7所示。

    區塊鏈打包上鏈模擬

    在進行酒測解鎖完畢以及進行人臉資料儲存後,會透過CNN將影像轉換輸出成128維的特徵向量作為人臉資料的測量值,接著將128個人臉特徵向量資料取出,並隨著車輛資訊一起打包到同一個區塊,然後串上區塊鏈。取出的人臉特徵資料,如圖8所示。

    要打包成區塊和上鏈的內容,包括了人臉特徵資料、車牌號碼、酒測解鎖時間點等相關輔助資料,接著透過雜湊函數將相關的資料打包成區塊。以車牌號碼ABC-1234為例,圖9顯示將車輛資料和人臉資料進行區塊鏈的打包,並進行HASH運算。

    將人臉資料和車輛相關資料作為一次的交易內容,並打包區塊,經過HASH後的結果如圖10所示,其中prev_hash屬性代表鏈結串列指向前一筆資料,由於這是實作模擬情境,並無上一筆資料,其中messages屬性代表內容數,一筆代表車牌資料,另一筆則為人臉資料。time屬性則代表區塊上鏈的時間點,代表車輛解鎖的時間點。

    情境演練說明

    話說小禛是一間企業的上班族,平時以開車為上下班的交通工具,他的汽車配置了酒駕防偽影像辨識系統,以下模擬小禛下班後準備開車的情境。

    已經下班的小禛今天打算從公司開車回家,當小禛上車準備發動車子時,他必須先拿起安裝在車上的酒測器進行吹氣,並將臉對準攝影鏡頭讓系統取得小禛的人臉影像。小禛在汽車發動前的人臉影像,如圖11所示。

    待攝影鏡頭偵測到小禛的人臉後,接著系統便會擷取臉上五官的68個特徵點,如圖12所示。然後,相關數據再透過CNN轉換輸出成128維的特徵向量作為人臉資料的測量值,如圖13所示。

    酒精鎖通過解鎖後,車輛隨之發動,解鎖成功的時間點將會記錄成時間戳記,隨著影像與相關資料串上區塊鏈。在行駛途中,設置在駕駛座前方的鏡頭將擷取目前駕駛的人臉,以取得駕駛人的128維人臉特徵向量測量值,並且與汽車發動前所存入的人臉資料進行比對,藉以判斷目前的駕駛人與剛才的吹氣人臉是否為同一位駕駛。當驗證通過後,也會再將通過的紀錄與時間戳上傳至區塊鏈中,如此一來,區塊鏈的訊息內容便完整記載了這一次駕車的紀錄,檢測通過的示意圖如圖14所示。

    系統通過辨識後,便確認了駕駛人的身分與吹氣人一致。且透過時戳的紀錄和區塊鏈的輔助,也確保了駕駛的不可否認性。若有其他違規事件發生時,區塊鏈的紀錄便成為一個強而有力的依據來進行追溯。

    如此一來,便可以預防小禛喝酒卻找其他人代吹酒測器的情況發生。在駕駛的途中,如果有需要更換駕駛人,必須待車輛靜止時,從車載系統發出更換駕駛要求,再重新進行酒測以及重複上述流程,才可以更換駕駛人。如果沒有按照該流程更換駕駛,系統將視為異常情況。

    結語

    酒駕一直是全球性的問題,將有高機率導致重大交通事故,造成人員傷亡、家庭破碎,進而醞釀後續更多的社會問題,皆是酒駕所引發的不良效益。為了解決酒駕的問題,各個國家都有不同的酒駕標準或是法律規範,但是大部分國家的規範和制度都只有嚇阻作用卻無法完全遏止。在不同的國家防止酒駕的方式不盡相同,有的國家如新加坡,透過監禁及鞭刑來遏止酒駕犯,又或者是薩爾瓦多,當發現酒駕直接判定死刑,這樣的制度雖嚇阻力極強,但是若讓其他國家也跟進,會造成違憲或是違反人權等問題。因此,各國都在酒駕的問題方面紛紛投入研究,想要達到零酒駕的社會。

    為達成此理想,本文介紹了基於區塊鏈的酒駕防偽辨識系統,利用酒精鎖搭配人臉辨識技術以及區塊鏈技術,使有飲酒的駕駛人無法發動汽車。且該系統搭載在行車電腦中,結合攝影鏡頭的監控對駕駛進行酒測防制管理,將人臉資料、酒精鎖、解鎖時間點與相關資訊打包成區塊並上鏈。基於區塊鏈技術內容的不易篡改,可加強駕駛人的不可否認性,當汽車發生異常情況時,便能利用有效且可靠的依據進行追溯。人工智慧和物聯網時代已經來臨,透過酒駕防偽辨識系統來改善酒駕問題,在未來能夠普及並結合法規,智慧汽車以及智慧科技的應用將會帶給人們更安全、更便利的社會。

    附圖:圖1 人臉辨識的步驟。
    圖2 人臉特徵點偵測(正臉)。
    圖3 人臉特徵點偵測(左側臉)。
    圖4 人臉特徵點偵測(右側臉)。
    圖5 酒精鎖。 (圖片來源:https://commons.wikimedia.org/wiki/File:Guardian_Interlock_AMS2000_1.jpg with Author: Rsheram)
    圖6 區塊鏈分散式節點的概念圖。
    圖7 系統概念流程圖。
    圖8 取出人臉128維特徵向量。
    圖9 儲存車輛相關資料及人臉資料到區塊。
    圖10 HASH後及打包成區塊的結果。
    圖11 汽車發動前小禛的人臉影像。
    圖12 小禛的人臉影像特徵點。
    圖13 小禛的人臉特徵向量資料。
    圖14 系統通過酒測檢測者與駕駛人為同一人。

    資料來源:https://www.netadmin.com.tw/netadmin/zh-tw/technology/CC690F49163E4AAF9FD0E88A157C7B9D

  • 深度學習模型訓練資料建立方法 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文

    2021-03-12 15:12:39
    有 1 人按讚

    【中鋼AI現場1:1千5百度高熱密閉生產環境如何監控?】高爐AI應用大剖析

    中鋼靠間接量測高爐生產數據,一步步打開黑盒子,運用AI即時監控爐況,提早預測異常生產狀況即時應變

    文/翁芊儒 | 2021-03-04發表
    攝影/洪政偉

    高爐之於鋼廠,是不可或缺的一環。飄洋渡海的鋼鐵原料從港口上岸後,會先由煉焦工廠製成焦炭、燒結工廠製成燒結礦與鐵礦,加入其他次要原料後,就會來到鋼鐵融煉的第一站,高爐。

    高爐的作用,就是透過一連串高溫熔融反應,將鋼鐵原料煉成鐵水。雖然說起來容易,實際上,高爐卻是一個複雜的煉鐵反應器。中鋼煉鐵廠高爐二課課長許雍達解釋,每一座高爐,都集合了非常多系統於一身,包括了爐體本身冷卻系統、熱風爐、原料輸送、出鐵、爐氣處理、頂壓回收發電、噴媒等環節,每個系統互相搭配,才能維持高爐穩定運作。

    這個系統中,真正煉製鐵之處,就是外觀形似巨大養樂多瓶的高爐爐身。其運作原理,是從上方加入煉鐵原料,以一層焦炭、一層燒結礦與鐵礦的方式,盡量將原料均勻散布其中,再透過周邊的熱風爐,將空氣加熱,從高爐下部的鼓風嘴鼓進高爐,來加熱、還原,將鐵礦石融煉成鐵水與爐渣。

    熔煉過程中,中鋼也透過鼓風嘴噴吹粉煤,來取代部分焦炭作為還原劑,可降低煉焦爐的負荷,並有利於爐熱調節;而爐內產生的高爐氣,也能在淨化後用來發電,並作為熱風爐及廠內的燃料,來達成節能、減少碳排放的效益。最後的鐵水與爐渣,則會分開取出,各自進行下一步的加工或販售。

    許雍達指出,這套高爐生產的做法,早從十多年前就持續運作至今,但在過去,高爐內部高溫、密閉且不易觀測,難以得知爐況是否符合預期,「比如原料一層一層加入之後,到底分佈均不均勻?又要如何在爐溫下降之前,提早預測來因應?」

    這些問題,隨著IoT與AI技術日漸成熟,中鋼開始蒐集更多生產數據,逐步翻轉過去熟悉的高爐運行操作。

    落地27項高爐智慧應用,更即時掌握高爐生產動態

    中鋼約從3年前開始,致力於研發高爐AI,不只開發高爐爐況監控的相關應用,也開發周邊設備的AI應用,比如原料輸送帶的預測維修、熱風爐生產效率與耗能監控、現場人員的安全監控等,截至今年初,已經完成27項高爐智慧應用的開發,依據應用的特性與適用場域,分散部署在4座高爐中。

    由於高爐本身就像是一個黑盒子,為了掌握高爐的生產狀況,中鋼在高爐上裝設了多種感測器,就是要靠各種生產數據,一步步將盒子打開。

    比如說,從高爐上方布料時,雖然是均勻旋轉布料,但實際布料情況還是會依據爐內氣流變化而改變,為了監控布料狀況並適時調整,中鋼在布料槽裝設了料面溫度儀與輪廓儀,來掌握布料形狀與高溫氣體的分布情形。在爐壁上,中鋼也裝測了溫度感測器,透過爐壁溫度變化頻率,來預測爐壁冷卻元件是否受侵蝕、內部是否結塊。

    不只如此,為了預測爐熱變化,中鋼量測出鐵口的鐵水溫度變化,參考操作條件、鐵渣的化性分析,開發AI預測未來爐熱;也運用爐溫爐壓分布的異常數值,找出發生管道流異常的可能性。透過更即時發現異常並自動預警,就是要讓產線人員盡早發現問題,才能提前調整生產參數來因應。

    而且,針對所有開發的生產數據監控與AI應用,中鋼開發了綜合爐況評分機制,能從原料分佈、氣流狀況、目前風量、鐵水產量、爐內溫度等生產狀況,為高爐當下的運行表現評分,讓產線人員可以更直覺、快速地的了解當前高爐爐況,「中鋼自己設定的目標,是要隨時大於89分以上,」許雍達說。

    克服AI落地挑戰,中鋼導入一站式生產數據監控平臺

    中鋼過去開發AI應用時,是由技術人員設法取得生產數據,開發出AI模型,再由IT單位開發成應用程式,個別部署到現場中控室的單機電腦中。

    許雍達指出,這個做法面臨了三大挑戰。首先,當時從生產環境蒐集到的資料,位於封閉式的生產系統中,為避免透過外部線路存取資料時,可能帶來的資安風險,「研究人員不能輕易的取得生產數據資料,分析費時費力。」

    再加上,每一支開發完成的應用程式,都必須部署到中控室的單機電腦中,透過視窗介面來呈現,在應用程式分散在多臺電腦的情況下,增加了電腦、網路的維護工作。不只如此,隨著蒐集到的資料量更大,AI分析也需要更大量的硬體運算需求,原有的主機資源逐漸不敷使用。

    這三大挑戰,讓中鋼在2019年底,率先在二號高爐場域,規劃建置AIoT智慧分析平臺,更找來研究部門、子公司中冠資訊共同研發,利用二號高爐在去年大修的期間,同步導入該場域。

    這套AIoT平臺最主要的目的,是要將分散部署在不同電腦的AI應用,整合到同一個Web平臺中,讓員工只要以瀏覽器開啟入口網站,登入帳密,就能一站式管理高爐所有的生產資訊。

    建置過程中,中鋼不只以Web介面重新設計AI應用儀表板,也將過去難以取得的生產數據整合到一個資料平臺,供技術人員更方便的分析取用資料,更建置了專屬AI應用的硬體資源,取代分散部署到電腦主機的方法。

    許雍達指出,AIoT平臺上線後,中控人員不只能即時查看重要的生產資訊,當高爐發生任何異常狀況,平臺也會自動觸發告警,並顯示操作指引,讓員工可以依照指示排除異常,將異常狀況可能帶來的傷害降到最低。

    比如說,當AI偵測到四號高爐的爐身發生結塊,就能利用過去一段時間的溫度變化,去推測結塊情形的演變,系統也會提供操作指引,來建議員工應使用哪一種應對模式,才不會導致結塊問題更嚴重。

    處置完成後,員工也可以直接在介面中回報,將此次事故處理過程提交出去,作為歷史維運紀錄,而且,過去類似事故的處理方法與結果,也會同步附件於操作指引的介面中,提供緊急處理時參閱。

    除了上線網頁版的AIoT監控平臺,中鋼也接續打造了行動裝置版本,只要安裝到手機上,具登入權限的中控人員,就能隨時隨地掌握生產即時動態,了解異常狀態資訊。

    今年初,二號高爐完成大修,這套AIoT平臺已經導入二號高爐場域中。中鋼也正在規劃,要將AIoT平臺導入其他座高爐中。許雍達表示,更長久的計畫,則是要開發煉焦、燒結兩大原料加工廠的智能模組,並且整合到AIoT平臺來監控運用,「這樣一來,我們在高爐的現場就能看到原料加工廠的生產數據,如果有異況,高爐也能同步調整、配合。」

    高爐AI應用大剖析

    「高爐出了問題,就得降風停產,如果能見微知著,在發生狀況前預先防範,就能降低損失產量的風險。」中鋼技術部門代理副總經理鄭際昭,一句話點出高爐AI的重要性。

    用AI煉鐵,導入27項高爐場域智慧應用,被中鋼視為第一個進化里程。27項應用中,中鋼不只開發高爐爐況分析監控,也開發周邊設備的AI應用,比如原料輸送帶的預測維修、熱風爐生產效率與耗能監控、現場人員的安全監控等。

    其中,高爐本身的爐況監測,更是AI開發的重點任務,因為高爐就像是一個黑盒子,為了掌控高爐的生產狀況,中鋼得在高爐上裝設多種感測器,以AI監控生產數據,才能提前發現問題,並及早因應。

    因此,在眾多應用中,中鋼特別介紹7項與高爐爐況分析相關的智慧應用,揭密1,500度高熱密閉的生產環境,如何靠AI監控。

    1 爐內布料情形監控

    技術關鍵 靠掃描感測儀器與熱像儀,偵測原料、粉塵、高溫氣體分佈狀況,並將資料視覺化

    效用 監控氣流是否穩定、布料形狀是否符合預期

    將原料從爐頂添加到高爐時,過去無法得知實際布料狀況,但現在,中鋼在爐頂布建掃描感測儀器,就能即時偵測原料在高爐內的分佈,同時透過爐內的熱像儀,掃描粉塵、高溫氣體的分佈,就能比對得知目前氣流是否穩定,布料形狀是否符合預期。中鋼也將量測到的數據,以視覺化的方式來呈現。

    2 管道流預警AI

    技術關鍵 透過AI判斷爐內壓力與溫度分布是否超過異常值,來預測管道流異常

    效用 提早預測管道流異常發生可能性,調整生產參數來因應

    一般來說,高爐運作的理想情況,是從下面鼓風,爐氣均勻往上傳遞,將原料還原熔融。但是,若爐氣無法穩定通過爐料,而是累積在某個區塊,就可能因為壓力蓄積過大往上竄出,造成爐頂洩壓閥排放,或造成設備損傷。「氣集中在一個地方,壓力大到一個程度就會往上衝,就好像人打嗝,不能等到衝上來,要想辦法及時拯救。」鄭際昭形容。

    為了提早發現管道流的情形,中鋼在高爐爐殼上設置壓力量測與溫度量測點,分別將溫度與壓力的分佈視覺化呈現,若結合兩者數值,發現壓力差超過異常值,或是局部溫度過高,AI判斷為管道流異常可能發生,「系統會發出預警,引導操作人員先降低風壓、風量,」中鋼煉鐵廠高爐二課課長許雍達表示,越早預測出管道流異常,就能越早調整生產參數,來避免管道流發生。

    3 爐壁厚度監測AI

    技術關鍵 透過爐壁探鑽深度與周圍壁面溫度變化的關聯性,訓練AI靠爐壁溫度變化,判斷爐壁厚薄

    效用 預測爐壁冷卻元件受損情形,安排檢修時程

    高爐爐壁冷卻元件(冷卻壁)若被蝕破,就可能造成嚴重的生產危機。然而,單從高爐外觀,無法得知爐壁冷卻元件被侵蝕的程度,中鋼以往只能定期量測來推斷爐壁狀況,定期檢修,來降低意外風險。

    要監測爐壁厚薄,中鋼在爐壁裝設測溫感測器,找出溫度與爐壁厚薄的關聯性。鄭際昭解釋,一般來說,爐壁變薄後,測得的爐壁溫度會升高,雖然鐵水在壁面結塊或脫落,也會造成可能造成溫度改變,但相較於正常爐壁狀況,溫度變化頻率會較為劇烈。

    因此,中鋼以探鑽點位附近的歷史溫度變化,結合實際探鑽的厚度訓練AI模型,再套用到高爐其他測溫點位上,來推測爐壁不同位置的侵蝕狀況。

    4 爐壁結塊預測AI

    技術關鍵 透過爐壁溫度變化頻率預測結塊情形

    效用 監測到爐壁溫度變化異常,提早因應避免結塊情形惡化

    高爐溫度一旦降低,就可能造成鐵水冷卻結塊、附著在爐壁上,若爐壁的結塊大量滑落,導致爐氣異常溢出,就可能發生操作上的危險,「許多高爐曾經因為高爐內部結塊過大,掉落時打到鼓風嘴,導致鼓風元件受損漏氣。」許雍達說。

    為了維持爐況穩定與操作安全,中鋼開發了爐壁結塊預測AI,當發現溫度變化波動越來越小,就能推測爐壁內部結塊,並提前調整高爐的生產條件,避免結塊情形更嚴重。

    許雍達表示,這套AI應用目前部署在三、四號高爐,因為這兩座高爐的爐內冷卻元件形式與一、二號高爐不同,更容易發生產生爐壁結塊問題,較有應用AI的急迫性。

    5 爐熱溫度預測AI

    技術關鍵 量測出鐵口的鐵水溫度變化,參考操作條件、鐵渣的化性分析,學習預測未來爐熱

    效用 預測未來2~4小時內的爐熱變化,提前調整生產參數來因應

    對於正在生產鐵水的高爐來說,必須維持一定的爐熱,高爐才能穩地熔煉鐵水,若溫度異常大幅下降,就可能造成爐冷危機,需花費許多時間調整加熱,一旦惡化至鐵水凝固無法排出,復原工作會很困難。

    「發生一次就是上億的損失,所以我們要盡可能避免走到這一步。」鄭際昭點出爐熱預測的重要性。

    中鋼在建立爐熱溫度預測AI時,就是透過量測出鐵口的鐵水溫度變化,參考操作條件、鐵渣的化性分析,學習預知未來2~4小時的爐熱趨勢,藉此訓練出爐熱預測的AI,若預測到未來爐熱可能下降,就能即時調整生產參數,微調風溫、噴煤量,來維持爐熱的穩定。

    6 鼓風嘴噴煤預警AI

    技術關鍵 透過大量鼓風嘴噴煤影像訓練AI判斷異常

    效用 自動化找出噴煤槍過短、噴煤口堵塞等異常影像,減少人力監控負擔

    中鋼透過在鼓風嘴噴吹粉煤,來減少原料焦炭的使用,同時,也能透過粉煤噴吹量來調節爐熱。不過,粉煤噴吹的狀況,過去需要人工監控,透過攝影機將風口影像傳輸到中控室,來監測是否發生噴嘴阻塞、或是噴煤槍設備耗損的情形,而且,需監控的影像還不只一個,光是二號高爐就有30個風口影像需要監控。

    為了減少人力的負擔,中鋼正在運用歷史監測影像,訓練影像辨識AI,來自動監診噴煤槍設備,找出噴煤槍過短、噴煤口堵塞等異狀。

    7 高爐原料粒徑分析AI

    技術關鍵 透過原料粒徑影像資料,訓練AI進行粒徑分析

    效用 即時辨識原料粒徑大小與分布,調整入料情形來降低燃料率

    將原料送入高爐時,若原料的粒徑大小符合預期、分布較平均,有助於爐況穩定、降低燃料率。中鋼甚至推算,高爐燃燒料率每減少1%,每年可以減少上億的燃料經費,因此,中鋼用AI來即時辨識原料的粒徑大小,即時計算進入到高爐原料粒徑分布,以及是否混雜到其他原料等情況,再根據分析結果來調整原料分布,有助於穩定爐況、降低燃料率。

    附圖:光是二號高爐,中鋼就投資約5,700萬元來建置智慧應用,投資的金額雖大,但帶來的效益更可觀,預估每年可以降低成本3,270萬元,減少排放溫室氣體2,217噸。(攝影/洪政偉)

    資料來源:https://www.ithome.com.tw/news/142938

  • 深度學習模型訓練資料建立方法 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文

    2021-03-08 18:09:20
    有 1 人按讚

    迎接終端AI新時代:讓運算更靠近資料所在

    作者 : Andrew Brown,Strategy Analytics
    2021-03-03

    資料/數據(data)成長的速度越來越快。據估計,人類目前每秒產出1.7Mb的資料。智慧與個人裝置如智慧型手機、平板電腦與穿戴式裝置不但快速成長,現在我們也真正目睹物聯網(IoT)的成長,未來連網的裝置數量將遠遠超越地球的人口。

    這包括種類繁多的不同裝置,像是智慧感測器與致動器,它們可以監控從震動、語音到視覺等所有的東西,以及幾乎大家可以想像到的所有東西。這些裝置無所不在,從工廠所在位置到監控攝影機、智慧手錶、智慧家庭以及自主性越來越高的車輛。隨著我們企圖測量生活週遭數位世界中更多的事物,它們的數量將持續爆炸性成長。

    資料爆量成長,讓許多企業把資料從內部部署運作移到雲端。儘管集中到雲端運算的性質,在成本與資源效率、彈性與便利性有它的優點,但也有一些缺點。由於運算與儲存在遠端進行,來自終端、也就是那些在網路最邊緣裝置的資料,需要從起始點經過網際網路或其他網路,來到集中式的資料中心(例如雲端),然後在這裡處理與儲存,最後再傳回給用戶。

    對於一些傳統的應用,這種方式雖然還可以接受,但越來越多的使用場景就是無法承受終端與雲端之間,資訊被接力傳遞產生的延遲。我們必須即時做出決策,網路延遲要越小越好。基於這些原因,開始有人轉向終端運算;越來越多人轉而使用智慧終端,而去中心化的程度也越來越高。此外,在這些即時應用中產生的龐大資料量,意味著處理與智慧必須在本地以分散的方式進行。

    與資料成長連袂而來的,是人工智慧與機器學習(ML)也朝終端移動,並且越來越朝終端本身移動。大量來自真實世界的資訊,需要用ML的方式來進行詮釋與採取行動。透過AI與ML,是以最小的延遲分析影像、動作、影片或數量龐大的資料,唯一可行且合乎成本效益的方式。運用AI與ML的演算法與應用將在邊緣運作,在未來還將會直接在終端裝置上進行。

    資料正在帶動從集中化到分散化的轉變

    隨著資訊科技市場逐漸發展與成熟,網路的設計以及在其運作的所有裝置,也都跟著進化。全盛時期從服務數千個小型客戶端的主機,一直到客戶端伺服器模型中使用的越來越本地化的個人電腦運算效能,基礎架構持續重組與最佳化,以便更貼近網路上的裝置以及符合運作應用的需求。這些需求包含檔案存取與資料儲存,以及資料處理的需求。

    智慧型手機與其他行動裝置的爆炸性成長,加上物聯網的快速成長,促使我們需要為如何讓資產進行最佳的部署與安排進行評估。而影響這個評估的因素,包括網路的可用性、安全性、裝置的運算力,以及把資料從終端傳送到儲存設備的相關費用,近來也已轉向使用分散式的運算模型。

    從邊緣到終端:AI與ML改變終端典範

    在成本、資源效率、彈性與便利性等方面,雲端有它的優點,裝置數量的急遽增加(如圖2),將導致資料產出量大幅增加。這些資料大部份都相當複雜且非結構化的,這也是為何企業只會分析1%~12% 的資料的原因之一。把大量非結構化的資料送到雲端的費用相當高、容易形成瓶頸,而且從能源、頻寬與運算力角度來看,相當沒有效率。

    在終端執行進階處理與分析的能力,可協助為關鍵應用降低延遲、減少對雲端的依賴,並且更好地管理物聯網產出的巨量資料。

    終端AI:感測、推論與行動

    在終端部署更多智慧的主要原因之一,是為了創造更大的敏捷性。終端裝置處於網路的最邊緣與資料產生的地方,可以更快與更準確地做出回應,同時免除不必要的資料傳輸、延遲與資料移動中的安全風險,可以節省費用。

    處理能力與神經網路的重大進展,正協助帶動終端裝置的新能力,另一股驅動力則是對即時資訊、效率(傳送較少的資訊到雲端)、自動化與在多數情況下,對近乎即時回應的需求。這是一個三道步驟的程序:傳送資料、資料推論(例如依據機器學習辨識影像、聲音或動作),以及採取行動(如物件是披薩,冰箱的壓縮機發出正常範圍外的聲音,因此發出警告)。

    感測

    處理器、微控制器與感測器產生的資料量相當龐大。例如,自駕車每小時要搜集25GB的資料。智慧家庭裝置、智慧牙刷、健身追蹤器或智慧手錶持續進化,並且與以往相比,會搜集更多的資料。

    它們搜集到的資料極具價值,但每次都從各個終端節點把資料推回給雲端,數量又會過多。因此必須在終端進行處理。倘若部份的作業負載能在終端本身進行,就可以大幅提升效率。

    推論

    終端搜集到的資料是非結構性的。當機器學習從資料擷取到關聯性時,就是在進行推論。這表示使用AI與ML工具來幫忙訓練裝置辨識物件。拜神經網路的進展之賜,機器學習工具越來越能訓練物件以高度的精準度辨識影像、聲音與動作,這對體積越來越小的裝置,極為關鍵。

    例如,圖4顯示使用像ONNX、PyTorch、Caffe2、Arm NN或 Tensorflow Lite 等神經網路工具,訓練高效能的意法半導體(ST)微控制器(MCU),以轉換成最佳化的程式碼,讓MCU進行物件辨識(這個的情況辨識對象是影像、聲音或動作)。更高效能的MCU越來越常利用這些ML工具來辨識動作、音訊或影像,而且準確度相當高,而我們接下來馬上就要對此進行檢視。這些動作越來越頻繁地從邊緣,轉移到在終端運作的MCU本身。

    行動

    資料一旦完成感測與推論後,結果就是行動。這有可能是回饋簡單的回應(裝置是開啟或關閉),或針對應用情況進行最佳化(戴耳機的人正在移動中,因此會針對穩定度而非音質進行最佳化),或是回饋迴路(根據裝置訓練取得的機器學習,輸送帶若發出聲音,顯示它可能歪掉了)。物聯網裝置將會變得更複雜且更具智慧,因為這些能力提升後,運算力也會因此增加。在我們使用新的機器學習工具後,一些之前在雲端或終端完成的關鍵功能,將可以移到終端本身的內部進行。

    終端 AI:千里之行始於足下

    從智慧型手機到車輛,今日所有電子裝置的核心都是許多的處理器、微控制器與感測器。它們執行各種任務,從最簡單到最複雜,並需要各式各樣的能力。例如,應用處理器是高階處理器,它們是為行動運算、智慧型手機與伺服器設計;即時處理器是為例如硬碟控制、汽車動力傳動系統,與無線通訊的基頻控制使用的非常高效能的處理器,至於微控制器處理器的矽晶圓面積則小了許多,能源效率也高出很多,同時擁有特定的功能。

    這意味著利用ML工具訓練如MCU等較不複雜元件來執行的動作,之前必須透過威力更強大的元件才能完成,但現在邊緣與雲端則是理想的場所。這將讓較小型的裝置以更低的延遲執行更多種類的功能,例如智慧手錶、健康追蹤器或健康照護監控等穿戴式裝置。

    隨著更多功能在較小型的終端進行,這將可以省下資源,包括資料傳輸費用與能源費用,同時也會產生極大的環境衝擊,特別是考量到全球目前已有超過200億台連網裝置,以及超過2,500億顆MCU(根據Strategy Analytics統計數據)。

    TinyML、MCU與人工智慧

    根據Google的TesnsorFlow 技術主管、同時也是深度學習與TinyML領域的指標人物 Pete Warden 表示:「令人相當興奮的是,我還不知道我們將如何使用這些全新的裝置,特別是它們後面代表的科技是如此的吸引人,我無法想像那些即將出現的全新應用。」

    微型機器學習(TinyML)的崛起,已經催化嵌入式系統與機器學習結合,而兩者傳統上大多是獨立運作的。TinyML 捨棄在雲端上運作複雜的機器學習模型,過程包含在終端裝置內與微控制器上運作經過最佳化的模式識別模型,耗電量只有數毫瓦。

    物聯網環境中有數十億個微型裝置,可以為各個產業提供更多的洞察與效率,包括消費、醫療、汽車與工業。TinyML 獲得 Arm、Google、Qualcomm、Arduino等業者的支持,可望改變我們處理物聯網資料的方式。

    受惠於TinyML,微控制器搭配AI已經開始增添各種傳統上威力更強大的元件才能執行的功能。這些功能包括語音辨識(例如自然語言處理)、影像處理(例如物件辨識與識別),以及動作(例如震動、溫度波動等)。啟用這些功能後,準確度與安全性更高,但電池的續航力卻不會打折扣,同時也考量到各種更微妙的應用。

    儘管之前提到的雲端神經網路框架工具,是取用這個公用程式最常用的方法,但把AI函式庫整合進MCU,然後把本地的AI訓練與分析能力插入程式碼中也是可行的。這讓開發人員依據從感測器、麥克風與其他終端嵌入式裝置取得的訊號導出資料模式,然後從中建立模型,例如預測性維護能力。

    如Arm Cortex-M55處理器與Ethos U55微神經處理器(microNPU),利用CMSIS-DSP與CMSIS-NN等常見API來簡化程式碼的轉移性,讓MCU與共同處理器緊密耦合以加速AI功能。透過推論工具在低成本的MCU上實現AI功能並符合嵌入式設計需求極為重要,原因是具有AI功能的MCU有機會在各種物聯網應用中轉變裝置的設計。

    AI在較小型、低耗電與記憶體受限的裝置中可以協助的關鍵功能,我們可以把其精華歸納至我們簡稱為「3V」的三大領域:語音(Voice,如自然語言處理)、視覺(Vision,如影像處理)以及震動(Vibration,如處理來自多種感測器的資料,包括從加速計到溫度感測器,或是來自馬達的電氣訊號)。

    終端智慧對「3V」至關重要

    多數的物聯網應用聚焦在一些特定的領域:基本控制(開/關)、測量(狀態、溫度、流量、噪音與震動、濕度等)、資產的狀況(所在地點以及狀況如何?),以及安全性功能、自動化、預測性維護以及遠端遙控(詳見圖 6)。

    Strategy Analytics的研究顯示,許多已經完成部署或將要部署的物聯網B2B應用,仍然只需要相對簡單的指令,如基本的開/關,以及對設備與環境狀態的監控。在消費性物聯網領域中,智慧音箱的語音控制AI已經出現爆炸性成長,成為智慧家庭指令的中樞,包括智慧插座、智慧照明、智慧攝影機、智慧門鈴,以及智慧恆溫器等。消費性裝置如藍牙耳機現在已經具備情境感知功能,可以依據地點與環境,在音質優先與穩定度優先之間自動切換。

    如同我們檢視的結果,終端AI可以在「3V」核心領域提供價值,而它觸及的許多物聯網領域,遍及B2B與B2C的應用:

    震動:包含來自多種感測器資料的處理,從加速計感測器到溫度感測器,或來自馬達的電氣訊號。
    視覺:影像與影片辨識;分析與識別靜止影像或影片內物件的能力。
    語音:包括自然語言處理(NLP)、瞭解人類口中說出與寫出的語言的能力,以及使用人類語言與人類交談的能力-自然語言產生(NLG)。
    垂直市場中有多種可以實作AI技術的使用場景:

    震動

    可以用來把智慧帶進MCU中的終端AI的進展,有各式各樣的不同應用領域,對於成本與物聯網裝置與應用的效用,都會帶來衝擊。這包括我們在圖6中點出的數個關鍵物聯網應用領域,包括:

    溫度監控;
    壓力監控;
    溼度監控;
    物理動作,包括滑倒與跌倒偵測;
    物質檢測(漏水、瓦斯漏氣等) ;
    磁通量(如鄰近感測器與流量監控) ;
    感測器融合(見圖7);
    電場變化。

    一如我們將在使用場景單元中檢視的,這些能力有許多可以應用在各種被普遍部署的物聯網應用中。

    語音

    語音是進化的產物,也是人類溝通非常有效率的方式。因此我們常常想要用語音來對機器下指令,也不令人意外;聲音檢測是持續成長的類別。語音啟動在智慧家庭應用中很常見,例如智慧音箱,而它也逐漸成為啟動智慧家庭裝置與智慧家電的語音中樞,如電視、遊戲主機與其他新的電器。

    在工業環境中,供車床、銑床與磨床等電腦數值控制(CNC)機器使用的電腦語音引擎正方興未艾。iTSpeex的ATHENA4是第一批專為這些產品設計的語音啟動作業系統。這些產品往往因為安全原因,有離線語音處理的需求,因此終端 AI 語音發展在這裡也創造出有趣的機會。用戶可以指示機器執行特定的運作,並從機器手冊與工廠文件,立即取用資訊。

    語音整合在車輛中也相當關鍵。OEM 代工廠商持續對車載娛樂系統中的語音辨識系統,進行大量投資。語音有潛力成為最安全的輸入模式,因為它可以讓駕駛的眼睛持續盯著道路,而雙手仍持續握著方向盤。

    對於使用觸控螢幕或硬體控制器通常需要多道步驟的複雜任務,語音辨識系統特別能勝任。這些任務包括輸入文字簡訊、輸入目的地、播放特定歌曲或歌曲子集,以及選擇廣播電台頻道。其他的服務包含如拋錨服務(或bCall)與禮賓服務。

    視覺

    正如我們之前已經檢視過,終端 AI 提供視覺領域全新的機會,特別是與物件檢測及辨識相關。這可能包括觀察生產線的製造瑕疵,以及找出自動販賣機需要補貨的庫存。其他實例包括農業應用,例如依據大小與品質為農產品分級。

    曳引機裝上機器視覺攝影機後,我們幾乎可以即時檢測出雜草。雜草冒出後,AI可以分類雜草並估算它對農產收穫的潛在威脅。這讓農民可以鎖定特定的雜草,並打造客製的除草解決方案。機器視覺然後可以檢測除草劑的效用,並找出農地中仍具抗藥性的殘餘雜草。

    使用場景

    預測性維護工具已經從擷取與比較震動的量測資料,進化到提出即時的資產監控。藉由連接物聯網感測器裝置與維護軟體,我們也可能做到遠端監控。

    震動分析

    這種類型的預測性維護在旋轉型機器密集的製造工廠裡,相當常見。震動分析可以揭露鬆脫、不平衡、錯位與軸承磨損等狀況。例如,把震動計量器接上靠近選煤廠離心泵浦內部承軸處,就可以讓工程師建立起正常震動範圍的基線。超出這個範圍的震動,可能顯示滾珠軸承出現鬆動,需要更換。

    磁感測器融合

    磁感測器利用磁性浮筒與一系列可以感應並與液體表面一起移動的感測器,測量液面的高低。所有的這些應用都使用一個固定面上的磁感測器,它與附近平面的磁鐵一起作動,與這個磁鐵相對應的感測器也會移動。

    聲學分析(聲音)

    與震動分析相似,聲測方位分析也是供潤滑技師使用,主要是專注在主動採取潤滑措施。這意味我們可以避免移動設備時產生的過度磨損,否則會為了修理造成代價高昂的停機。實際的例子可能包括測量輸送皮帶的承軸狀況。出現過度磨損時,承軸會因為潤滑不足或錯位出現故障,可能造成整個生產流程的中斷。

    聲學分析(超音波)

    聲音聲學分析雖然可以用來進行主動與預測性維護,超音波聲學分析卻只能用於預測性維護。它可以在超音波範圍內找出與機器摩擦及壓力相關的聲音,並使用在會發出較細微聲音的電氣設備與機器設備。我們可以說這一類型的分析與震動或油量分析相比,更可以預測即將出現的故障。目前它部署起來比其他種類的預防性維護花費較高,但終端 AI 的進展可以促成這種細微層級的聲學檢測,大幅降低部署的費用。

    熱顯影

    熱顯影利用紅外線影像來監控互動機器零件的溫度,讓任何異常情況很快變得顯而易見。具備終端 AI 能力的裝置,可以長期檢測微細的變化。與其他對事故敏感的監視器一樣,它們會觸發排程系統,自動採取適當的行動來預防零件故障。

    消費者與智慧家庭

    將語音運用在消費者與智慧家庭,是最常看到的場景之一。這包括智慧型手機與平板電腦上、未包含電話整合功能的裝置,例如螢幕尺寸有限的穿戴式裝置。這類型的裝置包含智慧手錶與健康穿戴式裝置,可以為各種功能提供免動手的語音啟動。像 Amazon 的 Echo 或 Google 的 Home 等智慧音箱市場的成長,說明消費者對於可接收與提供語音互動等現有裝置的強勁需求,與日俱增。

    消費者基於各種理由使用智慧音箱,最常見的使用場景為:

    聽音樂;
    控制如照明等智慧家庭裝置;
    取得新聞與天氣預報的更新;
    建立購物與待辦事項清單。

    除了像智慧音箱與智慧電視等消費裝置,智慧家庭裝置語音的使用,也顯現相當的潛力。諸如連網門鈴(如 ring.com)等裝置與連網的煙霧偵測器(例如 Nest Protect 煙霧與一氧化碳警報)目前都已上市可供消費者選購,它們結合了語音與視覺的感測器融合功能以及運動檢測。有了連網的煙霧偵測器,裝置在偵測到煙霧或一氧化碳時,可以發出語音警告。

    終端 AI 為強化這些能力提供了全新機會,而且常常結合震動(動作)、視覺與語音控制。例如,增加姿態辨識來控制例如電視等家電,或是把語音控制嵌入白色家電,即是以最低成本強化功能性最直接的方式。

    健康照護

    用來發現醫護資訊的 AI 驅動終端裝置的應用,將為病況的治療與診斷,提供更多的價值。這種資訊可能是資料,也可能是影像、影片以及說出的話,我們可以透過 AI 進行型態與診斷分析。這些資料將引發全新、更有效的治療方法,為整個產業節省成本。受惠於終端 AI 的進展,像 Google Duplex 等語音系統的複雜性將會降低。例如門診預約等勞力密集的工作,也可以轉換成 AI 活動。利用自然語言語音來延伸 AI 的使用,也可以把 AI 用在第一線的病人診斷,然後再由醫師接手提供諮詢。

    其他健康照護實例包括像 Wewalk5 等物件,這是一個供半盲與全盲人員使用的智慧拐杖。它使用感測器來檢測胸口水平以上的物件,並搭配 Google Maps 與 Amazon Alexa 等 app,方便使用者提出問題。

    結論

    由於連網的終端裝置數量越來越多,這個世界也越來越複雜。連接到網際網路的裝置已經超過 300 億個,而微控制器的數量也超過 2,500 億,每年還會增加約 300 億個。越來越多的程序開始進行自動化,不過,把大量資料傳送到雲端涉及的延遲以及邊緣運算的額外費用,意味著許多全新、令人興奮且引人矚目的物聯網使用場景,可能無法開花結果。

    解決這些挑戰的答案,並不是為雲端資料中心持續增添運算力。降低出現在邊緣的延遲雖然會有幫助,但不會解決日益分散的世界的所有挑戰。我們需要把智能應用到基礎架構中。

    儘管為終端裝置增添先進的運算能力在十年前仍不可行,TinyML 技術近來的提升,已經讓位處相當邊緣的裝置 (也就是終端本身)增添智能的機會大大改觀。在終端增加運算與人工智慧能力,可以讓我們在源頭搜集到更多更具關聯性與相關的資訊。隨著裝置與資料的數量持續攀升,在源頭掌握情境化與具關聯性的資料,具有極大的價值,並將開啟全新的使用場景與營收機會。

    終端裝置的機器學習,可以促成全新的終端 AI 世界。新的應用場景正在崛起,甚至跳過傳送大量資料的需求,因而紓解資料傳輸的瓶頸與延遲,並在各種作業環境中創造全新機會。終端 AI 將為我們開啟一個充滿全新機會與應用場景的世界,其中還有很多我們現在想像不到的機會。

    附圖:圖1:從集中式到分散式運算的轉變。
    (資料來源:《The End of Cloud Computing》,by Peter Levine,Andreessen Horowitz)
    圖2:全球上網裝置安裝量。
    (資料來源:Strategy Analytics)
    圖3:深度學習流程。
    圖4:MCU的視覺、震動與語音。
    (資料來源:意法半導體)
    圖5:AI 工具集執行模型轉換,以便在MCU上執行經最佳化的神經網路推論。
    (資料來源:意法半導體)
    圖6:物聯網企業對企業應用的使用-目前與未來。
    (資料來源:Strategy Analytics)
    圖7:促成情境感知的感測器融合。
    (資料來源:恩智浦半導體)

    資料來源:https://www.eettaiwan.com/20210303nt31-the-dawn-of-endpoint-ai-bringing-compute-closer-to-data/?fbclid=IwAR0JTRpNsJUl-DmSNpfIcymGQpkQaUgXixEaczwDpELxGCaCeJpkTyoqUtI

你可能也想看看

搜尋相關網站