雖然這篇google語音辨識api python鄉民發文沒有被收入到精華區:在google語音辨識api python這個話題中,我們另外找到其它相關的精選爆讚文章
在 google語音辨識api產品中有9篇Facebook貼文,粉絲數超過3,992的網紅台灣物聯網實驗室 IOT Labs,也在其Facebook貼文中提到, 迎接終端AI新時代:讓運算更靠近資料所在 作者 : Andrew Brown,Strategy Analytics 2021-03-03 資料/數據(data)成長的速度越來越快。據估計,人類目前每秒產出1.7Mb的資料。智慧與個人裝置如智慧型手機、平板電腦與穿戴式裝置不但快速成長,現在我...
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
google語音辨識api 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
迎接終端AI新時代:讓運算更靠近資料所在
作者 : Andrew Brown,Strategy Analytics
2021-03-03
資料/數據(data)成長的速度越來越快。據估計,人類目前每秒產出1.7Mb的資料。智慧與個人裝置如智慧型手機、平板電腦與穿戴式裝置不但快速成長,現在我們也真正目睹物聯網(IoT)的成長,未來連網的裝置數量將遠遠超越地球的人口。
這包括種類繁多的不同裝置,像是智慧感測器與致動器,它們可以監控從震動、語音到視覺等所有的東西,以及幾乎大家可以想像到的所有東西。這些裝置無所不在,從工廠所在位置到監控攝影機、智慧手錶、智慧家庭以及自主性越來越高的車輛。隨著我們企圖測量生活週遭數位世界中更多的事物,它們的數量將持續爆炸性成長。
資料爆量成長,讓許多企業把資料從內部部署運作移到雲端。儘管集中到雲端運算的性質,在成本與資源效率、彈性與便利性有它的優點,但也有一些缺點。由於運算與儲存在遠端進行,來自終端、也就是那些在網路最邊緣裝置的資料,需要從起始點經過網際網路或其他網路,來到集中式的資料中心(例如雲端),然後在這裡處理與儲存,最後再傳回給用戶。
對於一些傳統的應用,這種方式雖然還可以接受,但越來越多的使用場景就是無法承受終端與雲端之間,資訊被接力傳遞產生的延遲。我們必須即時做出決策,網路延遲要越小越好。基於這些原因,開始有人轉向終端運算;越來越多人轉而使用智慧終端,而去中心化的程度也越來越高。此外,在這些即時應用中產生的龐大資料量,意味著處理與智慧必須在本地以分散的方式進行。
與資料成長連袂而來的,是人工智慧與機器學習(ML)也朝終端移動,並且越來越朝終端本身移動。大量來自真實世界的資訊,需要用ML的方式來進行詮釋與採取行動。透過AI與ML,是以最小的延遲分析影像、動作、影片或數量龐大的資料,唯一可行且合乎成本效益的方式。運用AI與ML的演算法與應用將在邊緣運作,在未來還將會直接在終端裝置上進行。
資料正在帶動從集中化到分散化的轉變
隨著資訊科技市場逐漸發展與成熟,網路的設計以及在其運作的所有裝置,也都跟著進化。全盛時期從服務數千個小型客戶端的主機,一直到客戶端伺服器模型中使用的越來越本地化的個人電腦運算效能,基礎架構持續重組與最佳化,以便更貼近網路上的裝置以及符合運作應用的需求。這些需求包含檔案存取與資料儲存,以及資料處理的需求。
智慧型手機與其他行動裝置的爆炸性成長,加上物聯網的快速成長,促使我們需要為如何讓資產進行最佳的部署與安排進行評估。而影響這個評估的因素,包括網路的可用性、安全性、裝置的運算力,以及把資料從終端傳送到儲存設備的相關費用,近來也已轉向使用分散式的運算模型。
從邊緣到終端:AI與ML改變終端典範
在成本、資源效率、彈性與便利性等方面,雲端有它的優點,裝置數量的急遽增加(如圖2),將導致資料產出量大幅增加。這些資料大部份都相當複雜且非結構化的,這也是為何企業只會分析1%~12% 的資料的原因之一。把大量非結構化的資料送到雲端的費用相當高、容易形成瓶頸,而且從能源、頻寬與運算力角度來看,相當沒有效率。
在終端執行進階處理與分析的能力,可協助為關鍵應用降低延遲、減少對雲端的依賴,並且更好地管理物聯網產出的巨量資料。
終端AI:感測、推論與行動
在終端部署更多智慧的主要原因之一,是為了創造更大的敏捷性。終端裝置處於網路的最邊緣與資料產生的地方,可以更快與更準確地做出回應,同時免除不必要的資料傳輸、延遲與資料移動中的安全風險,可以節省費用。
處理能力與神經網路的重大進展,正協助帶動終端裝置的新能力,另一股驅動力則是對即時資訊、效率(傳送較少的資訊到雲端)、自動化與在多數情況下,對近乎即時回應的需求。這是一個三道步驟的程序:傳送資料、資料推論(例如依據機器學習辨識影像、聲音或動作),以及採取行動(如物件是披薩,冰箱的壓縮機發出正常範圍外的聲音,因此發出警告)。
感測
處理器、微控制器與感測器產生的資料量相當龐大。例如,自駕車每小時要搜集25GB的資料。智慧家庭裝置、智慧牙刷、健身追蹤器或智慧手錶持續進化,並且與以往相比,會搜集更多的資料。
它們搜集到的資料極具價值,但每次都從各個終端節點把資料推回給雲端,數量又會過多。因此必須在終端進行處理。倘若部份的作業負載能在終端本身進行,就可以大幅提升效率。
推論
終端搜集到的資料是非結構性的。當機器學習從資料擷取到關聯性時,就是在進行推論。這表示使用AI與ML工具來幫忙訓練裝置辨識物件。拜神經網路的進展之賜,機器學習工具越來越能訓練物件以高度的精準度辨識影像、聲音與動作,這對體積越來越小的裝置,極為關鍵。
例如,圖4顯示使用像ONNX、PyTorch、Caffe2、Arm NN或 Tensorflow Lite 等神經網路工具,訓練高效能的意法半導體(ST)微控制器(MCU),以轉換成最佳化的程式碼,讓MCU進行物件辨識(這個的情況辨識對象是影像、聲音或動作)。更高效能的MCU越來越常利用這些ML工具來辨識動作、音訊或影像,而且準確度相當高,而我們接下來馬上就要對此進行檢視。這些動作越來越頻繁地從邊緣,轉移到在終端運作的MCU本身。
行動
資料一旦完成感測與推論後,結果就是行動。這有可能是回饋簡單的回應(裝置是開啟或關閉),或針對應用情況進行最佳化(戴耳機的人正在移動中,因此會針對穩定度而非音質進行最佳化),或是回饋迴路(根據裝置訓練取得的機器學習,輸送帶若發出聲音,顯示它可能歪掉了)。物聯網裝置將會變得更複雜且更具智慧,因為這些能力提升後,運算力也會因此增加。在我們使用新的機器學習工具後,一些之前在雲端或終端完成的關鍵功能,將可以移到終端本身的內部進行。
終端 AI:千里之行始於足下
從智慧型手機到車輛,今日所有電子裝置的核心都是許多的處理器、微控制器與感測器。它們執行各種任務,從最簡單到最複雜,並需要各式各樣的能力。例如,應用處理器是高階處理器,它們是為行動運算、智慧型手機與伺服器設計;即時處理器是為例如硬碟控制、汽車動力傳動系統,與無線通訊的基頻控制使用的非常高效能的處理器,至於微控制器處理器的矽晶圓面積則小了許多,能源效率也高出很多,同時擁有特定的功能。
這意味著利用ML工具訓練如MCU等較不複雜元件來執行的動作,之前必須透過威力更強大的元件才能完成,但現在邊緣與雲端則是理想的場所。這將讓較小型的裝置以更低的延遲執行更多種類的功能,例如智慧手錶、健康追蹤器或健康照護監控等穿戴式裝置。
隨著更多功能在較小型的終端進行,這將可以省下資源,包括資料傳輸費用與能源費用,同時也會產生極大的環境衝擊,特別是考量到全球目前已有超過200億台連網裝置,以及超過2,500億顆MCU(根據Strategy Analytics統計數據)。
TinyML、MCU與人工智慧
根據Google的TesnsorFlow 技術主管、同時也是深度學習與TinyML領域的指標人物 Pete Warden 表示:「令人相當興奮的是,我還不知道我們將如何使用這些全新的裝置,特別是它們後面代表的科技是如此的吸引人,我無法想像那些即將出現的全新應用。」
微型機器學習(TinyML)的崛起,已經催化嵌入式系統與機器學習結合,而兩者傳統上大多是獨立運作的。TinyML 捨棄在雲端上運作複雜的機器學習模型,過程包含在終端裝置內與微控制器上運作經過最佳化的模式識別模型,耗電量只有數毫瓦。
物聯網環境中有數十億個微型裝置,可以為各個產業提供更多的洞察與效率,包括消費、醫療、汽車與工業。TinyML 獲得 Arm、Google、Qualcomm、Arduino等業者的支持,可望改變我們處理物聯網資料的方式。
受惠於TinyML,微控制器搭配AI已經開始增添各種傳統上威力更強大的元件才能執行的功能。這些功能包括語音辨識(例如自然語言處理)、影像處理(例如物件辨識與識別),以及動作(例如震動、溫度波動等)。啟用這些功能後,準確度與安全性更高,但電池的續航力卻不會打折扣,同時也考量到各種更微妙的應用。
儘管之前提到的雲端神經網路框架工具,是取用這個公用程式最常用的方法,但把AI函式庫整合進MCU,然後把本地的AI訓練與分析能力插入程式碼中也是可行的。這讓開發人員依據從感測器、麥克風與其他終端嵌入式裝置取得的訊號導出資料模式,然後從中建立模型,例如預測性維護能力。
如Arm Cortex-M55處理器與Ethos U55微神經處理器(microNPU),利用CMSIS-DSP與CMSIS-NN等常見API來簡化程式碼的轉移性,讓MCU與共同處理器緊密耦合以加速AI功能。透過推論工具在低成本的MCU上實現AI功能並符合嵌入式設計需求極為重要,原因是具有AI功能的MCU有機會在各種物聯網應用中轉變裝置的設計。
AI在較小型、低耗電與記憶體受限的裝置中可以協助的關鍵功能,我們可以把其精華歸納至我們簡稱為「3V」的三大領域:語音(Voice,如自然語言處理)、視覺(Vision,如影像處理)以及震動(Vibration,如處理來自多種感測器的資料,包括從加速計到溫度感測器,或是來自馬達的電氣訊號)。
終端智慧對「3V」至關重要
多數的物聯網應用聚焦在一些特定的領域:基本控制(開/關)、測量(狀態、溫度、流量、噪音與震動、濕度等)、資產的狀況(所在地點以及狀況如何?),以及安全性功能、自動化、預測性維護以及遠端遙控(詳見圖 6)。
Strategy Analytics的研究顯示,許多已經完成部署或將要部署的物聯網B2B應用,仍然只需要相對簡單的指令,如基本的開/關,以及對設備與環境狀態的監控。在消費性物聯網領域中,智慧音箱的語音控制AI已經出現爆炸性成長,成為智慧家庭指令的中樞,包括智慧插座、智慧照明、智慧攝影機、智慧門鈴,以及智慧恆溫器等。消費性裝置如藍牙耳機現在已經具備情境感知功能,可以依據地點與環境,在音質優先與穩定度優先之間自動切換。
如同我們檢視的結果,終端AI可以在「3V」核心領域提供價值,而它觸及的許多物聯網領域,遍及B2B與B2C的應用:
震動:包含來自多種感測器資料的處理,從加速計感測器到溫度感測器,或來自馬達的電氣訊號。
視覺:影像與影片辨識;分析與識別靜止影像或影片內物件的能力。
語音:包括自然語言處理(NLP)、瞭解人類口中說出與寫出的語言的能力,以及使用人類語言與人類交談的能力-自然語言產生(NLG)。
垂直市場中有多種可以實作AI技術的使用場景:
震動
可以用來把智慧帶進MCU中的終端AI的進展,有各式各樣的不同應用領域,對於成本與物聯網裝置與應用的效用,都會帶來衝擊。這包括我們在圖6中點出的數個關鍵物聯網應用領域,包括:
溫度監控;
壓力監控;
溼度監控;
物理動作,包括滑倒與跌倒偵測;
物質檢測(漏水、瓦斯漏氣等) ;
磁通量(如鄰近感測器與流量監控) ;
感測器融合(見圖7);
電場變化。
一如我們將在使用場景單元中檢視的,這些能力有許多可以應用在各種被普遍部署的物聯網應用中。
語音
語音是進化的產物,也是人類溝通非常有效率的方式。因此我們常常想要用語音來對機器下指令,也不令人意外;聲音檢測是持續成長的類別。語音啟動在智慧家庭應用中很常見,例如智慧音箱,而它也逐漸成為啟動智慧家庭裝置與智慧家電的語音中樞,如電視、遊戲主機與其他新的電器。
在工業環境中,供車床、銑床與磨床等電腦數值控制(CNC)機器使用的電腦語音引擎正方興未艾。iTSpeex的ATHENA4是第一批專為這些產品設計的語音啟動作業系統。這些產品往往因為安全原因,有離線語音處理的需求,因此終端 AI 語音發展在這裡也創造出有趣的機會。用戶可以指示機器執行特定的運作,並從機器手冊與工廠文件,立即取用資訊。
語音整合在車輛中也相當關鍵。OEM 代工廠商持續對車載娛樂系統中的語音辨識系統,進行大量投資。語音有潛力成為最安全的輸入模式,因為它可以讓駕駛的眼睛持續盯著道路,而雙手仍持續握著方向盤。
對於使用觸控螢幕或硬體控制器通常需要多道步驟的複雜任務,語音辨識系統特別能勝任。這些任務包括輸入文字簡訊、輸入目的地、播放特定歌曲或歌曲子集,以及選擇廣播電台頻道。其他的服務包含如拋錨服務(或bCall)與禮賓服務。
視覺
正如我們之前已經檢視過,終端 AI 提供視覺領域全新的機會,特別是與物件檢測及辨識相關。這可能包括觀察生產線的製造瑕疵,以及找出自動販賣機需要補貨的庫存。其他實例包括農業應用,例如依據大小與品質為農產品分級。
曳引機裝上機器視覺攝影機後,我們幾乎可以即時檢測出雜草。雜草冒出後,AI可以分類雜草並估算它對農產收穫的潛在威脅。這讓農民可以鎖定特定的雜草,並打造客製的除草解決方案。機器視覺然後可以檢測除草劑的效用,並找出農地中仍具抗藥性的殘餘雜草。
使用場景
預測性維護工具已經從擷取與比較震動的量測資料,進化到提出即時的資產監控。藉由連接物聯網感測器裝置與維護軟體,我們也可能做到遠端監控。
震動分析
這種類型的預測性維護在旋轉型機器密集的製造工廠裡,相當常見。震動分析可以揭露鬆脫、不平衡、錯位與軸承磨損等狀況。例如,把震動計量器接上靠近選煤廠離心泵浦內部承軸處,就可以讓工程師建立起正常震動範圍的基線。超出這個範圍的震動,可能顯示滾珠軸承出現鬆動,需要更換。
磁感測器融合
磁感測器利用磁性浮筒與一系列可以感應並與液體表面一起移動的感測器,測量液面的高低。所有的這些應用都使用一個固定面上的磁感測器,它與附近平面的磁鐵一起作動,與這個磁鐵相對應的感測器也會移動。
聲學分析(聲音)
與震動分析相似,聲測方位分析也是供潤滑技師使用,主要是專注在主動採取潤滑措施。這意味我們可以避免移動設備時產生的過度磨損,否則會為了修理造成代價高昂的停機。實際的例子可能包括測量輸送皮帶的承軸狀況。出現過度磨損時,承軸會因為潤滑不足或錯位出現故障,可能造成整個生產流程的中斷。
聲學分析(超音波)
聲音聲學分析雖然可以用來進行主動與預測性維護,超音波聲學分析卻只能用於預測性維護。它可以在超音波範圍內找出與機器摩擦及壓力相關的聲音,並使用在會發出較細微聲音的電氣設備與機器設備。我們可以說這一類型的分析與震動或油量分析相比,更可以預測即將出現的故障。目前它部署起來比其他種類的預防性維護花費較高,但終端 AI 的進展可以促成這種細微層級的聲學檢測,大幅降低部署的費用。
熱顯影
熱顯影利用紅外線影像來監控互動機器零件的溫度,讓任何異常情況很快變得顯而易見。具備終端 AI 能力的裝置,可以長期檢測微細的變化。與其他對事故敏感的監視器一樣,它們會觸發排程系統,自動採取適當的行動來預防零件故障。
消費者與智慧家庭
將語音運用在消費者與智慧家庭,是最常看到的場景之一。這包括智慧型手機與平板電腦上、未包含電話整合功能的裝置,例如螢幕尺寸有限的穿戴式裝置。這類型的裝置包含智慧手錶與健康穿戴式裝置,可以為各種功能提供免動手的語音啟動。像 Amazon 的 Echo 或 Google 的 Home 等智慧音箱市場的成長,說明消費者對於可接收與提供語音互動等現有裝置的強勁需求,與日俱增。
消費者基於各種理由使用智慧音箱,最常見的使用場景為:
聽音樂;
控制如照明等智慧家庭裝置;
取得新聞與天氣預報的更新;
建立購物與待辦事項清單。
除了像智慧音箱與智慧電視等消費裝置,智慧家庭裝置語音的使用,也顯現相當的潛力。諸如連網門鈴(如 ring.com)等裝置與連網的煙霧偵測器(例如 Nest Protect 煙霧與一氧化碳警報)目前都已上市可供消費者選購,它們結合了語音與視覺的感測器融合功能以及運動檢測。有了連網的煙霧偵測器,裝置在偵測到煙霧或一氧化碳時,可以發出語音警告。
終端 AI 為強化這些能力提供了全新機會,而且常常結合震動(動作)、視覺與語音控制。例如,增加姿態辨識來控制例如電視等家電,或是把語音控制嵌入白色家電,即是以最低成本強化功能性最直接的方式。
健康照護
用來發現醫護資訊的 AI 驅動終端裝置的應用,將為病況的治療與診斷,提供更多的價值。這種資訊可能是資料,也可能是影像、影片以及說出的話,我們可以透過 AI 進行型態與診斷分析。這些資料將引發全新、更有效的治療方法,為整個產業節省成本。受惠於終端 AI 的進展,像 Google Duplex 等語音系統的複雜性將會降低。例如門診預約等勞力密集的工作,也可以轉換成 AI 活動。利用自然語言語音來延伸 AI 的使用,也可以把 AI 用在第一線的病人診斷,然後再由醫師接手提供諮詢。
其他健康照護實例包括像 Wewalk5 等物件,這是一個供半盲與全盲人員使用的智慧拐杖。它使用感測器來檢測胸口水平以上的物件,並搭配 Google Maps 與 Amazon Alexa 等 app,方便使用者提出問題。
結論
由於連網的終端裝置數量越來越多,這個世界也越來越複雜。連接到網際網路的裝置已經超過 300 億個,而微控制器的數量也超過 2,500 億,每年還會增加約 300 億個。越來越多的程序開始進行自動化,不過,把大量資料傳送到雲端涉及的延遲以及邊緣運算的額外費用,意味著許多全新、令人興奮且引人矚目的物聯網使用場景,可能無法開花結果。
解決這些挑戰的答案,並不是為雲端資料中心持續增添運算力。降低出現在邊緣的延遲雖然會有幫助,但不會解決日益分散的世界的所有挑戰。我們需要把智能應用到基礎架構中。
儘管為終端裝置增添先進的運算能力在十年前仍不可行,TinyML 技術近來的提升,已經讓位處相當邊緣的裝置 (也就是終端本身)增添智能的機會大大改觀。在終端增加運算與人工智慧能力,可以讓我們在源頭搜集到更多更具關聯性與相關的資訊。隨著裝置與資料的數量持續攀升,在源頭掌握情境化與具關聯性的資料,具有極大的價值,並將開啟全新的使用場景與營收機會。
終端裝置的機器學習,可以促成全新的終端 AI 世界。新的應用場景正在崛起,甚至跳過傳送大量資料的需求,因而紓解資料傳輸的瓶頸與延遲,並在各種作業環境中創造全新機會。終端 AI 將為我們開啟一個充滿全新機會與應用場景的世界,其中還有很多我們現在想像不到的機會。
附圖:圖1:從集中式到分散式運算的轉變。
(資料來源:《The End of Cloud Computing》,by Peter Levine,Andreessen Horowitz)
圖2:全球上網裝置安裝量。
(資料來源:Strategy Analytics)
圖3:深度學習流程。
圖4:MCU的視覺、震動與語音。
(資料來源:意法半導體)
圖5:AI 工具集執行模型轉換,以便在MCU上執行經最佳化的神經網路推論。
(資料來源:意法半導體)
圖6:物聯網企業對企業應用的使用-目前與未來。
(資料來源:Strategy Analytics)
圖7:促成情境感知的感測器融合。
(資料來源:恩智浦半導體)
資料來源:https://www.eettaiwan.com/20210303nt31-the-dawn-of-endpoint-ai-bringing-compute-closer-to-data/?fbclid=IwAR0JTRpNsJUl-DmSNpfIcymGQpkQaUgXixEaczwDpELxGCaCeJpkTyoqUtI
google語音辨識api 在 君子馬蘭頭 - Ivan Li 李聲揚 Facebook 的最佳解答
[是日Startup]原意不錯,解決到問題—如果辨識度夠高的話。
TLDR:估唔估到我原本想講乜?肯定要成段由頭執過喎,如果打字快嘅(如我),自己打應該快過再要執。又,個語音辨識都唔係自己嘅,咁core competency在邊?
1. 講明先,非挑機非罵戰非抹黑。我有朋友做start up(相信大家身邊都梗有一個),我有做顧問(建議人地雪櫃買乜嘢飲都係顧問嚟嘅)(*),但絶對唔同領域,做硬件,所以唔會有任何衝突。唔好小人之心。
2. 是咁的,今日睇報紙見到呢檔嘢(https://bityl.co/3UUq),覺得個產品幾過癮,就去試下。拿,潛在客仔(我算係)會走去試,證明宣傳成功。證明信報係有人睇嘅,雖然係廢老(我),但廢老係客仔嘛(都係我)
3. 街邊阿叔都識講,start up嘅嘢,要針對個pain point。呢個東西就針對咗某啲人嘅痛點—影片配字幕。
4. 雖則埃汾唔係成日拍片,暫時都係同HomeBlogger合作(有同事後期製作配字幕真好)。但我工作都會講talk錄片。大家都知,有字幕嘅片好好多。特別係有人話埃汾講嘢好快(聽講係),至於埃汾講嘢一舊舊呀懶音呀咬字唔準呢啲,就各有主觀睇法,唔係重點。
5. 無論如何,字幕是重要的,但亦係難搞的。雖則埃汾打中文字相當快,舊文提過,我半個鐘出咗篇聯儲局減息嘅分析文,一路打一路諗,2300字(https://fbook.cc/3FT7)—但我都唔會幫自己啲片打字幕嘅。第一原因係懶,第二原因係:我好怕聽到自己把聲—以前上電視時,如果食飯或乜見到自己嘅片(有重播有錄播嘛),我會好唔自在。我亦當然唔會睇返自己嘅片,亦好少睇返自己嘅文,歌唱比賽我都唔聽返自己唱成點的(所以冇乜進步)
6. 呢個東西,話幫你gen 字幕喎,你send 條youtube link去,佢就幫你出字幕。試玩過,15分鐘嘅片(暫時免費版上限),一分鐘唔使就出到。好喎。咁就絶對解決到好多人嘅痛點啦。
7. 可惜,出嚟個效果,就認真麻麻。你都可以去玩下(https://bityl.co/3UVg)
8. 即係好似呢段片咁,估下我原本講嘅係乜?
9. 我講嘅係:零零舍舍有一隻Google就斯人獨憔悴
10. 結果變咗:零零四四九一只Gogo豆芽私人特橋水
11. 呢個準確度,應該麻麻地吧。
12. 你可以話,扯,你講嘢中英夾雜,好難認。但呢個應該係大多數香港人講嘢嘅習慣喎。
13. 你亦可以話,埃汾你講嘢尼格度鬼食泥咁,一舊舊,咬字又唔清,又多懶音。隨你點批評,雖則本人文化口試都高分,亦都算多講talk—我想講嘅係,當我講廣東話再難辨認,但1-10,1最難認10最清楚,我點都有3-4掛?你套嘢如果我講嘢都認唔到,應該有三成人都搞唔掂喎。再講一次,我唔係粵音權威,但連我都搞唔掂,你套嘢窄啲喎。
14. 當然創辦人都有講,套嘢初步階段啫,信報試用都見到要自己再執。佢話有七成,我就覺得冇啦—等於賣二手嘢廣告,九成新即係五成,五成新即係殘到仆街。
15. 另一個問題係:對我嚟講呢,反正我打字快,你叫我仲要執一輪,我不如由頭打過!!!真的,如果唔係完全唔識嘅,抄功課係耐過自己做架!正如自己作過篇係快過譯文的!你要我對返住自己把聲,我不如一開頭自己打字幕算數,我甚至懷疑可以一路打字幕一路拍片!—不如搵次試下!如果好似城寨之類有兩三個人一齊嘅,應該得,自己由頭講到尾當然難啲啦。
16. 明喎,免費版唔好咁多要求。明白嘅,唔好用免費版囉,唔鍾意呀?quit 免費版囉,畀錢囉。得唔得?O唔OK?(**)
17. 之但係收費版,er…….好似有啲貴!「唔係畀唔起,但唔抵!」「即係畀唔起」(***)。
18. 希望冇睇錯,但,$13.5 /每影片分鐘,即係一分鐘嘅片收我13.5,咁我homeblogger啲片半粒鐘,你咪收我四舊水?
19. 即係,埃汾Patreon,一個月打12篇文起碼,一篇三四千字,一個月都係收一舊水有找咋!!!係咪有良心先!(https://bit.ly/31QmYj7)(今次個廣告夠自然啦!)。真喎,一篇文我點都打兩三粒鐘,收你一蚊美金,時薪兩三蚊港紙(****),悲慘世界。
20. Premium佢話專業團隊為你修改字幕,「即係搵條友再改啦」,咁請人當然要錢。但不幸地,埃汾叔叔話你知,「其實邊個話你知售價由成本決定?」。我就覺得窄窄地啦,半個鐘片你收我400蚊嘅,我懷疑自己搵條友返打都得,仲可以即時問我。「都唔好講我去大灣區搵個營養快線哥幫我打」
21. 不過諗諗下,條友要坐定定半個鐘聽,然後再打返出嚟,可能都搞一粒鐘,咁計時薪四舊水又唔算好過份?唔知了。但我見快餐店好似五六十蚊時薪,咁打字幕,唔使演奏級唔使CFA下話。「況且你話你套嘢有七成準嘛,你執三成咋喎,唔係咩?」
22. 講返正經,如果Premium都係要人手後期執,唔係辦法,同埋會畀人覺得好似數碼驗孕棒(https://fbook.cc/3FTF),或者keyword counter扮AI咁(https://fbook.cc/3FTG)。「即係你返去搵真人去打字幕」。當你做到有客幫襯都好,但咁嘅故事,sell唔到投資者的。
23. 投資者好現實。要乜?一係好尖端嘅技術,一係自己好勁嘅算法,一係好強嘅品牌(但start up何來有品牌),一係好多人用,一係你有政府照,一係你好多錢燒可以掟死人,一係你股東好堅。否則你再巴閉好,兩嘢就畀人抄。
24. 正如訪問都有講,佢地話「相關的語音辨識系統並非團隊自行研發,而是外接第三方系統的應用程式介面(API)。」(埃汾按:唔係Google下話?)。咁其實個core competency係在人地個技術度喎,你呢度有乜value add?又AI?(原文係咁講)。識得斷句?好似窄啲喎。「一生愛錯放你的 手」點斷句?(OK,國語嚟的)
25. 總之,提高個辨識度先吧。否則我不如開個喇叭畀Google Translate,或者錄段嘢上大灣區搵營養快線哥人肉打字,應該平好多。「聽聞啲法文軟件都係去非洲搵人人工咁去做,因為非洲連乞兒都講法文」—OK,呢個係好bad taste嘅joke.但,法國啲客服同call center就真係搬去非洲的!而且唔係咩摩洛哥,太貴了。係去馬達加斯加!
26. 繼續努力吧,創業嘅嘢,唔係咁易的。但正係唔容易先會搵到錢,人人做到就唔會有extra回報啦
(*)但,呀朋友公司寫字樓呢,之前雪樻真係買埋啲完全冇撚人飲嘅古怪嘢。我好奇研究點解,卒之發現咗。因為佢搵個秘書兼打雜去買—而個秘書為咗唔使成日托嚟托去,就特登買啲不受歡迎嘅嘢!拿,所以真係買乜嘢飲都有學問架!我是企管醫生,主要醫肚。
(**)其實我第一次測試,就係拎Brian Cha段片!Kelvin Poon會變咗九分半!唔信你試下!(https://ggle.io/3QlK)。不過費事貼佢張相,陣間你地又投訴,佢又投訴。
(***)呢個句式好似係本人原創,相當有爭議。但幾有用。例如代入「坐頭等去歐洲」
(****)聰明嘅讀者睇到個謬誤啦:埃汾平均冇錯係一蚊美金篇文,其實冇添,Patreon Paypal仲要抽—但,我唔止寫畀一條友嘛!我篇文可以幾百條友睇嘛,marginal cost極低,士基拿保呀。又學到啦啦,仲唔訂?(https://bit.ly/31QmYj7)
———————————————————
Ivan Patreon 狼耳街華人,一星期至少三篇港美市場評點,一個月一舊水唔使,開張一個月已近 500人訂,仲有兩篇免費試睇:https://bit.ly/31QmYj7
——————————————————————————
[收費短片第九擊]美股科技股是否泡沫爆破?價值投資之選
課程資訊:https://homebloggerhk.com/course_detail/?code=CC009
內容:
*美股急跌點算好
*科技股係咪泡沫爆煲?
*有乜價值投資之選?
本星期內特惠售價: $80
課程編號:CC009
觀看期限:首次播放後一星期及限每影片4次
客服whatsapp: 63832145
另外想買返第八擊(美國總統大選股票部署)都仲可以:https://bityl.co/3NPn
google語音辨識api 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
7 大項科技技術與應用,掌握未來人類生活形式
作者 Atkinson | 發布日期 2017 年 10 月 30 日 18:10 |
針對人類科技未來的發展,美國科技媒體 PC Magazine 總編輯 Dan Costa 受「立法院數位國家促進會」會長立法委員余宛如之邀,前來做專題演講時表示,在未來科技不斷的發展下,他認為將有 7 大項產品或應用會改變未來人類的生活。其中包括了物聯網、智慧城市、虛擬實境與擴增實境、區塊鏈、語音辨識以及人工智慧。而這些產品或應用,將不會是單獨存在,而是交互的應用,才可為人們的生活帶來更大的便利性。
Dan Costa 表示,現代的新科技並不只是裝在盒子裡,然後出售給消費者使用而已。而更應該是了解這些科技當時被發明的初衷,然後思索在未來將能透過這些新科技帶給消費者多少的改變,並且為這個世界創造多少的機會。事實上,也就是 PC Magazine 每年必須從市場中測試超過 2,500 項的新產品或應用,有的是讓一般消費者改變生活方式的應用,也有的是提出更好的營運解決方案。因此,從這其中就可以歸類出 7 大項將會改變未來人類的生活產品或應用,在此與大家分享。
物聯網未來有發展,有商機
首先,就是目前當紅的物聯網 (IoT) 應用上。Dan Costa 強調,物聯網就是未來。因為,透過各項產品的上網,例如電冰箱也可以上網的機制,將可以改變人類世界的未來。根據統計,目前全球約有 84 億的聯網裝置,這對比目前全世界還有 20 億的人還沒辦法上網的情況,物聯網的市場比人聯網的規模更大,而且這也成為了未來人類的共同方向。
事實上,根據調查顯示,全世界企業的主管都已經可以開始接受物聯網的概念,在台灣也是相同的情況。未來,藉由各項物品的聯網,獲得各種數據,之後衍生出的數據經濟會是不可限量的一項新興經濟。只是,過去物聯網都是新創公司的產品,因此比較不重視安全的部分, 在當前都已經有適合的改善方案。而且,就此方面看來,安全雖然是阻礙物聯網推進的一項阻礙,但尤其是對台灣的廠商來說,卻開啟了一項新的商機。
智慧城市解決人類生活問題
其次,是在智慧城市的部分。Dan Costa 表示,根據調查,到 2050 年全球有將近 70% 的人口將會居住在城市中,如此都市化的情況也會形成許多的問題,包括交通、能源、衛生等各方面。因此,終究會有許多問題需要有解決方案來解決。只是,過去針對智慧城市,多數都偏向物聯網、感應器、交通運輸的層面,現在大家會希望藉由私人企業、公部門以及非營利單位之間的溝通合作,來完成智慧城市的規畫。
Dan Costa 認為,藉由公部門與私部門的聯繫,是達成智慧城市整合與成功的關鍵,尤其是藉由開放的溝通與資料,未來透過 5G 系統的問世,全球針對智慧城市的管理將會有同一個規格,使得各個智慧城市的管理回歸統一,如此也位廠商創造成為龐大商機。如此以提升生活品質,滿足智慧城市對人類生活的供給。
AR、VR,與區塊鏈將建立新的生活模式
再來是在虛擬實境 (VR)、擴增實境 (AR) 的發展上。Dan Costa 表示,AR 與 VR 的產品應用未來都會有爆炸性的發展,而且相關產業都相會投入。未來在低到 200 美元以下的產品問世之後,普及速度就會加快。這也使得更多的使用者體驗以及更新的人機介面與人機發展,會帶來科技層面的變化。而至於區塊鏈的發展,這個全球通用的開放性帳簿,可以在不透過第三方建立互信機制的情況下,藉由新的加密及編解碼的技術,可以更智慧化的進行資源處理。也許,未來區塊鏈的技術普及後,還將會淘汰某些人的工作。
語音辨識創造革命性的應用
至於,在第 6 項語音辨識部分,Dan Costa 強調,這項技術 20 年前就已經存在。只是,當年十分之一的出錯率與當今的 99.9% 的正確率相比,簡直不可同日而語。而語音辨識技術的推進,硬體廠商可藉由 API 介入語音辨識系統而不需要花太多的投資,使得亞馬遜、Google 、Apple 都介入語音助理產品中,未來會很快讓聲音來取代鍵盤,成為一種新的革命性應用。
人工智慧省思取代人類工作內容
最後,也是當前大家最寄予厚望人工智慧 (AI) 技術上,Dan Costa 表示,人工智慧與通用智慧的區別,就是在人工智慧指的是超人腦的技術,而非利用認知的部分來進行或取代人類的工作。所以,要使得人工智慧能夠成功,就必須在包括,第一,驅動力,也就是就是在大數據的基礎上達到一定的效能;第二,演算能力,目前的晶片發展,都已經逐步具備這樣的能力;第三,演算法架構,這也是目前發展人工智慧難度最高的部分。
Dan Costa 進一步強調,首代的人工智慧是為了解決商業模式的問題所開發出來的。但是,現在的演進,卻已經跳過這樣的需求。例如,目前有美國兩家媒體業的 AI 應用,是用來撰寫財報新聞,或是體育新聞這類的有框架報導。而值得注意的是,未來各行業人工智慧的崛起,加上自動化的普及,取代許多工作將是不可避免的趨勢,而這也是需要進一步面對的問題。
在說明了 7 大項影響未來生活的科技與應用之後,Dan Costa 最後表示,這些先進的技術與應用並不是單獨存在,而是可以交互作用與整合的。例如區塊鏈與物聯網的整合,將發揮更大的效益。而物聯網的發展,搭配人工智慧,將可為智慧城市的發展提供最佳的解決方案。而再透過擴增實境來協助智慧城市的管理,則將可以把功效發會到極致。所以,人類如何將這些新科技整合,並加以協調應用,將會是重要的關鍵點。
資料來源:https://technews.tw/2017/10/30/7-tech-watch/