[爆卦]人聲提取是什麼?優點缺點精華區懶人包

雖然這篇人聲提取鄉民發文沒有被收入到精華區:在人聲提取這個話題中,我們另外找到其它相關的精選爆讚文章

在 人聲提取產品中有13篇Facebook貼文,粉絲數超過67萬的網紅MenClub,也在其Facebook貼文中提到, 【必震撼世界】中國稱已成功研發豬紅提煉人造血液適合任何血型解救億民 中國人聲稱成功研發「萬用人造血」可以解救萬民血庫唔駛怕唔夠血要號召捐血救人!西北大學國家微檢測工程技術研究中心及西安血氧生物技術有限公司血氧液研發團隊表示,經過20年努力已經成功研發適合任何血型人類的人造血液。人造血由豬血作為原...

人聲提取 在 懋懋 Instagram 的最佳解答

2021-09-10 18:56:29

​ 平常會用到耳機的時機大多是通勤時聽音樂​ 在家怕打擾到其他人也習慣戴耳機看影片​ 對於耳機品質要求不是很高,不要是空洞音質就好😂​ ​ 這次收到OPPO Enco Air 真無線耳機​ 音質上經過研發團隊的優化,在低音和中高音的表現還不錯​ ​ 在語音通話或遊戲語音中​ 雙麥克風透過AI提取人聲...

人聲提取 在 小蔓Myra Instagram 的最讚貼文

2021-09-10 20:16:02

最近因為疫情的關係 WFH成了多數上班族的工作模式 長時間待在家常常都覺得心情不愉快 不能出去玩真的超悶的 但最近我在培養一個聽音樂的習慣,不只可以讓心情變得愉快,在工作上也可以增加不少創作靈感,這款耳機陪伴我工作每一天❤️ - 來分享我為什麼喜歡Enco Air真無線耳機幾個原因 外型為純黑色的...

  • 人聲提取 在 MenClub Facebook 的最佳貼文

    2021-07-23 13:30:53
    有 1,191 人按讚

    【必震撼世界】中國稱已成功研發豬紅提煉人造血液適合任何血型解救億民

    中國人聲稱成功研發「萬用人造血」可以解救萬民血庫唔駛怕唔夠血要號召捐血救人!西北大學國家微檢測工程技術研究中心及西安血氧生物技術有限公司血氧液研發團隊表示,經過20年努力已經成功研發適合任何血型人類的人造血液。人造血由豬血作為原料再將其中血紅蛋白提取出來,經過戊二醛聚合以及其他加工修飾手段後形成一种血紅蛋白聚合物替代人類紅細胞的功能。據說選用豬血血紅蛋白作原料因為中國大把豬,有利未來大量生產,成果已測試過輸血給老鼠、狗隻、猴子等動物模型,證實產品可完全替代紅細胞並攻克所有血型,相信成果可以解救人類突破中國醫學新領域。

    #溫提上年日本已成功研發細胞膜萃抽取技術人造血漿

  • 人聲提取 在 Facebook 的最佳解答

    2021-03-06 13:52:20
    有 215 人按讚

    (突然的下雨日 散文分享)

    這些日子,她也感染到外界的資訊焦慮似的,無論如何掩鼻、關門。那世間焦慮都像空氣一樣竄了進來,於是那她存放著心的房子,頓時像蓋在山坡上的違建物,聽著下面的洪水滔天,水氣也盈滿了整個違建。

    她無論是補強了水泥,或是多了幾道粉刷,那小屋都像是沾了水氣的紙盒子,心持續軟軟地塌陷著。

    自從有了社群疊床架屋,跟真實世界一樣巨大壅塞時。她為了堵住那些信號不明的人聲,或是隨人聲呼嘯進來的焦慮,原本可以承載日子的時空突然像飄盪的小船,隨著人群的聲音遠近浮沉著。

    有時聽到某個話題又引起了熱議,或是哪個遠方戰神在話題沃土上插旗。她就聽到兩派人們喊著:「殺啊!」在虛擬大地上衝鋒陷陣。好不熱鬧。她那紙盒似的小屋,像個紙船,有時隨著人心激憤沖進了瀑布一般,於是她總習慣躲進了暗礁,等著一波波群情熱浪過去。

    社群表面上熱鬧,其實是隨時需要抖乾淨的東西,不然那些會長黴的群情激憤,就會在某些小團體裡發酵,成為一塊醃漬物的存在。這時候,她都會提取記憶中某些特別的日子當乾燥劑,驅散那些淹過來的情緒。

    比方某年在日本東京上野美術館的日子。那一年她才剛畢業沒多久,同行朋友要去看演唱會,於是她拿著地圖去了上野,一個新舊混合的地方。

    那天,她買著那些復古的小東西跟和尚包,順著自己的心情往斜坡走。因沒有太大的渴求,有一剎那間以為自己也活在那裏,沒有要去哪裡地走著。

    她晃晃悠悠地走進了上野美術館,那天不是例假日,人不多。幸運地讓她碰到了羅丹展與莫內展。

    那天下午,她奢侈地在莫內的畫面前楞坐了一小時,沒有催趕、沒有導讀,她就跟那樣的純粹相處了個把小時。心裡想著:「人間的幸福,不就是今時今日嗎?」

  • 人聲提取 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文

    2020-03-15 13:06:41
    有 2 人按讚

    AI 將可快速分離人聲、各式樂器等音源,Facebook 開源 Demucs 計畫

    作者 雷鋒網 | 發布日期 2020 年 03 月 11 日 10:59 |

    音樂源分離,是利用技術將一首歌曲分解成它的組成成分,如人聲、低音和鼓,這和人類大腦的工作很類似,大腦可以將一個單獨的對話,從周圍的噪音和一屋子的人聊天中分離出來。

    如果你擁有原始的錄音室多軌錄音,這很容易實現,你只需調整混音來分離一個音軌,但是,如果你從一個普通 MP3 檔案開始,所有的樂器和聲音都被混合到一個立體聲錄音中,即使是最複雜的軟體程式也很難精確地挑出一個部分。

    Facebook AI 的研究人員已經開發了一個系統,可以做到這一點──精確度高得驚人。

    創建者名叫亞歷山大‧笛福茲(Alexandre Defossez),是 Facebook 人工智慧巴黎實驗室的科學家。笛福茲的系統被稱為 Demucs,這個名字來源於「音樂資源深度提取器」,其工作原理是檢測聲波中的複雜模式,對每種樂器或聲音的波形模式建立一個高層次的理解,然後利用人工智慧將它們巧妙地分離。

    笛福茲說,像 Demucs 這樣的技術,不僅能幫助音樂家學習複雜的吉他即興重複段落,總有一天,它還能讓人工智慧助理在嘈雜的房間裡更容易聽到語音指令。笛福茲說,他的目標是讓人工智慧系統擅長辨識音頻源的組成部分,就像它們現在可以在一張照片中準確地區分不同的物體一樣。「我們在音頻方面還沒有達到同樣的水平。」他說。

    分解聲波的更好方法

    聲源分離長期以來一直吸引著科學家。1953 年,英國認知科學家科林‧切爾瑞(Colin Cherry)創造了「雞尾酒會效應」這個詞語,用來描述人類在擁擠嘈雜的房間裡專注於一次談話的能力。

    工程師們首先試圖透過調整立體聲錄音中的左右聲道,或調整均衡器設置來提高或降低某些頻率,進而隔離歌曲的人聲或吉他聲。

    基於聲譜圖的人工智慧系統,在分離出以單一頻率響起或共振的樂器的音符方面相對有效,例如鋼琴或小提琴旋律。

    這些旋律在聲譜圖上顯示為清晰、連續的水平線,但是隔離那些產生殘餘噪音的撞擊聲,比如鼓、低音拍擊,是一項非常艱鉅的任務。鼓點感覺像一個單一的、即時的整體事件,但它實際上包含了不同的部分。對於鼓來說,它包括覆蓋較高頻率範圍的初始撞擊,隨後是在較低頻率範圍內的無音高衰減。笛福茲說,一般的小鼓「就頻率而言,到處都是」。

    聲譜圖只能將聲波表現為時間和頻率的組合,無法捕捉到這樣的細微差別。因此,他們將鼓點或拍子低音處理成幾條不連續的垂直線,而不是一個整齊、無縫的聲音。這就是為什麼透過聲譜圖分離出來的鼓和低音軌道,聽起來常常是模糊不清的。

    夠聰明的系統來重建缺失

    基於人工智慧的波形模型避免了這些問題,因為它們不試圖將一首歌放到時間和頻率的僵化結構中。笛福茲解釋,波形模型的工作方式與電腦視覺相似,電腦視覺是人工智慧的研究領域,旨在讓電腦學會從數位圖像中辨識模式,進而獲得對視覺世界的高級理解。

    電腦視覺使用神經網路來檢測基本模式──類似於在圖像中發現角落和邊緣──然後推斷更高級或更複雜的模式。「波形模型的工作方式非常相似」,笛福茲說。他解釋了波形模型如何需要幾秒鐘來適應歌曲中的突出頻率──人聲、低音、鼓或吉他──並為每一個元素生成單獨的波形。然後,它開始推斷更高比例的結構,以增加細微差別,並精細雕刻每個波形。

    笛福茲說,他的系統也可以比做探測和記錄地震的地震儀。地震時,地動儀的底座會移動,但懸掛在上面的重物不會移動,這使得附著在重物上的筆可以畫出記錄地面運動的波形。人工智慧模型可以探測到同時發生的幾個不同地震,然後推斷出每個地震的震級和強度的細節。同樣,笛福茲的系統分析並分離出一首歌曲的本來面目,而不是根據預先設定的聲譜圖結構來分割它。

    笛福茲解釋,構建這個系統需要克服一系列複雜的技術挑戰。他首先使用了 Wave-U-Net 的底層架構,這是一個為音樂源分離開發的早期人工智慧波形模型。然後他還有很多工作要做,因為聲譜圖模型的表現優於 Wave-U-Net。他透過添加線性單元來微調波形網路中分析模式的演算法參數。笛福茲還增加了長短期記憶,這種結構允許網路處理整個數據序列,如一段音樂或一段視頻,而不僅是一個數據點,如圖像。笛福茲還提高了 Wave-U-Net 的速度和記憶體使用率。

    這些修改幫助 Demucs 在一些重要方面勝過 Wave-U-Net,比如它如何處理一種聲音壓倒另一種聲音的問題。「你可以想像一架飛機起飛,引擎噪音會淹沒一個人的聲音」,笛福茲說。

    以前的波形模型,透過簡單地移除原始音頻源文件的一部分來處理這個問題,但是它們不能重建丟失材料的重要部分。笛福茲增強了 Demucs 解碼器的能力,「Demucs 可以重新創建它認為存在但卻迷失在混音中的音頻​​」,這意味著他的模型可以重新合成可能被響亮的鐃鈸聲影響而遺失的柔和鋼琴音符,因為它理解應該呈現什麼樣的聲音。

    這種重構和分離的能力使 Demucs 比其他波形模型有優勢。笛福茲說,Demucs 已經與最好的波形技術相匹配,並且「遠遠超出」最先進的聲譜技術。

    在盲聽測試中,38 名參與者從 50 首測試曲目中隨機抽取 8 秒鐘進行聽音,這 50 首曲目由 3 個模型分開:Demucs、領先波形、頻譜圖技術。聽眾認為 Demucs 在品質和無偽影(如背景噪音或失真)方面表現最佳。

    Demucs 已經引起了人工智慧愛好者的興趣,精通技術的讀者可以從 GitHub 下載 Demucs 的代碼,代碼用 MusDB 數據集來分離音樂源。

    笛福茲解釋,隨著 Demucs 的發展,它將為人們在家中創作音樂的數位音頻工作站帶來聲音的真實性。這些工作站提供了能夠喚起特定時代或風格的合成儀器,通常需要對原始硬體進行大量的數位化改造。

    想像一下,如果音樂源分離技術能夠完美地捕捉 20 世紀 50 年代搖滾歌曲中用電子管放大器演奏的老式空心電吉他的聲音,Demucs 讓音樂愛好者和音樂家離這個能力更近了一步。

    資料來源:https://technews.tw/2020/03/11/using-ai-for-music-source-separation/?fbclid=IwAR1C-0LhFNEkIFUg9QS3xRQK8VKeqKIkPEx9kh7QdGamcsCfUViwyeXyqXg

你可能也想看看

搜尋相關網站