接下來我們輸入一首歌詞當成語料庫示範,將每一句歌詞當成是一分文件,利用原本在中文斷詞的 Jieba 加上 sklearn 裡面的 TfidfVectorizer,這兩個套件就可以計算 TF-IDF。
確定! 回上一頁