此階段細分. 為四步驟,以爬蟲收集文本資料、斷詞與斷句標註、向量維度縮減,以及特徵選取。 目前常用中文處理系統有中研院的CkipTagger 中文處理工具GPL-3.0(GNU General.
確定! 回上一頁