from sklearn.feature_extraction.text import TfidfVectorizer ... 由於我們的對象是文字,固使用正規表達式,只留中文(u4E00~u9FFFa)和英文(a~z, A~Z).
確定! 回上一頁