為什麼這篇jieba斷詞鄉民發文收入到精華區:因為在jieba斷詞這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者tommy780507 (巴柏)看板Python標題[問題] 編碼問題求救時間Sat Feb ...
不好意思!! 小弟為新手
在JIEBA斷詞的過程中遇到編碼的問題
想請教一下各位高手,是否有方法可以解決或是我哪裡沒注意到
麻煩提點一下
程式碼:
#-*- coding: utf-8 -*-
# -*- coding: cp950 -*-
import jieba
jieba.set_dictionary('dict.txt.big')
ret = open ('speech.txt', "r",encoding = 'utf-8').read()
seglist = jieba.cut(ret, cut_all=False)
import json
hash = {}
for item in seglist:
if item in hash:
hash[item] += 1
else:
hash[item] = 1
json.dump(hash,open("count.json","w",encoding ='utf-8'),ensure_ascii=False)
fd = open("count.csv","w",encoding ='utf-8')
fd.write("word,count\n")
for k in hash:
fd.write("%s,%d\n"%(k.encode("utf8"),hash[k]))------>目前已經查出為這行程式的問題
但不知道如何修改可以輸出成中文,依照目前程式輸出為ASCII的編碼
拜託了~~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.159.33
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1486208790.A.AC3.html