[爆卦]jieba斷詞是什麼?優點缺點精華區懶人包

為什麼這篇jieba斷詞鄉民發文收入到精華區:因為在jieba斷詞這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者tommy780507 (巴柏)看板Python標題[問題] 編碼問題求救時間Sat Feb ...


不好意思!! 小弟為新手
在JIEBA斷詞的過程中遇到編碼的問題
想請教一下各位高手,是否有方法可以解決或是我哪裡沒注意到
麻煩提點一下

程式碼:

#-*- coding: utf-8 -*-
# -*- coding: cp950 -*-
import jieba
jieba.set_dictionary('dict.txt.big')
ret = open ('speech.txt', "r",encoding = 'utf-8').read()
seglist = jieba.cut(ret, cut_all=False)
import json
hash = {}
for item in seglist:
if item in hash:
hash[item] += 1
else:
hash[item] = 1
json.dump(hash,open("count.json","w",encoding ='utf-8'),ensure_ascii=False)
fd = open("count.csv","w",encoding ='utf-8')
fd.write("word,count\n")
for k in hash:
fd.write("%s,%d\n"%(k.encode("utf8"),hash[k]))------>目前已經查出為這行程式的問題
但不知道如何修改可以輸出成中文,依照目前程式輸出為ASCII的編碼

拜託了~~

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.159.33
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1486208790.A.AC3.html
ckc1ark: open指定encoding='utf-8'了 write的時候拿掉encode試試 02/04 20:39
tommy780507: 謝謝樓上 問題解決了!! 但我可以問一下 原因嗎? 02/04 22:15
GoalBased: 你知道py3媽 02/05 02:50
tommy780507: 沒有 我來研究一下 02/05 15:37
chehsunliu: 推py3,好用明瞭 02/05 19:32

你可能也想看看

搜尋相關網站