為什麼這篇unicode表中文鄉民發文收入到精華區:因為在unicode表中文這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者yi7310 (忘記過去吧! 請給我自由)看板C_and_CPP標題[問題] 問unicode編...
不知道在這裡問unicode對不對? 不過我想很多前輩在處理unicode編碼時,
應該碰過不少問題。
遇到的問題: (題意請描述清楚)
在網路上看到一份unicode表,表格放在:
http://www.geocities.co.jp/Bookend-Shikibu/1091/unicode.html
我覺得很有趣的地方是...為何unicode表裡面會存放相同的字但是有不同的編碼。
比如:
"不",同時出現在19981和63847
"茶",同時出現在33590和63998
"在",同時出現在21271和63843
不勝枚舉...
然後才發現unicode編碼裡,從第63744個,也就是第249行開始,一直到第64045個,
全部都是中文,很多重複的字皆出現在這個範圍裡。
請問為何會有這種相同的字但是卻有不同編碼的狀況出現?
再者,為何在建立unicode對應表時,會把中文字的對應拆成兩個部落??
第一個部落是第19731個到第40869個,第二個部落是第63744個到第64045個。
為何會搞這樣呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc)