[爆卦]unicode表中文是什麼?優點缺點精華區懶人包

為什麼這篇unicode表中文鄉民發文收入到精華區:因為在unicode表中文這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者yi7310 (忘記過去吧! 請給我自由)看板C_and_CPP標題[問題] 問unicode編...


不知道在這裡問unicode對不對? 不過我想很多前輩在處理unicode編碼時,
應該碰過不少問題。

遇到的問題: (題意請描述清楚)

在網路上看到一份unicode表,表格放在:
http://www.geocities.co.jp/Bookend-Shikibu/1091/unicode.html

我覺得很有趣的地方是...為何unicode表裡面會存放相同的字但是有不同的編碼。
比如:
"不",同時出現在19981和63847
"茶",同時出現在33590和63998
"在",同時出現在21271和63843
不勝枚舉...

然後才發現unicode編碼裡,從第63744個,也就是第249行開始,一直到第64045個,
全部都是中文,很多重複的字皆出現在這個範圍裡。

請問為何會有這種相同的字但是卻有不同編碼的狀況出現?
再者,為何在建立unicode對應表時,會把中文字的對應拆成兩個部落??
第一個部落是第19731個到第40869個,第二個部落是第63744個到第64045個。
為何會搞這樣呢?

--
※ 發信站: 批踢踢實業坊(ptt.cc)
james732:那段應該是中日韓啥的 所以會不會是同形但不同國家的字 06/21 09:52
james732:(譬如一個是中文的"不" 一個是日本漢字的"不") 06/21 09:52
yi7310:有沒有可能一個是簡體中文另一個是繁體中文??? 06/21 10:34
VictorTom:http://0rz.tw/FzuZN (wiki) http://0rz.tw/tEs63 (pdf) 06/21 11:15
james732:樓上專業 XD 06/21 11:18
VictorTom:其實用j大您的關鍵字就可以在wiki上找到這些info了喔XD 06/21 11:19
LPH66:原PO說的那段 (U+F900~U+FAFF) 是韓文編碼裡的重覆字 06/21 13:30
LPH66:在四樓的 pdf 裡的第 20 頁開始有說明 06/21 13:30
yi7310:謝謝說明~ XD 06/21 14:50
※ 編輯: yi7310 來自: 74.115.0.2 (09/29 11:24)

你可能也想看看

搜尋相關網站