為什麼這篇韓文打字對照表鄉民發文收入到精華區:因為在韓文打字對照表這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者rickhsu (TINNMINN/RBSAUD)看板PCman標題[轉錄]有關 PTT 是否能...
※ [本文轉錄自 HANGUKMAL 看板]
作者: albyu () 看板: HANGUKMAL
標題: 有關 PTT 是否能輸入韓文的問題
時間: Tue Feb 26 23:44:52 2008
既然特別被板主點名,看來我應該要出個聲來回應一下這個問題
這個問題並不光是 PTT 本身的問題,因此也不可能僅靠 PTT 站方就能解決
最大的問題點在於我們正體中文所使用的編碼:BIG-5 大五碼
大家都知道,電腦只看得懂 0 和 1,它是看不懂漢字的
因此,要讓電腦能夠處理漢字
我們必須要把每個漢字對應到一串獨一無二的 0 和 1 所組成的二進位數字
例如「瓩」這個字在 BIG-5 裡面就對應到 1100 0010 0110 0000
這樣,當電腦讀到 1100 0010 0110 0000 的時候,它才知道要顯示「瓩」字
而這個漢字和二進位數字的對應,就是編碼,我們的 BIG-5 就是一種漢字編碼
BIG-5 的年紀大概和這個板的板友們差不多大了,1980 年代的產物
當年台灣的中文編碼因為政府連續的錯誤政策
使得優秀的 CCCII 和浪費公帑搞出 CNS 11643 二種編碼互鬥,結果兩敗俱傷
台灣民間在無所適從的情況下,資策會和五個套裝軟體廠商共同制訂了一套編碼
因為是和五大套裝軟體一起推出的,所以因此取了一個很俗的名字:BIG-5
不過,BIG-5 的推出相當倉促,很多重要的問題完全沒有考量到
例如:沒有包含日文假名、沒有包含簡體字、沒有包含許多人名用字等等
雖然 BIG-5 有很多缺點,但是隨著當年的倚天中文系統的普及
已經廣泛成為台灣民間正體中文編碼的標準 (台灣政府的標準仍然是 CNS 11643)
倚天中文系統也嘗試解決 BIG-5 的一些問題,最重要的地方是它加入了日文假名
等到微軟開始開發中文 Windows 3.0,一樣沿用 BIG-5 編碼
不過,萬惡的微軟並沒有把倚天中文所補充的那些日文假名等的部分加進來
造成 Windows 系統上的 BIG-5 是無法處理日文、俄文等等文字碼
這個問題,到了 Windows XP 甚至是 Vista 也仍然沒有解決
從 Windows NT、Windows 2000 到 Windows XP、Windows 2003 還有 Vista
系統內部所處理的編碼已經全部改為 Unicode
Unicode 是一種超大字集的編碼,幾乎已經編入人類所有主要的文字
中日韓漢字、假名、韓文、藏文、老蒙文、阿拉伯文、梵文、希伯來文、坦米爾文…
你看得到的文字大都已經在 Unicode 裡面有一個碼了
但是,各個國家仍然慣用它們自己的編碼,像是台灣和香港仍慣用 BIG-5
於是系統在處理的時候,就需要先做一次 BIG-5 → Unicode 的轉換
這個轉換是用一個對照表,利用查表的方式去做的
因此,有人從這個對照表,想出了一個撇步,讓 BIG-5 能夠多塞進日文假名
這個東西就是 Unicode 補完計畫,它的原理很簡單,就是去修改對照表
把原本微軟沒有放進去的日文假名的轉換部分把它加上,這樣 BIG-5 就多了日文了
而後,這些搞 Unicode 補完計畫的人食髓知味,把腦筋又動到了簡體字頭上
BIG-5 裡面有留一些區域,稱為「使用者造字區」,可以讓人自行造字來用
而 Unicode 補完計畫就利用這些閒置的區域
把那個對照表又擅自加上了簡體字 → Unicode 的對應
這樣,BIG-5 貌似也可以支援簡體字了
為何是貌似呢?因為沒裝 Unicode 補完計畫的人是看不到的
原因就是因為沒裝的人的對照表沒修改過,系統是看不到額外簡體字對應的部分的
好了,扯了那麼多,到底和韓文有什麼關係?
你現在應該可以想到,PTT 使用的是 BIG-5 編碼,為何你可以看到假名和簡體字?
沒錯,就是 Unicode 補完計畫作祟!什麼?你說沒裝過 Unicode 補完計畫?
事實上,許多 BBS 連線軟體,例如 Open PCMan、PieTTY 等,直接內建了補完計畫
那韓文呢?很抱歉,Unicode 補完計畫並沒有做韓文的對應
所以當然是不能顯示韓文、不能輸入韓文了
所以,總而言之,這並不是 PTT 的問題
那到底有沒有解決的方法呢?
嗯,有是有,不過看起來並不是很可行
方案一:要求 Unicode 補完計畫加入韓文的對應
韓文很科學,只有 24 個字母,可惜它的編碼一點也不科學
每一個韓文方塊字都要有一個碼,ka 一個碼、kat 另一個碼、kas 又一個碼
簡單的排列組合可以算算,韓文需要的碼很是驚人
少說五六千個碼位是跑不掉的
但是呢,BIG-5 使用者造字區的位置有限
加上一堆簡體字和日本國字已經佔掉很多的位置了
目前看來,剩下的碼位要能容納可能使用到的韓文字是不大可能了
而且,要進行韓文對應的工作,可能也要許多熟悉韓文的人來參與
再者,改完編碼之後,還得要更新 PCMan 等程式的內建對照表
這,不能不說是一個大工程
方案二:放棄 BIG-5,全面改用 UTF-8 (Unicode 衍生出的一種編碼)
這是一勞永逸的方法,Unicode 本來就有包括中日韓文
不過,需要做二件事情才能辦到
第一、PTT 要修改程式,全面改用 UTF-8 進行儲存和傳輸
第二、所有的 PTT 使用者要改用全新的能夠支援 UTF-8 的連線程式
第一點可能 PTT 有能力辦到,第二點看起來是個不可能的任務
所以,要讓 PTT 能夠輸入並顯示韓文,看來是非常漫長的艱難旅程啊
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.138.150.43
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.105.201.25