為什麼這篇簡體轉繁體程式鄉民發文收入到精華區:因為在簡體轉繁體程式這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者danny0838 (道可道非常道)看板EZsoft標題[情報] 簡繁秘書-簡繁轉換暨校對程式時...
簡體轉繁體程式 在 前方有㜙? Instagram 的最讚貼文
2021-09-24 16:30:56
#20210919 #一㜙長談 #15 過了好久終於有時間發文,這是來講講我這陣子嘗試的習慣挑戰。 #daily_習慣養成21天 - 這次我設定的是「生活習慣」,我希望我能早睡早起、多喝水、讀點書、好好攝取蔬果,以確保我在疫情遠距的期間也能有好的生活習慣和健康的身體。 - 過完21天之後,我想說一...
軟體名稱:
簡繁秘書
軟體特色:
*簡化字與繁體字互轉,並能逐一校對或取代所有轉換後可能出錯的字。
*為網頁程式,超短小超綠色。免安裝、可在網路或本機上使用。
*可自行建立字庫、詞庫
詳細介紹:
隨著技術的進步,簡繁轉換軟體多如繁星,似乎毋庸介紹亦無須研發。然而簡
繁轉換正確率之瓶頸一直無法突破,簡體轉繁體尤為明顯,從「字」的層次上說,
「幹」擾、頭「發」、乙「醜」等怪詞層出不窮;從「詞」的層次上說,「小明帶
了一台計算機去考試」,天曉得他實際上帶的是「电脑」還是「计算机」?更有不
可能判斷的句子如對照表「簡繁轉換常見錯字:干[干幹乾榦]、叶[葉叶]」…
…繁轉簡的問題少得多,但偶爾還是會發生,比如「乾隆」不是「干隆」,「原著
」不是「原着」,「癥結」也不是「症结」。
顯然,在真正的人工智慧出來以前,簡繁轉換永遠不完美,只要對「正確」有
所要求,事後人工校對絕對不可避免。因此,本程式的想法也很簡單──用機器輔
助人工校對。亦即先用程式轉換,但把「所有轉換過」或「所有轉換過可能出錯(
一對多)」的地方上色,並允許使用者逐一校對、選字,如此可省下很多校對時間
,至少可以保證在run過一遍後,不再有任何簡繁轉換上的錯誤。
由於「人工校對」之需求,加上javascript有一定的限制(無法存取本機資源
),本程式目前只實作了轉換純文字內容的功能──而且本文也不能太大,否則雖
然可以轉,但瀏覽器會頓到讓你忍無可忍。
轉換技術上,本程式提供了最起碼、最常見的字庫、詞庫對照表,完全開放,
也允許使用者自行修改(本機使用的話),期待藉此拋磚引玉,有更多高手能夠在
此基礎上開發更好用的轉換工具。
在開發此程式前,作者亦整理了數個常見的簡繁對照表,及相關參考資料,可
在這裡找到:https://danny0838.bitbucket.io/tools/sts-ref/table.html
下載連結:
https://danny0838.bitbucket.io/tools/sts
(可直接在瀏覽器上操作,或另存原始碼到本機)
誰適合用:
1、對文章之簡繁轉換有正確之需求者。
2、有意開發、改進簡繁對照之字庫、詞庫者。
誰不適合用:
1、只想快速把簡化字變正體字,不管錯得多離譜者。
2、有處理非純文字檔案之需求者。
3、想批次轉換大量檔案或檔名者。
其他:
初步構想來自 #19TDNGN8 (Chinese),並參考網友「有女同車」之程式實作
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.160.49.204
原網址失效,已修正為搬家後的網址
※ 編輯: danny0838 (36.225.77.116), 12/01/2017 17:04:32
※ 編輯: danny0838 (59.115.48.101 臺灣), 04/21/2024 21:09:13