作者alphard (阿阿)
看板EZsoft
標題[請問] 如何分辦文字檔哪些是ansi碼哪些是utf8碼
時間Mon Jun 22 22:47:15 2015
目前需將某資料夾的所有文字檔約4百多個合併成一個文字檔
所以在cmd下指令type *.txt >> test
結果發現產生的檔案會有部份亂碼,
原因是資料夾裡某些txt檔是用ansi編碼,而非UTF-8編碼
由於在資料夾裡都只顯示txt,不知道哪個是ansi編碼,哪個是UTF-8編碼。
若用手動一一打開檔案,再把ansi編碼的檔案改存UTF-8,實在太費工了。
另外有試著用ConvertZ批次轉檔,惟ConvertZ只接受全部為ansi檔才可批次轉。
所以有何方法或工具可辦別資料夾裡的txt檔,哪些ansi編碼,哪些為UTF-8編碼?
使我能把這些ansi編碼的文件挑出來,再餵給ConvertZ批次轉檔。
嘗試了一個晚上+Googl爬文無解,只好問板上的強者了,
感謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.251.148.216
※ 文章網址: https://www.ptt.cc/bbs/EZsoft/M.1434984440.A.A54.html
→ dearlove: 您對utf-8的似乎有誤解 而且cmd本來就不是utf-8編碼 06/22 22:52
→ dearlove: 所以顯示不出來很正常... 06/22 22:52
→ alphard: 不會耶。在cmd底下打type *.txt >> test 06/22 23:11
→ alphard: 原先是UTF-8編碼的檔案不會有問題,而是原先ansi編碼的檔 06/22 23:12
→ alphard: 案,在匯入test檔中,都變成亂碼了@@ 06/22 23:13
→ kyrc: 最後先備分再試,注意事項有特別列出來無法恢復 06/23 00:12
推 mybaby520: 搜尋txt列出全部文字檔 拖曳到14.6版以上的Emeditor中 06/23 12:01
→ mybaby520: Ctrl+F搜尋 規則運算式打勾 搜尋群組中所有文檔打勾 06/23 12:03
→ mybaby520: 搜尋\w 按全部抽出 會把非空行的內容全部整併到新文件 06/23 12:04
→ alphard: 樓上大大的方法是可行的,但缺點是有文字檔裡有些留白的 06/23 20:28
→ alphard: 空行都不見了,可否有保留它們的方法。 06/23 20:28
推 mybaby520: 改搜尋\r 06/24 09:42
→ alphard: 再次感謝樓上。 06/24 22:18
→ alphard: 另外我發現EmEditor有個功能,把所有目前開啟的檔案, 06/24 22:21
→ alphard: "用指定編碼全部儲存",這樣便可把所有檔案改成UTF-8了。 06/24 22:23
→ alphard: 非常方便。 06/24 22:24
→ mybaby520: 咦原來有這功能阿XD 也感謝原PO 06/25 09:31
→ oversky0: totalcmd 加這 plug-in 就可以了。 06/27 13:34