解決了前述有關《有涯小札》的轉碼問題,《眾妙之門》的這一部份算是完全轉成了 UTF-8。下一步是其它網頁的轉碼問題。
事緣《眾妙之門》形成於 blog 還未流行的年代。當時我沒有用 WYSIWYG 的網頁編輯器,寫網頁是在文字編輯器中逐字逐字輸入的。現在《眾妙之門》中還保留著一些以 Big5 編碼的中文 HTML 文件(例如荒廢多時的 hohoSearch)。這些文件有待逐一以 iconv 程式轉碼。用 shell script 寫個 loop 來做,應該很容易完成。
問題是以後再要輸入中文 HTML 檔時怎麼辦。我的 Linux 以 Big5 編碼,而在 vim/gvim 輸入中文時,寫出來的也是 Big5 編碼的文件。總不能每次輸入完成之後,用 iconv 逐一轉換吧!幸好,偉大的 Google 很快給我答案。原來 vim/gvim 對 UTF-8 支援得很好,只是我這個井底之蛙沒有好好利用而已。以下的網頁提供了重要的啟示:
- vim 與 UTF-8 – 怕失憶筆記
- 讓 Vim 可以自己使用 UTF-8 & BIG5 – 小明網誌
- Vim 檔案編碼及格式 – wiki.gentoo.org.tw
- Vim documentation: mbyte
經理解消化之後,在自己的 .vimrc 加入了以下的設定,令 vim/gvim 遇到中文檔時,懂得選擇正確的編碼。而在建立新檔時,也自動以 utf-8 編碼:
“Default encoding
set fileencodings=utf-8,big5,gbk,latin1
set fileencoding=utf-8
實驗証明,這已能滿足大部份所需,讀寫都不成問題。最後,有時要強迫改變檔案的編碼,所以再加入以下設定:
“Hot key to switch between Big5 and UTF-8
set =^U
set =^B
map :set fileencoding=utf-8
map :set fileencoding=big5
以後便可以在 vim/gvim 裡按 ctrl-u 及 ctrl-b 來轉換編碼。
按:其實 gedit 也能自動選擇正確的編碼,不過在整體功能上,gedit 遠不及 vim/gvim(除了emacs 之外,又有哪個編輯器能及得上 vim/gvim?),所以不得不在 vim/gvim 上尋求解決之法。
----------------------------------------------------------
----------------------------------------------------------
“Default encoding
set fileencodings=utf-8,big5,gbk,latin1
set fileencoding=utf-8
set fileencodings=utf-8,big5,gbk,latin1
set fileencoding=utf-8
“Hot key to switch between Big5 and UTF-8
set=^U
set=^B
map :set fileencoding=utf-8
map :set fileencoding=big5
set
set
map
map
Putty 中文會有亂碼Putty 中文會有亂碼
Putty 中文會有亂碼
Putty 進Fedora 中文會有亂碼??
Fedora 預設使用 UTF-8 編碼, 您用 putty 連入
可能會看到亂碼, 若改成 big5 編碼, 應該可以看到.
修改vim /etc/sysconfig/i18n 前二項設定如下:
vim /etc/sysconfig/i18n
LANG="zh_TW.Big5"
SUPPORTED="zh_TW.Big5:zh_TW:zh"
SYSFONT="latarcyrheb-sun16"
/etc/rc.dinit.d/i18n restart
Reference: Fedora 預設使用 UTF-8 編碼, 您用 putty 連入
可能會看到亂碼, 若改成 big5 編碼, 應該可以看到.
修改vim /etc/sysconfig/i18n 前二項設定如下:
vim /etc/sysconfig/i18n
LANG="zh_TW.Big5"
SUPPORTED="zh_TW.Big5:zh_TW:zh"
SYSFONT="latarcyrheb-sun16"
/etc/rc.dinit.d/i18n restart
沒有留言:
張貼留言