[Ubuntu-zh] 怎样判断文本文件的编码?
synzz
omicroon在gmail.com
星期五 七月 16 15:04:35 BST 2010
大家好
我经常会下载一些包含中文或日文字符的文本文件,如ass、cue等。在mplayer等
程序在读取这些文件时,通常需要在配置文件或参数中显式地说明它们的编码。例
如用gedit直接打开一些字幕文件时会出现乱码,这时就需要加
上"--encoding=xxx"形式的参数。可是修改参数或配置文件比较麻烦,所以我通常
会用iconv将文件转换成utf8编码。
我的问题是,怎样确定iconv的第一个参数,即怎样确定转换编码之前文件的编
码。我现在的做法是用gedit尝试各种编码打开文件,人工判断。我觉得这样很
傻,并且相信会有更好的方法。
P.S. 我在vimrc中设置了
"set fencs=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936"之后就没有遇到过乱码
了,即使gedit打开是乱码,vim中也是正常的。据说文件的编码信心是保存在
inode里的,是不是从网上下载的文件没有这些信息?那么vim为什么能够直接判断
正确的编码呢?
--
To iterate is human, to recurse, divine.
关于邮件列表 ubuntu-zh 的更多信息