import sys<br>import chardet<br>f = open(sys.argv[1], 'r')<br>c = f.read()<br>f.close()<br>result = chardet.detect(c)<br>encoding = result['encoding']<br>print 'Detected', encoding, 'confidence:', result['confidence']<br>

c = c.decode(encoding).encode('utf8')<br>f = open(sys.argv[2], 'w')<br>f.write(c);<br>f.close();<br><br>比如这个程序保存为 autoconv.py<br>运行 python autoconv.py 源文件 目标文件<br>就可以将源文件自动转换为 UTF-8 并写入目标文件<br><br>不过刚刚测试了一下,如果字数太少的话,还是有挺大的机会会判断错的吧<br>

<br><br><div class="gmail_quote">2012/5/6 HeChi-Lau <span dir="ltr"><<a href="mailto:jianjia11010@hotmail.com" target="_blank">jianjia11010@hotmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<br>
嘿嘿,python仅限于hello world.<br>
<br>
好像2和3语法很大不同啊.现在我服务器上是2.4.能否写个范例?谢了!<br>
<br>
-------------- 下一部分 --------------<br>
一个HTML附件被移除...<br>
URL: <<a href="https://lists.ubuntu.com/archives/ubuntu-zh/attachments/20120506/e63d2ad5/attachment.html" target="_blank">https://lists.ubuntu.com/archives/ubuntu-zh/attachments/20120506/e63d2ad5/attachment.html</a>><br>


<div class="HOEnZb"><div class="h5">--<br>
ubuntu-zh mailing list<br>
<a href="mailto:ubuntu-zh@lists.ubuntu.com">ubuntu-zh@lists.ubuntu.com</a><br>
<a href="https://lists.ubuntu.com/mailman/listinfo/ubuntu-zh" target="_blank">https://lists.ubuntu.com/mailman/listinfo/ubuntu-zh</a><br>
</div></div></blockquote></div><br>