Connaitre l'encodage d'un fichier

Thomas PARIS mercen at mercen.org
Dim 11 Nov 11:01:52 UTC 2007


Le sam 10 nov à 21:03 (+0100), Michel D'HOOGE a écrit :
> On Saturday 10 November 2007 14:14:46 Lionel Porcheron wrote:
> > La commande "file" te permet d'avoir ce genre de renseignements : file
> > ton_fichier.
> 
> Surprenant, je n'aurais pas cru ça vraiment possible. Car sinon, on n'aurait 
> pas ce problème de caractères mal gérés...

Ça n'est pas tout à fait possible. Au mieux, on peut essayer de deviner.

En fait, file (et tout autre programme qui essaierait de faire ça) peut
constater qu'un fichier n'utilise que des séquences d'octets valides
pour un codage en iso-8859-x et donc en déduire que le fichier est
*probablement* codé en iso-8859-15 (aussi connu sous les petits noms de
latin0 et latin9). Mais ça pourrait tout aussi bien être de l'iso-8859-1
(aka latin1) ou bien un des autres codages 8bits européens (c'est-à-dire
les autres iso-8859-x).

HTH
Thomas "mercen" PARIS
-- 
Google Talk / Jabber: mercen at jabber.typhon.net
http://mercen.org         <- news
http://mercen.org/gallery <- photos




Plus d'informations sur la liste de diffusion ubuntu-fr