Connaitre l'encodage d'un fichier

Bruno Patri bruno.patri at gmail.com
Dim 11 Nov 16:02:17 UTC 2007


Le 11/11/07, Thomas PARIS<mercen at mercen.org> a écrit :
> Le sam 10 nov à 21:03 (+0100), Michel D'HOOGE a écrit :
> > On Saturday 10 November 2007 14:14:46 Lionel Porcheron wrote:
> > > La commande "file" te permet d'avoir ce genre de renseignements : file
> > > ton_fichier.
> >
> > Surprenant, je n'aurais pas cru ça vraiment possible. Car sinon, on n'aurait
> > pas ce problème de caractères mal gérés...
>
> Ça n'est pas tout à fait possible. Au mieux, on peut essayer de deviner.
>
> En fait, file (et tout autre programme qui essaierait de faire ça) peut
> constater qu'un fichier n'utilise que des séquences d'octets valides
> pour un codage en iso-8859-x et donc en déduire que le fichier est
> *probablement* codé en iso-8859-15 (aussi connu sous les petits noms de
> latin0 et latin9). Mais ça pourrait tout aussi bien être de l'iso-8859-1
> (aka latin1) ou bien un des autres codages 8bits européens (c'est-à-dire
> les autres iso-8859-x).
>
> HTH

Merci pour ces précisions Thomas. Cela me paraissait curieux de
pouvoir connaître à coup sûr l'encodage d'un fichier texte sans qu'il
existe des méta-données qui précisent cela (comme dans un document XML
ou un courrier électronique par exemple).

-- 
Bruno




Plus d'informations sur la liste de diffusion ubuntu-fr