Onderwerp : UTF-8 probleem

Auteur : coos de jong
E-mail : jadejong op xs4all.nl
Datum : Wo Aug 22 19:02:47 BST 2007


Martijn, Dank voor de hinten. Het heeft me even werk gekost, maar het
probleem lijkt opgelost.

Ik heb tav de tekenset=charset van alles veranderd en uitgeprobeerd.
Uiteindelijk
werkt het goed in ubuntu+amarok wanneer de volgende wijzigen worden
toegepast: In
het head van het html-bestand met de links naar de .wav-bestanden stond
ISO 8859-1,
en staat nu de utf-8 charset: <meta http-equiv="content-type"
content="text/html;
charset=utf-8">

Maar dat was niet voldoende, in de tekst-editor gedit bleek (nooit
geweten) dat het
html-bestand was opgeslagen in ISO 8859-15; opslaan in tekencodering utf-8
blijkt
noodzakelijk.

Voor de zekerheid heb ik ook firefox ingesteld op utf-8 maar ik geloof
niet dat dat
nog noodzakelijk was.

Inmiddels een en ander ook in Windows gecontroleerd, en alles werkt nu
prima. Geweldig

Toch, voor de ontwikkelaars onder de lezers, heb ik een opmerking. In XP
zijn er zelden of nooit problemen met de tekenset. Vandaar dat niemand
zich hierin hoeft te verdiepen. Helaas onder Ubuntu moet je er wel in
verdiepen. Bijvoorbeeld een dvd schijf gebrandt op een apple in de duitse
taal, afgespeeld in Ubuntu geeft veel vraagtekentjes op de umlautplekken.
Deze files kunnen dus niet gelezen worden. Zeker, ook hier zal de oorzaak
liggen in de verkeerde tekenset. Maar het is niet aangenaam in
ieder(beetje overdreven) apart programma de tekenset te moeten aanpassen.

Bedenk dat ik een beginneling ben op Linuxgebied. Heb ooit eens suse
aangeschaft, maar vrij gauw weer opgegeven. Heb een half jaartje terug van
een kennis gehoord dat Ubuntu publieksvriendelijk is. En inderdaad, het
programma is echt publieksvriendelijk. Toch zijn er dit soort kleine
steekjes die het gebruik door de volkomen leek moeilijk maken. Degene die
doorzet wordt veel wijzer op computergebied. Mede door dit forum!

Zelf heb ik onlangs twee nieuwe dingen gedaan. Vorige week voor het eerst
via een terminal een opdracht uitgevoerd. Lukte! Deze week, mijns inziens,
diep in de betreffende programms gedoken om dit utf probleem op te lossen.
Pluim, niet alleen voor mezelf, maar ook voor dit forum en het hele Ububtu
gebeuren!
Maakte je een klein foutje bij suse gaf dat soms een groot probleem. Bij
ubuntu zit altijd wel ergens een oplossing als er een probleem is!

Martijn, nogmaals dank voor de hints,

Groeten,

Coos

> On Mon, 20 Aug 2007, coos de jong wrote:
>
>> > Hoe kom je aan die files? Vreemd partitie-type? Hoe heb je die
>> gemount?
>>
>> Die files staat op een externe schijf, geformatteerd in ntfs. Ze zijn er
>> op gezet met nero. Met Feisty kan er goed mee gewerkt worden.
>
> Hoe heb je die schijf gemount? Via een tool? Ging het vanzelf?
> Zien de bestandsnamen er in Nautilus goed uit?
>
>> Trouwens, de herkomst van de onleesbare tekens is niet belangrijk. In de
>> help van audacity, over audacity staat coordinatie (met officieel de
>> twee
>> puntjes) als cAQrdinatie.
>
> Dat betekent dus dat de encoding van de vertaling van Audacity niet goed
> is. Of dat audacity niet goed met de encoding omgaat.
>
> Grote kans dat het aan audacity ligt dus, ipv aan "de rest" van het
> systeem.
>
>> (Met de Q bedoel ik een ander teken die niet zo
>> gauw op mijn toetsenbord staat.)Neem toch aan dat de vertaler weet wat
>> hij
>> deed. Ook andere bestanden met de accenten zijn niet te openen.
>
>
>
>> > Voor zover ik weer hebben ze er geen last van. Veel
>> Ubuntu-ontwikkelaars
>> > zijn Duitsers..
>>
>> Inderdaad! Vreemd, toch? Gebruiken zij utf-8?
>
> Ja, alle Ubuntu-installaties (sinds 5.10 volgens mij) gebruiken overal
> standaard UTF-8, onder anderen omdat je daar alle karakters van alle
> schriften mee kunt weergeven, en je dus nooit encoding-problemen zou
> moeten hebben als je bestanden uitwisselt met anderen.
>
> NTFS-schijven kunnen echter andere encodings gebruiken, en je zult de
> gebruikte encoding (ongetwijfeld iets als "windows-1252", of "cp850", of
> "utf-16" of iets wat daar op lijkt) moeten meegeven bij het mounten,
> zodat de rest van het systeem (dat UTF-8 verwacht) weet hoe de
> bestandsnamen naar de juiste codering omgezet moeten worden.
>
> Je zou het volgende kunnen proberen om dit te testen:
> Als je vanuit Windows zo'n bestand met een "rare" filename naar jezelf
> emailt, en die email in Linux ophaalt, en dan de file opslaat, zou de
> naam er "goed" uit moeten zien, en zou je de file gewoon met alles
> moeten kunnen openen.
>
> Je kunt ook eens een office-document proberen te openen, om te testen of
> het probleem niet bij audacity ligt.
>
> Martijn
> --
> Sorry isn't an excuse when you do something stupid on purpose.
> --
> Ubuntu-NL mailing list
> Ubuntu-NL op lists.ubuntu.com
> Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
>