[Ubuntu-cat] microsoft access

Eduard Selma selma a tinet.cat
dis jul 13 15:05:13 UTC 2019


El 13/7/19 a les 15:36, Joan Inglada Roig ha escrit:
................................................................

> El dubte que tinc és en com es pot fer el bolcat de les DADES des d'un 
> Word, on a més d'identificar cada camp, s'ha de contemplar les 
> propietats dels caràcters, negretes, cursives dels títols bibliogràfics, 
> etc. És possible fer-ho, tenint en compte que els displays de les 
> consultes hauran de respectar aquestes propietats?

- Un camí possible, tot i que tampoc és massa fàcil, fóra "exportar" el 
fitxer de MS-Word a un altre format més senzill i ben documentat, com 
l'antiquíssim WordStar (WordPerfect potser també podria servir). El 
fitxer de sortida està en text pla, amb una capçalera descriptiva de 
formats generals, i cada mot o paràgraf amb un atribut (p. ex. negreta, 
cursiva, subratllat) està envoltat per un caràcter d"escape" (#27, si no 
recordo malament) i una lletra, que indica l'atribut. Amb una 
cerca+substitució es podrien canviar aquests caràcters per "<b>/</b>" o 
el que fos, si es tracta de passar-los a HTML.

No sé quina codificació de caràcters usa/usava el MS-Word, en una època 
era de 16 bit. Tampoc sé com els exportaria ara, ni quina pàgina de 
codis per als caràcters especials, potser a ISO-8859-1; el que em sembla 
segur és que a UTF-8 no. En qualsevol cas, una altra sessió de 
cerca/substitució.

Segurament hi ha altres mètodes més pràctics, però en aquest moment he 
pensat que podria ser una solució.

El "segle passat" com bé dius, vaig fer una aplicació (en MS-DOS, 
programada en Pascal) que permetia també "traduir" camps d'una base de 
dades UNIX a un format estàndard, però els camps crec que tenien una 
longitud màxima de 256 bits, si recordo bé.

Els meus 5 cèntims.


-- 
Eduard Selma i Bargalló.




Més informació sobre la llista de correu Ubuntu-cat