[Ubuntu-cat] microsoft access
Eduard Selma
selma a tinet.cat
dis jul 13 15:05:13 UTC 2019
El 13/7/19 a les 15:36, Joan Inglada Roig ha escrit:
................................................................
> El dubte que tinc és en com es pot fer el bolcat de les DADES des d'un
> Word, on a més d'identificar cada camp, s'ha de contemplar les
> propietats dels caràcters, negretes, cursives dels títols bibliogràfics,
> etc. És possible fer-ho, tenint en compte que els displays de les
> consultes hauran de respectar aquestes propietats?
- Un camí possible, tot i que tampoc és massa fàcil, fóra "exportar" el
fitxer de MS-Word a un altre format més senzill i ben documentat, com
l'antiquíssim WordStar (WordPerfect potser també podria servir). El
fitxer de sortida està en text pla, amb una capçalera descriptiva de
formats generals, i cada mot o paràgraf amb un atribut (p. ex. negreta,
cursiva, subratllat) està envoltat per un caràcter d"escape" (#27, si no
recordo malament) i una lletra, que indica l'atribut. Amb una
cerca+substitució es podrien canviar aquests caràcters per "<b>/</b>" o
el que fos, si es tracta de passar-los a HTML.
No sé quina codificació de caràcters usa/usava el MS-Word, en una època
era de 16 bit. Tampoc sé com els exportaria ara, ni quina pàgina de
codis per als caràcters especials, potser a ISO-8859-1; el que em sembla
segur és que a UTF-8 no. En qualsevol cas, una altra sessió de
cerca/substitució.
Segurament hi ha altres mètodes més pràctics, però en aquest moment he
pensat que podria ser una solució.
El "segle passat" com bé dius, vaig fer una aplicació (en MS-DOS,
programada en Pascal) que permetia també "traduir" camps d'una base de
dades UNIX a un format estàndard, però els camps crec que tenien una
longitud màxima de 256 bits, si recordo bé.
Els meus 5 cèntims.
--
Eduard Selma i Bargalló.
Més informació sobre la llista de correu Ubuntu-cat