[ubuntu-it] Macro da file di testo

lucio pineda lucio.pineda a gmail.com
Dom 26 Ago 2012 13:07:07 UTC


Il 26/08/2012 12:01, Mattia Rizzolo ha scritto:
>
>> Invio ciò che copio, cioè le prime due ragioni sociali incollate su gedit
>> 1.
>> furbatto immobili dal 1929
>> 4, v. Guarini ((ang. p. Lagrange)) - 10123 Torino (TO) | mappa
>> tel: 011 544566 fax: 011 5176766
>>
>> Lo Studio Furbatto nasce nel 1929 ed oggi rappresenta il più antico
>> studio immobiliare torinese.
>>
>> Categoria: Amministrazioni immobiliari
>> sito web | altri link
>> aggiungi ai preferiticondividi su facebookcondividi su twittercondividi
>> via mail
>> 1 2 3 4 5
>> 0
>> Scheda Azienda FURBATTO IMMOBILI DAL 1929
>> 2.
>> oberto srl
>> 35, v. S. Secondo - 10128 Torino (TO) | mappa
>> tel: 011 5622055 fax: 011 5622848
>>
>> La Oberto viene costituita nel 2008 dal geom. Oberto Pietro e dai suoi
>> figli, Massimiliano e Simone, al fine di sviluppare e potenziare la
>> pluridecennale attività svolta dallo studio tecnico.
>>
>> Categoria: Amministrazioni immobiliari
>> sito web
>> aggiungi ai preferiticondividi su facebookcondividi su twittercondividi
>> via mail
>> 1 2 3 4 5
>> 0
>> Scheda Azienda OBERTO srl
>>
>> Cosa vuol dire costante, non lo so.
>>
>> Grazie
>>
> umh.. vedo la logica, ma io non sono in grado di estrarre dati
> automaticamente da una lista di quel tipo... :(
>
> btw c'è qualcuno in grado di farlo, basta trovarlo...
Sono rassegnato a procedere nell'unico modo che riesco, anche se poco 
efficiente
dalla mailing list di Ooo mi hanno risposto quanto segue
OpenOffice puo' collegarsi direttamente a una sorgente dati esterna 
purche' i dati siano organizzati come tabella (purtroppo non e' il tuo 
caso, ma magari riesci a farli mostrare in qualche altro formato e 
risolvi). Ad esempio, da Calc Inserisci - Collegamento a dati esterni, 
inserisci come URL: http://www.w3schools.com/html/html_tables.asp , 
aspetti un attimo per la lettura del file, poi scegli (sotto) la tabella 
HTML_1 e ti trovi i dati importati in Calc.

Vedendo la struttura del sito delle Pagine Gialle, che e' tipo
http://www.paginegialle.it/pgol/4-pizzerie/3-Milano%20%28MI%29
non penso che questo ti funzioni subito. Ma dato che e' tutto annotato 
bene in CSS, puoi farlo con JavaScript.

Non c'entra nulla con OpenOffice, quindi ti dico solo come cominciare e 
poi devi cavartela da solo o chiedere in un forum di JavaScript. In 
Firefox crei un nuovo segnalibro nella barra dei segnalibri con titolo 
"Estrai" e nell'indirizzo copi e incolli quanto segue:

javascript:%20alert('Inizio%20Analisi');%20var%20found=new%20Array();%20for(var%20i=0;i%20<%20window.document.getElementsByTagName("h2").length;i++)%20{if(document.getElementsByTagName("h2")[i].className=="rgs"){found.push(document.getElementsByTagName("h2")[i].childNodes[1].childNodes[0].wholeText);}%20}%20alert('Trovati:'%20+%20found); 


Poi apri la pagina indicata sopra, fai clic su "Estrai" e ti elenca le 
ragioni sociali, con varie limitazioni; aggiustarlo in modo che funzioni 
bene e' un lavoro complesso e off-topic per questa lista; indirizzo e 
CAP invece dovrebbero essere un po' piu' semplici perche' sono meglio 
identificabili. Se fai bene l'estrazione l'importazione in OpenOffice 
poi e' indolore.

Cosa per me pressoché impossibile in tempi ragionevoli cioè senza 
passare giornate intere al pc accompagnato da ansia e frustrazione a non 
riuscirci.
Copiando e incollando in un paio d'ore ho un po d' imprese da contattare 
c'è l' ho con il metodo migliore non credo di contattare nessuno per 
almeno 2 ????????
E così anche io lol :)  o meglio :-
Grazie




Maggiori informazioni sulla lista ubuntu-it