[Ubuntu-BR] [OT] - Conversão de arquivos HTML para TXT

Marcos Alano marcoshalano em gmail.com
Sexta Setembro 15 14:47:34 UTC 2017


Um exemplo:

for arquivo in `ls raceday em dia*`; do
lynx -dump $arquivo > `basename $arquivo .html`.txt
done

É algo por aí.


2017-09-15 6:46 GMT-03:00 Marcos Alano <marcoshalano em gmail.com>:
> O comando "for" é um comando embutido no shell e não um comando externo. Dá
> uma olhada em páginas da Internet. Lá tem bastante documentação.
>
> Marcos H. Alano
> Linux System Administrator
> marcoshalano em gmail.com
>
> On Sep 14, 2017 23:31, "Paulo Fernandes" <pferna53 em gmail.com> wrote:
>>
>> Prezados,
>>
>> descobri que existe o utilitário *lynx* para fazer a conversão de arquivos
>> HTML para TXT. Maravilha! Tenho, porém, vários arquivos assim (conseguidos
>> pelo uso do *WGet*):
>>
>> /home/paulof/Documentos/raceday em dia=2017-01-01.html
>> /home/paulof/Documentos/raceday em dia=2017-01-02.html
>> /home/paulof/Documentos/raceday em dia=2017-01-03.html
>> /home/paulof/Documentos/raceday em dia=2017-01-04.html
>> /home/paulof/Documentos/raceday em dia=2017-01-05.html
>> /home/paulof/Documentos/raceday em dia=2017-01-06.html
>> /home/paulof/Documentos/raceday em dia=2017-01-07.html
>> /home/paulof/Documentos/raceday em dia=2017-01-08.html
>> /home/paulof/Documentos/raceday em dia=2017-01-09.html
>> /home/paulof/Documentos/raceday em dia=2017-01-10.html
>> /home/paulof/Documentos/raceday em dia=2017-01-11.html
>> /home/paulof/Documentos/raceday em dia=2017-01-12.html
>> /home/paulof/Documentos/raceday em dia=2017-01-13.html
>> /home/paulof/Documentos/raceday em dia=2017-01-14.html
>>
>> Esses aí são apenas alguns; mas o total é grande. Então, um arquivo em
>> lote
>> ou outro recurso pra fazer a conversão de TODOS ao mesmo tempo, a exemplo
>> do comando *FOR* do Windows, seria o ideal.
>>
>> Fiz uma pesquisa e descobri que há um FOR para o Linux, mas o comando *man
>> for* me diz que a página do manual não existe. Alguém postou o *ls* com
>> *grep* pra montar o arquivo de lote, mas não consegui fazer o meu aqui.
>>
>> Os universitários de plantão poderiam dar uma luz sobre o caso?
>>
>> Grato desde já!
>>
>> Paulo Fernandes
>> --
>> Mais sobre o Ubuntu em português: http://www.ubuntu-br.org/comece
>>
>> Lista de discussão Ubuntu Brasil
>> Histórico, descadastramento e outras opções:
>> https://lists.ubuntu.com/mailman/listinfo/ubuntu-br



-- 
Marcos Alano
----------------------------------------------
P: Por que este email é tão curto?
R: http://five.sentenc.es
----------------------------------------------



Mais detalhes sobre a lista de discussão ubuntu-br