[Ubuntu-BR] Baixas artigos de texto de site com o wget

Andre Cavalcante andre.d.cavalcante em gmail.com
Terça Junho 25 19:12:12 UTC 2013


Oi

Em 25 de junho de 2013 08:23, Ricardo Jorge <rjbgbo em gmail.com> escreveu:

> Olá a todos
> Estou precisando baixar por lote os artigos de texto de um site.
>
> Estou usando o comando wget -r
> http://www.endereço_do_site <http://www.xn--endereo_do_site-jmb><
> http://www.xn--endereo_do_site-jmb>- para
> baixar todo o site
>
> Há vários sites tutores para o wget, como o:
> http://www.hardware.com.br/dicas/baixando-sites-wget.html
>
> Mas gostaria de baixar somente as partes dos texto de artigo de um blog.
>
> Existe alguma alternativa de comandos do wget para baixar texto.
>

vê se cola:

$ sudo apt-get install html2text

$ wget -r site | html2text -o site.txt

more options:

$ man html2text

chau!

André Cavalcante
Manaus, AM., Brasil

Ubuntu User number # 24370
Quer saber sobre Open Source Software? http://sobreoss.blogspot.com
Quer saber mais sobre Espiritismo? http://sobreespiritismo.blogspot.com

Atenção: Este e-mail pode conter anexos no formato ODF (Open Document
Format)/ABNT (extensões odt, ods, odp, odb, odg). Antes de pedir os anexos
em outro formato, você pode instalar gratuita e livremente o LibreOffice (
http://pt-br.libreoffice.org/).



More information about the ubuntu-br mailing list