[Ubuntu-BR] Baixas artigos de texto de site com o wget
Andre Cavalcante
andre.d.cavalcante em gmail.com
Terça Junho 25 19:12:12 UTC 2013
Oi
Em 25 de junho de 2013 08:23, Ricardo Jorge <rjbgbo em gmail.com> escreveu:
> Olá a todos
> Estou precisando baixar por lote os artigos de texto de um site.
>
> Estou usando o comando wget -r
> http://www.endereço_do_site <http://www.xn--endereo_do_site-jmb><
> http://www.xn--endereo_do_site-jmb>- para
> baixar todo o site
>
> Há vários sites tutores para o wget, como o:
> http://www.hardware.com.br/dicas/baixando-sites-wget.html
>
> Mas gostaria de baixar somente as partes dos texto de artigo de um blog.
>
> Existe alguma alternativa de comandos do wget para baixar texto.
>
vê se cola:
$ sudo apt-get install html2text
$ wget -r site | html2text -o site.txt
more options:
$ man html2text
chau!
André Cavalcante
Manaus, AM., Brasil
Ubuntu User number # 24370
Quer saber sobre Open Source Software? http://sobreoss.blogspot.com
Quer saber mais sobre Espiritismo? http://sobreespiritismo.blogspot.com
Atenção: Este e-mail pode conter anexos no formato ODF (Open Document
Format)/ABNT (extensões odt, ods, odp, odb, odg). Antes de pedir os anexos
em outro formato, você pode instalar gratuita e livremente o LibreOffice (
http://pt-br.libreoffice.org/).
More information about the ubuntu-br
mailing list