[ubuntu-bo] Quien quiere descargarse todo la oferta de materias de la UAGRM? Python
Cesar Flores
inf.floresg en gmail.com
Dom Ene 23 01:12:16 UTC 2011
[cesarjesus en hades:tmp]$ python scrap.py
--- Ingeniería de Sistemas
Done, see 05_187_4_2-2010_scrap.html
Traceback (most recent call last):
File "scrap.py", line 109, in <module>
Scrap(fac, carr, plan, '2', '2010')
File "scrap.py", line 67, in __init__
nivel = clean_text(row.text).split('-')[1]
File "scrap.py", line 18, in clean_text
return re.sub("\s+" , " ", text).replace(' ', '')
File "/usr/lib/python2.5/re.py", line 150, in sub
return _compile(pattern, 0).sub(repl, string, count)
TypeError: expected string or buffer
[cesarjesus en hades:tmp]$ python --version
Python 2.5.2
[cesarjesus en hades:tmp]$
El 22 de enero de 2011 20:20, Mario César Señoranis Ayala <
mariocesar.c50 en gmail.com> escribió:
> Les comparto un script en python
>
> http://dpaste.com/hold/344282/
>
>
> $ python scrap.py
>
> Y obtendran la oferta de materias de la UAGRM, es la universidad más grande
> de Santa Cruz, pero en 11 años que tiene la web no se dignan en dejar que
> los estudiantes puedan descargar la oferta.
>
> Para configurarlo, cambiar el semestre, carrera, etc. Solo lean el código.
>
> Se explica solo.
>
> Un abrazo!
>
> --
> Mario César Señoranis Ayala
>
>
> --
> Lista de correo Ubuntu-bo Ubuntu-bo en lists.ubuntu.com
> Modifica tu subscripción en:
> https://lists.ubuntu.com/mailman/listinfo/ubuntu-bo
> Sitio Web : http://ubuntu.org.bo
> Foro : http://bolivia.ubuntuforums.org
> Microblogging : http://identi.ca/ubuntubo && http://twitter.com/ubuntubo
> Facebook : http://www.facebook.com/group.php?gid=7292335819
> Canal IRC : #ubuntu-bo @ irc.freenode.net
>
>
--
Cesar Flores
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://lists.ubuntu.com/archives/ubuntu-bo/attachments/20110122/f12d1393/attachment.html>
Más información sobre la lista de distribución Ubuntu-bo