[l-ubuntu-cu] script para listar documentos

Rodolfo Rodolfo
Lun Oct 22 16:24:03 BST 2007


Hola amigos:

Estoy tratando de hacer un script para obtener las primeras líneas de
todos los documentos de word que hay en una carpeta, funciona bien con
nombres de ficheros que no tienen espacios, sin embargo cuando hay
espacios en el nombre del fichero en $i lo que se obtienen son las
palabras que componen el fichero una por una, no he logrado obtener el
nombre completo, con sed pude poner un \ antes del primer espacio, no
logré hacerlo para los restantes, pero de todas formas $i toma las
palabras de una en una, por lo que antiword recibe cada palabra como si
fuera el nombre de un fichero.
El script es el siguiente:

ls -R -1 *.doc > list
for i in `cat list`;do echo $i; antiword -t $i |head -n 15; done

antiword es una utilidad que convierte ficheros de MS Word en texto.

Alguna sugerencia? mejor aún si saben de  una utilidad que haga esto
(también me hace falta para pdf's).

Gracias 

Rodolfo




Más información sobre la lista de distribución Ubuntu-cu