<br><br><div class="gmail_quote">El 19 de junio de 2010 09:39, Juan Pablo <span dir="ltr">&lt;<a href="mailto:pablosarubbi@gmail.com">pablosarubbi@gmail.com</a>&gt;</span> escribió:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<br><br><div class="gmail_quote">El 17 de junio de 2010 09:59, Fernando Vicio <span dir="ltr">&lt;<a href="mailto:fernando_018@hotmail.com" target="_blank">fernando_018@hotmail.com</a>&gt;</span> escribió:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><div></div><div class="h5">




<div>
Date: Wed, 16 Jun 2010 15:20:40 -0700<br>From: <a href="mailto:danielhmaidana@yahoo.com" target="_blank">danielhmaidana@yahoo.com</a><br>To: <a href="mailto:ubuntu-ar@lists.ubuntu.com" target="_blank">ubuntu-ar@lists.ubuntu.com</a><br>

Subject: [ubuntu-ar] CONTAR PALABRAS REPETIDAS<div><br><br><table border="0" cellpadding="0" cellspacing="0"><tbody><tr><td style="font:inherit" valign="top"><blockquote style="margin-left:5px;padding-left:5px">
<div>POR FAVOR, NECESITO UN PROGRAMA QUE CUENTE LAS REPETICIONES DE CADA PALABRA EN UN TEXTO.<br></div></blockquote></td></tr></tbody></table><br><br></div>Buen día Daniel<br><br>Tal vez esto te ayude a resolverlo: <a href="http://rainbow.arch.scriptmania.com/tools/word_counter.html" target="_blank">http://rainbow.arch.scriptmania.com/tools/word_counter.html</a><br>

Sería mucho más fácil si es una palabra por línea (sort MiArchivo.txt | uniq -c).<br><br>Saludos cordiales,<br><font color="#888888">Fernando.-<br>                                               </font><div><br><hr>No importa si es pesado o liviano. Con Hotmail Skydrive tenés 25 GB para guardar todo. <a href="http://www.descubrehotmail.com/almacenamiento.asp" target="_blank">Clic aquí</a></div>

</div>
<br></div></div>--<div class="im"><br>
Ubuntu-ar lista de correo<br>
<a href="mailto:Ubuntu-ar@lists.ubuntu.com" target="_blank">Ubuntu-ar@lists.ubuntu.com</a><br>
Modifica tus opciones o desuscribite en: <a href="https://lists.ubuntu.com/mailman/listinfo/ubuntu-ar" target="_blank">https://lists.ubuntu.com/mailman/listinfo/ubuntu-ar</a><br>
Siempre leer, comprender y aplicar nuestra etiqueta: <a href="https://wiki.ubuntu.com/ArgentinaTeam/EtiquetaML" target="_blank">https://wiki.ubuntu.com/ArgentinaTeam/EtiquetaML</a><br>
<br>
<br></div></blockquote></div><br>y me estoy poniendo viejo, pero con awk lo podes resolver así:<div><div><br></div><div># Imprime palabras y sus repeticiones: contarPalabras.awk</div><div># Procesar con :</div><div># <span style="white-space:pre">        </span>awk  -f contarPalabras.awk archivo.txt</div>

</div><div><br></div><div><div>BEGIN {}</div><div><br></div><div>{ for (i=1; i&lt;=NF; i++)<span style="white-space:pre">                </span># NF es el número de campos en el registro actual.</div><div>     words[tolower($i)]++</div>

<div>}</div><div><br></div><div>END { for (i in words)</div><div>    print i, words[i]</div><div>}</div><div><br></div><div><br></div><div>Si necesitas ordenarlo o algo mas podes pipearlo con sort o cut o cambiar la línea print i, words[i] por print words[i], i</div>

<div><br></div><div>Saludos</div><div><br></div><br>-- <br>  Juan Pablo Sarubbi<br>Licenciado en Sistemas<br><br>Google Talk: pablosarubbi#gmail com<br>MSN: pablosarubbi#hotmail com<br>Skype: pablosarubbi<br>Blog: <a href="http://pablosarubbi.blogspot.com" target="_blank">pablosarubbi.blogspot.com</a><br>

Public Key: D0E8 F172 1DA6 C9C4 35D2  98A6 38A3 31F6 2183 D44A<br>
</div>
</blockquote></div><br><br clear="all">y como estaba aburrido, me puse a combinar comandos linux:<div><br></div><div>sed ejecuta una expresion regular, \s es un espacio en blanco, \n un salto de linea y /g para que se haga global</div>
<div>sort ordena un archivo y con -n trata a los numeros como numeros :p</div><div>uniq hace que la lista no se repita y con -c te genera una columna con la cantidad de veces que se repite cada palabra.</div><div><br></div>
<div>Entonces desde la linea de comandos quedaria algo así:<br><div><br></div><div>sed &#39;s/\s/\n/g&#39; archivo.txt | sort | uniq  -c | sort -n</div><div><br></div><div>Saludos</div><div><br></div><div><br></div><div>-- <br>
  Juan Pablo Sarubbi<br>Licenciado en Sistemas<br><br>Google Talk: pablosarubbi#gmail com<br>MSN: pablosarubbi#hotmail com<br>Skype: pablosarubbi<br>Blog: <a href="http://pablosarubbi.blogspot.com">pablosarubbi.blogspot.com</a><br>
Public Key: D0E8 F172 1DA6 C9C4 35D2  98A6 38A3 31F6 2183 D44A<br>
</div></div>