[Ubuntu-BR] WF

José Geraldo Gouvêa jggouvea em gmail.com
Sábado Julho 7 21:51:42 UTC 2007


Há algum tempo fiz um trabalho excelente de análise textual empregando
exclusivamente o textutils. Consegui extrair de um "corpus" de mais de
750,000 palavras (a obra completa de um escritor) uma série de dados
estatísticos interessantes, tais como a freqüência com que empregava
certas palavras e certas combinações de palavras, o tamanho médio de
cada conto em palavras, caracteres e frases, etc.

Hoje cismei de escrever um tutorial explicando como fiz isso (sei lá,
algum maluco -- ou então um estudante de graduação em literatura -- pode
se interessar por isso!). Só que aí descobri que o pacote "textutils" do
Ubuntu é um mero dummy do "coreutils" e que no "coreutils" não tem todos
os aplicativos do "textutils" que eu usei nos tempos do Fedora Core 3.
Entre os aplicativos faltando estão justamente o /usr/bin/wf ("word
frequency") e o /usr/bin/wc ("word count"), nos quais 70% de meu
tutorial seria baseado.

O pior é que pesquisei no Google e não achei nada sobre nenhum dos dois!
Que eu não estou maluco eu sei porque a monografia está aqui na minha
mão nesse momento e os dados estatísticos nela não foram inventados (e
nem poderiam ser coletados senão através de processamento eletrônico).

Alguém sabe de um link que me possa ajudar?


-- 
José Geraldo Gouvêa <jggouvea em gmail.com>





More information about the ubuntu-br mailing list