[Ubuntu-BR] WF

Dorneles Treméa dorneles em x3ng.com.br
Segunda Julho 9 01:25:18 UTC 2007


Opa José Geraldo,

> Há algum tempo fiz um trabalho excelente de análise textual empregando
> exclusivamente o textutils. Consegui extrair de um "corpus" de mais de
> 750,000 palavras (a obra completa de um escritor) uma série de dados
> estatísticos interessantes, tais como a freqüência com que empregava
> certas palavras e certas combinações de palavras, o tamanho médio de
> cada conto em palavras, caracteres e frases, etc.
> 
> Hoje cismei de escrever um tutorial explicando como fiz isso (sei lá,
> algum maluco -- ou então um estudante de graduação em literatura -- pode
> se interessar por isso!). Só que aí descobri que o pacote "textutils" do
> Ubuntu é um mero dummy do "coreutils" e que no "coreutils" não tem todos
> os aplicativos do "textutils" que eu usei nos tempos do Fedora Core 3.
> Entre os aplicativos faltando estão justamente o /usr/bin/wf ("word
> frequency") e o /usr/bin/wc ("word count"), nos quais 70% de meu
> tutorial seria baseado.

deve ter passado desapercebido, mas o wc está sim no coreutils... :-)

$ dpkg -S /usr/bin/wc
coreutils: /usr/bin/wc

> O pior é que pesquisei no Google e não achei nada sobre nenhum dos dois!
> Que eu não estou maluco eu sei porque a monografia está aqui na minha
> mão nesse momento e os dados estatísticos nela não foram inventados (e
> nem poderiam ser coletados senão através de processamento eletrônico).
> 
> Alguém sabe de um link que me possa ajudar?

Não sei exatamente o que o wf fazia, mas verifica se isso te ajuda
a resolver o problema:

http://tldp.org/LDP/abs/html/textproc.html#WF

HTH,

-- 

Dorneles Treméa
X3ng Web Technology
http://nosleepforyou.blogspot.com





More information about the ubuntu-br mailing list