voxforge applet, java και ubuntu 12.04

Thu May 3 11:20:56 UTC 2012

Στο

http://www.voxforge.org/el/read

μπορεί κάποιος να δωρίσει ένα δείγμα φωνής (10-15 λεπτά) προκειμένου
να γίνει εφικτή
η κατασκευή ακουστικού μοντέλου για την ελληνική γλώσσα και ως εκ
τούτου να έχουμε
ΕΛ/ΛΑΚ εφαρμογές αναγνώρισης ομιλίας.

Αυτό γίνεται χρησιμοποιώντας το java applet που περιέχει η παραπάνω
σελίδα το οποίο
προσφέρει μερικά prompts προς ανάγνωση και φροντίζει και για το upload
του τελικού
αποτελέσματος.

Δυστυχώς από ότι φαίνεται για να δουλέψει το java applet χρειάζεται η
JRE της Oracle
καθώς το OpenJDK/IcedTea δε φαίνεται να υποστηρίζει signed applets.

Άρα, αν και κάποιος άλλος θα ήθελε να δωρίσει ένα δείγμα φωνής και δεν
κατάφερνε να
δουλέψει το applet, η διαδικασία (για ubuntu 12.04) είναι η εξής:

1) Κατέβασμα της ORACLE JRE από εδώ
http://www.oracle.com/technetwork/java/javase/downloads/jre-7u4-download-1591157.html

2)

Για x86_64
  * Κατέβασμα του jre-7u4-linux-x64.tar.gz
  * tar -xzvf jre-7u4-linux-x64.tar.gz
  * sudo mv jre1.7.0_04/ /usr/lib/jvm/
  * sudo update-alternatives --install "/usr/bin/java" "java"
"/usr/lib/jvm/jre1.7.0_04/bin/java" 1
  * sudo update-alternatives --install
"/usr/lib/mozilla/plugins/libjavaplugin.so" "mozilla-javaplugin.so" \

"/usr/lib/jvm/jre1.7.0_04/lib/amd64/libnpjp2.so" 1

Για i386:
  * Κατέβασμα του jre-7u4-linux-i586.tar.gz
  * tar -xzvf jre-7u4-linux-i586.tar.gz
  * sudo mv jre1.7.0_04/ /usr/lib/jvm/
  * sudo update-alternatives --install "/usr/bin/java" "java"
"/usr/lib/jvm/jre1.7.0_04/bin/java" 1
  * sudo update-alternatives --install
"/usr/lib/mozilla/plugins/libjavaplugin.so" "mozilla-javaplugin.so" \

"/usr/lib/jvm/jre1.7.0_04/lib/i386/libnpjp2.so" 1

3)
   Restart το Firefox

   Αν υπάρχει ανοιχτός media player / εφαρμογή μουσικής ή οτιδήποτε
άλλο σχετικό με ήχο
   το κλείνουμε.

4) Πάμε στη σελίδα http://www.voxforge.org/el/read
     και διαβάζουμε prompts κατά βούληση.

Χρειάζονται περίπου 140 ώρες ομιλίας προκειμένου να μπορέσει να
φτιαχτεί ένα ακουστικό μοντέλο
ανεξάρτητο από τον ομιλητή κατάλληλο για "command & control" εφαρμογές
τύπου "simon listens"
(ή όπως το HUD που θέλει ο Shuttleworth).

Για μία εφαρμογή dictation (στα πρότυπα του "Λογογράφου" ή του Dragon
Naturally Speaking)
χρειάζονται ίσως και χιλιάδες ώρες, αν και υπάρχουν ορισμένες έξυπνες
ιδέες στην ερευνητική
κοινότητα ώστε η απαίτηση αυτή να περιοριστεί κάπως.

Σύμφωνα με το http://www.voxforge.org/el/downloads πάντως, μέχρι
στιγμής υπάρχει μόνο περίπου
1 ώρα ομιλίας για ελληνικά, ποσοστό 0.92% από τις 140 ώρες του στόχου ... :(

Χαιρετισμούς,
Παντελής

Υ.Γ. 1, μία άλλη δυνατότητα είναι και η χρήση ελεύθερων audiobooks από
το Librivox project
αλλά δε βλέπω ούτε εκεί να υπάρχουν ελληνικά βιβλία (ή αν υπάρχουν
είναι καλά κρυμμένα :P)
οπότε δε φαίνεται προς το παρόν κάποια ελπίδα ούτε εκεί ...