voxforge applet, java και ubuntu 12.04
Pantelis Koukousoulas
pktoss at gmail.com
Thu May 3 11:20:56 UTC 2012
Στο
http://www.voxforge.org/el/read
μπορεί κάποιος να δωρίσει ένα δείγμα φωνής (10-15 λεπτά) προκειμένου
να γίνει εφικτή
η κατασκευή ακουστικού μοντέλου για την ελληνική γλώσσα και ως εκ
τούτου να έχουμε
ΕΛ/ΛΑΚ εφαρμογές αναγνώρισης ομιλίας.
Αυτό γίνεται χρησιμοποιώντας το java applet που περιέχει η παραπάνω
σελίδα το οποίο
προσφέρει μερικά prompts προς ανάγνωση και φροντίζει και για το upload
του τελικού
αποτελέσματος.
Δυστυχώς από ότι φαίνεται για να δουλέψει το java applet χρειάζεται η
JRE της Oracle
καθώς το OpenJDK/IcedTea δε φαίνεται να υποστηρίζει signed applets.
Άρα, αν και κάποιος άλλος θα ήθελε να δωρίσει ένα δείγμα φωνής και δεν
κατάφερνε να
δουλέψει το applet, η διαδικασία (για ubuntu 12.04) είναι η εξής:
1) Κατέβασμα της ORACLE JRE από εδώ
http://www.oracle.com/technetwork/java/javase/downloads/jre-7u4-download-1591157.html
2)
Για x86_64
* Κατέβασμα του jre-7u4-linux-x64.tar.gz
* tar -xzvf jre-7u4-linux-x64.tar.gz
* sudo mv jre1.7.0_04/ /usr/lib/jvm/
* sudo update-alternatives --install "/usr/bin/java" "java"
"/usr/lib/jvm/jre1.7.0_04/bin/java" 1
* sudo update-alternatives --install
"/usr/lib/mozilla/plugins/libjavaplugin.so" "mozilla-javaplugin.so" \
"/usr/lib/jvm/jre1.7.0_04/lib/amd64/libnpjp2.so" 1
Για i386:
* Κατέβασμα του jre-7u4-linux-i586.tar.gz
* tar -xzvf jre-7u4-linux-i586.tar.gz
* sudo mv jre1.7.0_04/ /usr/lib/jvm/
* sudo update-alternatives --install "/usr/bin/java" "java"
"/usr/lib/jvm/jre1.7.0_04/bin/java" 1
* sudo update-alternatives --install
"/usr/lib/mozilla/plugins/libjavaplugin.so" "mozilla-javaplugin.so" \
"/usr/lib/jvm/jre1.7.0_04/lib/i386/libnpjp2.so" 1
3)
Restart το Firefox
Αν υπάρχει ανοιχτός media player / εφαρμογή μουσικής ή οτιδήποτε
άλλο σχετικό με ήχο
το κλείνουμε.
4) Πάμε στη σελίδα http://www.voxforge.org/el/read
και διαβάζουμε prompts κατά βούληση.
Χρειάζονται περίπου 140 ώρες ομιλίας προκειμένου να μπορέσει να
φτιαχτεί ένα ακουστικό μοντέλο
ανεξάρτητο από τον ομιλητή κατάλληλο για "command & control" εφαρμογές
τύπου "simon listens"
(ή όπως το HUD που θέλει ο Shuttleworth).
Για μία εφαρμογή dictation (στα πρότυπα του "Λογογράφου" ή του Dragon
Naturally Speaking)
χρειάζονται ίσως και χιλιάδες ώρες, αν και υπάρχουν ορισμένες έξυπνες
ιδέες στην ερευνητική
κοινότητα ώστε η απαίτηση αυτή να περιοριστεί κάπως.
Σύμφωνα με το http://www.voxforge.org/el/downloads πάντως, μέχρι
στιγμής υπάρχει μόνο περίπου
1 ώρα ομιλίας για ελληνικά, ποσοστό 0.92% από τις 140 ώρες του στόχου ... :(
Χαιρετισμούς,
Παντελής
Υ.Γ. 1, μία άλλη δυνατότητα είναι και η χρήση ελεύθερων audiobooks από
το Librivox project
αλλά δε βλέπω ούτε εκεί να υπάρχουν ελληνικά βιβλία (ή αν υπάρχουν
είναι καλά κρυμμένα :P)
οπότε δε φαίνεται προς το παρόν κάποια ελπίδα ούτε εκεί ...
More information about the Ubuntu-gr
mailing list