Re: Πρόγραμμα εντολών που να μετατρέπει αρχείο
Savvas Radevic
vicedar at gmail.com
Fri Jun 12 21:52:13 BST 2009
Κάτι σαν το επισυνημμένο;
> Η δουλειά είναι:
> 1. Ανάγνωση του ftp://ftp.unicode.org/Public/UNIDATA/UnicodeData.txt
> Θέλει κατανόηση των πεδίων για να εντοπίσουμε ποιοι χαρακτήρες είναι
> αλφαβητικοί.
> Αλφαβητικοί εδώ είναι τα γράμματα που είναι είτε πεζά ή κεφαλαία.
> 2. Κάθε χαρακτήρας Unicode έχει ένα αύξων αριθμό, από 1-χχχχ. Εδώ μάς
> αρκεί μέχρι 65535.
Δεν κατάλαβα όμως.. αυτόν τον αύξων αριθμό που τον βρίσκουμε; Το μόνο που
βλέπω είναι hexadecimal. :)
> 3. Το αποτέλεσμα θέλουμε να είναι κάτι σαν
>
> 1 όχι
> 2 όχι
> 3 όχι
> ...
> 65 ναι
> 66 ναι
> ...
> κτλ
α) όχι = "δεν είναι γράμμα κεφαλαίο ούτε μικρό" και ναι = "είναι γράμμα
κεφαλαίο ή μικρό"
β) Για τους "GREEK" χαρακτήρες μόνο ή για όλους τους χαρακτήρες;
> 4. Όταν το φτιάξουμε αυτό, μετά μπορούμε να το βελτιστοποιήσουμε διότι
> οι περισσότεροι χαρακτήρες
> δεν είναι αλφαβητική. Ωστόσο ας φτάσουμε στο σημείο αυτό.
>
> Η όλη δουλειά γίνεται για το ς (σίγμα τελικό).
>
> Σίμος
Η εφαρμογή Character Map έχει αρκετές πληροφορίες σχετικά με τον κάθε
χαρακτήρα στο "Character Details":
*
Σ
U+03A3 GREEK CAPITAL LETTER SIGMA
General Character Properties
In Unicode since: 1.1
Unicode category: Letter, Uppercase
Various Useful Representations
UTF-8: 0xCE 0xA3
UTF-16: 0x03A3
C octal escaped UTF-8: \316\243
XML decimal entity: Σ
Annotations and Cross References
See also:
• U+01A9 LATIN CAPITAL LETTER ESH
• U+2211 N-ARY SUMMATION
*
-------------- next part --------------
An HTML attachment was scrubbed...
URL: https://lists.ubuntu.com/archives/ubuntu-gr/attachments/20090612/5b8605a4/attachment.htm
-------------- next part --------------
A non-text attachment was scrubbed...
Name: unicodetest.sh
Type: application/x-sh
Size: 594 bytes
Desc: not available
Url : https://lists.ubuntu.com/archives/ubuntu-gr/attachments/20090612/5b8605a4/attachment.sh
More information about the Ubuntu-gr
mailing list