[உபுண்டு_தமிழ்]டிவிஎஸ் நிறுவனத்தின் தமிழ் 99 விசைப் பலகை ?

K. Sethu skhome at gmail.com
Thu Jan 11 19:47:00 GMT 2007


ராமதாஸ் மற்றும் நண்பர்களே

On 01/10/2007 01:01 AM, amachu wrote:

 > On Sun, 2006-12-31 at 11:47 +0530, K. Sethu wrote:
 >
 > 
 >> கொடுக்கப்பட்டுள்ள குறியீடுகள் சரிவரவில்லை. குறியீடுகள் என்று சொன்னது
 >> symbols
 >> தானே?. unicode.org இன் தமிழிற்கான U0B80.pdf கோப்பில் கடைசிப்
 >> பகக்த்தில் (page
 >> 499) காணப்படும் 8 symbols களைப் பார்க்கலாம். இதில் அப்பக்கம் உள்ளது:
 >> http://i10.tinypic.com/3yns4xz.png - அத்துடன் இப்பக்கத்தில்
 >> இடதுபுறமாக தமிழ்
 >> 99 உருவரையையும் ஒப்பிடுதலுக்காகக் காட்டியுள்ளேன்.  m17n-தமிழ் 99
 >> முலம்
 >> உள்ளிடுகையில் இந்த 8 குறியீடுகளும் நான் முயற்சித்த எல்லா
 >> எழுத்துருக்களிலும் சரியாகவே
 >> தெரிகின்றன - பார்க்க மேற்குறிப்பிட்ட :
 >> http://i16.tinypic.com/4br4dig.png
 >> ஆக, ராம்தாஸ் மேற்கூறிய இக் குறியீடுகள் தொடர்பாக தாங்கள் கண்ட
 >> குறைபாடுகள் யாவை ?
 >>  
 >
 > உபுண்டுவில் கிடைக்கப் பெறும் Kadambari, Kalyani and Maduram எழுதுருவைக்
 > கொண்டு முயற்சி செய்தேன். கட்டம் கட்டமாய் வருகிறது. தாங்கள சுட்டி
 > இருக்கும் எழுத்துருக்களில் முயற்சி செய்யவேண்டும்.
 >
 > 
ஆம், ராமதாஸ் சொல்லியதில் உண்மை உள்ளது. மன்னிக்கவும்! சில வாரங்கள் முன் நான் கண்டறிந்த 
ஒரு முக்கிய விடயத்தை மறந்துவிட்டேன்.

மேற்குறிப்பிட்ட குறியீடுகள் unicode 4வது வெளியீடு வாக்கிலே ஒருங்குறிகள் பெற்றன என 
நினக்கிற்றேன் - மேலும் புதிய SHA ஆன ஶ (இது யுனிகோட்: U+0bb6) மற்றும் தமிழ் 
இலக்கம் சுழி ஆன ௦ (இது யுனிகோட்: U+0BE6) என்பவைகள் 2004 யில் வெளியிடப்பட்ட 
unicode 4.1 யிலேயே ஒருங்குறிக்கள் பெற்றன. ஆகவே அநேகமான எழுதுருக்களில் இவ்வெல்லா 
குறியீடுகளும் சேர்க்கப்பட்டிருக்கவில்லை. ஆனால் பின்னால் ஆக்கப்பட்டிருக்கக்கூடிய 
எழுத்துருக்கள் சில நாம் நிறுவுமேயானல் அவற்றில் அக்குறியீடுகள் சேர்க்கப்பட்டிருக்குமாயின் 
அவ்வெழுத்துருக்கள் மட்டுமல்லாமல் முன்னைய எழுத்துருக்கள் பாவிக்கையிலும் இக்குறியீடுகள் 
காட்சித் தருகின்றன.

பரிசோதனை மூலம் நான் கண்டறிந்ததைக் கேளுங்கள் பின் வருபவற்றில்:

உபுண்டு நிகழ்வட்டு இயங்குதளம் (Live CD session) ஒன்றை பாவிக்கையில் அதில் 
நிறுவப்பட்டிருகும் தமிழுக்கான TTF எழுத்துருக்களானவைகள் :

1. Lohit Tamil
2. TSCu-Paranar (and also its files for bold and italic styles)
3. TSCu-Comic
4. TSCu-Times
5. TAMu-Kadambari
6. TAMu-Kalyani
7. TAMu-Maduram

அடுத்ததாக முனையத்தில் gucharmap என்ற கட்டளையை கொடுத்து அச்செயலியை இயக்கி அதில் 
எழுத்துருவுக்கான தேர்வுக்கட்டத்தில் (cage) LohitTamil எழுத்துருவை தெரிவு செய்து 
கீழே Script எனபதற்கான நிரலில் தமிழ் மொழியை தெரிவு செய்து பார்த்தால் இப்படத்தில் 
உள்ளது போலத் தெரிகிறது : http://i10.tinypic.com/2iix1xu.png

இப் படத்தில் பின்வரும் குறியீடுகள் உருக்காட்சிக் காட்டாதவைகள் .

1. U+0BB6 ( புதிய SHA )
2. U+0BE6 ( சுழி )
3. U+0BF3 ( நாள் )
4. U+0BF4 (மாதம்)
5. U+0BF5 (வருடம்)
6. U+0BF6 (பற்று)
7. U+0BF7 (வரவு)
8. U+0BF8 (மேலுள்ளது போல)
9. U+0BF9 (ரூபாய்)
10. U+0BFA (இலக்கம்)

அதே gucharmap இல் ஏனைய எல்லா எழுத்துருக்களிலும் பார்த்தாலும் அவ்வாறே 
மேற்குறிப்பிடப்பட்ட 10 குறியீடுகளும் உருக்காட்சி காட்டாதுள்ளன. (Lohit Tamil க்கும் 
ஏனைய தமிழுக்காக ஆக்கப்பட்ட 3 TSCu + 3 TAMu எழுத்துருக்களுக்கும் இடையே மேலதிகமாக 
உள்ள இன்னொரு வித்தியாசம் என்னவெனில் LohitTamil லில் எங்கெல்லாம் பின் உயிர் 
எழுத்துக்களுடன் தென்படும் புள்ளிகளான வட்டம் - dotted circles உருக்காட்ச்சி 
கொடுக்கிறதோ ஏனைய தமிழுக்கான எழுத்துருக்களில் அங்கெல்லாம் புள்ளிகளான வட்டம் காட்ச்சி 
இல்லை, மாறாக அதற்கான யுனிகோடான 25CC தெரியும் கட்டத்திற்குள் )

அடுத்ததாக நான் எனது நிரந்தர உபுண்டு - எட்ஜி நிறுவலுக்கான பகிர்வை ஏற்றி (mounted 
my ubuntu-edgy hard-disk partition) அதிலிருந்து JanaTamil என்ற எழுத்துருவை 
இந்த நிகழ்வட்டு தளத்தில் நிறுவினேன் (நான் எழுத்துருக்களை நிறுவும் முறை: முதலில் 
எனது ~/.fonts கோப்பகத்தில் எழ்த்துருக்கான .ttf கோப்பை உள்ளிட்டு அதன்பின் 
mkfontscale, mkfontdir , fc-cache ஆகிய 3 கட்டளைகளை அடுத்தடுத்து கொடுப்பது).

அவ்வாறு JanaTamil என்பதை நிறுவிய பின் gucharmap இல் பார்த்த போது LohitTamil 
எழுத்துருக்கான அட்டவனை இவ்வாறு உள்ளது: http://i18.tinypic.com/2pyw0hc.png  - 
இதில் மேற்குறிப்பிடப்பட்ட 10 குறியீடுகளில் முதல் இரண்டான புதிய SHA மற்றும் தமிழ் 
சுழி தவிர ஏனைய 8 ( யுனிகோடு 0BF3 muthal 0BFA வரை) குறியீடுகளும் இப்போது 
உருப்பெற்று காட்ச்சியளித்தன. அவ்வாறே ஏனைய எல்லா எழுத்துருக்களிலும்.

அடுத்து JanaTamil யை நீக்கி விட்டு சூரியன்டொட்கொம் (SooriyanDotCom) எழுத்துருவை 
நிறுவினேன். அதற்கு கிடைத்த பிரதிபலன் இதோ:
http://i16.tinypic.com/2wqfz3o.png - இதில் அனைத்து குறியீடுகளுக்கும் 
உருக்காட்ச்சி தெரிகின்றது. எல்லா எழுத்துருக்களிலும் அப்படியே.

ராமதாஸ், மற்றும் எல்லா நண்பர்களே சூரியன்டொட்கொம் எழுத்துரு நிறுவியிருந்தால் எல்லா 
யுனிகோட் எழுத்துக்களும் மற்றும் குறியீடுகளும் எந்த எழுத்துருவிலும் தெரியும். ராமதாஸ் 
சொன்ன கட்டம் கட்டமாகத் தெரியும் பிரச்சினை வராது. காரணம் சூரியன்டொட்கொம் Unicode 
ver 4.1 பின் ஆக்கப்பட்டிருக்க வேண்டும். (சூரியன்டொட்கொம் எழுத்துருப்பாவனையில் ஒரே 
தீர்க்கப்பட வேண்டிய வழுவானது அது ஔகாரம் சார்ந்த உயிர்மெய்களின் உருவாக்கத்தில் ஒரு 
புள்ளிகளாலான வட்டத்தை நீக்காமல் அல்லது மறைக்காமல் விடுவதே).

தபுண்டு பொதியை முழுமையாக நிறுவும் போது அதிலிருந்து சூரியன்டொட்கொம் மற்றும் 
பாமினி எழுத்துருக்களும் நிறுவும்படியே நண்பர் மயூரன் நிறுவல் செயலியிலுள் 
எழுதியுள்ளார். ராமதாஸ் தமிழ் 99 விசைப்பலகைக்காக மட்டும் தபுண்டுவிலிருந்து 
தேர்ந்தெடுக்கப்பட்ட கோப்புகளை நிறுவியிருப்பார் என நினைக்கிறேன். அவ்வாறு அவர் தபுண்டு 
பொதியில் இருந்து சூரியன்டொட்கொம் நிறுவாமையும் நன்மையாயிற்று - ஏனெனில் அவ்வாறு 
நிறுவாதலினாலேயே அவர் குறியீடுகள் தெரியவில்லை என பார்த்து முயற்சித்தது TAMu 
எழுத்துருக்கள் என்றும் சுட்டிக்காட்ட நானும் சில வாரங்கள் முன் கணடிருந்ததை இன்று மீண்டும் 
பார்த்து எழுத கிடைத்தது. இத் தகவல் முக்கியமானதாகவே நினைக்கிறேன்.

ஏனைய விடயங்கள் பின்னர். 

~சேது
More information about the Ubuntu-l10n-tam mailing list