[உபுண்டு_தமிழ்]டிவிஎஸ் நிறுவனத்தின் தமிழ் 99 விசைப் பலகை ?

K. Sethu skhome at gmail.com
Sun Dec 31 06:17:20 GMT 2006


On 12/30/2006 08:35 PM, ம.ராமதாஸ் wrote:
> சில விஷயங்கள்:
>
> மயூரன் அனுப்பிய tabuntu 
> (http://ubuntu-tam.org/tamil_ubuntu_wiki/index.php/தமிழ்_பொதிகள்)  
> கோப்பில் m17n-contrib பொதியினை நிறுவியதில் Tamil 99 விசைப்பலகை கிட்டியது.  :-)
>
> இதில் வருடம் முதலிவற்றினைக் குறிக்கும் பொருட்டு தமிழ்99 விசைப்பலகையில் கொடுக்கப் 
> பட்டுள்ள குறியீடுகள் சரிவரவில்லை.
>
> மேலும் க்ஷ - என்பதும் கூட்டெழுத்தாய் வரவில்லை.
>
> இங்ஙனம் இருப்பதற்கும் எழுத்துருக்கும் சம்பந்தம் உள்ளதா? 

முதலில் க்ஷ பற்றி.  ஆம் எழுத்துருக்கள் பொருத்து கூட்டெழுத்தாகவோ, 
கூடாவெழுத்துக்களாகவோ தென்படுகின்றன. இதைப் பாருங்கள்: 
http://i16.tinypic.com/4br4dig.png - சில எழுத்துருக்களில் கூடவில்லை. அதாவது 
இது விசைப்பலகை அமைப்பினால் உருவான ஒரு பழு அல்ல. எந்த வி. ப. பாவித்தாலும் இவ்வாறே.

க் + ஷ கூட்டெழுத்தாக வரவேண்டும் என்பது அத்தியாவசியமா?

தமிழ் ஒருங்குறி குறியீட்டைப் பொருத்த மட்டில் குறியீட்டுக்குள்ளடக்கப்பட்ட உயிர்மெய்கள் 23 
ஆகும்: க முதல் ன வரையான 18 தமிழ்  உயிர்மெய்களுடன் ,  ஜ, ஹ, ஸ , ஷ மற்றும் ஶ என 5 
கிரந்த  உயிர்மெய். இவைகள் யாவும் அகரவுயிர் சார்ந்த உயிர்மெய்கள். இதில் கடைசியாக 
சேர்க்கப்பட்ட கிரந்த எழுத்தே ஶ என்பது - (unicode: 0BB6).  இதை unicode 4.1 இல் 
உள்ளிட்டபோது இதன் யுனிகோட் ஆங்கிலப் பெயரை SHA என்று குறிப்பிட்டனர். அதற்கு முன்னைய 
வெளியீடுகளில்  SHA எனற ஆங்கிலத்தில் பெயரிடப்பட்ட  ஷ  வை  unicode 4.1 முதல் SSA 
எனற ஆங்கிலப் பெயருக்கு மாற்றினார்கள். அதுவரை ஸ்ரீ என்ற கூட்டெழுத்துக்கு unicode 
அங்கீகரித்திருந்த கூட்டல் ஸ் + ரீ  என்பது -  unicode 4.1 முதல் அவர்கள் பரிந்துரைப்பது: 
ஶ் + ரீ - பார்க்க: http://www.unicode.org/faq/tamil.html#12 - இதில் கடைசி 
வினாவும் விடையும் பின்வருமாறு:

*****************
Q: What is the mapping for TSCII grantha ligature 0x82 SRI? A: Prior to 
Unicode 4.1, the best mapping is to the sequence <U+0BB8, U+0BCD, 
U+0BB0, U+0BC0>. Unicode 4.1 added the character U+0BB6 TAMIL LETTER SHA 
and as a consequence, the mapping should be updated to <U+0BB6, U+0BCD, 
U+0BB0, U+0BC0
*********************

இவ்வாறு, ஸ்ரீ க்குப் போல, க்ஷ எனற கூட்டெழுத்துக்கும் யுனிக்கோட் அமைப்பாளர்கள் ஏதாவது 
நியமக்கட்டளைகளைத் தெரிவித்துள்ளனரா? இல்லை என்றே எண்ணுகிறேன். கூட்டலாக இருப்பினும் 
கூடாமல் இருப்பினும் ஓசையின் அடிப்படையில் ஒன்றே என்பதாக நினைக்கிறேன். எனவே கூடாமல் 
தென்படுவதால் என்ன தவறு? ஆனாலும் எல்லா எழுத்துருக்களும் ஒரே மாதிரியாக 
தென்படுவதுதான் சாலச்சிறந்தது. அதாவது இவ்விரண்டில் ஒன்றுதான் சரி என்று நியம் ஒன்று 
இருப்பின் நன்றே. இதைப்பற்றி மேலும் தகவல்கள் / கருத்துக்கள் பார்க்க விரும்புகிறேன்.

அடுத்து நீங்கள் கூறியுள்ளது: வருடம் முதலியவற்றினை குறிக்கும் தமிழ் 99 வி.ப வில் 
கொடுக்கப்பட்டுள்ள குறியீடுகள் சரிவரவில்லை. குறியீடுகள் என்று சொன்னது symbols 
தானே?.  unicode.org இன் தமிழிற்கான U0B80.pdf கோப்பில் கடைசிப் பகக்த்தில் (page 
499) காணப்படும் 8 symbols களைப் பார்க்கலாம். இதில் அப்பக்கம் உள்ளது: 
http://i10.tinypic.com/3yns4xz.png -  அத்துடன் இப்பக்கத்தில் இடதுபுறமாக தமிழ் 
99 உருவரையையும் ஒப்பிடுதலுக்காகக் காட்டியுள்ளேன்.   m17n-தமிழ் 99 முலம் 
உள்ளிடுகையில் இந்த 8 குறியீடுகளும் நான் முயற்சித்த எல்லா எழுத்துருக்களிலும் சரியாகவே 
தெரிகின்றன  - பார்க்க மேற்குறிப்பிட்ட : http://i16.tinypic.com/4br4dig.png

ஆக, ராம்தாஸ் மேற்கூறிய இக் குறியீடுகள் தொடர்பாக தாங்கள் கண்ட குறைபாடுகள் யாவை ?

> தமிழ்99 விசைப் பலகை   க + அ = க என்ற ரீதியில் வடிவமைக்கப் பட்டுள்ளதற்கு ப்ரத்யேக 
> காரணம் உள்ளதா?
> க் + அ = க என்பது ஏன் கடைபிக்கப் படவில்லை? எவரேனும் அறிந்தவர் சொல்லுங்களேன்...
இதைப் பற்றி எனது கருத்துகளை பின்னர் ஒரு நாள் எழுதுகிறேன்.

>
> இப்பொதிகளின் தொகுப்பில் Remington  இல்லை  எனத் தோன்றுகிறது. மேலும் அப்பொதியுள் 
> அடக்கப் பட்டுள்ள scim-additional-tables ல் Phoenetic & Inscript விசைப்பலகைகள் 
> மட்டும் உள்ளது.
>
> ரெமிங்கடன் முறை இயல்பாக தற்போது scim-additional-tables  பொதியில் 
> சேர்க்கப்பட்டுள்ளதால் அடுத்த Feisty வெளியீட்டில் இது இடம்பெறும் என நம்பலாம்.
>
scim இன் தாயகம் (upstream project) www.scim-im.org சென்று பார்க்கையில் 
ta-remington முதலில் சேர்க்கப்பட்டது கடைசியாக 2006-ஒக்டோபரில் வெளியிடப்பட்ட 
scim-tables 0.5.7 (பார்க்க : 
http://www.scim-im.org/news/imengines_news/scim_tables_0_5_7 ). 

scim-additional-tables என்பது சீன, ஜப்பானிய, கொரிய (CJK) மொழிகளுக்கான 
scim-tables தவிர்ந்த, ஏனைய scim-tables களை உபுண்டுவில் சேர்ப்பதற்காக  
உபுண்டுவினால்  உருவாக்கப்பட்ட  தொகுப்பு.  அது  main  repo / utilities  இருந்து 
கொடுக்கப்படுகிறது - அதாவது Canonical நிறுவனத்தின் பொறுப்பிலிருந்து. இதுவரை 
அக்காப்பகத்தில் இருந்து எட்ஜிக்கு 0.5.6-1build1 என்பதுதான்  கொடுக்கப்படுகிறது.  
தாங்கள் " ரெமிங்கடன் முறை இயல்பாக தற்போது scim-additional-tables  பொதியில் 
சேர்க்கப்பட்டுள்ளதால்" என்று கூறுவது புரியவில்லை. வேறு ஏதாவது cvs யில் உள்ளதா?

நண்பர் மயூரன் தயாரித்த தபுண்டு பொதியும், உபுண்டுவின் scim-tables-additional 
(0.5.6-1build) பொதியையே உள்ளடக்கியதால் ரெமிங்டன் வி.ப. அதிலும் இல்லை.

ஆயினும் scim-tables 0.5.7 யை www.scim-im.org  இலிருந்து பதிவிறக்கம் செய்து 
அதினுள்ளுள்ள Tamil-remington.txt.in என்ற கோப்பை வெளியெடுத்து பின்வரும் கட்டளை 
மூலம் இருவாக்கலாம் (compiling) :

scim-make-table  scim-make-table ~/Tamil-remington.txt.in -b -o 
~/Tamil-remington.bin

மேற்குறிபிட்ட கட்டளை  Tamil-remington.txt.in கோப்பு பயனரின் அகவடைவுவில் (home 
directory) இருப்பதாயின். வேறு இடத்தில் இருப்பின் ~/ என்பதற்கு பதிலாக சரியான 
இடத்தை எழுதவும். சரியாக அக்கட்டளை செயலிக்குமாயின் வெளிவரும் பைனரி கோப்பை scim 
யின் GUI இடைமுகமூடாக நிறுவலாம். அல்லது நேரடியாக  பயனரின் ~/.scim/user-tables 
என்ற  அடைவுவினுள் சேர்க்கலாம்.

NRC-FOSS யின் தளதில் இருந்தும் பதிவிறக்கி நிறுவலாம் தானே?
> இங்ஙனம் scim-additional-tables பொதிபிலேயே  Tamil99 மற்றும் Bamini  யும் 
> சேர்க்கப்படுதல் நலம்.
>
> <http://www.scim-im.org/downloads/imengines_download>
மீண்டும் குறிப்பிடுகிறேன் scim-additional-tables என்பது உபுண்டுவின் தொகுப்பு. 
நீங்கள் விரும்பும்படி scim-tables முறைக்கு தற்போதில்லாத ஏனைய வி.ப. அமைபுக்கள் உள் 
கொண்டு வர வேண்டுமாயின், முதலில் upstream project யினுள் அவை வர முயலுங்கள் - 
இங்கு upstream project ஆனது scim-im.org ஆகும். அதன்பின்  ubuntu நிறுவனத்தினர் 
scim-additional-tables உள் சேர்க்கட்டும். (ரெமிங்டனை NRC_-FOSS முன்னெடுத்தது போல)

2005 கடைசி மாதங்களில் ரெட்ஹாட்டின் இந்திய மொழிக்குழுவினர் முதலில் inscript, 
phonetic என இரண்டையும் scim-tables க்குத்தான் உருவாக்கினர். அக்காலத்தில் அக்குழுவின் 
அங்கத்தினர் திரு. ஜென்ஸ் பீட்டர்சன் எனபவருடன் எனது சில வினாக்களுக்காக மடல்கள் மூலம் 
தொடர்பு கொண்டிருந்தேன். அப்போது அவர் கூறியிருந்தார் பின்வரும் காலங்களில் அவர்கள் 
scim-tables விட m17n க்குத்தான் முக்கியத்துவம் கொடுக்க உள்ளதாக. அதே போல நண்பர் 
பீலிக்ஸ் எழுதிய தமிழ்99 மற்றும் ta-typewriter இரண்டும் scim-tables க்கு 
கொடுக்கப்படவில்லை - m17n க்கு மட்டுமே.

உண்மையில் ரெட்ஹாட் இந்திய மொழிக்குழுவினரது m17n பங்களிப்புக்கள் எல்லாம் lookup-table 
முறைகளே. அதாவது scim-tables க்கு எழுதும் assignment statements 
எல்லாவற்றையும்  அப்படியே m17n க்கான mim கோப்பில் உபயோகிப்பது.  m17n-lib க்கே 
உரித்தான LISP அடிப்படையிலான programming steps அவர்கள் பயன்படுத்தவில்லை. 
உதாரணத்திற்கு m17n-ta-trans அத்துடன் மயூரனின் m17n-ta-avarangal என்பன 
பொருத்தமான இடங்களில் LISP statesment பாவிக்கின்றன. வேகம் குறைந்த கணினி சூழல்களில் 
tables முறைகளை விட m17n (ta-trans, ta-avarangal போன்றவைகள்) முறைகள் தான் 
சிறப்பாக இருக்கும் என்பதைக் கண்டிருக்கிறேன்.  மேலும் முக்கியமாக m17n, scim உடன் 
மட்டுமல்லாது வேறு உள்ளிடல் முறைமைகளுடனும்  (uim, iiimf) பின்முகமாக இயங்குவதற்கு 
சாத்தியக் கூறுகள் உள்ளன. எட்ஜியில் uim உடன் m17n செயலிக்கிறது என்பதை நான் 
கூறியிருந்தேன்.

ஆக scim-tables முறைக்கு முன்னெடுத்துச்செல்கையில் m17n முறை தேவையில்லை என்ற 
கொள்கையை யாரும் முன்வைப்பின் நான் ஏற்றுக்கொள்வதற்கில்லை.
> மேலும் scim-additional-tables அவசியமில்லாமல் அனைத்து பாரதிய மொழிகளுக்கான 
> விசைப் பலகைகளையும் நிறுவுகிறது.  இதனைத் தவிர்த்து scim-tamil-tables என தமிழ் 
> பொதி ஒன்றினை  செய்வது அதிக ஆற்றல் உள்ளதாய் இருக்கும்.
>
இது உபுண்டு நிறுவத்தினரிடம் கோர வேண்டியது.  ஒரு பொதியானத எப்போதும் பல கோப்புகளை 
உள்ளடக்கியது. ஒவ்வொரு மொழிக்கும் தனித்தனி பொதியெனின் (ரெட்ஹாட்டினர் அவ்வாறு 
செய்கின்றனர் - பார்த்துள்ளேன்) பொதிகளின் எண்ணிக்கைகள் பெருகியிருக்கும். நமது apt, 
synaptic போன்ற பொதி முகான்மைச் செயலிகளுக்கு எடை குறைந்த ஆனால் எண்ணிக்கை கூடிய 
பொதிகளை கையாள்வது திறமையை (efficiency) குறைக்குமா?  தாங்கள் சொல்லும் 
அவசிய்யமில்லா அனைத்து வி.ப. க்களையும் நிறுவுகிறதுு என்ற குறைபாடை கையாள இன்னொரு 
வழியானது நிறுவப்பட்ட எல்லா tables களையும் முதலில் GUI இல் தேர்வுகளிலிருந்து நீக்கி 
விட்டு (அதாவது சரிக்கான் குறியை நீக்குதல்) நமக்கு தேவையானவைகளை மட்டும் வேண்டும் என 
மீண்டும் தேர்வுக்குறியிடல்.


> தங்கள் கருத்துக்களை  ஆவலுடன் எதிர்பார்க்கிறேன்...
>
> தொடரும்...
>


தங்கள் அடுத்த மடலும் கண்டேன் சிறிது நேரம் முன். இன்று மாலையின் பின் நான் தொடர்வேன்.

~சேது



More information about the Ubuntu-l10n-tam mailing list