[உபுண்டு_தமிழ்]டிவிஎஸ் நிறுவனத்தின் தமிழ் 99 விசைப் பலகை ?
K. Sethu
skhome at gmail.com
Sun Dec 31 06:17:20 GMT 2006
On 12/30/2006 08:35 PM, ம.ராமதாஸ் wrote:
> சில விஷயங்கள்:
>
> மயூரன் அனுப்பிய tabuntu
> (http://ubuntu-tam.org/tamil_ubuntu_wiki/index.php/தமிழ்_பொதிகள்)
> கோப்பில் m17n-contrib பொதியினை நிறுவியதில் Tamil 99 விசைப்பலகை கிட்டியது. :-)
>
> இதில் வருடம் முதலிவற்றினைக் குறிக்கும் பொருட்டு தமிழ்99 விசைப்பலகையில் கொடுக்கப்
> பட்டுள்ள குறியீடுகள் சரிவரவில்லை.
>
> மேலும் க்ஷ - என்பதும் கூட்டெழுத்தாய் வரவில்லை.
>
> இங்ஙனம் இருப்பதற்கும் எழுத்துருக்கும் சம்பந்தம் உள்ளதா?
முதலில் க்ஷ பற்றி. ஆம் எழுத்துருக்கள் பொருத்து கூட்டெழுத்தாகவோ,
கூடாவெழுத்துக்களாகவோ தென்படுகின்றன. இதைப் பாருங்கள்:
http://i16.tinypic.com/4br4dig.png - சில எழுத்துருக்களில் கூடவில்லை. அதாவது
இது விசைப்பலகை அமைப்பினால் உருவான ஒரு பழு அல்ல. எந்த வி. ப. பாவித்தாலும் இவ்வாறே.
க் + ஷ கூட்டெழுத்தாக வரவேண்டும் என்பது அத்தியாவசியமா?
தமிழ் ஒருங்குறி குறியீட்டைப் பொருத்த மட்டில் குறியீட்டுக்குள்ளடக்கப்பட்ட உயிர்மெய்கள் 23
ஆகும்: க முதல் ன வரையான 18 தமிழ் உயிர்மெய்களுடன் , ஜ, ஹ, ஸ , ஷ மற்றும் ஶ என 5
கிரந்த உயிர்மெய். இவைகள் யாவும் அகரவுயிர் சார்ந்த உயிர்மெய்கள். இதில் கடைசியாக
சேர்க்கப்பட்ட கிரந்த எழுத்தே ஶ என்பது - (unicode: 0BB6). இதை unicode 4.1 இல்
உள்ளிட்டபோது இதன் யுனிகோட் ஆங்கிலப் பெயரை SHA என்று குறிப்பிட்டனர். அதற்கு முன்னைய
வெளியீடுகளில் SHA எனற ஆங்கிலத்தில் பெயரிடப்பட்ட ஷ வை unicode 4.1 முதல் SSA
எனற ஆங்கிலப் பெயருக்கு மாற்றினார்கள். அதுவரை ஸ்ரீ என்ற கூட்டெழுத்துக்கு unicode
அங்கீகரித்திருந்த கூட்டல் ஸ் + ரீ என்பது - unicode 4.1 முதல் அவர்கள் பரிந்துரைப்பது:
ஶ் + ரீ - பார்க்க: http://www.unicode.org/faq/tamil.html#12 - இதில் கடைசி
வினாவும் விடையும் பின்வருமாறு:
*****************
Q: What is the mapping for TSCII grantha ligature 0x82 SRI? A: Prior to
Unicode 4.1, the best mapping is to the sequence <U+0BB8, U+0BCD,
U+0BB0, U+0BC0>. Unicode 4.1 added the character U+0BB6 TAMIL LETTER SHA
and as a consequence, the mapping should be updated to <U+0BB6, U+0BCD,
U+0BB0, U+0BC0
*********************
இவ்வாறு, ஸ்ரீ க்குப் போல, க்ஷ எனற கூட்டெழுத்துக்கும் யுனிக்கோட் அமைப்பாளர்கள் ஏதாவது
நியமக்கட்டளைகளைத் தெரிவித்துள்ளனரா? இல்லை என்றே எண்ணுகிறேன். கூட்டலாக இருப்பினும்
கூடாமல் இருப்பினும் ஓசையின் அடிப்படையில் ஒன்றே என்பதாக நினைக்கிறேன். எனவே கூடாமல்
தென்படுவதால் என்ன தவறு? ஆனாலும் எல்லா எழுத்துருக்களும் ஒரே மாதிரியாக
தென்படுவதுதான் சாலச்சிறந்தது. அதாவது இவ்விரண்டில் ஒன்றுதான் சரி என்று நியம் ஒன்று
இருப்பின் நன்றே. இதைப்பற்றி மேலும் தகவல்கள் / கருத்துக்கள் பார்க்க விரும்புகிறேன்.
அடுத்து நீங்கள் கூறியுள்ளது: வருடம் முதலியவற்றினை குறிக்கும் தமிழ் 99 வி.ப வில்
கொடுக்கப்பட்டுள்ள குறியீடுகள் சரிவரவில்லை. குறியீடுகள் என்று சொன்னது symbols
தானே?. unicode.org இன் தமிழிற்கான U0B80.pdf கோப்பில் கடைசிப் பகக்த்தில் (page
499) காணப்படும் 8 symbols களைப் பார்க்கலாம். இதில் அப்பக்கம் உள்ளது:
http://i10.tinypic.com/3yns4xz.png - அத்துடன் இப்பக்கத்தில் இடதுபுறமாக தமிழ்
99 உருவரையையும் ஒப்பிடுதலுக்காகக் காட்டியுள்ளேன். m17n-தமிழ் 99 முலம்
உள்ளிடுகையில் இந்த 8 குறியீடுகளும் நான் முயற்சித்த எல்லா எழுத்துருக்களிலும் சரியாகவே
தெரிகின்றன - பார்க்க மேற்குறிப்பிட்ட : http://i16.tinypic.com/4br4dig.png
ஆக, ராம்தாஸ் மேற்கூறிய இக் குறியீடுகள் தொடர்பாக தாங்கள் கண்ட குறைபாடுகள் யாவை ?
> தமிழ்99 விசைப் பலகை க + அ = க என்ற ரீதியில் வடிவமைக்கப் பட்டுள்ளதற்கு ப்ரத்யேக
> காரணம் உள்ளதா?
> க் + அ = க என்பது ஏன் கடைபிக்கப் படவில்லை? எவரேனும் அறிந்தவர் சொல்லுங்களேன்...
இதைப் பற்றி எனது கருத்துகளை பின்னர் ஒரு நாள் எழுதுகிறேன்.
>
> இப்பொதிகளின் தொகுப்பில் Remington இல்லை எனத் தோன்றுகிறது. மேலும் அப்பொதியுள்
> அடக்கப் பட்டுள்ள scim-additional-tables ல் Phoenetic & Inscript விசைப்பலகைகள்
> மட்டும் உள்ளது.
>
> ரெமிங்கடன் முறை இயல்பாக தற்போது scim-additional-tables பொதியில்
> சேர்க்கப்பட்டுள்ளதால் அடுத்த Feisty வெளியீட்டில் இது இடம்பெறும் என நம்பலாம்.
>
scim இன் தாயகம் (upstream project) www.scim-im.org சென்று பார்க்கையில்
ta-remington முதலில் சேர்க்கப்பட்டது கடைசியாக 2006-ஒக்டோபரில் வெளியிடப்பட்ட
scim-tables 0.5.7 (பார்க்க :
http://www.scim-im.org/news/imengines_news/scim_tables_0_5_7 ).
scim-additional-tables என்பது சீன, ஜப்பானிய, கொரிய (CJK) மொழிகளுக்கான
scim-tables தவிர்ந்த, ஏனைய scim-tables களை உபுண்டுவில் சேர்ப்பதற்காக
உபுண்டுவினால் உருவாக்கப்பட்ட தொகுப்பு. அது main repo / utilities இருந்து
கொடுக்கப்படுகிறது - அதாவது Canonical நிறுவனத்தின் பொறுப்பிலிருந்து. இதுவரை
அக்காப்பகத்தில் இருந்து எட்ஜிக்கு 0.5.6-1build1 என்பதுதான் கொடுக்கப்படுகிறது.
தாங்கள் " ரெமிங்கடன் முறை இயல்பாக தற்போது scim-additional-tables பொதியில்
சேர்க்கப்பட்டுள்ளதால்" என்று கூறுவது புரியவில்லை. வேறு ஏதாவது cvs யில் உள்ளதா?
நண்பர் மயூரன் தயாரித்த தபுண்டு பொதியும், உபுண்டுவின் scim-tables-additional
(0.5.6-1build) பொதியையே உள்ளடக்கியதால் ரெமிங்டன் வி.ப. அதிலும் இல்லை.
ஆயினும் scim-tables 0.5.7 யை www.scim-im.org இலிருந்து பதிவிறக்கம் செய்து
அதினுள்ளுள்ள Tamil-remington.txt.in என்ற கோப்பை வெளியெடுத்து பின்வரும் கட்டளை
மூலம் இருவாக்கலாம் (compiling) :
scim-make-table scim-make-table ~/Tamil-remington.txt.in -b -o
~/Tamil-remington.bin
மேற்குறிபிட்ட கட்டளை Tamil-remington.txt.in கோப்பு பயனரின் அகவடைவுவில் (home
directory) இருப்பதாயின். வேறு இடத்தில் இருப்பின் ~/ என்பதற்கு பதிலாக சரியான
இடத்தை எழுதவும். சரியாக அக்கட்டளை செயலிக்குமாயின் வெளிவரும் பைனரி கோப்பை scim
யின் GUI இடைமுகமூடாக நிறுவலாம். அல்லது நேரடியாக பயனரின் ~/.scim/user-tables
என்ற அடைவுவினுள் சேர்க்கலாம்.
NRC-FOSS யின் தளதில் இருந்தும் பதிவிறக்கி நிறுவலாம் தானே?
> இங்ஙனம் scim-additional-tables பொதிபிலேயே Tamil99 மற்றும் Bamini யும்
> சேர்க்கப்படுதல் நலம்.
>
> <http://www.scim-im.org/downloads/imengines_download>
மீண்டும் குறிப்பிடுகிறேன் scim-additional-tables என்பது உபுண்டுவின் தொகுப்பு.
நீங்கள் விரும்பும்படி scim-tables முறைக்கு தற்போதில்லாத ஏனைய வி.ப. அமைபுக்கள் உள்
கொண்டு வர வேண்டுமாயின், முதலில் upstream project யினுள் அவை வர முயலுங்கள் -
இங்கு upstream project ஆனது scim-im.org ஆகும். அதன்பின் ubuntu நிறுவனத்தினர்
scim-additional-tables உள் சேர்க்கட்டும். (ரெமிங்டனை NRC_-FOSS முன்னெடுத்தது போல)
2005 கடைசி மாதங்களில் ரெட்ஹாட்டின் இந்திய மொழிக்குழுவினர் முதலில் inscript,
phonetic என இரண்டையும் scim-tables க்குத்தான் உருவாக்கினர். அக்காலத்தில் அக்குழுவின்
அங்கத்தினர் திரு. ஜென்ஸ் பீட்டர்சன் எனபவருடன் எனது சில வினாக்களுக்காக மடல்கள் மூலம்
தொடர்பு கொண்டிருந்தேன். அப்போது அவர் கூறியிருந்தார் பின்வரும் காலங்களில் அவர்கள்
scim-tables விட m17n க்குத்தான் முக்கியத்துவம் கொடுக்க உள்ளதாக. அதே போல நண்பர்
பீலிக்ஸ் எழுதிய தமிழ்99 மற்றும் ta-typewriter இரண்டும் scim-tables க்கு
கொடுக்கப்படவில்லை - m17n க்கு மட்டுமே.
உண்மையில் ரெட்ஹாட் இந்திய மொழிக்குழுவினரது m17n பங்களிப்புக்கள் எல்லாம் lookup-table
முறைகளே. அதாவது scim-tables க்கு எழுதும் assignment statements
எல்லாவற்றையும் அப்படியே m17n க்கான mim கோப்பில் உபயோகிப்பது. m17n-lib க்கே
உரித்தான LISP அடிப்படையிலான programming steps அவர்கள் பயன்படுத்தவில்லை.
உதாரணத்திற்கு m17n-ta-trans அத்துடன் மயூரனின் m17n-ta-avarangal என்பன
பொருத்தமான இடங்களில் LISP statesment பாவிக்கின்றன. வேகம் குறைந்த கணினி சூழல்களில்
tables முறைகளை விட m17n (ta-trans, ta-avarangal போன்றவைகள்) முறைகள் தான்
சிறப்பாக இருக்கும் என்பதைக் கண்டிருக்கிறேன். மேலும் முக்கியமாக m17n, scim உடன்
மட்டுமல்லாது வேறு உள்ளிடல் முறைமைகளுடனும் (uim, iiimf) பின்முகமாக இயங்குவதற்கு
சாத்தியக் கூறுகள் உள்ளன. எட்ஜியில் uim உடன் m17n செயலிக்கிறது என்பதை நான்
கூறியிருந்தேன்.
ஆக scim-tables முறைக்கு முன்னெடுத்துச்செல்கையில் m17n முறை தேவையில்லை என்ற
கொள்கையை யாரும் முன்வைப்பின் நான் ஏற்றுக்கொள்வதற்கில்லை.
> மேலும் scim-additional-tables அவசியமில்லாமல் அனைத்து பாரதிய மொழிகளுக்கான
> விசைப் பலகைகளையும் நிறுவுகிறது. இதனைத் தவிர்த்து scim-tamil-tables என தமிழ்
> பொதி ஒன்றினை செய்வது அதிக ஆற்றல் உள்ளதாய் இருக்கும்.
>
இது உபுண்டு நிறுவத்தினரிடம் கோர வேண்டியது. ஒரு பொதியானத எப்போதும் பல கோப்புகளை
உள்ளடக்கியது. ஒவ்வொரு மொழிக்கும் தனித்தனி பொதியெனின் (ரெட்ஹாட்டினர் அவ்வாறு
செய்கின்றனர் - பார்த்துள்ளேன்) பொதிகளின் எண்ணிக்கைகள் பெருகியிருக்கும். நமது apt,
synaptic போன்ற பொதி முகான்மைச் செயலிகளுக்கு எடை குறைந்த ஆனால் எண்ணிக்கை கூடிய
பொதிகளை கையாள்வது திறமையை (efficiency) குறைக்குமா? தாங்கள் சொல்லும்
அவசிய்யமில்லா அனைத்து வி.ப. க்களையும் நிறுவுகிறதுு என்ற குறைபாடை கையாள இன்னொரு
வழியானது நிறுவப்பட்ட எல்லா tables களையும் முதலில் GUI இல் தேர்வுகளிலிருந்து நீக்கி
விட்டு (அதாவது சரிக்கான் குறியை நீக்குதல்) நமக்கு தேவையானவைகளை மட்டும் வேண்டும் என
மீண்டும் தேர்வுக்குறியிடல்.
> தங்கள் கருத்துக்களை ஆவலுடன் எதிர்பார்க்கிறேன்...
>
> தொடரும்...
>
தங்கள் அடுத்த மடலும் கண்டேன் சிறிது நேரம் முன். இன்று மாலையின் பின் நான் தொடர்வேன்.
~சேது
More information about the Ubuntu-l10n-tam
mailing list