புதன், ஜூன் 16, 2021

அலகு 3 - அகர வரிசையாக்கம்

https://kaninitamil.wordpress.com/2018/02/25/tamil-sorting/ 

தமிழ் எழுத்துக்களின் அகரவரிசை

மூலம்: எதிர்நீச்சல் வலைப்பதிவு
அகரவரிசை என்பது ஒரு மொழியின் பல சொற்களை ஒன்றன் பின் ஒன்றாக அடுக்கி ஒழுங்குப்படுத்தும் முறையாகும். இது மொழி இலக்கணத்திற்கு நேரடி தொடர்பில்லை என்றாலும் மொழியினைப் படிப்பவருக்கு எளிதாக்கவே அகரவரிசை பயன்படுகிறது. தற்காலத்தில் குறிப்பாகக் கணினி பயன்பாட்டுச் சூழலில் அகரவரிசைப் படுத்தலுக்குப் பல கருவிகள் உள்ளன. பொத்தானை அழுத்தினால் அகர  வரிசையில் சொற்களை ஒழுங்குப்படுத்த முடியும். பெரும்பாலும் மைக்ரோசாப்ட் போன்ற சொல்லாளர்களில் sort செய்து கொள்கிறோம். ஆனால் தமிழில் அகரவரிசைப்படுத்தி எழுதுதல் என்பது பொதுவாக ஒரே மாதிரி இருந்தாலும் இரண்டு முக்கிய குழப்பங்கள் நிகழ்கின்றன. மேலும் கிரந்த எழுத்தும், நகர, னகர, லகர,ளகர, ழகர ஒழுங்கும் மாற்றுகின்றன.



இந்த மூன்று குழப்பங்களை ஒவ்வொன்றாகப் பார்ப்போம். ஆயுத எழுத்தான “ஃ” என்பது சில இடங்களில் “அ”விற்கு முன்னும் “ஔ” விற்குப் பின்னும் வருகிறது. அடுத்து ஒற்றெழுத்துக்கள் உயிர்மெய் எழுத்திற்கு முன்னும்  பின்னும் வருகின்றன. அதாவது “க”க்கு முன் “க்” அல்லது “கௌ”க்குப் பின் “க்”. இவ்விரண்டு குழப்பங்களும் பல பரவலாகப் புழக்கத்தில் உள்ளன.  இறுதியான குழப்பமான ஒழுங்கு மாறுதல் என்பது ஒருங்குறி வரிசையில் ஏற்பட்ட வரிசைமுறையே காரணம். ஒருங்குறியில் நுட்பக் காரணங்களால் ஃ, அ, ஆ, இ, ஈ, உ, ஊ, எ, ஏ, ஐ, ஒ, ஓ, ஔ, க, ங, ச, ஜ, ஞ, ட, ண, த, ந, ன, ப, ம, ய, ர, ற, ல, ள, ழ, வ, ஶ, ஷ, ஸ, ஹ என்றே வரிசைப்படுத்தியுள்ளனர். இதனால் சராசரி கணினி மென்பொருள் சகரத்திற்குப் பின் ஜகரம் என்றே தமிழில் வரிசைப்படுத்தும். இது நுட்பப் பிழை என்பதால் முறையாகத் திருத்தி எழுதிவிடலாம்; அதுசரி என்று நமக்கு விளங்குகிறது. மைக்ரோசாஃப்ட் 2010 பதிப்பிற்குப் பின் அதன் வரிசைப்படுத்தலில் இச்சிக்கலை நீக்கியுள்ளது. அதே போல சில மென்பொருட்களும் இந்தச் சிக்கலைச் சீர் செய்தாலும் மேலே சுட்டியுள்ள இரு குழப்பம் இன்னும் நீடிக்கின்றன. 

கீழ்க்கண்ட வரிசையே சீரானது அதையே பயன்படுத்துவோம்.

அனைத்து கணினி மொழியிலும் தமிழுக்கு ஏற்ப வரிசைப்படுத்த முடியும். சாதாரணப் பயனர்கள் தங்கள் சொற்களை இணையத்தில் அகரவரிசைப்படுத்த சுளகு (http://dev.neechalkaran.com/p/sulaku.html) கருவியைப் பயன்படுத்தலாம்.