ইউনিকʼড নামেৰে পৰিচিত কম্পিউটাৰ আৰু ইণ্টাৰনেটৰ ভাষা জড়িত মানক গঢ়া আন্তঃৰাষ্ট্ৰীয় অনুস্থানটিৰ বিষয়ে খবৰ কাগজত আৰু আন ঠাইত কিছু আলোচনা হৈ থকা দেখা যায় । ইয়াৰ পৰা বুজিব পাৰি যে এই অনুস্থানটিৰ মানক বিলাকত অসমীয়া ভাষাটোক যোগ্য স্থান দিয়া হোৱা নাই বুলি মানুহৰ এটা ধাৰণাৰ জন্ম হৈছে। অৱশ্যে যোগ্য স্থান নিদিয়াৰ ধাৰণাটো অশুদ্ধ আৰু কেইটামান ভুল বুজাবুজিৰ বাবে হৈছে বুলি ভবাৰ থল আছে। ভাঙি-পাতি কিছু অধ্যয়ন কৰাৰ পাছত বুজিব পৰা গৈছে যে বাংলা ভাষাৰ পৰা সুকীয়া ৰূপে ইউনিকʼডে অসমীয়া ভাষাক স্পষ্টভাৱে নিজৰ স্থান দিছে। বৰ্ত্তমান ইউনিকʼডৰ মানক কাকতবোৰ অধ্যয়ন কৰাৰ পাছত এই মন্তব্যটোলৈ আহিলোঁ। এই কামত, সহায়ক ভিত্তিৰে, আগতে শিকা কিছু কথা আৰু বহু বছৰ আগতে আদায় কৰা ভাৰতীয় লিপিৰ কম্পিউটাৰ প্ৰক্ৰিয়াৰ বিষয়ে অভিজ্ঞতা [১] খিনিয়েও অলপ সহায় কৰিছে। ইউনিকʼডত লিপিৰ নামটোৰ ক্ষেত্ৰত নিশ্চয় কিছু আশংকা আছে। ইয়াৰ বিষয়ে বহুজনে আগতে উল্লেখ কৰিছে । কিন্তু ইয়াৰ পাছৰ ব্যাখ্যাৰ পৰা বুজা যায় যে এই আশংকাখিনি কম্পিউটাৰত আৰু ইণ্টাৰনেটত অসমীয়া ভাষাৰ প্ৰচাৰৰ বাবে তুলনাত্মকভাবে বেছি গুৰুত্বপূৰ্ণ নহয়। প্ৰৱন্ধটিৰ বাকী অংশত এই নিৰ্ধাৰণসমূহ বহলাই বুজোৱাৰ এটি চেষ্টা কৰা হৈছে ।
ইণ্টাৰনেটত অসমীয়া ভাষাৰ অৱলম্বনৰ বিষয়ে, আৰম্ভণিতে উক্ত আলোচনাবোৰত “লিপি” আৰু “ভাষা”ৰ পাৰ্থক্যৰ বিষয়ে বহুখিনি বিভ্ৰান্তি দেখা পোৱা যায় । যদিও পাৰ্থক্যবোৰ সূক্ষ্ম, ইউনিকʼড যিহেতু কম্পিউটাৰ সম্বন্ধি মানক, সেয়ে এই পাৰ্থক্যবোৰ স্পষ্টভাৱে বৰ্ণনা কৰিবলৈ বাধ্য।
উদাহৰণ স্বৰূপে, পৰৱৰ্তী বাক্যটো ৰোমান লিপিত মই ইংৰাজী ভাষাত লিখিলোঁ। I speak a little English. (মই অলপ ইংৰাজী কʼব পাৰোঁ।) এতিয়া, একেই ৰোমান লিপিত মই ফৰাচী ভাষাৰ বাক্য এটাও লিখিলোঁ । je parleunpeu de francais. (মই অলপ ফৰাচী কʼব পাৰোঁ।) ইয়াৰপৰা দেখা যায় যে দুটি ভাষায়ে (ইংৰাজী আৰু ফৰাচী) একেই লিপি (ৰোমান) ব্যৱহাৰ কৰে।
লিপি আৰু ভাষাৰ এই পাৰ্থক্যটো ইউনিকʼডে মানকত স্পষ্টকৈ এনেধৰণে কৰিছে। লিপিৰ কাৰণে “কʼড চাৰ্ট” (code chart) আৰু ভাষাৰ কাৰণে বেলেগে “লোকাল” (locale) ইউনিকʼডত পৰিভাষিত কৰা হৈছে। কʼড চাৰ্ট এখনত একো একোটা আখৰৰ কাৰণে ইউনিকʼডে একো একোটা ক্ৰমাংক নিৰ্ধাৰণ কৰি দিয়ে । এই ক্ৰমাংকবোৰক “কʼড” (code) বুলি কোৱা হয়। সেয়ে, “লেটিন” নামৰ কʼড চাৰ্ট এখন দিয়া হৈছে (আমি যাক ৰোমান লিপি বুলি কওঁ, তাৰে এটি বিস্তাৰিত ৰূপক বৰ্ণনা কৰাৰ বাবে) আৰু তাৰ পাছত ইংৰাজী, ফৰাচী ইত্যাদি ভাষাৰ কাৰণে একো একোটা লোকাল দিয়া হৈছে যিবোৰে এই কʼড চাৰ্ট খন ব্যৱহাৰ কৰে।
এইখিনিতে এটি প্ৰশ্ন উত্থাপন কৰিব পাৰি যে ইউনিকʼডে এই ভাষাবোৰৰ কাৰণে একেখন কʼড চাৰ্ট কিয় নিৰ্ধাৰণ কৰিলে ? ইয়াৰ কাৰণ হʼল যে ইংৰাজী, ফৰাচী, ডাত্চ, জাৰ্মান আৰু আন সম্পৰ্কীয় ভাষাবোৰৰ ৯০% লিখিত লিপি একেই। এই কথাটো লক্ষ্য কৰি, ইউনিকʼডে লেটিন নামেৰে কʼড চাৰ্ট এখন বনাই এই ভাষাবোৰত ব্যৱহাৰ হোৱা গোটেইবোৰ আখৰক তাতে সুমুৱাই দিলে । এইদৰে, কম সংখ্যা কʼড যাপন কৰি সম্পৰ্কীয় ভাষা কেইটিত ব্যৱহাৰ হোৱা গোটেইবোৰ আখৰক ইউনিকʼডে সামৰি লʼব পাৰিলে। এই ব্যৱস্থা এনেকৈ কৰা হʼল কাৰণ কম্পিউটাৰত ক্ৰমাংকলৈ ৰূপান্তৰ কৰা পদ্ধতি সাজোঁতে এটি স্বাভাৱিক মিতব্যয়িতাৰ প্ৰযত্ন সদায় থাকে । সেই অনুচৰে, ইউনিকʼডে এই নীতিক দিহা-বুদ্ধি হিচাবে ভাষা মানকৰ সকলো কামতে ব্যৱহাৰ কৰে।
গতিকে অসমীয়া আৰু বাংলা ভাষাৰ ক্ষেত্ৰতো ইউনিকʼডে এই দিহা-বুদ্ধিটো ব্যৱহাৰ কৰাত আচৰিত হʼব নালাগে। অসমীয়া আৰু বাংলা লিপিৰ মাজত কিছু পাৰ্থক্য আছে, কিন্তু ৯০% আখৰ দুয়ো লিপিতে একেই । ইয়াৰপৰা বুজিব পৰা যায় যে ইউনিকʼডে বনোৱা অসমীয়া নতুবা বাংলা ভাষাত ব্যৱহাৰ কৰা সকলো আখৰ সম্বলিত এখন যুটীয়া কʼড চাৰ্টৰ ব্যৱহাৰোপযোগিতাৰ কথা ।
কিন্তু অসমীয়া আৰু বাংলা লিপিৰ কʼড চাৰ্টখন বনাওতে ইউনিকʼডে গোটেইখিনি কাম শুদ্ধকৈ কৰিব পাৰিলে নে ? নোৱাৰিলে; ইউনিকʼডে কʼড চাৰ্টখনৰ নামাকৰণৰ কামত কিছু ভুল কৰিলে। নামটো “বেঙ্গলী” (Bengali) কʼড চাৰ্ট বুলি দি, ইউনিকʼডে অসমীয়া জনসাধাৰণৰ অনুভূতিত আঘাত সানিলে যাৰ মূলতে হʼল ভাষা দুটিৰ সম্বন্ধৰ বুৰঞ্জীৰ কিছু কথা, যাক এই কাৰিকৰি আলোচনাত মই সুমুৱাব বিচৰা নাই । এইখিনি কʼলেই যথেষ্ট যে, নামৰ এই আশংকাটোৰ বিষয়ে বহু জনৰ প্ৰচেষ্টাৰ ফলত, ইউনিকʼডে তেওঁলোকৰ যোগাযোগত কিছু সলনি আনিব ধৰিছে যে যদিও নামটো “বেঙ্গলী” কʼড চাৰ্ট, সেই কʼড চাৰ্টত অসমীয়া আখৰো আছে। তেওঁলোকৰ ৱেব-চাইটত এতিয়া কʼড চাৰ্টখনক “বেঙ্গলী এণ্ড এচেমীজ” (“Bengali and Assamese”) বুলি উল্লেখ কৰে http://www.unicode.org/charts/।
কিন্তু আচল মানক খনত কʼড চাৰ্টখনৰ নামৰ বিষয়ে এতিয়াও কিছু আশংকা থাকি যায় । মানক কাকতখনত এতিয়াও ইয়াক “বেঙ্গলী” কʼড চাৰ্ট বুলি কোৱা হয়, যদিও ৱেব-চাইটতত ইয়াক “বেঙ্গলী এণ্ড এচেমীজ” কʼড চাৰ্ট বুলি উল্লেখ কৰে । প্ৰশ্ন হয়, মানক কাকতত দিয়া কʼড চাৰ্টৰ আচল নামটোৱে যাতে দুয়ো ভাষাকে অন্তৰ্গত কৰি লʼব পাৰে সেইবিষয়ে ইউনিকʼডে আৰু কিবা কৰিব পৰাৰ থল আছে নেকি ?
নিশ্চয় আছে, কিন্তু তেনে নাম সলনিৰ ফলস্বৰূপে সকলো ছফ্টৱেৰ প্লেটফৰ্মত বহু কাম ওলাব য’ত ইতিমধ্যে ইউনিকʼড মানক খনক ৰূপায়ণ কৰা হৈছে। তেনে প্লেটফৰ্মৰ মাজত হʼল মাইক্ৰʼচফ্ট ৱিন্ডʼজ আৰু ইউনিক্চৰ সকলো ভিন ভিন ৰূপ (ফ্ৰী-বি-এচ-ডি, লিনাক্চ, মেক-ও-এচ, চোলাৰিচ, এন্ড্ৰʼইড ও-এচ, আই-ও-এচ, মাত্ৰ কেইটামানৰ নাম ল’বলৈ)। ইউনিকʼড মানকত থকা কʼড চাৰ্ট সমূহৰ (লেটিন, আৰবী, বেঙ্গলী ইত্যাদি) অৱলম্বনৰ বাবে এই সকলো প্লেটফৰ্মতেই ভিন ভিনকৈ চফ্টৱেৰ ইতিপূৰ্বে লিখা হৈছে। মানকৰ কোনো কʼড চাৰ্টৰ নামত হোৱা তেনে সলনিৰ পৰিণামত এয়ে হʼব যে সকলোবোৰ প্লেটফৰ্মৰৰ বাবে লিখা ছফ্টৱেৰৰ মৌলিক ৰূপত (source code) কিছু সলনি কৰিব লাগিব। এই কামটোৰ ভাৰটো পৰিব এনে লোকৰ হাতত যিয়ে প্লেটফৰ্মবোৰৰ কাৰণে চফ্টৱেৰ লিখে। সাল-সলনিখিনি কৰাৰ পাছত, একো একোটা প্লেটফৰ্মৰ কাৰণে ছফ্টৱেৰৰ একো একোটা সংস্কৰণ বিতৰণ কৰিব লাগিব যাৰ প্ৰভাৱ হাজাৰ হাজাৰ নিযুত কম্পিউটাৰ, টেব্লেট, স্মাৰ্ট-ফোন ইত্যাদি সংগণক সৰঞ্জামত বিশ্বব্যাপিভাৱে হʼব।
সেই কাৰণে, তেনে নাম সলনিৰ পৰা অসমীয়া ভাষাৰ নিবেশ, সংসাধন, বা প্ৰদৰ্শনত কি লাভ হʼব, তাৰ বিষয়ে ইউনিকʼডে সাৱধানে ভাৱি-চিন্তি লোৱাতো উচিত। দেখা গʼল যে তেনে নাম সলনিৰ পৰা অসমীয়াৰ কাৰণে কোনো লাভ নহয়। ইয়াৰ দুটা কাৰণ:
(১) বৰ্ত্তমানৰ কʼড চাৰ্টখনত অসমীয়া লিপিৰ নিবেশ, সংসাধন, বা প্ৰদৰ্শনৰ বাবে সকলো প্ৰয়োজনীয় আখৰৰ কʼড এতিয়াই বিদ্যমান আৰু
(২) ভাষাৰ আন গুণ যিবোৰ ভাষা বিশিষ্ট, যেনে বৰ্ণমালা-ক্ৰমান্বয়, ইউনিকʼডে লিপিৰ বাহিৰত আন উপযুক্ত মানকত অসমীয়াৰ কাৰণে পৰিভাষিত কৰিছে। পৰবৰ্তী খণ্ডত ভাষা বিশিষ্ট গুণবোৰৰ বিষয়ে আলোচনা কৰিম, কিন্তু এইখিনিতে বুজাতো আৱশ্যক যে আলোচনা কৰা কথাখিনিৰ কাৰণেই ইউনিকʼড অনুষ্ঠানে কʼড চাৰ্টৰ নামটো সলনি কৰা নাই আৰু ৱেব-চাইটত “বেঙ্গলী এণ্ড এচেমীজ” বুলি উল্লেখ কৰাৰ পৰ্যায়তে ৰʼলে।
মন কৰিব যে বৰ্ণমালা-ক্ৰমান্বয়ৰ নিচিনা বিশিষ্ট গুণবোৰ আন সম্পৰ্কীয় ভাষাৰ বাবেও বেলেগ; সেয়ে ইউনিকʼডে ইয়াক এটা নতুন সমস্যা বুলি নাভাৱে। চ্বীডিছ ভাষাৰ বৰ্ণমালাৰ শেষত তিনিতা অতিৰিক্ত স্বৰবৰ্ণ ৰখা হৈছে (…, X, Y, Z, Å, Ä, Ö), দেনিছ আৰু নৰ্ৱেগিয়ান ভাষাৰ নিচিনাকৈ, কিন্তু লিখা ৰূপবোৰ আৰু বৰ্ণমালা-ক্ৰমান্বয়তো বেলেগ। চ্বীডিছ, দেনিছ, নৰ্ৱেগিয়ান ভাষাকেইটিৰ কাৰণে, ইউনিকʼডে এই পাৰ্থক্যবোৰ পৰিভাষিত কৰিছে লেটিন কʼড চাৰ্টৰ বাহিৰত ;সেই ভাষা কেইটিৰ লোকালত। ঠিক তেনেকৈ, অসমীয়া আৰু বাংলা ভাষাৰ বেলেগ বৰ্ণমালা-ক্ৰমান্বয় দুটা সেই একে বিধিৰে পৰিভাষিত হৈছে; ভাষা দুটিৰ লোকালত।
এতিয়া প্ৰশ্ন হʼল – ইউনিকʼডে অসমীয়া ভাষাক ঠিক কেনেধৰে অৱলম্বন কৰে? লোকালবোৰৰ বিৱৰণ ইউনিকʼডে ইয়াতে ৰাখে ঃ- Unicode Common Locale Data Repository (CLDR) http://cldr.unicode.org/, যাক আমি ʼইউনিকʼড লোকাল কোষʼ বুলি কʼব পাৰো।
এই কোষত অসমীয়া ভাষাক ʼএচেমীজʼ লোকাল হিচাপে পূৰ্ণৰূপে পৰিভাষিত কৰা আছে ভাষাৰ বহুতো গুণৰ বিৱৰণৰ মাজেৰে, যেনে:
এই বিৱৰণসমূহ CLDR-ত core.zip নামৰ ফাইল এটাত দিয়া আছে যাক আগতে দিয়া কোষৰ লিংকৰ পৰা আনি লʼব পাৰি। core.zip ফাইলটো খুলিলে, তাৰ ভিতৰত থকা এই ফাইলকেইটাৰে এচেমীজ লোকালটো বৰ্ণনা কৰা হৈছে:
./common/casing/as.xml
./common/collation/as.xml
./common/main/as.xml
পৰবৰ্তী প্ৰবন্ধত, ফাইলসমূহৰ ভিতৰত থকা কথাখিনিৰ বিষয়ে বহলাই লিখিম যাতে বুজিব পৰা যায় সেইবোৰে অসমীয়া ভাষাৰ সকলো গুণক কেনেকৈ প্ৰতিৰূপিত কৰে।
সাৰাংশ
সাৰাংশত এইটোৱে কʼব পাৰি যে ইউনিকʼডে ইতিপূৰ্বে প্ৰতিষ্ঠা কৰা কʼড চাৰ্টখন (যদিও ইয়াৰ নামটো বেয়াকৈ দিয়া হৈছে) আৰু ʼএচেমীজʼ (‘as’) লোকালখন দুয়োকে লৈ, অসমীয়া ভাষাত পঢ়া আৰু লিখাৰ বাবে ইণ্টাৰনেটতত প্ৰয়োজনীয় সকলো বস্তু আগবঢ়াইছে [২]। এই কথাৰ প্ৰমাণ হিচাবে আমি এই কথা ক’ব পাৰোঁ যে এই প্ৰৱন্ধটি মই ইউনিকʼডৰ জৰিয়তে নিবেশ কৰি, বহুটো কম্পিউটাৰত সংসাধন হৈ, আপোনোৰ কম্পিউটাৰত প্ৰদৰ্শিত হৈছে যাতে আমি অসমীয়া ভাষাত এই আলোচনাটি লিখিতভাৱে কৰিব পাৰিছোঁ ।
তথ্য সুত্ৰ
[১] এই বিষয়ত ১৯৮০ চনৰ ওচৰে-পাজৰে কম্পিউটাৰত ভাৰতীয় ভাষাৰ লেখনৰ সংসাধনৰ ওপৰত কাম কৰি মই কিছু অৱগতি পাইছোঁ । সহকৰ্মীৰ সৈতে লিখা সমকক্ষ-পৰ্য্যালোচিত আৰু প্ৰকাশিত ইংৰাজী লেখনি এখনৰ লিংকটো ইয়াতে দিলো: https://docs.google.com/open?id=0B7lCYS3yYAjhdEpsclFmVWlLQk0।
[২] ইণ্টাৰনেটত নিৰ্ভৰযোগ্যভাৱে অসমীয়া ভাষাৰ তথ্য সন্ধান কৰাত বাধা এটা আছে কিন্তু তাক আঁতৰোৱাৰ বাবে ইউনিকʼডৰ পৰা একো নালাগে । শুধৰণিখিনি অনুসন্ধানৰ বাবে বনুৱা গুগল আৰু বিংৰ নিচিনা সেৱাবোৰতহে লাগে। বাধাটো, তাৰ সমাধানটো আৰু এতিয়াৰ কাৰণে বাধাটো নেওচি যাবলৈ এটা কিটিপৰ বৰ্ণনাৰে লেখনি এখনৰ লিংকটো ইয়াতে দিলো: https://docs.google.com/document/d/1gcgX1hua22rpvFFtgG50PVJILq64fr3MwWoJU6o7VD0/edit।
[৩] অসমীয়া ভাষাৰ তথ্য সন্ধান কৰাত বাধাটো নেওচি যোৱাৰ কিটিপটো ৰূপায়ণ কৰা এটা ফায়াৰফক্চ প্লাগ-ইন ইয়াত আছে: http://mycroft.mozdev.org/search-engines.html?name=Google+%28as%29+Assamese+%28Adds+ৰ%29।
লেখক: শ্ৰী সত্যজিৎ নাথ
শেহতীয়া উন্নীতকৰণ: : 4/27/2020