Logo

কৃত্রিম বৃদ্ধিমতায় বাংলায় যুক্ত হলো আরও ৩ ডিজিটাল সেবা

অনিন্দ্য বাংলা
রবিবার, মার্চ ২৪, ২০২৪
  • শেয়ার করুন

অনিন্দ্যবাংলা অনলাইন ডেস্ক:

  • কৃত্রিম বুদ্ধিমত্তার যুগে বাংলা ভাষা যাতে পিছিয়ে না পড়ে, সেই লক্ষ্যে বেশ কিছু উদ্যোগের কাজ চলছে পুরোদমে। তাদের প্রয়োজনীয় সহায়তা ও প্ল্যাটফরম দেওয়ার লক্ষ্যে গড়া হয়েছে ‘বাংলা ডট গভ ডট বিডি’। এদের উদ্যোগে বাংলা লেখা, পড়া এবং মুদ্রিত ডকুমেন্টকে ইলেকট্রনিক করার জন্য তৈরি করা হয়েছে নতুন তিনটি সেবা। বিস্তারিত জানাচ্ছেন এস এম তাহমিদ

তথ্য ও যোগাযোগ প্রযুক্তি বিভাগের অধীনে এবং বাংলাদেশ কম্পিউটার কাউন্সিলের তত্ত্বাবধানে পরিচালিত প্রজেক্টটি আন্তর্জাতিক অঙ্গনে যাতে বাংলা শীর্ষস্থানীয় ভাষা হিসেবে প্রতিষ্ঠিত থাকেসেই লক্ষ্যে গবেষণা ও উন্নয়নের মাধ্যমে তথ্যপ্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণে কাজ করে যাচ্ছে। এ বছর মহান মাতৃভাষা দিবস উপলক্ষে প্রজেক্টটি তিনটি নতুন সেবা চালু এবং একটি নতুন বাংলা ফন্ট প্রকাশ করেছে।

বাংলা লেখাপড়া এবং মুদ্রিত ডকুমেন্টে ইলেকট্রনিক করাকে ঘিরে তৈরি করা হয়েছে নতুন তিনটি সেবা। প্রথমে আছে ‘কথা’, এটির কাজ মৌখিক বাংলাকে লিখিত ডকুমেন্টে লিপ্যন্তর করবে।

তারপর আছে ‘উচ্চারণ’, এটির কাজ লিখিত বাংলা ডকুমেন্ট পড়ে শোনানো। মুদ্রিত বা হাতে লেখা বাংলাকে পিডিএফ বা ডক ফাইলে রূপান্তর করার জন্য আছে ‘সেবা বর্ণ। সেবাগুলো ‘বাংলা ডট গভ ডট বিডি ওয়েবসাইট থেকেই ব্যবহার করা যাবে। সেবাগুলো পরীক্ষা করার জন্য অ্যাকাউন্ট না করলেও চলবেতবে পূর্ণাঙ্গ সুবিধার জন্য বিনা মূল্যে অ্যাকাউন্ট করে নিতে হবে।

মৌখিক বাংলাকে ডকুমেন্ট করবে ‘কথা

কথা সেবাটির মূলে আছে অটোমেটিক স্পিচ রিকগনিশন বা ‘এসিআর সিস্টেম’, যা ‘স্পিচটুটেক্সট অথবা ‘এসটিটি নামেও পরিচিত। কথ্য বাংলা ভাষাকে টেক্সট ফরম্যাটে রপান্তর করার জন্য বিশেষভাবে সেটি ডিজাইন করা হয়েছে। বাংলা ভাষার কথাকে সহজেই যাতে টেক্সটে রূপান্তর করা যায়সে জন্য একটি কার্যকরী বাংলা এসটিটি ইঞ্জিন ডিজাইন করা ছিল বড়সড় চ্যালেঞ্জ।

এসটিটি ইঞ্জিনটি আদর্শ বাংলার পাশাপাশি বিভিন্ন আঞ্চলিক উচ্চারণকেও ভবিষ্যতে সমর্থন করার জন্য ডিজাইন করা হচ্ছে।

এ ছাড়াও বিভিন্ন ধরনের বাক্য, যেমনঘোষণামূলকপ্রশ্নবোধক বা বিস্ময়সূচক বাক্যের মধ্যকার তফাত বুঝে সে অনুযায়ী যতিচিহ্ন বসাতে পারবে। বাক্যের জটিলতাও চিনতে সেটি সক্ষম। ইঞ্জিনটিকে ডিজাইন করা হচ্ছেযাতে কথার গতির তারতম্যও নিজ থেকেই বুঝে নিতে পারে। এতে করে স্বাভাবিক কথার প্রবাহ এবং বিরতিচিহ্নের তফাত সেটি ধরতে পারবে। ভয়েস রিকগনিশনে ত্রুটির ক্ষেত্রেসফটওয়্যারটি মাউসকিবোর্ড বা নতুন করে কণ্ঠস্বর ইনপুট দিয়ে করে প্রুফ রিডিং এবং সংশোধনের সুযোগ দেবে।
অন্যান্য অ্যাপ্লিকেশনের সঙ্গে একীকরণের সুবিধার্থে একটি অ্যাপ্লিকেশন প্রগ্রামিং ইন্টারফেস (এপিআইভবিষ্যতে উন্মুক্ত করা হবে। বিভিন্ন প্ল্যাটফরমের সঙ্গে সামঞ্জস্যের জন্য এসটিটি ইঞ্জিনের আলাদা সংস্করণ থাকবেযেমনএকটি লাইটওয়েট মোবাইল সংস্করণ এবং শক্তিশালী সার্ভার সংস্করণ।

কথাতে ব্যবহৃত এসটিটি ইঞ্জিনটি অনেক ধরনের কাজে ব্যবহার করা যাবে। যার মধ্যে রয়েছে কিবোর্ডের বিকল্প হিসেবে টেক্সট ইনপুট ডিভাইস হিসেবে কাজ করাযাতে প্রতিবন্ধী ব্যক্তিরাও সহজেই বাংলা টেক্সট ইনপুট করতে পারে। বাংলা ভাষার ভিডিওতে স্বয়ংক্রিয়ভাবে ক্যাপশন তৈরিও করতে পারবে এটি। অফিশিয়াল মিটিংডাক্তাররোগীর বা কল সেন্টারের কথোপকথনের লিখিত ডকুমেন্ট তৈরিতেও সেটি কাজে আসবে। সব শেষে আইওটিতে ব্যবহৃত যন্ত্র নিয়ন্ত্রণের মাধ্যমে বাংলাতেই স্মার্টহোম ডিভাইস নিয়ন্ত্রণ করাও যাবে কথা ব্যবহার করে।

বর্তমানে সেবাটি https://voice.bangla.gov.bd/ Iয়েবসাইটে যেয়ে সরাসরি কথা বলে বা কথার রেকর্ড আপলোড করার মাধ্যমে টেক্সট ফাইলে রূপান্তর করা যাবে। ইন্টারফেসটি খুবই সহজবোধ্যমাত্র দুটি বাটনের মাধ্যমেই সিস্টেমটির সব ফিচার ব্যবহার পাওয়া যাচ্ছে।

বাংলা লেখা পড়ে শোনাবে ‘উচ্চারণ

আজ টেক্সট টু স্পিচ বা টিটিএস প্রযুক্তি প্রায় সব ধরনের ডিভাইসেই দেখা যায়। ডিজিটাল লেখাকে উচ্চারিত ভাষায় রূপান্তর করাই তার কাজ। ‘উচ্চারণ প্রকল্পটির লক্ষ্য বিভিন্ন প্ল্যাটফরমে কাজ করবে এমন উচ্চমানের একটি বাংলা টিটিএস ইঞ্জিন তৈরি করা।

উচ্চারণের প্রধান লক্ষ্য থাকবে বাংলা ইউনিকোড টেক্সটকে শ্রবণযোগ্য বাংলা বক্তৃতায় রূপান্তর করাসেটি যাতে হয় বোধগম্যস্বাভাবিক এবং মানুষের কণ্ঠস্বরের অনুরূপযান্ত্রিক কণ্ঠ যাতে মনে না হয়। সে জন্য চাই প্রসোডিক এবং ইনটোনেশন বৈশিষ্ট্যের সঠিক নিয়ন্ত্রণ। বেশ কয়েক ধরনের কণ্ঠে সেবাটি ব্যবহার করা যাচ্ছে। কৃত্রিম বুদ্ধিমত্তা কাজে লাগিয়ে কণ্ঠের মুডপিচসময়গতি এবং ধরন (পুরুষ/মহিলা/প্রাপ্তবয়স্ক/শিশুএর সংমিশ্রণে তৈরি হবে একেকটি ভয়েস। বর্তমানে অবশ্য একটিই মডেল পুরুষ ও মহিলাদুই ধরনে পাওয়া যাবে। উচ্চারণ তৈরির সময় পাঠ্যের ফরম্যাটিংযেমনবোল্ড বা আন্ডারলাইন উপেক্ষা করা শেখানো হয়েছে। বাংলা অক্ষরযুক্তবর্ণবিরাম চিহ্ন ও বিভিন্ন বাক্যের ধরনযেমনজিজ্ঞাসানেতিবাচক ইত্যাদি শনাক্ত করাসে অনুযায়ী উচ্চারণের ধরন বদলানোর ফিচারও যুক্ত করেছে এটির নির্মাতারা। সংখ্যাতারিখসময়মুদ্রা ইত্যাদির সঠিক রূপান্তর করার পাশাপাশি বাংলা সংক্ষিপ্ত রূপআদ্যক্ষর এবং সংক্ষিপ্ত শব্দ শনাক্ত করাও ছিল বড় চ্যালেঞ্জ। ডকডকএক্সপিডিএফ এবং ওয়েব পেজের (এইচটিএমএলমতো বিভিন্ন ফরমেটের নথি থেকে পাঠ্য পড়তে এবং উচ্চারণ করতে সক্ষম উচ্চারণ।

উচ্চারণ প্রযুক্তিটি বাংলা ভাষাভাষীদের জন্য অনেক সুবিধা প্রদান করবে। দৃষ্টিপ্রতিবন্ধী ব্যক্তিদের জন্য যেমন সেটি সহায়ক হবেতেমনি ডকুমেন্ট এবং ওয়েবসাইটগুলোকে আরো সহজে অ্যাকসেস করার জন্যও কাজ করবে। একাধিক কাজ করার সময় বাংলা তথ্য কথা আকারে শোনার জন্যও কাজে আসবে। পড়ার অসুবিধা সম্পন্ন ব্যক্তিদের জন্য সহায়তা দেবে এটি। শিক্ষাগত এবং বিনোদনমূলক উদ্দেশ্যে ব্যবহার করার পাশাপাশি এই প্রযুক্তিটি বাংলা ভাষার ব্যবহার ও সংরক্ষণে গুরুত্বপূর্ণ ভূমিকা পালন করবে।

উচ্চারণ ব্যবহার করতে ভিজিট করতে হবে https://read.bangla.gov.bd/ ওয়েব সাইটটি। সরাসরি বাংলা ইউনিকোড বা বিজয় টাইপ করেও ইনপুট দেওয়া যাবেঅথবা অ্যাকাউন্ট করার পর লিখিত বাংলার ডকুমেন্ট ফাইলও আপলোড করে সেটা উচ্চারিত কথায় পরিণত করা যাবে।

মুদ্রিত ও হাতের লেখাকে ডকুমেন্ট করবে ‘বর্ণ

বর্ণ একটি বাংলা ভাষার জন্য তৈরি ‘অপটিক্যাল ক্যারেক্টার রিকগনিশন বা ‘ওসিআর’, এবং ভবিষ্যতে হাতে লেখা বাংলাকে বুঝার জন্য তৈরি হ্যান্ড রাইটিং রিকগনিশন বা এইচডাব্লিউআর হিসেবে কাজ করবে। ওসিআর প্রযুক্তি ছবি আকারে থাকা বাংলা ডকুমেন্টকে সম্পাদনাযোগ্য ও অনুসন্ধানযোগ্য টেক্সটে রূপান্তর করে থাকে। বর্তমানে ‘বর্ণ মুদ্রিত বাংলা লেখা উচ্চ নির্ভুলতার সঙ্গে চিহ্নিত করতে পারেহাতের লেখা নিয়ে জোরেশোরে কাজ চলছে। ওয়েবমোবাইল এবং সার্ভার এপিআইতিনটি উপায়েই বর্ণ কাজ করবে। মুদ্রিত বাংলা মডিউল কম্পিউটারটাইপরাইটার ও লেটারপ্রেসে রচিত নথিগুলো বুঝতে সক্ষম। ভবিষ্যতে হাতে লেখা মডিউল স্ক্যান করা ও সরাসরি টাচ স্ক্রিনের লেখার সঙ্গে কাজ করবে।

সেবাটি বিভিন্ন ধরনের বাংলা ফাইলযেমনপিডিএফজেপিজি ও পিএনজি থেকে বর্তমানে সম্পাদনাযোগ্য ও অনুসন্ধানযোগ্য টেক্সট তৈরি করতে পারে। টেক্সট থেকে বাংলার পাশাপাশি ইংরেজি টেক্সটছবিটেবিলসংখ্যাবুলেট ও কিছু আরবি অক্ষর চিহ্নিত করে সেটা উপেক্ষা করে কাজ করতে সক্ষম। মূল নথির বিন্যাস (পাঠ্যছবিকলামফন্টবজায় থাকবে নতুন ডকুমেন্টেও। আউটপুট টেক্সটকে ইউনিকোড টেক্সটএমএস ওয়ার্ডএইচটিএমএলইপাব এবং সার্চযোগ্য পিডিএফ হিসেবে সংরক্ষণ করা যাবে।

এই প্রযুক্তি বাংলা ভাষা ব্যবহারকারীদের জন্য অনেক সুবিধা প্রদান করবে। সেটি কাজ করবে টাইপ করার বিকল্প হিসেবেপুরনো ডকুমেন্ট ডিজিটাইজেশন করার জন্যহাতে লেখা নোটকে কম্পিউটার ডকুমেন্ট হিসেবে সম্পাদনাযোগ্য করার কাজেও লাগবে সেটি। প্রতিবন্ধী ব্যক্তিরা প্রযুক্তিটি কাজে লাগাতে পারবে। বাংলা সাহিত্যের ডিজিটাল লাইব্রেরি তৈরিতেও কাজে আসবে।

সেবাটি ব্যবহার করা যাবে https://ocr.bangla.gov.bd/ সাইট থেকে। অ্যাকাউন্ট তৈরি করার পর ফাইল আপলোড করে সেটার টেক্সট পাওয়া যাবেসেটা প্রয়োজনীয় ফরম্যাটে সেভ করে সম্পাদনা বা ওয়েবসাইটে পাবলিশিংয়ের জন্য প্রস্তুত করে নেওয়া যাবে সহজেই।