অন্যান্য অ্যাপ্লিকেশনের সঙ্গে একীকরণের সুবিধার্থে একটি অ্যাপ্লিকেশন প্রগ্রামিং ইন্টারফেস (এপিআই) ভবিষ্যতে উন্মুক্ত করা হবে। বিভিন্ন প্ল্যাটফরমের সঙ্গে সামঞ্জস্যের জন্য এসটিটি ইঞ্জিনের আলাদা সংস্করণ থাকবে, যেমন—একটি লাইটওয়েট মোবাইল সংস্করণ এবং শক্তিশালী সার্ভার সংস্করণ।
কথাতে ব্যবহৃত এসটিটি ইঞ্জিনটি অনেক ধরনের কাজে ব্যবহার করা যাবে। যার মধ্যে রয়েছে কি–বোর্ডের বিকল্প হিসেবে টেক্সট ইনপুট ডিভাইস হিসেবে কাজ করা, যাতে প্রতিবন্ধী ব্যক্তিরাও সহজেই বাংলা টেক্সট ইনপুট করতে পারে। বাংলা ভাষার ভিডিওতে স্বয়ংক্রিয়ভাবে ক্যাপশন তৈরিও করতে পারবে এটি। অফিশিয়াল মিটিং, ডাক্তার–রোগীর বা কল সেন্টারের কথোপকথনের লিখিত ডকুমেন্ট তৈরিতেও সেটি কাজে আসবে। সব শেষে আইওটিতে ব্যবহৃত যন্ত্র নিয়ন্ত্রণের মাধ্যমে বাংলাতেই স্মার্টহোম ডিভাইস নিয়ন্ত্রণ করাও যাবে কথা ব্যবহার করে।
বর্তমানে সেবাটি https://voice.bangla.gov.bd/ Iয়েবসাইটে যেয়ে সরাসরি কথা বলে বা কথার রেকর্ড আপলোড করার মাধ্যমে টেক্সট ফাইলে রূপান্তর করা যাবে। ইন্টারফেসটি খুবই সহজবোধ্য, মাত্র দুটি বাটনের মাধ্যমেই সিস্টেমটির সব ফিচার ব্যবহার পাওয়া যাচ্ছে।
বাংলা লেখা পড়ে শোনাবে ‘উচ্চারণ’
আজ টেক্সট টু স্পিচ বা টিটিএস প্রযুক্তি প্রায় সব ধরনের ডিভাইসেই দেখা যায়। ডিজিটাল লেখাকে উচ্চারিত ভাষায় রূপান্তর করাই তার কাজ। ‘উচ্চারণ’ প্রকল্পটির লক্ষ্য বিভিন্ন প্ল্যাটফরমে কাজ করবে এমন উচ্চমানের একটি বাংলা টিটিএস ইঞ্জিন তৈরি করা।
উচ্চারণের প্রধান লক্ষ্য থাকবে বাংলা ইউনিকোড টেক্সটকে শ্রবণযোগ্য বাংলা বক্তৃতায় রূপান্তর করা, সেটি যাতে হয় বোধগম্য, স্বাভাবিক এবং মানুষের কণ্ঠস্বরের অনুরূপ, যান্ত্রিক কণ্ঠ যাতে মনে না হয়। সে জন্য চাই প্রসোডিক এবং ইনটোনেশন বৈশিষ্ট্যের সঠিক নিয়ন্ত্রণ। বেশ কয়েক ধরনের কণ্ঠে সেবাটি ব্যবহার করা যাচ্ছে। কৃত্রিম বুদ্ধিমত্তা কাজে লাগিয়ে কণ্ঠের মুড, পিচ, সময়, গতি এবং ধরন (পুরুষ/মহিলা/প্রাপ্তবয়স্ক/শিশু) এর সংমিশ্রণে তৈরি হবে একেকটি ভয়েস। বর্তমানে অবশ্য একটিই মডেল পুরুষ ও মহিলা, দুই ধরনে পাওয়া যাবে। উচ্চারণ তৈরির সময় পাঠ্যের ফরম্যাটিং, যেমন—বোল্ড বা আন্ডারলাইন উপেক্ষা করা শেখানো হয়েছে। বাংলা অক্ষর, যুক্তবর্ণ, বিরাম চিহ্ন ও বিভিন্ন বাক্যের ধরন, যেমন—জিজ্ঞাসা, নেতিবাচক ইত্যাদি শনাক্ত করা, সে অনুযায়ী উচ্চারণের ধরন বদলানোর ফিচারও যুক্ত করেছে এটির নির্মাতারা। সংখ্যা, তারিখ, সময়, মুদ্রা ইত্যাদির সঠিক রূপান্তর করার পাশাপাশি বাংলা সংক্ষিপ্ত রূপ, আদ্যক্ষর এবং সংক্ষিপ্ত শব্দ শনাক্ত করাও ছিল বড় চ্যালেঞ্জ। ডক, ডকএক্স, পিডিএফ এবং ওয়েব পেজের (এইচটিএমএল) মতো বিভিন্ন ফরমেটের নথি থেকে পাঠ্য পড়তে এবং উচ্চারণ করতে সক্ষম উচ্চারণ।
উচ্চারণ প্রযুক্তিটি বাংলা ভাষাভাষীদের জন্য অনেক সুবিধা প্রদান করবে। দৃষ্টিপ্রতিবন্ধী ব্যক্তিদের জন্য যেমন সেটি সহায়ক হবে, তেমনি ডকুমেন্ট এবং ওয়েবসাইটগুলোকে আরো সহজে অ্যাকসেস করার জন্যও কাজ করবে। একাধিক কাজ করার সময় বাংলা তথ্য কথা আকারে শোনার জন্যও কাজে আসবে। পড়ার অসুবিধা সম্পন্ন ব্যক্তিদের জন্য সহায়তা দেবে এটি। শিক্ষাগত এবং বিনোদনমূলক উদ্দেশ্যে ব্যবহার করার পাশাপাশি এই প্রযুক্তিটি বাংলা ভাষার ব্যবহার ও সংরক্ষণে গুরুত্বপূর্ণ ভূমিকা পালন করবে।
উচ্চারণ ব্যবহার করতে ভিজিট করতে হবে https://read.bangla.gov.bd/ ওয়েব সাইটটি। সরাসরি বাংলা ইউনিকোড বা বিজয় টাইপ করেও ইনপুট দেওয়া যাবে, অথবা অ্যাকাউন্ট করার পর লিখিত বাংলার ডকুমেন্ট ফাইলও আপলোড করে সেটা উচ্চারিত কথায় পরিণত করা যাবে।
মুদ্রিত ও হাতের লেখাকে ডকুমেন্ট করবে ‘বর্ণ’
‘বর্ণ’ একটি বাংলা ভাষার জন্য তৈরি ‘অপটিক্যাল ক্যারেক্টার রিকগনিশন’ বা ‘ওসিআর’, এবং ভবিষ্যতে হাতে লেখা বাংলাকে বুঝার জন্য তৈরি হ্যান্ড রাইটিং রিকগনিশন বা এইচডাব্লিউআর হিসেবে কাজ করবে। ওসিআর প্রযুক্তি ছবি আকারে থাকা বাংলা ডকুমেন্টকে সম্পাদনাযোগ্য ও অনুসন্ধানযোগ্য টেক্সটে রূপান্তর করে থাকে। বর্তমানে ‘বর্ণ’ মুদ্রিত বাংলা লেখা উচ্চ নির্ভুলতার সঙ্গে চিহ্নিত করতে পারে, হাতের লেখা নিয়ে জোরেশোরে কাজ চলছে। ওয়েব, মোবাইল এবং সার্ভার এপিআই—তিনটি উপায়েই বর্ণ কাজ করবে। মুদ্রিত বাংলা মডিউল কম্পিউটার, টাইপরাইটার ও লেটারপ্রেসে রচিত নথিগুলো বুঝতে সক্ষম। ভবিষ্যতে হাতে লেখা মডিউল স্ক্যান করা ও সরাসরি টাচ স্ক্রিনের লেখার সঙ্গে কাজ করবে।
সেবাটি বিভিন্ন ধরনের বাংলা ফাইল, যেমন—পিডিএফ, জেপিজি ও পিএনজি থেকে বর্তমানে সম্পাদনাযোগ্য ও অনুসন্ধানযোগ্য টেক্সট তৈরি করতে পারে। টেক্সট থেকে বাংলার পাশাপাশি ইংরেজি টেক্সট, ছবি, টেবিল, সংখ্যা, বুলেট ও কিছু আরবি অক্ষর চিহ্নিত করে সেটা উপেক্ষা করে কাজ করতে সক্ষম। মূল নথির বিন্যাস (পাঠ্য, ছবি, কলাম, ফন্ট) বজায় থাকবে নতুন ডকুমেন্টেও। আউটপুট টেক্সটকে ইউনিকোড টেক্সট, এমএস ওয়ার্ড, এইচটিএমএল, ইপাব এবং সার্চযোগ্য পিডিএফ হিসেবে সংরক্ষণ করা যাবে।
এই প্রযুক্তি বাংলা ভাষা ব্যবহারকারীদের জন্য অনেক সুবিধা প্রদান করবে। সেটি কাজ করবে টাইপ করার বিকল্প হিসেবে, পুরনো ডকুমেন্ট ডিজিটাইজেশন করার জন্য, হাতে লেখা নোটকে কম্পিউটার ডকুমেন্ট হিসেবে সম্পাদনাযোগ্য করার কাজেও লাগবে সেটি। প্রতিবন্ধী ব্যক্তিরা প্রযুক্তিটি কাজে লাগাতে পারবে। বাংলা সাহিত্যের ডিজিটাল লাইব্রেরি তৈরিতেও কাজে আসবে।
সেবাটি ব্যবহার করা যাবে https://ocr.bangla.gov.bd/ সাইট থেকে। অ্যাকাউন্ট তৈরি করার পর ফাইল আপলোড করে সেটার টেক্সট পাওয়া যাবে, সেটা প্রয়োজনীয় ফরম্যাটে সেভ করে সম্পাদনা বা ওয়েবসাইটে পাবলিশিংয়ের জন্য প্রস্তুত করে নেওয়া যাবে সহজেই।
মতামত লিখুন :