মাতেক সংশ্লেষণ

উত্তম সিংহ, নিউইয়র্ক

আমার ইমার ঠারহান এ মালেমে ঙালুয়া থাক, পুঞ্চি পালক এ খৌরাঙে লিশিঙ মানুর লালফাম হৎনা বার' সুদেষ্ণা গিথানকর আত্ম বলিদান। তানুর হৎনা বার' বলিদান পালকরিক বুল্লেতে আমারতাউ তেতনেই কাম করানি লাগতই। এ হাকতাকর Artificial Intelligence (AI) কৃত্রিম বা গড়েইপা লৌশিং (গলৌ)র বৌ বুলনে জিংতা অনি মনেইলেতে আমারতা উসুক গিথিয়া উবা অনা লাগতই।

আমার কাদার বাংলা বা হিন্দি, ঠারর প্রযুক্তিত য়াম আগুওয়া বেল্লা। তানুর ঠারহান গড়েইপা লৌশিং (গলৌ) এ হারপার। গড়েইপা লৌশিংরে আমার ঠারহান হিকা দিলেতে গেলেগা আমার কিহান করানি থক? অহানই আমার এবাকার ধ্যানহান। হৎনা এহার পাংলাকে মি হাদি এহান ঠারর প্রযুক্তিল কাম করুরি।

কর্পাস হংকরানির হৎনা

বাক্কা কতদিন আগে আমার ঠারর ওয়াহিকলা (অভিধান) অনলাইনে উথাপিতা করানিরকা বুলিয়া owhai.com চালাসিলু। অহাত আমার ঠারর ওয়াহি বার' অতার সরগ (উচ্চারণ) বিসারিয়া চানা বা পানা একরের। এহার থাঙনাকার থাকহান ইসেতাই manipuri.com নাংর ওয়েব সাইটহান। এ সাইট এহান হুদ্দা আমার ওয়াহিকলা (অভিধান) হান নাবে। এহান ঠারর প্রযুক্তিত আগুওয়ানি বার' আর আর ঠারর লগে শিংনা দেনার কাকেই আহান। এহান ডাঙর প্রজেক্ট আহান। এহান ইংরেজীল "Bishnupriya Manipuri Dictionary and Speech Technology" বার' আমার ঠারে "বিষ্ণুপ্রিয়া মণিপুরী ওয়াহিকলা বারো মাতেক প্রযুক্তি" নাং দেনা অইল।

চিত্র ১: owahi.com সাইটহানর অংতাহান

গড়েইপা লৌশিংর কাজে ঠারহানরে উপযুক্ত করানির হুরকা কাকেই আহান। মি যেহান করুরি অহান্ন হাবি অসাধ্য সাধন ইতই বা হাব্বিতা কাম করিয়া লমইতই এসারে নাবে। মাতেক প্রযুক্তিল আগুওয়ানি মনেইলে আমরাতা লাগতইতা ডাটা সেট, যেসাদে ওয়াহির কর্পাস, বাক্যর কর্পাস, বার' খন্তা/ধ্বনির কর্পাস হংকরানি হাবির গজর কামহান অসে। মি তিনহানি কাম সুপকরিয়া "বিষ্ণুপ্রিয়া মণিপুরী ওয়াহিকলা বারো মাতেক প্রযুক্তি"-র সাইটহানাত হৎনা চালাসু।

ওয়াহির কর্পাস বা ওয়াহিকলা: এহাত ওয়াহি পুলকরৌরি। আমার ঠারে এবাকা পেয়া যে যে ওয়াহিকলা (অভিধান) হানি নিকুলেসে অতাত্ত, আমার ঠারর লেরিক, বার' উইকিপিডিয়াত্ত আকপেইত হাব্বি ওয়াহির ডাটাবেস আহান হংকনির কাম চলের manipuri.com এ। মি অভিধান বা কর্পাস বা ডিকশনারি এহানরে ওয়াহিকলা বুলেসু। এহানরে কারনহান ওয়াহিকলা = ওয়াহি + কলা। ১. কলা বুলতে আমি হারপেয়ারতা নানান বিদ্যা, তা থকয়া যে লেরিখানে ওয়াহির বিদ্যা দের অহান ওয়াহিকলা। ২. অন্যগদে কলা বুলতে হারপেয়ারতা মলপাকর তিরা বরানির খৌ আকেইগ, তাথকয়া যে লেরিকাহান ওয়াহিনো বুজের অহানই ওয়াহিকলা।
চিত্র ২: manipuri.com সাইটহানর অংতাহান

বাক্যর কর্পাস বা বাক্যকলা: যেসাদে ওয়াহি পুলকরানি দরকার পরেসে ঔসাদেই বাক্য পুলকরানি এহানৌ দরকারীহান অসে। গড়েইপা লৌশিং (গলৌ)রে ঠারাহান হিকাদিতে গেলেগা এহান দরকার অইতই। বাক্য আহান কিসারে হঙর, এহাত কর্তা/কিহান/উদ্দেশ্যহান, বিভক্তি পদহান/হানি, বার' বিধেয়হান টাঙ্খেই সেঙকরে বাগাদে পারলে বা (Part-of-speech Tagger) লেপকরেদে পারলে কামহান সুসার ইতই।

খন্তা/ধ্বনি বার' মাতেক প্রযুক্তি

খন্তা/ধ্বনির কর্পাস বা খন্তাকলা: বাগযন্ত্র (নার/সর, জু, তালু, দাত, অট বার' নাক)ল অতারারাং বা মাতরাং অতাত হাবিত্ত হুরকাং রৌ অতারে খন্তা বা ধ্বনি মাতানি অর। খন্তা আহানর কোন অর্থ নাথার কিন্তু এতাই ওয়াহি হংকরানি পাংকরের। পেটগর খাবালাহাত্ত বা ফুসফুসগত্ত বৌ নিকুলের সময় অহাত যে রৌহান অর যেসাদে অ, আ, ক, খ আদি অতারেই খন্তা/ধ্বনি মাতানি অর। খন্তা অতার নিজর কোন অর্থ নেয়র। থতার বিতরর নানান অংশত সকিয়া খন্তা আহানে অর্থ আসে অসারে ওয়াহি হংকরের। খন্তা বা ধ্বনি দিজাত, স্বর বারো ব্যঞ্জন।

খন্তারে ইকরানির কাজে যে চিন বা খাস থার অতারে মেয়েক বুলানি অর। কম্পিউটার হাত মেয়েক ইকরলে এতারে কিসারে সরগদেনা বা মাতেক হংকরানি অরে প্রক্রিয়া অহানরে মাতানি অর "মেয়েকেত্ত মাতেক (মেত্তমা)" ইংরেজীল Text-to-Speech (TTS)। বার' আমি মাতেক আহান মাতলে অহানরে মেয়েকে সিলকরানির প্রক্রিয়াহান ইলতাই "মাতেকেত্ত মেয়েক (মাত্তমে)" ইংরেজীল Speech-to-Text (STT)।

চিত্র ৩: মাতেক ওয়াহি অহান অডিওত চেইতে কিসাদে

মাতেক সংশ্লেষণ: কম্পিউটারে মানুর সর তিলকরানি বা হংকরানি বা কংকাদেনার যে প্রক্রিয়াহান আতাপিতা করানি অর অহানরে মাতেক সংশ্লেষণ বা Speech Synthesis বুলানি অর। মাতেকর জুরা বাধানি অহান ইংরেজীল Speech Synthesis বুলতারা। সংশ্লেষণ বার' বিশ্লেষণ: দিয়হানি আহানে আহানর উন্টাতা। সংশ্লেষণ মানে পুলকরানি, তিলকরানি, গাঠি দেনা বা কংকাদেনা। অহার উন্টাহান ইলতাই বিশ্লেষণ মানে থেইকরানি, খেইকারি, বাগানি, মুকানি, ফুকানি, সুটানি আদি।

ডাইফোন (Diphone) বার' গবেষণা

মি, কি প্রক্রিয়াহান্ন আগুওয়াউরিতা? পয়লাকা ওয়াহির কর্পাসহান হংকরানি বার' অহার হাব্বি ওয়াহি অতারে "আন্তর্জাতিক ওয়াহিবিজ্ঞানর মেয়েক (আওমে)" বা International Phonetic Alphabet (IPA)ল সিলকরানি। হাব্বি ওয়াহির খন্তা অতারে বিশ্লেষণ (tokenized into phonemes) করানি। মানে ওয়াহি অহানরে হুরকা হুরকা খন্তাত খেইকরানি (বিশ্লেষণ)। Phonemes এহানরে য়ামপারাই ধ্বনিমূল মাত্তারা। আমারতা এহানর চানাপ্পা বা মান্নাপা ওয়াহি নেই অহানে এহানরে আমি খন্তামূল বা খনিম (খন্তা + nemes) বুলে পাররাং। লমিতেগা খনিম এতারে ডাইফোন বা দিখন্তামালপি ত সিলকরানি।

উদাহরণ: অংতা (aṃtā) - ɔŋtaː - ɔ ŋ t aː - #-ɔ ɔ-ŋ ŋ-t t-aː aː-#

ডাইফোন (Diphone) বা দিখন্তামালপি: এহান এমন ওয়াহি আহান বা ওয়াহির অংতা আহান যেহান খন্তার জুরা বা কংকা আগ যেগ খন্তা দুহার বুকগত থায়া মুংর খন্তার লেজগত্ত থাংনার খন্তাহার মুংহান পেয়া থার। টাঙ্খেই সেংকরে মাত্তে গেলেগা দুহান খন্তার কংকা বা গাথি আগ বা জুরা আগা। এহানে দুহান খন্তারে কাদাত চেপকরের বা জুরাদের। এহানরে কুপকরে হুনলে মনে অরতা এহান না আগর, না পিঠির খন্তাহান বুলিয়া। এহান খন্তার দিমনদিশা অংতাহান অহানে এহানরে আমি ডাইফোন (Diphone) বা দিখন্তামালপি বুলিয়ার। যেসাদে অংতা (ɔŋtaː) অহানর দিখন্তামালপিহান ৫হান: #-ɔ ɔ-ŋ ŋ-t t-aː aː-# (১. #-ɔ, ২. ɔ-ŋ, ৩. ŋ-t, ৪. t-aː, ৫. aː-#)।

উদাহরণ দিয়া বুক্তাগত বেলাদেনার কাজে “মাতেক” ওয়াহি অহানরে ছবিগত দেখাদেনা অইল:

চিত্র ৪: “মাতেক” ওয়াহি অহানরে দিখন্তামালপিত সিলকরানির উদাহরণ আহান

এসারে করানির দরকারহানতে কিদিয়া? নিঙকরিক আমারতা য়্যাঙ্খেই লিশিং ওয়াহি আসে। বারো যে কোন সময় আরাকউ নুওয়া ওয়াহি হঙিতে পারে বা ওয়াহি এতাত্ত আরাকউ ওয়াহি হঙিতে পারে। অহানে এতার হাবির নারগ বা সরগ রেকডিং করিয়া আকহান আকহান ওয়াহি জুরা দিয়া বাক্য আহান অতারতে কম্পিউটারতা য়াম বা আবকচা সময় লাগতই। আর যদি ওয়াহি এতার দিখন্তামালপি এতার কর্পাস বা দিখন্তামালপিকলা আকপেই থইলে এতার "বার' আতাপিতা" বা পুনর্ব্যবহার বা 'Reuse' করে পারিয়ার।

চিত্র ৫: মাতেক ওয়াহি অহানরে সংশ্লেষণ করানির প্রক্রিয়াহান

বুক্তা: বুক্তা মানে তত্ত্ব বা মুল ফাতকরে বিষয় আহান হারপানি। উদাহরন: তুমি মর কথাহার বুক্তাগত পরলাইতা?

ঠারর মান্নাপা ওয়াহি (পরিভাষা)

লমিতেগা আমার ঠারর মান্নাপা ওয়াহি (পরিভাষা) কতহান যেতা মর এরে গবেষণা এহান আতাপিতা করানি অইল বা আরআর গবেষকেউ আতাপিতা করতারা অতা মাতিয়া লমকরুরি:

ড: স্মৃতি কুমার সিংহ গিরকর নিবন্ধ আহাত্ত পাসু পরিভাষা— ধ্বনি (phone), ধ্বনিমূল(phoneme), রূপমূল (morpheme), রূপমৌলিক বিশ্লেষণ (morphological analysis), ক্রিয়াবাচক বিশেষ্য (Verbal Noun)।

English Term বিষ্ণুপ্রিয়া মণিপুরী পরিভাষা
Artificial Intelligence (AI) গড়েইপা লৌশিং (গলৌ)
Dictionary / Word Corpus ওয়াহিকলা = ওয়াহি + কলা
Sentence Corpus বাক্যকলা
Phoneme Corpus খন্তাকলা
Diphone দিখন্তামালপি / খন্তার জুরা
International Phonetic Alphabet (IPA) আন্তর্জাতিক ওয়াহিবিজ্ঞানর মেয়েক (আওমে)
Phonemes ধ্বনিমূল / খনিম
Speech Technology মাতেক প্রযুক্তি / জতর
Speech Synthesis মাতেক সংশ্লেষণ / জুরা
Text-to-Speech (TTS) মেয়েকেত্ত মাতেক (মেত্তমা)
Speech-to-Text (STT) মাতেকেত্ত মেয়েক (মাত্তমে)
Historical Linguistics ঠারবিজ্ঞান
Linguistics ঠারবুক্তা
Morphology অংতাবুক্তা
Phonology খন্তাবুক্তা
Semantics অর্থবুক্তা
Sound/Voice/Pronunciation সর
Easy সুসার

পাংলাক পাসু লেরিক বার’ নিবন্ধ:

  1. বিষ্ণুপ্রিয়া মণিপুরী জাতীয় অভিধান. (২০২৩)। দিল্স লক্ষীন্দ্র সিংহ, ড. সন্তোষ সিংহ, অনিতা সিংহ। নিখিল বিষ্ণুপ্রিয়া মণিপুরী সাহিত্য পরিষদ।
  2. Sinha, Kali Prasad (1986). An Etymological Dictionary of Bishnupriya Manipuri. Punthi Pustak.
  3. Singha, Uttam. (2026). Bishnupriya Manipuri Dictionary and Language Science Project. Lexical database, pronunciation rules, and system documentation.
  4. ড০ স্মৃতিকুমার সিংহ, বিষ্ণুপ্রিয়া মণিপুরি বানান
  5. M. Baumgartner, R. Wilhelms-Tricarico, and J. Reichenbach, “The Lessac Technologies Time Domain Diphone Parametric Synthesis System for Microcontrollers for Blizzard Challenge 2012,” Blizzard Challenge Workshop, 2012.
  6. R. Prudon and C. d’Alessandro, “A selection/concatenation text-to-speech synthesis system: databases development, system design, comparative evaluation,” ISCA Speech Synthesis Workshop, 2001.
  7. X. Tan et al., “A Survey on Neural Speech Synthesis,” arXiv:2106.15561, 2021.
  8. F. Seebauer et al., “Re-examining the quality dimensions of synthetic speech,” ISCA Speech Synthesis Workshop, 2023.
  9. Y. Yang et al., “Towards Responsible Evaluation for Text-to-Speech,” arXiv:2510.06927, 2025/2026.