আমার ইমার ঠারহান এ মালেমে ঙালুয়া থাক, পুঞ্চি পালক এ খৌরাঙে লিশিঙ মানুর লালফাম হৎনা বার' সুদেষ্ণা গিথানকর আত্ম বলিদান। তানুর হৎনা বার' বলিদান পালকরিক বুল্লেতে আমারতাউ তেতনেই কাম করানি লাগতই। এ হাকতাকর Artificial Intelligence (AI) কৃত্রিম বা গড়েইপা লৌশিং (গলৌ)র বৌ বুলনে জিংতা অনি মনেইলেতে আমারতা উসুক গিথিয়া উবা অনা লাগতই।
আমার কাদার বাংলা বা হিন্দি, ঠারর প্রযুক্তিত য়াম আগুওয়া বেল্লা। তানুর ঠারহান গড়েইপা লৌশিং (গলৌ) এ হারপার। গড়েইপা লৌশিংরে আমার ঠারহান হিকা দিলেতে গেলেগা আমার কিহান করানি থক? অহানই আমার এবাকার ধ্যানহান। হৎনা এহার পাংলাকে মি হাদি এহান ঠারর প্রযুক্তিল কাম করুরি।
কর্পাস হংকরানির হৎনা
বাক্কা কতদিন আগে আমার ঠারর ওয়াহিকলা (অভিধান) অনলাইনে উথাপিতা করানিরকা বুলিয়া owhai.com চালাসিলু। অহাত আমার ঠারর ওয়াহি বার' অতার সরগ (উচ্চারণ) বিসারিয়া চানা বা পানা একরের। এহার থাঙনাকার থাকহান ইসেতাই manipuri.com নাংর ওয়েব সাইটহান। এ সাইট এহান হুদ্দা আমার ওয়াহিকলা (অভিধান) হান নাবে। এহান ঠারর প্রযুক্তিত আগুওয়ানি বার' আর আর ঠারর লগে শিংনা দেনার কাকেই আহান। এহান ডাঙর প্রজেক্ট আহান। এহান ইংরেজীল "Bishnupriya Manipuri Dictionary and Speech Technology" বার' আমার ঠারে "বিষ্ণুপ্রিয়া মণিপুরী ওয়াহিকলা বারো মাতেক প্রযুক্তি" নাং দেনা অইল।
গড়েইপা লৌশিংর কাজে ঠারহানরে উপযুক্ত করানির হুরকা কাকেই আহান। মি যেহান করুরি অহান্ন হাবি অসাধ্য সাধন ইতই বা হাব্বিতা কাম করিয়া লমইতই এসারে নাবে। মাতেক প্রযুক্তিল আগুওয়ানি মনেইলে আমরাতা লাগতইতা ডাটা সেট, যেসাদে ওয়াহির কর্পাস, বাক্যর কর্পাস, বার' খন্তা/ধ্বনির কর্পাস হংকরানি হাবির গজর কামহান অসে। মি তিনহানি কাম সুপকরিয়া "বিষ্ণুপ্রিয়া মণিপুরী ওয়াহিকলা বারো মাতেক প্রযুক্তি"-র সাইটহানাত হৎনা চালাসু।
বাক্যর কর্পাস বা বাক্যকলা: যেসাদে ওয়াহি পুলকরানি দরকার পরেসে ঔসাদেই বাক্য পুলকরানি এহানৌ দরকারীহান অসে। গড়েইপা লৌশিং (গলৌ)রে ঠারাহান হিকাদিতে গেলেগা এহান দরকার অইতই। বাক্য আহান কিসারে হঙর, এহাত কর্তা/কিহান/উদ্দেশ্যহান, বিভক্তি পদহান/হানি, বার' বিধেয়হান টাঙ্খেই সেঙকরে বাগাদে পারলে বা (Part-of-speech Tagger) লেপকরেদে পারলে কামহান সুসার ইতই।
খন্তা/ধ্বনি বার' মাতেক প্রযুক্তি
খন্তা/ধ্বনির কর্পাস বা খন্তাকলা: বাগযন্ত্র (নার/সর, জু, তালু, দাত, অট বার' নাক)ল অতারারাং বা মাতরাং অতাত হাবিত্ত হুরকাং রৌ অতারে খন্তা বা ধ্বনি মাতানি অর। খন্তা আহানর কোন অর্থ নাথার কিন্তু এতাই ওয়াহি হংকরানি পাংকরের। পেটগর খাবালাহাত্ত বা ফুসফুসগত্ত বৌ নিকুলের সময় অহাত যে রৌহান অর যেসাদে অ, আ, ক, খ আদি অতারেই খন্তা/ধ্বনি মাতানি অর। খন্তা অতার নিজর কোন অর্থ নেয়র। থতার বিতরর নানান অংশত সকিয়া খন্তা আহানে অর্থ আসে অসারে ওয়াহি হংকরের। খন্তা বা ধ্বনি দিজাত, স্বর বারো ব্যঞ্জন।
খন্তারে ইকরানির কাজে যে চিন বা খাস থার অতারে মেয়েক বুলানি অর। কম্পিউটার হাত মেয়েক ইকরলে এতারে কিসারে সরগদেনা বা মাতেক হংকরানি অরে প্রক্রিয়া অহানরে মাতানি অর "মেয়েকেত্ত মাতেক (মেত্তমা)" ইংরেজীল Text-to-Speech (TTS)। বার' আমি মাতেক আহান মাতলে অহানরে মেয়েকে সিলকরানির প্রক্রিয়াহান ইলতাই "মাতেকেত্ত মেয়েক (মাত্তমে)" ইংরেজীল Speech-to-Text (STT)।
মাতেক সংশ্লেষণ: কম্পিউটারে মানুর সর তিলকরানি বা হংকরানি বা কংকাদেনার যে প্রক্রিয়াহান আতাপিতা করানি অর অহানরে মাতেক সংশ্লেষণ বা Speech Synthesis বুলানি অর। মাতেকর জুরা বাধানি অহান ইংরেজীল Speech Synthesis বুলতারা। সংশ্লেষণ বার' বিশ্লেষণ: দিয়হানি আহানে আহানর উন্টাতা। সংশ্লেষণ মানে পুলকরানি, তিলকরানি, গাঠি দেনা বা কংকাদেনা। অহার উন্টাহান ইলতাই বিশ্লেষণ মানে থেইকরানি, খেইকারি, বাগানি, মুকানি, ফুকানি, সুটানি আদি।
ডাইফোন (Diphone) বার' গবেষণা
মি, কি প্রক্রিয়াহান্ন আগুওয়াউরিতা? পয়লাকা ওয়াহির কর্পাসহান হংকরানি বার' অহার হাব্বি ওয়াহি অতারে "আন্তর্জাতিক ওয়াহিবিজ্ঞানর মেয়েক (আওমে)" বা International Phonetic Alphabet (IPA)ল সিলকরানি। হাব্বি ওয়াহির খন্তা অতারে বিশ্লেষণ (tokenized into phonemes) করানি। মানে ওয়াহি অহানরে হুরকা হুরকা খন্তাত খেইকরানি (বিশ্লেষণ)। Phonemes এহানরে য়ামপারাই ধ্বনিমূল মাত্তারা। আমারতা এহানর চানাপ্পা বা মান্নাপা ওয়াহি নেই অহানে এহানরে আমি খন্তামূল বা খনিম (খন্তা + nemes) বুলে পাররাং। লমিতেগা খনিম এতারে ডাইফোন বা দিখন্তামালপি ত সিলকরানি।
উদাহরণ: অংতা (aṃtā) - ɔŋtaː - ɔ ŋ t aː - #-ɔ ɔ-ŋ ŋ-t t-aː aː-#
ডাইফোন (Diphone) বা দিখন্তামালপি: এহান এমন ওয়াহি আহান বা ওয়াহির অংতা আহান যেহান খন্তার জুরা বা কংকা আগ যেগ খন্তা দুহার বুকগত থায়া মুংর খন্তার লেজগত্ত থাংনার খন্তাহার মুংহান পেয়া থার। টাঙ্খেই সেংকরে মাত্তে গেলেগা দুহান খন্তার কংকা বা গাথি আগ বা জুরা আগা। এহানে দুহান খন্তারে কাদাত চেপকরের বা জুরাদের। এহানরে কুপকরে হুনলে মনে অরতা এহান না আগর, না পিঠির খন্তাহান বুলিয়া। এহান খন্তার দিমনদিশা অংতাহান অহানে এহানরে আমি ডাইফোন (Diphone) বা দিখন্তামালপি বুলিয়ার। যেসাদে অংতা (ɔŋtaː) অহানর দিখন্তামালপিহান ৫হান: #-ɔ ɔ-ŋ ŋ-t t-aː aː-# (১. #-ɔ, ২. ɔ-ŋ, ৩. ŋ-t, ৪. t-aː, ৫. aː-#)।
উদাহরণ দিয়া বুক্তাগত বেলাদেনার কাজে “মাতেক” ওয়াহি অহানরে ছবিগত দেখাদেনা অইল:
এসারে করানির দরকারহানতে কিদিয়া? নিঙকরিক আমারতা য়্যাঙ্খেই লিশিং ওয়াহি আসে। বারো যে কোন সময় আরাকউ নুওয়া ওয়াহি হঙিতে পারে বা ওয়াহি এতাত্ত আরাকউ ওয়াহি হঙিতে পারে। অহানে এতার হাবির নারগ বা সরগ রেকডিং করিয়া আকহান আকহান ওয়াহি জুরা দিয়া বাক্য আহান অতারতে কম্পিউটারতা য়াম বা আবকচা সময় লাগতই। আর যদি ওয়াহি এতার দিখন্তামালপি এতার কর্পাস বা দিখন্তামালপিকলা আকপেই থইলে এতার "বার' আতাপিতা" বা পুনর্ব্যবহার বা 'Reuse' করে পারিয়ার।
বুক্তা: বুক্তা মানে তত্ত্ব বা মুল ফাতকরে বিষয় আহান হারপানি। উদাহরন: তুমি মর কথাহার বুক্তাগত পরলাইতা?
ঠারর মান্নাপা ওয়াহি (পরিভাষা)
লমিতেগা আমার ঠারর মান্নাপা ওয়াহি (পরিভাষা) কতহান যেতা মর এরে গবেষণা এহান আতাপিতা করানি অইল বা আরআর গবেষকেউ আতাপিতা করতারা অতা মাতিয়া লমকরুরি:
ড: স্মৃতি কুমার সিংহ গিরকর নিবন্ধ আহাত্ত পাসু পরিভাষা— ধ্বনি (phone), ধ্বনিমূল(phoneme), রূপমূল (morpheme), রূপমৌলিক বিশ্লেষণ (morphological analysis), ক্রিয়াবাচক বিশেষ্য (Verbal Noun)।
| English Term | বিষ্ণুপ্রিয়া মণিপুরী পরিভাষা |
|---|---|
| Artificial Intelligence (AI) | গড়েইপা লৌশিং (গলৌ) |
| Dictionary / Word Corpus | ওয়াহিকলা = ওয়াহি + কলা |
| Sentence Corpus | বাক্যকলা |
| Phoneme Corpus | খন্তাকলা |
| Diphone | দিখন্তামালপি / খন্তার জুরা |
| International Phonetic Alphabet (IPA) | আন্তর্জাতিক ওয়াহিবিজ্ঞানর মেয়েক (আওমে) |
| Phonemes | ধ্বনিমূল / খনিম |
| Speech Technology | মাতেক প্রযুক্তি / জতর |
| Speech Synthesis | মাতেক সংশ্লেষণ / জুরা |
| Text-to-Speech (TTS) | মেয়েকেত্ত মাতেক (মেত্তমা) |
| Speech-to-Text (STT) | মাতেকেত্ত মেয়েক (মাত্তমে) |
| Historical Linguistics | ঠারবিজ্ঞান |
| Linguistics | ঠারবুক্তা |
| Morphology | অংতাবুক্তা |
| Phonology | খন্তাবুক্তা |
| Semantics | অর্থবুক্তা |
| Sound/Voice/Pronunciation | সর |
| Easy | সুসার |