কন্ঠ সনাক্তকরণ

কণ্ঠ শনাক্তকরণ হলো কম্পিউটেশনাল ভাষাবিদ্যার পারস্পরিক সম্পর্কযুক্ত একটি উপক্ষেত্র যেখানে কম্পিউটারের সাহায্যে কণ্ঠ শনাক্তকরণ ও মুখে উচ্চারিত ভাষাকে কম্পিউটারের সাহায্যে লেখ্যরুপে রুপান্তর সম্পর্কিত প্রযুক্তিসমূহ উন্নয়ন করে থাকে। কণ্ঠ শনাক্তকরণকে স্বয়ংক্রিয় কণ্ঠ শনাক্তকরণ, কম্পিউটার কণ্ঠ শনাক্তকরণ বা কণ্ঠ থেকে লেখ্যরুপে রুপান্তর (Speech to text (STT)) বলা হয়ে থাকে। ভাষাবিদ্যা, কম্পিউটার বিজ্ঞান ও ইলেক্ট্রিক্যাল প্রকৌশল এর ক্ষেত্রসমূহের জ্ঞান ও গবেষণার সমন্বিত রুপ হলো কণ্ঠ শনাক্তকরণ।

কিছু কণ্ঠ শনাক্তকরণ সিস্টেমে "প্রশিক্ষণ" প্রয়োজন হয়ে থাকে যেখানে একজন ব্যক্তি বা বক্তা কোন বাক্য পড়ে বা আলাদা আলাদা শব্দ পড়ে। সিস্টেম ব্যক্তির কণ্ঠ বিশ্লেষণ করে,বিশ্লেষিত বৈশিষ্ট্য ব্যবহার করে ভবিষ্যতে উক্ত ব্যক্তির কণ্ঠ শনাক্তকরণে ব্যবহার করে থাকে যা শনাক্তকরণের সঠিকতা বাড়িয়ে দেয়। যেসকল কণ্ঠ শনাক্তকরণ সিস্টেম "প্রশিক্ষণ" ধাপ ব্যবহার করে না, সেগুলোকে "বক্তা-স্বাধীন ব্যবস্থা" ("speaker independent"[1] systems)। যেসকল কণ্ঠ শনাক্তকরণ সিস্টেম "প্রশিক্ষণ" ধাপ ব্যবহার করে, সেগুলোকে "বক্তা-নির্ভর ব্যবস্থা" ("speaker dependent"[1] systems)।

তথ্যসূত্র

    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.