উপাত্ত খনন
উপাত্ত খনন বা ইংরেজি পরিভাষায় ডাটা মাইনিং (ইংরেজি: data mining) পরিগণক বিজ্ঞান তথা কম্পিউটার বিজ্ঞানের একটি ক্ষেত্র হিসেবে বিবেচিত হয়।[1][2][3] এটি "উপাত্তাধারগুলিতে জ্ঞান আবিষ্কার" (নলেজ ডিসকভারি ইন ডেটাবেসেজ বা সংক্ষেপে কেডিডি)[3]-এর একটি ধাপ।
উপাত্ত খনন কৃত্রিম বুদ্ধিমত্তা, পরিসংখ্যান, ডেটাবেজ ম্যানেজমেন্ট সিস্টেম সমন্বয়ে গঠিত একটি কম্পিউটিং বা পরিগণন কর্মকাণ্ড যার মাধ্যমে বিশালাকার উপাত্ত সংকলন (ডাটা সেট) থেকে নির্দিষ্ট বৈশিষ্টের উপাত্ত আবিষ্কার করা সম্ভব হয়। উপাত্ত খননের লক্ষ্য হল একটি উপাত্ত সংকলন থেকে নির্দিষ্ট বা কাংক্ষিত উপাত্ত খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেণীবদ্ধ ও উপস্থাপন করা।
উপাত্তাধারগুলিতে জ্ঞান আবিষ্কারের ধাপগুলো নিম্নরূপঃ
- বাছাইকরণ (সিলেকশন)
- প্রাক-প্রক্রিয়াজাতকরণ (প্রি-প্রোসেসিং)
- রূপান্তর (ট্রান্সফরমেশন)
- উপাত্ত খনন (ডাটা মাইনিং)
- মূল্যায়ন (এভালুয়েশন)[4]
উপাত্ত খননের অ্যালগরিদম বা পরিগণনা প্রক্রিয়া
- শ্রেণীবদ্ধকরণ (ক্লাসিফিকেশন)
এই প্রক্রিয়ায় পূর্বের উপাত্ত বিশ্লেষণ করে ভবিষ্যতের উপাত্তের চরিত্র সম্পর্কে পূর্ভাবাস দেওয়া যায়। সিদ্ধান্ত বৃক্ষ (ডিসিশন ট্রি), স্নায়বিক জাল [(নিউরাল নেটওয়ার্ক), ইত্যাদি প্রক্রিয়ায় সাধারণত উপাত্ত বিশ্লেষণ করা হয়।
- গুচ্ছকরণ (ক্লাস্টারিং)
এই প্রক্রিয়ায় উপাত্তসমূহকে নির্দিষ্ট বৈশিষ্ট্যের ভিত্তিতে শ্রেণীবদ্ধ করা হয়। একটি নির্দিষ্ট শ্রেণীর উপাত্তগুলির মধ্যে সর্বোচ্চ সাদৃশ্য বজায় রাখা এবং দুইটি ভিন্ন শ্রেণীর উপাত্তগুলির মধ্যে সর্বনিম্ন সাদৃশ্য বজায় রাখা গুচ্ছকরণের উদ্দেশ্য।[5]
- সম্পর্কস্থাপন (অ্যাসোসিয়েশন)
এই প্রক্রিয়ায় পূর্বের কোন লিখিত নথিবিবণীতে (রেকর্ডে) যেসব উপাত্ত এসাথে অবস্থান করে তাদের মধ্যে সম্পর্কস্থাপন করা হয়।
- অনুক্রম আবিষ্কার (সিকুয়েন্স ডিসকভারি)
এই প্রক্রিয়ায় সময়ের ভিত্তিতে এবং ক্রমানুসারে উপাত্ত শ্রেণীবদ্ধ করা হয়।[4]
তথ্যসূত্র
- Clifton, Christopher (২০১০)। "Encyclopædia Britannica: Definition of Data Mining"। সংগ্রহের তারিখ ২০১০-১২-০৯।
- Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (২০০৯)। "The Elements of Statistical Learning: Data Mining, Inference, and Prediction"। ২০০৯-১১-১০ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২০১২-০৮-০৭।
- "Data Mining Curriculum"। ACM SIGKDD। ২০০৬-০৪-৩০। ২০১১-১০-২৮ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২০১১-১০-২৮।
- Book: Decision Support System and Business Intelligence by Efraim Turban
- Book: Data Mining: Concepts and Techniques by Jiawei Han, Micheline Kamber and Jian Pei
বহিঃসংযোগ
- কার্লিতে ডেটা মাইনিং সফটওয়্যার (ইংরেজি)