مقدمه:
یکی از سرگرمیهای من پیدا کردن راههایی است تا مفاهیم یادگیری ماشین را به زبان سادهتر توضیح بدهم. این نوشته نمونهای از راهکارهایی است که موقع برگزاری کلاس اتفاقی پیدا کردم.
یادگیری نظارتی (Supervised Learning)
داستان:
فرض کنید که معلمی با والدین یک شاگرد توافق میکند که به فرزندشان کمک کند تا نمره بهتری در درس ریاضی بگیرد. معلم با والدین روی نمرهی بالاتر از ۱۸ توافق میکند.
ابزاری که معلم دارد فقط ۱۰۰۰ نمونه سوال ریاضی از سالهای گذشته است. معلم تصمیم میگیرد که ۲۰۰ سوال را از بین ۱۰۰۰ سوال جدا کند و از آنها به عنوان آزمون نهایی استفاده کند. اگر شاگرد بتواند پس از پاسخ به این ۲۰۰ سوال به نمرهای بالاتر از ۱۸ برسد، تعهد او با والدین انجام شده، وگرنه خیر.
حالا معلم ۸۰۰ سوال در اختیار دارد و باید به شکلی مطمئن شود که شاگرد نمرهی بالای ۱۸ از ۲۰۰ سوال آزمون آزمایشی خواهد گرفت. او این ۸۰۰ سوال را نیز به دو بخش ۶۴۰ و ۱۶۰ تایی تقسیم میکند. از ۶۴۰ سوال اول برای آموزش به شاگرد استفاده میکند و از ۱۶۰ سوال باقیمانده هم برای آن که مطمئن شود شاگرد حل ۶۴۰ سوال را به خوبی یاد گرفته است و آمادهی آموزن نهایی است.
سوال بعدی معلم این خواهد بود که چند بار کل ۶۴۰ سوال را با شاگردش حل کند و در هر جلسهی چند تا سوال را حل کند. مثلا میتواند ۳ بار کل سوالات را حل کند (۳ * ۶۴۰ سوال) و در هر جلسه هم ۶۴ تا سوال (در مجموع ۳ * ۱۰ جلسه).
حالا اگر پس از برگزاری جلسات آموزشی، به کمک ۱۶۰ سوال باقی مانده از شاگرد آزمون (آزمون دستگرمی) بگیریم و نمره شاگرد ۱۶ شد چه اتفاقی میافتد؟ اگر نمره شاگرد ۱۹ شد چه خواهد شد؟
فرض کنیم که شاگرد به خوبی آزمون دستگرمی را پشت سر گذاشت و معلم خیالش راحت شد. حالا نوبت برگزاری آزمون نهایی است. اگر شاگرد پس از حل ۲۰۰ سوال نهایی، نمرهاش ۱۷ شد چه خواهد شد؟ اگر ۱۸.۵ شد چه خواهد شد؟
در چه صورت خیال والدین راحت خواهد بود که فرزندشان میتواند در آزمون مدرسه نمره بالای ۱۸ را به دست بیاورد؟
نکات مهم داستان:
– معلم
– ۱۰۰۰ سوال
– ۲۰۰ سوال برای آزمون نهایی (۲۰ درصد کل سوالات)
– ۸۰۰ سوال
– ۱۶۰ سوال
– ۶۴۰ سوال
– نمره به دست آمده از آزمون دستگرمی (ارزیابی)
– تفاوت نمره آزمون ارزیابی با نمره تعهدشده
– نمره به دست آمده از آزمون نهایی
– تفاوت نمره آزمون نهایی با نمره تعهدشده
مفاهیم یادگیری ماشین:
– معلم: معلم کسی است که جوابها را میداند. در نتیجه این روش یادگیری، یادگیری تحت نظارت یا تحت سرپرستی معلم است.
-نمره ۱۸: مقدار سنجه (metric) قابل قبول
– ۱۰۰۰ سوال: مجموع دادهها یا dataset
– ۲۰۰ سوال برای آزمون نهایی (۲۰ درصد کل سوالات): دادههای آزمون یا test data
– ۸۰۰ سوال: دادههای آموزشی یا train data
– ۱۶۰ سوال: دادههای ارزیابی یا validation data
– ۶۴۰ سوال: دادههای آموزشی train data
– نمره به دست آمده از آزمون دستگرمی (ارزیابی): مقدار سنجه (متریک) حاصل از دادههای ارزیابی (validation metrics)
– تفاوت نمره آزمون ارزیابی با نمره تعهدشده: انحراف مقدار سنجه در مرحلهی ارزیابی با مقدار سنجهی قابل قبول
– نمره به دست آمده از آزمون نهایی: مقدار سنجهی حاصل از دادههای آزمایشی (test metrics)
– تفاوت نمره آزمون نهایی با نمره تعهدشده: انحراف سنجه حاصل از دادههای آزمایشی با سنجه قابل قبول
نکته پایانی:
برگردان مفاهیم یادگیری ماشین به فارسی چه کار دشواری شد!
گزیده:
مردم نگرانند که کامپیوترها بیش از اندازه باهوش شوند که دنیا را قبضه کنند. اما مسالهی واقعی این است که آنها خیلی احمقاند ولی با این حال، همین الان هم دنیا را قبضه کردهاند. پدرو دومینگوس
فرزاد کاظمی بالانی
۶ تیر ۱۴۰۰ در ۰۸:۳۲مفاهیم خیلی جالب بود. مرسی جناب دکتر
یوسف مهرداد
۷ تیر ۱۴۰۰ در ۰۹:۵۵سلام فرزاد جان عزیزم
محبت دارید. خوشحالم که برای شما جالب بود.