یادگیری ماشین برای همه (۸)

  • یوسف مهرداد

ادامه طبقه‌بندی …

ماشین‌ بردار پشتیبان (Support Vector Machines) یا SVM به راستی محبوب‌ترین روش طبقه‌بندی کلاسیک است. از آن برای طبقه‌بندی هر موجودی در جهان هستی استفاده می‌شود مانند طبقه‌بندی گیاهان بر اساس شکل ظاهری آنها در عکس‌ یا طبقه‌بندی اسناد بر اساس نوع آنها و…

ایده‌ی پشت SVM بسیار ساده است. SVM سعی می‌کند تا دو خط با بیشترین فاصله‌ی ممکن بین نقاط داده (data points) ترسیم کند. به تصویر زیر نگاه کنید.

یکی از کاربردهای جنبی و بسیار مفید طبقه‌بندی، تشخیص ناهنجاری (anomaly detection) است. هنگامی که یکی از ویژگی‌های داده در هیچ یک از طبقه‌ها قرار نمی‌گیرد(مترجم؛ مثلا در دسته‌بندی عکس‌ها به عکس سگ و عکس گربه،‌ عکسی از فیل وجود داشته باشد)، آن را برجسته و اعلام می‌کنیم. این روزها از تشخیص ناهنجاری در پزشکی و برای تصاویر MRI استفاده می‌شود. رایانه‌ها تمام مناطق مشکوک به بیماری یا متفاوت با حالت عادی آزمایش را برجسته و گزارش می‌کنند. بازارهای سهام از این تکنیک برای شناسایی رفتار غیرعادی معامله‌گران و پیدا کردن معامله‌گرانی که به صورت غیرقانونی به اطلاعات محرمانه‌ی شرکت‌ها دسترسی دارند استفاده می‌کنند. در اینجا، وقتی می‌خواهیم داده‌های درست را به کامپیوتر آموزش بدهیم در واقع داده‌هایی را به آن آموزش می‌دهیم که در واقع اشتباه و نادرست‌اند (مترجم؛ ما تصاویر پزشکی با علائم غیرعادی و مشکوک به بیماری و هم‌چنین اطلاعات معامله‌گران قانون‌گریز را به ماشین یاد می‌دهیم تا آنها را شناسایی کند).

امروزه معمولا برای طبقه‌بندی، بیشتر از شبکه‌های عصبی (neural networks) استفاده می‌شود. در حقیقت شبکه‌های عصبی اصلا برای همین کار به وجود آمده‌اند.

قاعده کلی (rule of thumb) این است: هر چه داده‌ها پیچیده‌تر، الگوریتم هم پیچیده‌تر. برای داده‌های متنی، عددی و جدولی، من روش‌های کلاسیک را انتخاب می‌کنم. زیرا در روش‌های کلاسیک، مدل‌ها کوچکترند و سریع‌تر یاد می‌گیرند و البته عملکرد آنها شفاف‌تر و قابل‌فهم‌تر است. برای تصاویر ، فیلم و بقیه کلان داده‌های (big data) پیچیده، من قطعاً شبکه‌های عصبی را انتخاب می‌کنم.

تا پنج سال پیش هم می‌شد یک طبقه‌‌بندی‌کننده (classifier) برای دسته‌بندی چهره‌های انسان پیدا کرد که با SVM ساخته شده باشد. اما امروزه برای انجام چنین کاری، راه آسان‌تر این است که از بین صدها شبکه‌ی عصبی‌ که از پیش آموزش دیده‌اند (pre-trained) یکی را انتخاب کنید. اما روش‌های به‌کار رفته در فیلترکننده‌های هرزنامه‌ها (spam filters) هیچ تغییری نکرده‌اند و کماکان با SVM نوشته می‌شوند. و تاکنون هیچ دلیل منطقی و مناسبی برای تغییر آنها پیدا نشده است.
حتی وب سایت شخصی من نیز برای شناسایی هرزنامه‌ها در بخش نظرات (comeents) از SVM استفاده می‌کند. ¯_(ツ)_/¯

مترجم: خانم سپیده مشایخی

گزیده:
از دید من، یادگیری ماشین ابزاری است برای رساندن ما از داده‌ها به احتمالات. اما برای رسیدن از احتمالات به درک واقعی، هنوز دو گام دیگر باید برداشته شود- دو گام بزرگ و مهم. یکی پیش‌بینی اثر اقدامات و دیگری تصور خلاف وابع

جودیا پرل (Judea Pearl)
منبع: کتاب تراوش‌های ذهنی، ۲۵ شیوه نگرش به هوش مصنوعی

https://bibalan.com/?p=4050
یوسف مهرداد

یوسف مهرداد


کانال تلگرام

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

برای خروج از جستجو کلید ESC را بفشارید