از هفته پیش که ترم جاری دانشگاه رسما به پایان رسید، کمی فرصت پیدا کردم به کارهایی که دوست داشتم بپردازم. آموختن علم داده و یادگیری ماشین که خود یک سفر بیپایان است کمک میکند تا به مسالههای جدیدی فکر کنم و راهکارهایی هم در ذهنم برای آنها آماده کنم.
یکی از این طیف مسالهها، کاربرد یادگیری ماشین در ادبیات فارسی است. عزیزانی که با یادگیری ماشین آشنایی دارند بیشک میدانند که چقدر مسالههای جالب میتوان از کاربرد یادگیری ماشین در این حوزه تعریف کرد که به شناخت و گسترش آن کمک کند.
هفته پیش تصمیم گرفتم یکی کارهایی را که دوست داشتم شروع کنم و بخشی از مرخصی بین ترم را به آن اختصاص دهم. این کار، تحقیقی بود روی اشعار مولانا. دادهها را از سایت گنجور دانلود کردم و شروع کردم به کار روی دیوان شمس. فهمیدن ساختار پایگاه داده یک کم زمان برد ولی به دلیل طراحی ساده و قشنگ آن، خیلی زود متوجه شدم که ابیات را چگونه پیدا کنم. نتایج اولیهاش برای خودم خیلی جالب بود.
یکی از مسالههای مهمی که با آن برخورد کردم، نبود کتابخانهها و مدلهای آموزشدیده (trained model) برای زبان فارسی بود. امیدوارم که روز به روز به تعداد این کتابخانهها و مدلها افزوده شود. با خود فکر میکردم چقدر کارهایی جالب بین رشتهای میتوان در حوزهی ادبیات فارسی و علوم داده تعریف کرد.
نومید نیم گرچه ز من ببریدی
یا بر سر من یار دگر بگزیدی
تا جان دارم غم تو خواهم خوردن
بسیار امیدهاست در نومیدی
تا یادم نرفته عرض کنم که سایت گنجور از سایتهای مورد علاقهی من است. قدردان زحمات بنیانگذار و همهی دستاندرکاران آن هستم. پاینده باشید.
گزیده:
تا در طلب گوهر کانی کانی
تا در هوس لقمهٔ نانی نانی
این نکتهٔ رمز اگر بدانی دانی
هر چیزی که در جستن آنی آنی
دیدگاهتان را بنویسید