استخراج گذرگاهها با استفاده از تشخیص اشیا در یادگیری تقویتی
الموضوعات : electrical and computer engineeringبهزاد غضنفری 1 , ناصر مزینی 2 , محمدرضا جاهد مطلق 3
1 - دانشگاه علم و صنعت ایران
2 - دانشگاه علم و صنعت ایران
3 - دانشگاه علم و صنعت ایران
الکلمات المفتاحية: يادگيري تقويتي خوشهبندي اشيا يادگيري تقويتي سلسله مراتبي اقدامات گسترشيافته زماني,
ملخص المقالة :
اين مقاله روش جديدي را مطرح ميکند که قادر به استخراج گذرگاهها بهصورت اتوماتيک براي عامل يادگيري تقويتي است. روش پيشنهادي از سيستمهاي بيولوژيکي، رفتار و مسيريابي حيوانات الهام گرفته شده است و بهواسطه تعاملات عامل با محيط پيرامونياش عمل ميکند. عامل با استفاده از خوشهبندي و تشخيص اشيا بهصورت سلسله مراتبي، نشانههايي را پيدا ميکند. اگر اين نشانهها در فضاي اقدام به هم نزديک باشند، گذرگاهها با استفاده از حالتهاي بين آنها استخراج ميشوند. نتايج آزمايشها بهبود قابل ملاحظهاي را در فرايند يادگيري تقويتي در مقايسه با ساير روشهاي مشابه نشان ميدهد.