قالب بندی : PPT
تعداد اسلاید : 60 اسلاید
شرح مختصر : یک اتوماتای یادگیر را می توان بصورت یک شئ مجرد که دارای تعداد متناهی عمل است، در نظر گرفت. اتوماتای یادگیر با انتخاب یک عمل از مجموعه عمل¬های خود و اِعمال آن بر محیط، عمل می کند. عمل مذکور توسط یک محیط تصادفی ارزیابی می شود و اتوماتا از پاسخ محیط برای انتخاب عمل بعدی خود استفاده می کند. در طی این فرایند اتوماتا یاد می گیرد که عمل بهینه را انتخاب نماید. نحوه استفاده از پاسخ محیط به عمل انتخابی اتوماتا که در جهت انتخاب عمل بعدی اتوماتا استفاده می شود، توسط الگوریتم یادگیری اتوماتا مشخص می گردد. یک اتوماتای یادگیر از دو قسمت اصلی تشکیل شده است:
1- یک اتوماتای تصادفی با تعداد محدودی عمل و یک محیط تصادفی که اتوماتا با آن در ارتباط است.
2- الگوریتم یادگیری که اتوماتا با استفاده از آن عمل بهینه را یاد می گیرد.