לימוד עם חיזוקים

מְחַבֵּר: Lewis Jackson
תאריך הבריאה: 11 מאי 2021
תאריך עדכון: 15 מאי 2024
Anonim
חיזוקים טילים על לימוד התורה הקדושה - הרב מאיר אליהו שליט"א.
וִידֵאוֹ: חיזוקים טילים על לימוד התורה הקדושה - הרב מאיר אליהו שליט"א.

תוֹכֶן

הגדרה - מה המשמעות של למידת חיזוק?

למידת חיזוק, במונחים של בינה מלאכותית, היא סוג של תכנות דינאמי המכשיר אלגוריתמים באמצעות מערכת של תגמול ועונש.


אלגוריתם למידה חיזוק, או סוכן, לומד על ידי אינטראקציה עם הסביבה שלו. הסוכן מקבל תגמולים על ידי ביצוע נכון ועונשים על ביצוע לא נכון. הסוכן לומד ללא התערבות מצד אדם על ידי מקסום שכרו ומזעור העונש שלו.

מבוא ל- Microsoft Azure ו- Microsoft Cloud | במהלך מדריך זה תוכלו ללמוד על אודות מיחשוב ענן וכיצד Microsoft Azure יכולה לעזור לכם להעביר ולנהל את העסק שלכם מהענן.

Techopedia מסביר למידה על חיזוק

למידת חיזוק היא גישה ללימוד מכונות בהשראת הפסיכולוגיה הביהביוריסטית. זה דומה לאופן בו ילד לומד לבצע משימה חדשה. למידת חיזוק מנוגדת לגישות אחרות של למידת מכונה בכך שהאלגוריתם לא מסופר במפורש כיצד לבצע משימה, אלא עובדת על הבעיה בכוחות עצמה.

כסוכן, שיכול להיות מכונית בנהיגה עצמית או בתוכנית שמשחקת שחמט, מתקיים אינטראקציה עם סביבתו, מקבל מצב תגמול תלוי בביצועיו, כמו נסיעה ליעד בבטחה או ניצחון במשחק. לעומת זאת, הסוכן מקבל קנס בגין ביצוע לא נכון, כגון היציאה מהכביש או הוצאת צ'מקים.

הסוכן מקבל לאורך זמן החלטות למקסם את תגמולו ולמזער את העונש שלו באמצעות תכנות דינמי. היתרון בגישה זו לבינה מלאכותית הוא בכך שהיא מאפשרת לתוכנית AI ללמוד מבלי שמתכנת יפרט כיצד סוכן צריך לבצע את המשימה.