תהליך החלטת מרקוב (MDP)

מְחַבֵּר: Laura McKinney
תאריך הבריאה: 5 אַפּרִיל 2021
תאריך עדכון: 22 יוני 2024
Anonim
Markov Decision Processes (MDPs) - Structuring a Reinforcement Learning Problem
וִידֵאוֹ: Markov Decision Processes (MDPs) - Structuring a Reinforcement Learning Problem

תוֹכֶן

הגדרה - מה המשמעות של תהליך החלטת מרקוב (MDP)?

תהליך החלטה של ​​מרקוב (MDP) הוא דבר שאנשי מקצוע מתייחסים אליו כ"תהליך בקרה סטוכסטי בזמן דיסקרטי ". הוא מבוסס על מתמטיקה שבראשה היה אקדמי הרוסי אנדריי מרקוב בסוף המאה ה -19 ותחילת המאה העשרים.


מבוא ל- Microsoft Azure ו- Microsoft Cloud | במהלך מדריך זה תוכלו ללמוד על אודות מיחשוב ענן וכיצד Microsoft Azure יכולה לעזור לכם להעביר ולנהל את העסק שלכם מהענן.

Techopedia מסביר את תהליך ההחלטה של ​​מרקוב (MDP)

אחת הדרכים להסביר את תהליך ההחלטה של ​​מרקוב ואת שרשראות מרקוב המשויכות היא שמדובר באלמנטים של תורת המשחקים המודרנית שמקורה במחקר מתמטי פשוט יותר של המדען הרוסי לפני כמאה שנים. התיאור של תהליך החלטת מרקוב הוא שהוא חוקר תרחיש שבו מערכת נמצאת במערכת מסוימת של מדינות, ומתקדמת למדינה אחרת על בסיס החלטות של מקבלי החלטות.

שרשרת Markov כמודל מראה רצף של אירועים שבהם ההסתברות לאירוע נתון תלויה במצב שהושג בעבר. אנשי מקצוע עשויים לדבר על "מרחב מצבי ניתן לספור" בתיאור תהליך ההחלטה של ​​מרקוב - יש המקשרים בין רעיון מודל ההחלטה של ​​מרקוב למודל "הליכה אקראית" או מודל סטוכסטי אחר המבוסס על הסתברויות (מודל ההליכה האקראי, המצוטט לעתים קרובות על קיר) רחוב, מדגם את תנועת ההון כלפי מעלה או מטה בסבירות הסתברות בשוק).


באופן כללי, תהליכי ההחלטה של ​​מרקוב מיושמים לרוב על כמה מהטכנולוגיות המתוחכמות ביותר עליה עובדים אנשי מקצוע כיום, למשל במודלים של רובוטיקה, אוטומציה ומחקר.