למידת חיזוק יכולה לתת ספין דינאמי נחמד לשיווק

תוֹכֶן

מהי למידת חיזוק?
אין באגים, אין מתח - המדריך השלב אחר צעד שלך ליצירת תוכנה לשינוי חיים מבלי להרוס את חייך
מכונות למשווקים
בקרוב
חושב גדול יותר
דרך לאימוץ

מקור: Juliatimchenko / Dreamstime.com

להסיר:

למידת חיזוק היא תת קבוצה של בינה מלאכותית ולמידה מכונה שיכולה לחזות תוצאות ולעזור למשתמשים לקבל החלטות טובות יותר.

משווקים מחפשים כל הזמן פתרונות מדרגיים ואינטליגנטים כאשר הם מנסים להשיג יתרון בתנאי השיווק התחרותיים והולכים וגוברים. אין פלא שהבינה המלאכותית (AI) ולמידת מכונות (ML) מאמצים כעת בהמוניהם על ידי מותגים וארגוני השיווק שלהם. (למידע נוסף על היסודות של ML, עיין במכונה למידה 101.)

עבור הלא-יזומים, AI יכול להיחשב בדרך כלל כטכנולוגיה כאשר מחשב מבצע אוטומציה של המשימות שהוגדרו שאדם אחר יבצע. למידת מכונה, כאזור פונקציונלי בתוך AI, היא כאשר למחשב ניתנת מטרת סיום, אך עליו לחשב את המסלול הטוב ביותר בכוחות עצמו.

כיום אנו רואים טכנולוגיות אלה - במיוחד למידת מכונות - פרוסות בתחומי שיווק רבים, כולל איתור הונאות מודעות, חיזוי התנהגות צרכנים, מערכות המלצות, התאמה אישית של יצירתי ועוד.

אמנם כל זה טוב ויפה, אבל יש טכנולוגיה חדשה לפיזור שיועדה למשווקים באמת לספק את הדרישה שיוצרת למידת מכונות. זה נקרא "למידת חיזוק" (RL).

מהי למידת חיזוק?

השינוי בצעד מ- ML ל- RL הוא יותר מסתם מכתב. מרבית המשימות המועברות ללימוד מכונות כוללות שימוש בצעד אחד, כמו "להכיר תמונה זו", "להבין תוכן ספרים" או "הונאה לתפוס". עבור משווק, מטרה עסקית כמו "למשוך, לשמור ולהעסיק משתמשים" היא מטבעו צעד רב-שלבי וארוך טווח, שאינו מושג בקלות בלימוד מכונות.

כאן נכנס למידה של חיזוק. אלגוריתמים של RL כוללים אופטימיזציה למסע שמתגלגל ומשתנה ללא הרף - כזה בו מתרחשות בעיות דינמיות. על ידי שימוש ב"פונקציית תגמול "מתמטית כדי לחשב את התוצאה של כל תמורה, RL יכול לראות לעתיד ולבצע את השיחה הנכונה.

כיום ניתן לראות את התגלומים הטובים ביותר של טכנולוגיה חדישה זו במשחקים ובמכוניות לנהיגה עצמית. כשמערכת ה- AlphaGo של גוגל ניצחה את השחקן הטוב בעולם של משחק הלוח גו בשנה שעברה, הרוטב הסודי שלהם היה למידת חיזוק. בעוד שמשחקים קבעו כללים, האפשרויות של השחקן למסלול לקראת ניצחון משתנות באופן דינמי על סמך מצב הלוח. בעזרת למידת חיזוק, המערכת אחראית לכל התעלות האפשריות שעשויות להשתנות בהתבסס על כל מהלך הבא.

באופן דומה, מכונית שנוהגת בעצמה יוצאת למסע בו כללי הדרך ומיקום היעד נותרו קבועים, אך המשתנים לאורך הדרך - מהולכי רגל ועד חסימות כביש לרוכבי אופניים - משתנים באופן דינמי. זו הסיבה ש- OpenAI, הארגון שהוקם על ידי אלון מאסק של טסלה, מעסיק אלגוריתמים RL מתקדמים לרכביה.

אין באגים, אין מתח - המדריך השלב אחר צעד שלך ליצירת תוכנה לשינוי חיים מבלי להרוס את חייך

אתה לא יכול לשפר את כישורי התכנות שלך כאשר לאף אחד לא אכפת מאיכות התוכנה.

מכונות למשווקים

מה המשמעות של כל אלה למשווקים?

אתגרי הליבה של משווקים רבים נוצרים על ידי העובדה שהמצב העסקי משתנה כל הזמן. אסטרטגיית קמפיין מנצח יכולה להפוך למועדפת עם הזמן, בעוד שאסטרטגיה ישנה יכולה להשיג משיכה חדשה. RL הוא צעד לחיקוי האינטיליגנציה האנושית האמיתית בה אנו למדים מההצלחה ו / או כישלון של תוצאות מרובות, ומהווים אסטרטגיה מנצחת של העתיד. תן לי כמה דוגמאות:

1. שיפור מעורבות משתמשים

בואו נתמקד במעורבות הלקוחות ברשת מסעדות, ובמטרה להכפיל אותה פי עשרה בשנה הבאה. כיום קמפיין שיווקי עשוי לכלול ברכת ברכה ליום הולדת עם הצעת הנחה, אולי אפילו על סמך העדפות אוכל. זוהי חשיבה לינארית בה המשווק הגדיר נקודת התחלה וסיום.

בעולם עמוס, חיי הלקוחות משתנים כל הזמן בזמן אמת - לפעמים הם יותר מעורבים, לפעמים פחות. בלמידת חיזוק, מערכת הייתה מכוונת כל העת מחדש את הטקטיקות שבנשק השיווק, בכל רגע נתון, שעומדות בסיכוי הטוב ביותר להעביר את הנמען לעבר המטרה הסופית של מעורבות 10X.

2. הקצאת תקציב דינמית

עכשיו דמיין תרחיש פרסום שבו יש לך תקציב של מיליון דולר ואתה צריך להשקיע כמה בכל יום עד סוף החודש, המוקצה לארבעה ערוצים שונים: טלוויזיה, קידומי נאמנות וגוגל. איך אתה יכול להבטיח שאתה מוציא את התקציב בצורה האופטימלית ביותר? התשובה תלויה ביום, במשתמשי היעד, במחיר המלאי ובשלל גורמים אחרים.

בלמידת חיזוק, האלגוריתמים ישתמשו בנתוני תוצאות מודעה היסטוריות בכדי לכתוב פונקציות תגמול המבקרות החלטות הוצאה מסוימות. אבל זה גם אחראי לגורמים בזמן אמת כמו תמחור והסבירות לקבלה חיובית מצד קהל היעד. באמצעות למידה איטרטיבית, הקצאת הוצאות המודעות לאורך החודש תשתנה באופן דינמי. אף על פי שהמטרה הסופית נקבעה, RL תקצה תקציב בצורה הטובה ביותר בכל התרחישים. (למידע נוסף על AI בשיווק ראו כיצד בינה מלאכותית תחולל מהפכה בתעשיית המכירות.)

בקרוב

למידת חיזוק מכירה במורכבות ומכירה בכך שאנשים הטרוגניים ומחייבים את האמיתות הללו ומשפרות את כל הפעולות הבאות לאורך זמן ככל שחלקי לוח המשחק שלך משתנים סביבו.

למידת חיזוק היא עדיין במידה רבה שימורם של פרויקטים מחקריים ומאמצים מהשורה הראשונה. התפיסה והטכניקה של המתמטיקה קיימים כבר למעלה מארבעים שנה, אך לא ניתן היה להיערך עד לאחרונה יחסית, הודות לשלושה מגמות:

התפשטות כוח המחשוב באמצעות יחידות עיבוד גרפיות בעלות עוצמה גבוהה (GPUs).
מחשוב ענן הופך את כוח המעבד המתקדם לזמין בשבריר מעלות רכישת ה- GPU עצמם, ומאפשר לצדדים שלישיים לשכור GPU לאמן את מודל ה- RL שלהם למשך מספר שעות, ימים או שבועות במחיר מרתף יחסית להסדר.
שיפור באלגוריתמים מספריים או היוריסטיקה חכמה. כמה צעדים מספריים קריטיים באלגוריתם RL יכולים כעת להתכנס בקצב הרבה יותר מהיר. ללא הטריקים המספריים הקסומים הללו, הם עדיין לא יהיו בר ביצוע אפילו עם המחשבים החזקים ביותר של ימינו.

חושב גדול יותר

כל זה אומר שהכוחות החדשים של למידת חיזוקים בקרוב יהיו זמינים בקנה מידה למותגים ומשווקים. עם זאת, חיבוק זה עומד לדרוש שינוי בהלך הרוח. עבור מנהל שיווק, טכנולוגיה זו פירושה היכולת להוריד את הידיים מההגה.

לכל עסק יש מטרה, אך כשאתה עמוק בתעלות, הפעולות היומיומיות שננקטות לקראת מטרה זו עלולות להפוך מטושטשות. כעת טכנולוגיית RL תאפשר למקבלי ההחלטות להציב את המטרה, תוך ביטחון רב יותר כי המערכות יתוות את הדרך הטובה ביותר שלה.

בפרסום, למשל, בימינו אנשים רבים מבינים כי ערכים כמו שיעור קליקים (CTR) הם בסך הכל פרוקסי לתוצאות עסקיות אמיתיות, אשר נספרות רק מכיוון שהן ניתנות לספור. מערכות שיווק מונעות RL מעניקות דגש על מדדי ביניים כאלה וכל ההרמה הכבדה הקשורה אליהם, ותאפשר לבוסים להתמקד ביעדים.

זה ידרוש מהעסקים לחשוב על הבעיות הגדולות שלהם בצורה הרבה יותר פרואקטיבית וארוכת טווח. כאשר הטכנולוגיה בוגרת, הם ישיגו את מטרתם.

דרך לאימוץ

למידת חיזוק עדיין לא מוכנה לשימוש בקנה מידה מלא של מותגים; עם זאת, על משווקים להקדיש זמן להבין את התפיסה החדשה הזו שעלולה לחולל מהפכה בדרך שבה מותגים מבצעים שיווק, ולהפיק את ההבטחות המוקדמות של לימוד מכונות.

כאשר הכוח יגיע הוא יגיע בתוכנת שיווק עם ממשק משתמש, אך המשימות הנדרשות על ידי אותה תוכנה יופשטו באופן קיצוני. עבור אנשי הצוות יהיו פחות מתגים נעים והזנת מספרים, כמו גם פחות קריאת דוחות אנליטיים ופעולה עליהם. מאחורי לוח המחוונים, האלגוריתם יטפל ברובו.

אין זה סביר כי RL יכולה להתאים את האינטליגנציה האנושית ממש מחוץ לשער. מהירות פיתוחו תלויה במשוב והצעות המשווקים. עלינו להבטיח שאנו מבקשים ממחשב לפתור את הבעיה הנכונה, ולהעניש אותה כשאינה עושה זאת. נשמע איך היית מלמד את ילדך שלך, לא?