מדוע בחירת תכונות חשובה כל כך בלימוד מכונות?

מְחַבֵּר: Roger Morrison
תאריך הבריאה: 26 סֶפּטֶמבֶּר 2021
תאריך עדכון: 11 מאי 2024
Anonim
Feature Selection In Machine Learning | Feature Selection Techniques With Examples | Simplilearn
וִידֵאוֹ: Feature Selection In Machine Learning | Feature Selection Techniques With Examples | Simplilearn

תוֹכֶן

ש:

מדוע בחירת תכונות חשובה כל כך בלימוד מכונות?


ת:

בחירת תכונות חשובה ביותר בלמידה של מכונה, בעיקר מכיוון שהיא משמשת כטכניקה בסיסית להפניית השימוש במשתנים למה היעיל והיעיל ביותר עבור מערכת לימוד מכונה נתונה.

מומחים מדברים על האופן בו בחירת תכונות וחילוץ תכונות פועלות כדי למזער את קללת המימד או לעזור להתמודד עם התאמה יתר - אלה דרכים שונות להתייחס לרעיון של דוגמנות מורכבת מדי.


דרך נוספת לומר זאת היא שבחירת תכונות עוזרת לתת למפתחים את הכלים להשתמש רק בנתונים הרלוונטיים והשימושיים ביותר בקבוצות הדרכה למידת מכונה, מה שמפחית באופן דרמטי את העלויות ואת נפח הנתונים.

דוגמא אחת היא הרעיון של מדידת צורה מורכבת בסדר גודל. ככל שהתכנית מתרחשת, היא מזהה מספר גדול יותר של נקודות נתונים והמערכת הופכת מורכבת בהרבה. אך צורה מורכבת אינה מערך הנתונים האופייני שמערכת למידת מכונה משתמשת בה. מערכות אלה עשויות להשתמש במערכות נתונים שיש בהן שונות מאוד ברמות השונות בין משתנים שונים. לדוגמה, בסיווג מינים, מהנדסים יכולים להשתמש בבחירת תכונות רק כדי ללמוד את המשתנים שיעניקו להם את התוצאות הממוקדות ביותר. אם לכל בעל חיים בתרשים יש את אותו המספר של עיניים או רגליים, ייתכן שיש להסיר נתונים או לחלץ נקודות נתונים רלוונטיות אחרות.


בחירת התכונות היא התהליך המפלה שבאמצעותו מכוונים מהנדסים מערכות למידת מכונה לעבר היעד. בנוסף לרעיון של הסרת המורכבות ממערכות בסדר גודל, בחירת התכונות יכולה גם להיות שימושית במיטוב ההיבטים של מה שמומחים מכנים "חילופי הטיה" בלימוד מכונות.

הסיבות לכך שבחירת התכונות מסייעת בניתוח הטיה וניתוח שונות הן מסובכות יותר. מחקר מאוניברסיטת קורנל על בחירת תכונות, שונות בהטיה ושקיות משמשים להמחשה כיצד בחירת התכונות מסייעת לפרויקטים.

לדברי המחברים, העיתון "בוחן את המנגנון שבאמצעותו בחירת התכונות משפרת את הדיוק של הלמידה בפיקוח."

המחקר קובע עוד כי:

ניתוח הטיה / שונות בין אמפירי ככל שמתקדמת בבחירת התכונות מצביע על כך שערכת התכונות המדויקת ביותר תואמת את נקודת ההחלפה הטובה ביותר של הטיה בין שונות לאלגוריתם הלמידה.

בדיון בשימוש ברלוונטיות חזקה או חלשה, הכותבים מדברים על בחירת תכונות כ"שיטת צמצום שונות "- זה הגיוני כשחושבים על שונות ככמות הווריאציה במשתנה נתון. אם אין שונות, נקודת הנתונים או המערך עשויים להיות חסרי תועלת. אם יש שונות גבוהה במיוחד, זה עשוי להתפשט למה שהמהנדסים עשויים לחשוב עליהם כ"רעש "או תוצאות לא שרלוונטיות, שרירותיות, שקשה למערכת למידת המכונה לנהל.


לאור זאת, בחירת התכונות היא חלק מהותי מהעיצוב בלימוד מכונות.