7 שלבים ללימוד כריית נתונים ומדעי נתונים

מְחַבֵּר: Eugene Taylor
תאריך הבריאה: 12 אוגוסט 2021
תאריך עדכון: 22 יוני 2024
Anonim
7 שלבים ללימוד כריית נתונים ומדעי נתונים - טכנולוגיה
7 שלבים ללימוד כריית נתונים ומדעי נתונים - טכנולוגיה

תוֹכֶן


מקור: פול צי / Dreamstime.com

להסיר:

מדעי הנתונים נלמדים בצורה הטובה ביותר על ידי עשייה, אך גם בסיס טוב לסטטיסטיקה ולמידת מכונה עניינים.

שואלים אותי לעתים קרובות כיצד ללמוד כריית נתונים ומדעי נתונים. הנה הסיכום שלי.

אתה יכול ללמוד בצורה הטובה ביותר כריית נתונים ומדעי נתונים על ידי כך שתתחיל לנתח נתונים בהקדם האפשרי! עם זאת, אל תשכח ללמוד את התיאוריה, מכיוון שאתה זקוק לבסיס טוב לסטטיסטיקה ומכונה כדי להבין מה אתה עושה ולמצוא נאגטים אמיתיים בעלי ערך ברעש של נתונים גדולים.

להלן שבעה שלבים ללימוד כריית נתונים ומדעי נתונים. למרות שהם ממוספרים, אתה יכול לעשות אותם במקביל או בסדר אחר.

  1. שפות: למדו R, Python ו- SQL
  2. כלים: למד כיצד להשתמש בכלי כריית נתונים והדמיה
  3. ספרים: קרא ספרי מבוא כדי להבין את היסודות
  4. השכלה: צפה בסמינרים מקוונים, השתתף בקורסים ושקול תעודה או תואר במדעי המידע (קרא עוד בבן לוריקאס כיצד לטפח מדען נתונים.)
  5. נתונים: בדוק את מקורות הנתונים הזמינים ומצא שם משהו
  6. תחרויות: השתתפו בתחרויות לכריית נתונים
  7. אינטראקציה עם מדעני נתונים אחרים, דרך רשתות חברתיות, קבוצות ומפגשים

במאמר זה, אני משתמש בכריית נתונים ובמדעי נתונים זה בזה. ראה את המצגת שלי, סקירת תעשיה של אנליטיקס, שם אני מסתכל על ההתפתחות והפופולריות של מונחים שונים כמו סטטיסטיקות, גילוי ידע, כריית נתונים, ניתוח חזוי, מדעי נתונים ונתונים גדולים.


1. לימוד שפות

בסקר KDnuggets שנערך לאחרונה נמצא כי השפות הפופולריות ביותר לכריית נתונים הן R, Python ו- SQL. ישנם משאבים רבים לכל אחד, למשל:

  • ספר אלקטרוני בחינם על מדעי נתונים עם R
  • תחילת העבודה עם פייתון למדעי נתונים
  • פייתון לניתוח נתונים: כלים זריזים לנתונים בעולם האמיתי
  • פיתון חיוני: המקור למדעי נתונים
  • W3 בתי ספר לומדים SQL

2. כלים: תוכנת כריית נתונים, מדעי נתונים, ויזואליזציה

ישנם כלים רבים לכריית נתונים למשימות שונות, אך עדיף ללמוד כיצד להשתמש בחבילת כריית נתונים התומכת בכל תהליך ניתוח הנתונים. אתה יכול להתחיל עם כלים עם קוד פתוח (בחינם) כמו KNIME, RapidMiner ו- Weka.

עם זאת, עבור עבודות אנליטיקה רבות אתה צריך להכיר את SAS, שהוא הכלי המסחרי המוביל והשימוש נרחב. תוכנות אנליטיות וכריית נתונים פופולריות אחרות כוללות MATLAB, StatSoft STATISTICA, Microsoft SQL Server, Tableau, IBM SPSS Modeler ו- Rattle.

אין באגים, אין מתח - המדריך השלב אחר צעד שלך ליצירת תוכנה לשינוי חיים מבלי להרוס את חייך

אתה לא יכול לשפר את כישורי התכנות שלך כאשר לאף אחד לא אכפת מאיכות התוכנה.


ויזואליזציה היא חלק חיוני מכל ניתוח נתונים. למדו כיצד להשתמש ב- Microsoft Excel (מתאים למשימות רבות ופשוטות יותר), גרפיקה R, (במיוחד ggplot2), וגם Tableau - חבילה מצוינת להמחשה. כלי הדמיה טובים אחרים כוללים TIBCO Spotfire ו- Miner3D.

3. ספרים

ישנם ספרים רבים בנושא כריית נתונים ומדעי נתונים, אך אתה יכול לבדוק את הדברים הבאים:

  • כריית נתונים וניתוח: מושגים ואלגוריתמים בסיסיים, הורדת PDF בחינם (טיוטה), מאת מוחמד זכי ווגנר מאירה ג'וניור.
  • כריית נתונים: כלים וטכניקות למידת מכונות מעשיות, מאת איאן וייטן, אייבה פרנק ומארק הול, מחברי ווקה, והשתמשו בוואקה בהרחבה בדוגמאות.
  • מרכיבי הלמידה הסטטיסטית, כריית נתונים, הסקה וחיזוי, מאת טרבור הייסטי, רוברט טיבשיראני, ג'רום פרידמן. מבוא נהדר למכוונים מתמטיים
  • LIONbook: למידה ואופטימיזציה חכמה, מאת רוברטו באטיטי ומאורו ברונאטו, זמין באופן חופשי באינטרנט, פרק אחר פרק.
  • כריית ספר נתונים ענקיים, מאת א 'רג'ארמאן, ג'יי אולמן
  • ספר הסטטיסטיקה האלקטרונית של סטאטסופט (בחינם), כולל נושאים רבים של כריית נתונים

4. השכלה: סמינרים מקוונים, קורסים, תעודות ותארים

אתה יכול להתחיל בצפייה בכמה מהסמינרים הרבים והמשדרים ברשת בחינם בנושאים האחרונים בתחום ניתוחים, ביג נתונים, כריית נתונים ומדעי נתונים.

ישנם גם הרבה קורסים מקוונים, קצרים וארוכים, רבים מהם בחינם. (ראה ספריית חינוך מקוונת של KDnuggets.)

בדוק במיוחד את הקורסים הבאים:

  • לימוד מכונות, בקורסרה, בהוראת אנדרו נג
  • למידה מהנתונים ב- edX, בהוראת פרופסור קלטק יסר אבו-מוסטפא
  • קורס מקוון פתוח במדעי נתונים יישומיים, מ- Syracuse iSchool
  • כריית נתונים עם ווקה, קורס מקוון חינם
  • בדוק גם שקופיות מקוונות בחינם מקורס כריית הנתונים שלי, קורס מבוא ארוך-ימי סמסטר בכריית נתונים

לבסוף, שקלו לקבל תעודות בכריית נתונים, ומדעי נתונים או תארים מתקדמים, כמו תואר שני במדעי נתונים.

5. נתונים

תצטרך נתונים לניתוח - עיין בספריית KDnuggets של מערכי נתונים לכריית נתונים, כולל:

  • אתרי נתונים ופורטלים ממשלתיים, פדרליים, מדינה, עיריים, מקומיים וציבוריים
  • ממשקי API של נתונים, רכזות, שוק, פלטפורמות, פורטלים ומנועי חיפוש
  • ערכות נתונים ציבוריות בחינם

6. תחרויות

שוב, תוכלו ללמוד בצורה הטובה ביותר על ידי ביצוע, אז השתתפו בתחרויות קגגל. התחל עם תחרויות מתחילים, כמו חיזוי הישרדות טיטניק באמצעות למידת מכונה.

7. אינטראקציה: פגישות, קבוצות ורשתות חברתיות

אתה יכול להצטרף לקבוצות עמיתים רבות. עיין ב -30 קבוצות הלינקדאין המובילות עבור אנליטיקס, ביג דאטה, כריית נתונים ומדעי נתונים.

AnalyticBridge היא קהילה פעילה למדעי אנליזה ומידע.

תוכלו להשתתף בכמה מהפגישות והוועידות הרבות בנושא אנליטיקס, ביג דאטה, כריית נתונים, מדעי נתונים וגילוי ידע.

כמו כן, שקלו להצטרף ל- ACM SIGKDD, המארגנת את ועידת KDD השנתית - ועידת המחקר המובילה בתחום.

מאמר זה הנו ריד מ- KDNuggets.com. השימוש בו נעשה ברשות המחבר.