12 טיפים עיקריים ללימוד מדעי הנתונים

מְחַבֵּר: Laura McKinney
תאריך הבריאה: 3 אַפּרִיל 2021
תאריך עדכון: 1 יולי 2024
Anonim
12 days Plan To Learn Python For Data Analyst And Data Science
וִידֵאוֹ: 12 days Plan To Learn Python For Data Analyst And Data Science

תוֹכֶן


מקור: Artinspiring / Dreamstime.com

להסיר:

מדעני נתונים, כמובן, זקוקים לכישורי מתמטיקה וקידוד חזקים, אך תקשורת וכישורים רכים אחרים הם גם חיוניים להצלחה.

מדען הנתונים הוא התפקיד הטוב ביותר לשנת 2019 באמריקה ב- Glassdoor. עם שכר בסיס חציוני של 108,000 $ ודירוג שביעות רצון בעבודה הוא 4.3 מתוך 5, בתוספת מספר לא מבוטל של פתיחות, זה לא מפתיע. השאלה היא: מה צריך לעשות כדי להגיע למסלול כדי להעפיל לתפקיד זה?

כדי לגלות, חיפשנו את העצות שניתנו למי שמבקש לצאת למסלול הקריירה הזה. הרבה מסתכם בכישורים הקשים בקידוד ובמתמטיקה. אבל החישוב החזק הזה בלבד לא חותך אותו. מדעני נתונים מצליחים צריכים גם להיות מסוגלים לדבר עם אנשי עסקים בתנאים שלהם, מה שקורא ליכולות הקשורות למיומנויות רכות ומנהיגות. (למידע נוסף על תפקידו של מדען נתונים, ראה תפקיד תפקיד: מדען נתונים.)

בניית הקרן החינוכית: שלושה טיפים עיקריים

דראץ ג'אן, מדען נתונים באקדמיה למדעי הנתונים של ניו יורק, מדגיש את הצורך בבסיס חינוכי הכולל את יסודות הקידוד ויכולת המתמטיקה:


  1. R / Python + SQL. אם אין לך את כישורי הקידוד, אתה זקוק להרבה כוח רשת ואזורים אחרים בכדי להרגיע את הגירעון הזה. ראיתי מדעני נתונים עם מתמטיקה חלשה וניסיון דומיין מועט אך הם תמיד נשאו על ידי יכולת חזקה לקודד. פייתון אידיאלי אבל R הוא כלי נהדר ליפול. הכי טוב שיהיה שניהם בארסנל שלך. SQL הוא גם חשוב ביותר למנתח נתונים.

  2. כישורי מתמטיקה חזקים. הבנה טובה מאוד של כמה מהשיטות הנפוצות: מודלים לינאריים כלליים, עץ החלטה, אמצעי K ומבחנים סטטיסטיים עדיפה על תמונה רחבה של דגמים שונים או התמחות כמו RNN.

אלה מיומנויות מרכזיות לבנות עליהן, אם כי כמה מומחים מוסיפים להן. לדוגמה, רשימת KDnuggets כוללת את רכיבי הקידוד שזאן ציין ומוסיפה על כמה דברים שימושיים אחרים שצריך לדעת בצד הטכני, כולל פלטפורמת Hadoop Apache Spark, הדמיית נתונים, נתונים לא מובנים, למידת מכונה ו- AI.

אבל אם ניקח את הרמזים שלנו מסקר על הכלים הנפוצים ביותר שזוהו לשימוש בחיים האמיתיים על ידי סקר קגל, אנו מקבלים תוצאות שונות במקצת. כפי שניתן לראות מהגרף של 15 האפשרויות המובילות למטה, Python, R ו- SQL מבצעות בקלות את שלוש הראשונות, אך הרביעית היא מחברות יופיטר, ואחריהן TensorFlow, Amazon Web Services, shell של יוניקס, Tableau, C / C ++, NoSQL , MATLAB / Octave ו- Java, כולם לפני Hadoop ו- Spark. תוספת אחת נוספת שעשויה להפתיע אנשים היא כריית הנתונים של Excel של מיקרוסופט.


תמונה באדיבות קגל

רשימת KDnuggets כוללת גם טיפ לגבי חינוך רשמי. מרבית מדעני הנתונים הם בעלי תארים מתקדמים: 46 אחוזים הם בעלי תואר שלישי ו- 88 אחוזים הם בעלי תואר שני לפחות. התארים לתואר הראשון ברשותם מפוצלים בדרך כלל בין תחומים קשורים. כשליש נמצאים במתמטיקה וסטטיסטיקה, שהיא הפופולרית ביותר למסלול קריירה זה. הבא הפופולרי ביותר הוא תואר במדעי המחשב, המוחזק על ידי 19 אחוזים, והנדסה, הבחירה של 16 אחוזים. כמובן, שהכלים הטכניים המיוחדים למדעי הנתונים לרוב אינם נלמדים בתוכניות התואר אלא במחנות אתחולים המתמחים או באמצעות קורסים מקוונים.

יותר מקורסים: שני טיפים נוספים

האנק יון, עוזר מחקר במחלקת הריאות ברפואת ווייל קורנל וסטודנט באקדמיה למדעי הנתונים של ניו יורק, מייעץ למשאבי מדעי נתונים לתכנן מה הם יעבדו ולמצוא מנטור. הוא אמר:

אין באגים, אין מתח - המדריך השלב אחר צעד שלך ליצירת תוכנה לשינוי חיים מבלי להרוס את חייך

אינך יכול לשפר את כישורי התכנות שלך כאשר לאף אחד לא אכפת מאיכות התוכנה.

אל תעשה את הטעות שעשיתי בכך שאמרת לעצמך שאתה מכיר מדעי נתונים מכיוון שלקחת קורס וקיבלת תעודה. זו התחלה נהדרת, אבל כשאתה מתחיל ללמוד, קח בחשבון פרויקט. אז מצא מנטור בתחום והתחל מייד פרויקט תשוקה! כשאתה טרי אתה לא יודע מה אתה לא יודע אז זה עוזר כשמישהו שם כדי להדריך אותך מה חשוב לך ומה לא. אתה לא רוצה להקדיש זמן רב ללימודים בלי להראות שום דבר לזה!

הידיעה איזה כלי להוציא מארגז הכלים שלך: טיפ להישאר לפני העקומה

בהתחשב בפער בדירוג הכלים למדעי נתונים, חלקם עשויים להרגיש מבולבלים במה להתמקד. סלסט פרליק, מדענית נתונים ראשית בחברת תוכנת האבטחה מקאפי, מתייחסת לנושא במאמר CIO הבוחן את הכישורים החיוניים עבור מדען נתונים, ומצהירה כי "מדען נתונים צריך להישאר מול העקומה במחקר, כמו גם להבין איזה טכנולוגיה ליישם מתי. "זה אומר שלא לפתות את ה"סקסיות" והחדשות, כאשר הבעיה בפועל "דורשת משהו הרבה יותר מפעל. "הכרת העלות החישובית למערכת האקולוגית, הפרשנות, השהיה, רוחב הפס ותנאי גבול מערכת אחרים - כמו גם הבשלות של הלקוח - עצמה עוזרת למדען הנתונים להבין באיזו טכנולוגיה יש ליישם."

מיומנויות רכות חיוניות: שישה טיפים נוספים

הנקודה שמעלה פרליק מתייחסת לכישורים הלא-טכניים שעבודת מדען הנתונים דורשת. זו הסיבה שרשימת KDnuggets כוללת את ארבעת אלה: סקרנות אינטלקטואלית, עבודת צוות, כישורי תקשורת וחיטוב עסקי. ג'אן כלל גם מיומנויות רכות עיקריות בטיפים שלו למדעני נתונים, תוך זיהוי "כישורי תקשורת" כמו KDnuggets, אך שימוש ב"מומחיות תחום "במקום" חוכמה עסקית. "איך שזה נקרא, זה מתייחס ליישום מעשי של מדעי נתונים על עסק. (למידע נוסף על כישורי תקשורת, ראה החשיבות של מיומנויות תקשורת עבור אנשי מקצוע טכניים.)

אוליביה פאר-רוד הציעה סיבוב משלה בנושא, והוסיפה שתי כישורים רכים נוספים, בדגש על תפקיד היצירתיות, תוך טענה, "אני חושבת על מדעי נתונים כאומנות כמו מדע", משהו שדורש להתבסס עליו החוזקות של שני צידי המוח. "אנשים רבים מדברים על מדעי נתונים כקריירה שמשתמשת בעיקר במוח השמאלי. מצאתי שעל מנת להצליח, על מדעני נתונים להשתמש במוחם המלא. "

היא הסבירה כי ההתקדמות בתחום אינה דורשת רק מיומנות טכנית אלא יצירתיות והחזון הדרוש למנהיגות:

רוב המשימות השמאליות / לינאריות יכולות להיות אוטומטיות או למקור חוץ. כדי להציע יתרון תחרותי כמדעני נתונים, עלינו להיות מסוגלים לזהות דפוסים ולסנתז כמויות גדולות של מידע באמצעות שני צידי המוח שלנו. ועלינו להיות הוגים חדשניים. רבים מהתוצאות הטובות ביותר נובעות משילוב מוח שמאל וימני.

היא גם הדגישה מדוע העברת חזון בבירור חיונית:

כמדעני נתונים, מטרתנו היא להשתמש בנתונים כדי לסייע ללקוחותינו להגדיל את רווחיהם. רוב המנהלים אינם מבינים מה אנו עושים ואיך אנו עושים זאת. לכן עלינו לחשוב כמו מנהיגים ולהעביר את הממצאים וההמלצות שלנו בשפה שבעלי העניין שלנו מבינים וסומכים עליהם.

עשרות הנתונים

העצות העיקריות כוללות מספר גדול יותר של כלים טכניים, מיומנויות ויכולות, כמו גם תכונות פחות כימות כמו יכולת ליצירתיות ומנהיגות. בסופו של דבר, זה לא רק משחק מספרים. מכיוון שמדע נתונים אינו עוסק רק ביצירת מודלים בוואקום אלא לבוא עם יישומים מעשיים לפתור בעיות בחיים האמיתיים עבור עסקים, אלה אשר יצליחו בתחום צריכים לא רק לשלוט בטכנולוגיה אלא להכיר את תחום העסקים שלהם ולהבין את הצרכים של חברי הצוות השונים בעבודה.