6 מיתוסים גדולים אודות ניהול ביג דאטה

מְחַבֵּר: Eugene Taylor
תאריך הבריאה: 15 אוגוסט 2021
תאריך עדכון: 22 יוני 2024
Anonim
7 deadly myths about big data, Part 6
וִידֵאוֹ: 7 deadly myths about big data, Part 6

תוֹכֶן


מקור: Dwnld777 / Dreamstime.com

להסיר:

נתונים גדולים הם עסק גדול, אך רק אם משתמשים בהם כראוי.

בחודש מאי 2014 פרסמה מחקר פורסטר שני דו"חות שהסקו מסקנות מסוימות לגבי ההייפ סביב נתונים גדולים. חברת המחקר סקרה למעלה מ- 250 מנהלי שיווק ופיתוח עסקי. על פי מחברי הדוחות, הרטוריקה של נתונים גדולים נמצאת בשיא כל הזמנים, וספקי הטכנולוגיה מציגים מוצרים עם מה שנראה כתביעות מדהימות.

גרטנר מסכים עם פורסטר מחקר; הייפ משמעותי מקיף נתונים גדולים. בדו"ח ספטמבר 2014 גרטנר מתייחס לחמישה ממיתוסי הנתונים הגדולים ביותר, ואנליסטים של גרטנר מציעים את דעתם באשר לאי-הבנה רבה של נתונים גדולים ומניפולציה שלהם. אז מהם המיתוסים הגדולים של הנתונים הגדולים? בוא נראה.

מיתוס: כולם לפנינו באימוץ נתונים גדולים.

גרטנר אומר שההתעניינות בנתונים גדולים עולה בשיא כל הזמנים. למרות זאת, ל -13 אחוזים מהסקרנים יש מערכות עבודה. הסיבה: מרבית החברות טרם הבינו כיצד ניתן לכרות ערך כלשהו ממאגרי נתונים גדולים. כאן, הסקר של גרטנר הוא אופטימי יותר מדו"ח פורסטר ", שמצא שרק 9 אחוז ממשתתפי הסקר אמרו כי הם מתכוונים ליישם טכנולוגיות ביג-נתונים בשנה הבאה. (לנתונים גדולים יש הרבה מה להציע. למידע נוסף על 5 בעיות בעולם האמיתי שביג דאטה יכול להיפתר.)

מיתוס: יש לנו כל כך הרבה נתונים; איננו צריכים לדאוג לכל פגם קטן בנתונים.

גרטנר מודאג מכדאיות שיש לנו בבני אדם: "יש לנו כל כך הרבה, המעט שזה רע לא משנה." טד פרידמן, סגן נשיא ואנליטיקאי מכובד בגרטנר סבור שזו הדרך הלא נכונה להסתכל על המצב.

פרידמן אמר כי "במציאות, למרות שלכל פגם אינדיבידואלי יש השפעה קטנה בהרבה על כל מערך הנתונים, מאשר היה כשהיו פחות נתונים, ישנם יותר פגמים מאשר בעבר מכיוון שיש יותר נתונים". "לכן, ההשפעה הכוללת של נתונים באיכות ירודה על מערך הנתונים כולו נותרה זהה."

פרידמן מוסיף סיבה נוספת לדאגה. לכידת נתונים גדולים כוללת לעתים קרובות נתונים מחוץ לעסק, אשר אם כן הם בעלי מבנה ומוצא לא ידוע. זה מגדיל את פוטנציאל השגיאות.

מיתוס: טכנולוגיית נתונים גדולה תבטל את הצורך בשילוב נתונים.

ישנן שתי אסטרטגיות מפתח לניתוח נתונים העשויות להחיל על נתונים גדולים: "סכמה על כתיבה" או "סכמה בקריאה". עד לאחרונה, סכימות בכתיבה היו השיטה היחידה בה נעשה שימוש. סכמה לקריאה היא השיגעון הנוכחי בניהול מסדי נתונים. בשונה מסכימות על הכתיבה, הדורשת תבנית מובנית, נתונים נטענים למסדי נתונים שקוראים קריאה בפורמט הגולמי. ואז מפתחים - המשתמשים בפלטפורמות מסד נתונים לא מובנות כמו Hadoop - מכופפים את הנתונים השונים לפורמט שמיש. לסכמה שקראה יש יתרונות ברורים, אך כפי שציין גרטנר, שילוב נתונים צריך להתרחש בשלב מסוים.

מיתוס: השימוש במחסן נתונים לניתוח מתקדם הוא חסר טעם.

לבזבז את הזמן ליצירת מחסן נתונים נראה חסר טעם עבור מנהלי מידע רבים, במיוחד כאשר נתונים שנלכדו לאחרונה שונים מאלה שבמחסן הנתונים. עם זאת, גרטנר שוב מזהיר כי אפילו ניתוחים מתקדמים של נתונים ישתמשו במחסני נתונים ובנתונים חדשים, מה שאומר שמשלבי נתונים חייבים:
  • צמצם את סוגי הנתונים החדשים כדי להתאים אותם לניתוח
  • החלט אילו נתונים הם רלוונטיים, ואת רמת איכות הנתונים הדרושה
  • קבע כיצד לצבור את הנתונים
  • הבינו ששכלול נתונים יכול לקרות במקומות שאינם מחסן הנתונים

מיתוס: אגמי נתונים יחליפו את מחסן הנתונים.

אגמי נתונים הם מאגרים של נתונים שונים, לעומת מחסני נתונים שבהם הנתונים בפורמט מובנה. יצירת אגם נתונים דורשת מאמץ מעט מראש (אין צורך לפרמט את הנתונים) לעומת מחסני נתונים, וזו הסיבה שאגמי נתונים מעניינים אותם.

גרטנר מדגיש כי אין בכך את העניין - היכולת לתמרן את הנתונים שנלכדו לקבלת החלטות מושכלות היא הנקודה. יתר על כן, השימוש באגמי נתונים (לא מוכחים) כדי להקל על קבלת ההחלטות הוא בעייתי.

ניק מחודר, מנהל המחקר בגרטנר, אמר כי "למחסני נתונים כבר יש את היכולות לתמוך במגוון רחב של משתמשים ברחבי ארגון." "מנהיגי ניהול מידע אינם צריכים לחכות לאגמי נתונים כדי להתעדכן." (למידע נוסף על אימוץ נתונים גדולים ב- 7 דברים שעליכם לדעת על נתונים גדולים לפני אימוץ.)

Big Data Works - שיטות מניפולציה חדשות עשויות שלא

הסיבה לכך שגרטנר אמר כי "מיתוסי הנתונים הגדולים ביותר" במקום "מיתוסים גדולים-נתונים" מתבררת לאחר שקרא את הדו"ח. גרטנר אינו מבולבל של נתונים גדולים. גרטנר מעורר זלזול במי שמרגיש שהשיטות החדשות יותר לתמרון נתונים גדולים מוכנים ל"פריים טיים ".