קוד פתוח של Big Data Analytics

מְחַבֵּר: Laura McKinney
תאריך הבריאה: 1 אַפּרִיל 2021
תאריך עדכון: 14 מאי 2024
Anonim
30 глупых вопросов Data Engineer [Карьера в IT]
וִידֵאוֹ: 30 глупых вопросов Data Engineer [Карьера в IT]

תוֹכֶן

הגדרה - מה המשמעות של קוד פתוח של Big Data Analytics?

ניתוח נתונים גדולים של קוד פתוח מתייחס לשימוש בתוכנות קוד פתוח וכלים לניתוח כמויות אדירות של נתונים על מנת לאסוף מידע רלוונטי וניתן לפעולה בו יכול ארגון להשתמש כדי לקדם את היעדים העסקיים שלו. השחקן הגדול ביותר בניתוח נתונים גדולים של קוד פתוח הוא Apaches Hadoop - זוהי ספריית התוכנה הנפוצה ביותר לעיבוד מערכי נתונים עצומים ברחבי מקבץ מחשבים המשתמשים בתהליך מבוזר להקבלה.


מבוא ל- Microsoft Azure ו- Microsoft Cloud | במהלך מדריך זה תוכלו ללמוד על אודות מיחשוב ענן וכיצד Microsoft Azure יכולה לעזור לכם להעביר ולנהל את העסק שלכם מהענן.

Techopedia מסביר קוד פתוח של Big Data Analytics

ניתוח נתונים גדולים של קוד פתוח עושה שימוש בתוכנות וכלים בקוד פתוח בכדי לבצע ניתוחי נתונים גדולים של נתונים על ידי שימוש בפלטפורמת תוכנה שלמה או בכלי קוד פתוח שונים למשימות שונות בתהליך ניתוח נתונים. Apache Hadoop היא המערכת הידועה ביותר לניתוח נתונים גדולים, אך רכיבים אחרים נדרשים לפני שניתן יהיה להרכיב מערכת אנליזה אמיתית.

Hadoop הוא יישום הקוד הפתוח של אלגוריתם MapReduce החלוץ על ידי גוגל ויאהו, כך שהוא הבסיס לרוב מערכות האנליטיקה כיום. כלים רבים לניתוח נתונים גדולים מאפשרים שימוש בקוד פתוח, כולל מערכות מסדי נתונים חזקות כמו MongoDB עם קוד פתוח, בסיס נתונים NoSQL מתוחכם וניתן להרחבה המתאים מאוד ליישומי נתונים גדולים כמו גם לאחרים.

שירותי ניתוח נתונים גדולים של קוד פתוח כוללים:

  • מערכת איסוף נתונים
  • מרכז בקרה לניהול וניטור אשכולות
  • למידת מכונות וספריית כריית נתונים
  • שירות תיאום אפליקציות
  • מנוע מחשוב
  • מסגרת ביצוע