אפאצ'י חזיר

מְחַבֵּר: Robert Simon
תאריך הבריאה: 16 יוני 2021
תאריך עדכון: 13 מאי 2024
Anonim
אפאצ'י חזיר - טכנולוגיה
אפאצ'י חזיר - טכנולוגיה

תוֹכֶן

הגדרה - מה המשמעות של אפאצ'י חזיר?

Apache Pig היא פלטפורמה המשמשת לניתוח מערכי נתונים גדולים. זה מורכב משפה ברמה גבוהה לביטוי תוכניות לניתוח נתונים, יחד עם התשתית להערכת תוכניות אלה. אחת התכונות המשמעותיות ביותר של חזיר היא שהמבנה שלה מגיב להקבלה משמעותית.


חזיר פועל בפלטפורמת Hadoop, כותב נתונים וקורא נתונים ממערכת הקבצים המופצת Hadoop (HDFS) ומבצע עיבוד באמצעות משימה אחת או יותר של MapReduce. Apache Pig זמין כקוד פתוח.

אפאצ'י חזיר ידוע גם בשם שפת תכנות חזיר או Hadoop Pig.

מבוא ל- Microsoft Azure ו- Microsoft Cloud | במהלך מדריך זה תוכלו ללמוד על אודות מיחשוב ענן וכיצד Microsoft Azure יכולה לעזור לכם להעביר ולנהל את העסק שלכם מהענן.

Techopedia מסביר את Apache Pig

אפאצ'י חזיר יש שני חלקים: שפת חזיר לטינית ומנוע חזיר. שפת החזיר הלטינית היא שפת סקריפט המאפשרת למשתמשים להמחיש את האופן בו יש לקרוא ולעבד את זרימת הנתונים מכניסות אחת או יותר, ואת המיקום בו יש לאחסן.

חלק מתכונות המפתח של חזיר לטיני הם כדלקמן:

  • קל לתכנות: משימות מורכבות המורכבות מטרנספורמציות נתונים שונות המחוברות זו לזו מקודדות בבירור כרצפי זרימת נתונים. זה הופך אותם לפשוטים לכתוב, להבין ולתחזק.
  • אפשרויות אופטימיזציה: אופן קידוד המשימות מאפשר למערכת לבצע אופטימיזציה של ביצוע אוטומטי. זה מאפשר למשתמש לשים לב לסמנטיקה במקום ליעילות.
  • הרחבה: למשתמשים רשאים ליצור פונקציות משלהם לביצוע עיבוד ייעודי מיוחד. מנוע החזיר אחראי על ביצוע זרימת הנתונים הכתובה בלטינית חזיר. בדומה לתכנון רגיל של מערכת ניהול בסיסי נתונים (RDBMS), אפאצ'י חזיר מורכב מנתח, אופטימיזציה ובודק סוג, בנוסף למפעילים המבצעים עיבוד נתונים. החזיר אינו כולל עסקאות, קטלוג נתונים או יכולת לטפל ישירות באחסון נתונים או להעסיק את מסגרת הביצוע.