כיצד מאגרי נתונים גרפיים מביאים רשת לנתונים

מְחַבֵּר: Roger Morrison
תאריך הבריאה: 20 סֶפּטֶמבֶּר 2021
תאריך עדכון: 11 מאי 2024
Anonim
Network & IT Operations:  Leveraging Connections in Data with Graph Databases
וִידֵאוֹ: Network & IT Operations: Leveraging Connections in Data with Graph Databases

תוֹכֶן


מקור: Nongpimmy / Dreamstime.com

להסיר:

בסיסי נתונים גרפיים משתמשים במושגי רשת כדי לעבד נתונים במהירות רבה וביעילות הרבה יותר מאשר מסדי נתונים מסורתיים.

יישומים מונעי נתונים מודרניים תלויים במידה רבה בתובנות רלוונטיות הנגזרות מכמויות הנתונים העצומות בהן הם מטפלים מדי יום. כדי לקבל תובנות טובות יותר בכל פעם, היישומים צריכים להיות מסוגלים לשאילתות מורכבות ובסיס הנתונים אמור להיות מסוגל לתת מענה לשאלות מורכבות. מערכות RDBMS מסורתיות הנשענות על SQL אינן מסוגלות להתמודד עם שאילתות מורכבות במיוחד. מאגרי נתונים גרפיים הצליחו לפתור בעיה זו מכיוון שהם מסתמכים על אובייקטים ועל מערכות היחסים בין אובייקטים. על סמך הנחת יסוד זו ניתן לחלץ תובנות עמוקות. עם זאת, השימוש במאגרי נתונים גרפיים מוגבל, אם כי ישנם סימנים מוגדרים לכך שהוא ימלא תפקיד חשוב ככל שעסקים מסתמכים יותר ויותר על תובנות לשלטון העסק שלהם. (למידע נוסף על בסיסי נתונים בכלל, ראה מבוא למאגרי מידע.)

מהו מאגר גרפים?

להבנת מסדי נתונים של גרפים, נשתמש בדוגמה הבאה:

ביל ומשפחתו רוצים לתכנן חופשה למקום שמציע מטבח אסייתי נהדר. הוא החל לתכנן מוקדם ואחת הדרכים למצוא מידע היא כמובן גוגל. למרות שהמידע מגוגל אמין וטוב, עבור ביל, חשוב לקבל מידע ספציפי ככל האפשר. אז הוא מתחיל לשאול את חבריו, מכריו ועמיתיו. נניח שביל שואל את ראיין, שינה וג'ון, שהם אנשי הקשר העיקריים שלו (קשר ברמה 1). שלושתם מבטיחים להגיב במידע בהקדם האפשרי. ריאן שואל את חברו גרג, ששואל את בן דודו מרטין שהה בבנגקוק כמה פעמים. מרטין ממליץ על שמות ופרטים של כל האוכל המועדף עליו בבנגקוק הידוע במאכלים האסיאתיים שלהם. מידע זה מועבר בחזרה לביל.


ראית זה עתה דוגמא מהחיים האמיתיים לשאילתה מורכבת המבוססת על אובייקטים ומערכות יחסים. בסיס הנתונים הגרפי עובד על אותו עיקרון. זה קשור לרשת, האובייקטים ומערכות היחסים ביניהם ברשת.

בעיקרון, מסד נתונים של גרפים מסוגל לתרשימים מורכבים במיוחד ומספק תובנות שמערכות RDBMS מבוססות שאילתות SQL אינן יכולות. וזו נקודת המכירה הייחודית למאגרי נתונים גרפיים.

כיצד עובד מסד נתונים גרפי?

התיאור לעיל של מסד נתונים גרפי נותן מושג כלשהו לגבי העקרונות שמאגר מידע גרף מיישם כאשר הוא מחפש מידע או תובנות. בעיקרון, הוא חוצה את רשת האובייקטים והקשרים המבוססים על השאילתה, ומחזיר את התוצאות.

אם ניקח את הדוגמא לעיל של ביל, אז כיצד יתבצע מסד נתונים גרפי בתפקידו? ברור שיש הרבה מערכות יחסים וצמתים בדוגמה. אם אנו רואים את מרחק היחסים, זה היה נראה כך:

חשבון = 0 (המקור)

אין באגים, אין מתח - המדריך השלב אחר צעד שלך ליצירת תוכנה לשינוי חיים מבלי להרוס את חייך

אינך יכול לשפר את כישורי התכנות שלך כאשר לאף אחד לא אכפת מאיכות התוכנה.


ראיין = 1

שינה = 1

ג'ון = 1

גרג = 2

מרטין = 3

המרחק בין המקור (אפס) לצומת המספק את המידע יכול להיות עוד יותר בחיים האמיתיים - כך עובדת הרשת.

דמיין יישום שמכיל שאילתה בהתבסס על דרישתו של ביל. זה יהיה משהו כמו:

מצא את כל החברים שקשורים לחמישה חברים שאוהבים אוכל אסייתי, שביקרו בתאילנד וגרים במרחק של 5 מיילים מדאלאס.

קיימים בשוק הרבה מסדי נתונים של גרפים, וה- Neo4j הוא הפופולרי ביותר ביניהם. Neo4j יכול לייחס את הפופולריות שלה לעובדות שהיא יעילה וגם קוד פתוח. לכן, כשאתה מבקש ל- Neo4j כדי לפתור את הבעיה של ביל, השאילתה יכולה להיראות כמו:

// בחר חברים וחברים של חברים, מילת מפתח של אוכל אסייתי, מילת מפתח של בנגקוק, סדר לפי עומק הקשר

מחרוזת findFriendsQuery = "התחל n = צומת (*), אדם = צומת ({userNode}) MATCH p = (אדם) - (חבר) מחזירים סדר p נפרד לפי אורך (p)";

בהתבסס על השאילתה, Neo4j הולך לחפש ברשת הזמינה שלה ולמצוא את ההתאמות הקרובות ביותר.

ההבדל בין מסדי נתונים גרפיים ובסיסי נתונים יחסיים

הנקודה העיקרית שסביבה משווים בין מסדי נתונים יחסיים ומסדי נתונים גרפיים היא מהירות העסקאות, כלומר כמה מהר היא יכולה לעבד שאילתה מורכבת במערך נתונים גדול.

אמיל אפרם, מנכ"ל Neo Technology, החברה שעומדת מאחורי Neo4j, מדד את הביצועים של מסדי נתונים יחסיים וגם של מסדי גרפים במספר פרמטרים. השאילתה הייתה: ב -1,000 משתמשים עם כל משתמש שיש לו 50 חברים ומעלה, גלה אם משתמש אחד מחובר לאחר ב -4 כשות או פחות. התוצאות ניתנות להלן:

  • מסד נתונים יחסי פופולרי עם קוד פתוח לקח 200 שניות כדי לעבד את השאילתה ואילו מסד נתונים של גרף ארך 2 שניות.
  • כאשר אותה שאילתה הופעלה בבסיס משתמשים של 1,000,000 משתמשים, מסד הנתונים הגרפי ארך 2 ms בעוד שבסיס הנתונים היחסי היה צריך להיפסק לאחר מספר ימים של עיבוד בלתי נגמר.

הסיבה העיקרית שלקח זמן רב כל כך לעבד שאילתות למאגר המידע ההתייחסותי הייתה שהיא חיפשה את הנתונים עבור כל מונח שסופק בשאילתה. אין פלא שזה לוקח כל כך הרבה זמן! במאגר נתונים גדול יותר, זה ייקח עוד יותר זמן. מאגר הגרפים, לעומת זאת, יסתכל רק על רשומות המחוברות ישירות לרשומות שבמאגר. אם למסד הנתונים הגרפי מותר מספר ספציפי של כשות, הוא היה דבק בזה בדיוק. זו הייתה הסיבה שמסד הנתונים הגרפי הצליח לעבד שאילתות מורכבות במערכות נתונים ענקיות יחסית יחסית ולהשיג תוצאות מהירות יותר. (למידע נוסף על עבודה עם מסדי נתונים, עיין בקריירות ניהול מאגרי נתונים 101.)

מחקרי מקרה של מאגר גרפים

היו יישומים רבים ומוצלחים של מסדי נתונים גרפיים בענפים שונים. חברות גדולות הובילו את הדרך לבניית המוצרים שלהן ברמה עולמית עם עקרונות בסיס הנתונים של הגרפים. בתחילה נהוג היה לחשוב שמכיוון שמדובר על צמתים ומערכות יחסים, תעשיות מסוימות כמו מדיה חברתית יכולות להרוויח מכך. עם זאת, מגזרים אחרים כמו היכרויות מקוונות, ייצור ופורטלי משרות מקוונים נהנו גם מכך. להלן כמה דוגמאות:

  • השתמש בהצלחה במאגר נתונים גרפי בבניית המוצר ברמה העולמית שלו. כיום, אתה יכול לחפש מידע על ידי חוצה רשת חברים וחברים שלהם וכן הלאה.
  • לינקדאין עבדה על הגרף הכלכלי המתוקשר שלה. הגרף הכלכלי מתכנן לספק הזדמנויות מתאימות לכל משתמשיה על ידי חיבור המשתמשים לחברות והפרופילים שלהם לרמה מסוימת.
  • מערכת ההמלצות, שהיא כלי חשוב מאוד עבור קמעונאים מקוונים רבים, משתמשת בעקרונות מסדי נתונים של גרפים כדי לספק המלצות אפקטיביות ורלוונטיות לצרכנים פוטנציאליים. מנועי ההמלצה בעיקרון מבצעים חיפוש ברשת הלקוחות שביצעו רכישות דומות לאורך תקופה ומניחים שללקוח הגולש במוצרים דומים יהיה אותם טעמים והעדפות.

סיכום

לגבי כל הפוטנציאל של מסדי נתונים גרפיים, חברות רבות עדיין משחקות את המגמה. אז, ייקח זמן עד שמסדי נתונים של גרפים יתקבלו באופן נרחב. אמנם הפוטנציאל של מסד הנתונים הגרפי בפתרון בעיות מורכבות כבר אינו מוטל בספק, אולם עמדתו של בסיס הנתונים היחסי אינה מאוימת בשום דרך. הדבר הטוב ביותר עבור מסד הנתונים הגרפי הוא שניתן להציע אותו כטכנולוגיית קוד פתוח. על התעשיות למנף את היתרונות.