כיצד Analytics יכול לשפר את העסק? - תמליל פרק 2 של TechWise

מְחַבֵּר: Eugene Taylor
תאריך הבריאה: 14 אוגוסט 2021
תאריך עדכון: 12 מאי 2024
Anonim
כיצד Analytics יכול לשפר את העסק? - תמליל פרק 2 של TechWise - טכנולוגיה
כיצד Analytics יכול לשפר את העסק? - תמליל פרק 2 של TechWise - טכנולוגיה



מקור: פליקר / ג'יימס רויאל-לוסון

להסיר:

המארח אריק קוואנה דן בשימוש באנליטיקה בעסקים עם מדעני נתונים ומובילים בתעשייה.

עורכים הערה: זהו תמליל של אחד משידורי האינטרנט שלנו בעבר. הפרק הבא עולה במהירות, לחצו כאן להרשמה.


אריק קוואנה: גבירותיי ורבותיי, שלום וברוך שובכם שוב לפרק 2 של TechWise. כן, אכן הגיע הזמן להשיג אנשים חכמים! יש לי היום כמה אנשים חכמים באמת שיעזרו לנו במאמץ הזה. שמי אריק קוואנה, כמובן. אני אהיה המארח שלך, המנחה שלך, למפגש הברק הזה. יש לנו הרבה תוכן כאן, אנשים. יש לנו כמה שמות גדולים בעסק, שהיו אנליסטים בחללנו וארבעה מהספקים המעניינים ביותר.אז אנו הולכים לבצע הרבה פעולה טובה בשיחה היום. וכמובן, אתם שם בקהל ממלאים תפקיד משמעותי בשאלות.


אז שוב, המופע הוא TechWise והנושא היום הוא "איך Analytics יכול לשפר את העסק?" ברור שזה נושא חם בו הוא הולך לנסות להבין את סוגי הניתוחים השונים שאתה יכול לעשות וכיצד זה יכול לשפר את הפעולות שלך כי זה מה שהכל בסופו של יום.

אז אתה יכול לראות את עצמי שם למעלה, זה באמת שלך. ד"ר קירק בורן, חבר טוב מאוניברסיטת ג'ורג 'מייסון. הוא מדען נתונים עם ניסיון אדיר, התמחות עמוקה מאוד במרחב הזה וכריית נתונים ונתונים גדולים וכל אותם דברים מהנים. וכמובן שיש לנו ד"ר רובין בלור משלנו, אנליסט ראשי כאן בקבוצת בלור. שהתאמן כאקטואר לפני שנים רבות. והוא ממש התמקד בכל שטח הנתונים הגדולים ובמרחב האנליטי די באינטנסיביות במשך חצי העשור האחרון. עברו חמש שנים כמעט מאז שהשקנו את קבוצת Bloor כשלעצמה. אז הזמן עובר כשאתה נהנה.

אנו גם נשמע מוויל גורמן, האדריכל הראשי של פנטהו; סטיב וילקס, CCO של WebAction; פרנק סנדרס, מנהל טכני ב- MarkLogic; וחנה סמלטרי, מנהלת בחברת נתוני האוצר. אז כמו שאמרתי, זה הרבה תוכן.

אז איך ניתוחים יכולים לעזור לעסק שלך? ובכן, איך זה לא יכול לעזור לעסק שלך, בכנות? ישנן כל מיני דרכים בהן ניתן להשתמש בניתוח לביצוע דברים המשפרים את הארגון שלך.

אז לייעל את הפעולות. זה שאתה לא שומע עליו כמו שאתה עושה על דברים כמו שיווק או גיוס הכנסות או אפילו זיהוי הזדמנויות. אבל התייעלות של הפעולות שלך היא הדבר האמיתי והעוצמתי שאתה יכול לעשות למען הארגון שלך מכיוון שאתה יכול לזהות מקומות שבהם אתה יכול למיקור חוץ למשהו או שאתה יכול להוסיף נתונים לתהליך מסוים, למשל. וזה יכול לייעל אותו בכך שהוא לא ידרוש ממישהו להרים את הטלפון להתקשר אליו או למישהו אליו. ישנן כל כך הרבה דרכים שונות שאתה יכול לייעל את הפעולות שלך. וכל זה באמת עוזר להוריד את העלות שלך, נכון? זה המפתח, זה מוריד את העלות. אבל זה גם מאפשר לך לשרת טוב יותר את הלקוחות שלך.

ואם אתה חושב על איך אנשים הפכו חסרי סבלנות, ואני רואה את זה כל יום ביחס לאופן שבו אנשים מתקשרים באופן מקוון, אפילו עם התוכניות שלנו, ספקי השירות שאנחנו משתמשים בהן. הסבלנות שיש לאנשים, טווח הקשב, הולך ומתקצר ביום. ומה זה אומר שאתה צריך, כארגון, להגיב בפרקי זמן מהירים ומהירים יותר כדי שתוכל לספק את הלקוחות שלך.

כך, למשל, אם מישהו באתר האינטרנט שלך משודר או מדפדף ומנסה למצוא משהו, אם הם מתוסכלים והם עוזבים, ובכן, ייתכן שהרגע איבדת לקוח. ותלוי בכמה שתגבה עבור המוצר או השירות שלך, ואולי זה עניין גדול. אז בשורה התחתונה, פעולות התייעלות, לדעתי, הן אחד החללים החמים ביותר ליישום ניתוח. ואתה עושה זאת על ידי התבוננות במספרים, על ידי ריסוק הנתונים, על ידי הבנת, למשל, "היי, מדוע אנו מאבדים כל כך הרבה אנשים בדף זה באתר שלנו?" "מדוע אנו מקבלים כמה משיחות טלפון כרגע?"

וככל שתוכלו להגיב בזמן אמת יותר לדברים מסוג זה, כך הסיכויים טובים יותר יהיה לכם להתעלות על המצב ולעשות משהו בעניין לפני שיהיה מאוחר מדי. מכיוון שיש חלון הזמן הזה שמישהו מתעצבן בגלל משהו, הוא לא מרוצה או שהוא מנסה למצוא משהו אבל הוא מתוסכל; יש לך שם חלון הזדמנויות לפנות אליהם, לתפוס אותם, לקיים אינטראקציה עם הלקוח הזה. ואם תעשה זאת בצורה הנכונה עם הנתונים הנכונים או תמונת לקוח נחמדה - להבין מי הלקוח הזה, מה הרווחיות שלו, מהן ההעדפות שלהם - אם אתה באמת יכול להתמודד עם זה, אתה הולך לעשות עבודה נהדרת להחזיק מעמד ללקוחות שלך ולקבל לקוחות חדשים. וזה מה שהכול קשור אליו.

אז עם זה, אני אעביר את זה, למעשה, לקירק בורן, אחד מדעני הנתונים שלנו בשיחה היום. והם די נדירים בימינו, אנשים. יש לנו שניים מהם לפחות בשיחה אז זה עניין גדול. עם זה, קירק, אני הולך למסור לך אותו כדי לדבר על ניתוחים וכיצד זה עוזר לעסקים. לך על זה.

ד"ר קירק בורן: ובכן תודה רבה אריק. אתה יכול לשמוע אותי?

אריק: זה בסדר, קדימה.

ד"ר קירק: אוקיי, טוב. אני רק רוצה לשתף אם אני מדבר במשך חמש דקות, ואנשים מניפים לי את היד. אז הערות הפתיחה, אריק, שיצרת ממש קשר לנושא הזה אני הולך לדבר בקצרה בדקות הקרובות וזה השימוש הזה במאגר נתונים גדולים ובניתוח לנתונים להחלטות לתמיכה שם. ההערה שהעברת על התייעלות תפעולית, בעיניי, זה נופל לתפיסה הזו של ניתוחים תפעוליים, שבהם אתה יכול לראות כמעט בכל יישום בעולם, בין אם זה יישום מדעי, עסק, אבטחת סייבר ואכיפת חוק, ממשלה, בריאות. כל מספר של מקומות שבהם יש לנו זרם נתונים ואנחנו מקבלים איזושהי תגובה או החלטה בתגובה לאירועים והתראות והתנהגויות שאנו רואים בזרם הנתונים ההוא.

וכך אחד הדברים שאני רוצה לדבר עליהם היום הוא סוג של איך אתה מחלץ את הידע והתובנות מהנתונים הגדולים כדי להגיע לנקודה הזו בה אנו יכולים למעשה לקבל החלטות לנקוט בפעולות. ולעתים קרובות אנו מדברים על זה במונחי אוטומציה. והיום אני רוצה למזג את האוטומציה עם האנליטיקאי האנושי בתוך הלולאה. אז בזה אני מתכוון בעוד שהאנליטיקאי העסקי ממלא כאן תפקיד חשוב מבחינת הימורים, הכשרה, אימות פעולות ספציפיות או כללי למידת מכונות שאנו מוציאים מהנתונים. אבל אם נגיע לנקודה בה אנו משוכנעים למדי את הכללים העסקיים שחילצנו והמנגנונים להתראה בנוגע לתוקף, אנו יכולים למעשה להפוך את זה לתהליך אוטומטי. אנו למעשה מבצעים את ההתייעלות המבצעית שעליה דיבר אריק.

אז יש לי כאן מעט משחק על מילים אבל אני מקווה שאם זה עובד בשבילך דיברתי על האתגר D2D. ו- D2D, לא רק מנתחים את ההחלטות בכל העניין, אנו מסתכלים על זה בתחתית שקופית זו, בתקווה שתוכלו לראות זאת, לגלות תגליות ולהגדיל דמי הכנסה מצינורות האנליטיקס שלנו.

אז במונח הזה, למעשה יש לי את התפקיד הזה של משווק לעצמי כאן עכשיו שאני עובד איתו וזה; הדבר הראשון שאתה רוצה לעשות הוא לאפיין את הנתונים שלך, לחלץ את הפיצ'רים, לחלץ את המאפיינים של הלקוחות שלך או כל יישות שהיא מעקב בחלל שלך. אולי זה מטופל בסביבה אנליטית לבריאות. אולי זה משתמש באינטרנט אם אתה מסתכל בסוג של סוגיית אבטחת סייבר. אבל אפינו וחילצו מאפיינים ואז עקבו כמה ניגשים לגבי אותו אדם, על אותה ישות. ואז אתה אוסף את הקטעים שיצרת זה עתה ומכניס אותם לאיזה סוג של אוסף ממנו תוכל להחיל אלגוריתמים למידת מכונה.

הסיבה שאני אומר את זה ככה היא שתהיה רק ​​מצלמת מעקב בשדה תעופה. הסרטון עצמו הוא נפח עצום וגדול והוא גם מאוד לא מובנה. אבל אתה יכול להפיק ממעקב וידאו, ביומטריה לפנים ולזהות אנשים במצלמות המעקב. כך למשל בשדה תעופה, תוכלו לזהות אנשים ספציפיים, תוכלו לעקוב אחר אותם בשדה התעופה על ידי צלב זהה של אותו אדם במצלמות מעקב מרובות. כך שהתכונות הביומטריות שחולצו שאתה באמת מכרה ומעקב אינן הסרטון המפורט בעצמו. אבל ברגע שיש לך את ההחלצות האלו, אתה יכול להחיל כללי למידת מכונה ואנליטיקה כדי לקבל החלטות אם אתה צריך לנקוט בפעולה במקרה מסוים או שמשהו קרה בצורה לא נכונה או שיש לך הזדמנות להציע הצעה. אם אתה, למשל, אם יש לך חנות בשדה התעופה ואתה רואה את הלקוח ההוא עובר בדרכך ואתה יודע ממידע אחר על אותו לקוח, שאולי הוא באמת התעניין לקנות דברים בחנות הדיוטי פרי או משהו כזה, תציע את ההצעה הזו.

אז לאיזה סוג דברים הייתי מתכוון באפיון ופוטנציאל? באפיון אני מתכוון, שוב, לחלץ את התכונות והמאפיינים בנתונים. וזה יכול להיות מיוצר במכונה, ואז האלגוריתמים שלה יכולים למעשה לחלץ, למשל, חתימות ביומטריות מניתוח וידאו או סנטימנט. אתה יכול לחלץ את רגש הלקוח באמצעות ביקורות מקוונות או מדיה חברתית. חלק מהדברים האלה עשויים להיות שנוצרו על ידי בני אדם, כך שהאדם, האנליטיקאי העסקי, יוכל לחלץ תכונות נוספות שאציג בשקופית הבאה.

חלקם ניתנים לצפייה בהמוניהם. ועל ידי קהל המונים, יש הרבה דרכים שונות שאתה יכול לחשוב על זה. אך בפשטות רבה, למשל, המשתמשים שלכם מגיעים לאתר שלכם והם מכניסים מילות חיפוש, מילות מפתח, והם מגיעים בסופו של דבר לדף מסוים ולמעשה מבלים שם בדף זה. שהם למעשה, לפחות, מבינים שהם צופים, גולשים, לוחצים על דברים באותו דף. מה שאומר לך הוא שמילת המפתח שהם הקלידו בהתחלה היא המתאר של אותו דף מכיוון שהוא נחת את הלקוח בדף שהוא צפה. וכך תוכלו להוסיף מידע זה הנוסף, כלומר לקוחות המשתמשים במילת מפתח זו, זיהו את דף האינטרנט הזה בארכיטקטורת המידע שלנו כמקום בו התוכן התואם אותה מילת מפתח.

וכך היבט ההסעות הוא היבט נוסף שלפעמים אנשים שוכחים, סוג כזה של מעקב אחר פירורי הלחם של הלקוחות שלך, כביכול; איך הם עוברים במרחב שלהם, בין אם זה נכס מקוון או נכס אמיתי. ואז השתמש בנתיב מסוג זה שהם, שהלקוח לוקח מידע נוסף על הדברים שאנחנו מסתכלים עליהם.

אז אני רוצה לומר שדברים שנוצרו על ידי בני אדם, או שנוצרו על ידי מכונה, הסתיימו בסופו של דבר במעין הערות או תיוג של גרגרי נתונים או ישויות ספציפיות. בין אם ישויות אלה חולים במסגרת בית חולים, לקוחות או כל דבר אחר. וכך ישנם סוגים שונים של תיוגים והערות. חלק מזה עוסק בנתונים עצמם. זה אחד הדברים, איזה סוג של מידע, איזה סוג של מידע, מהם התכונות, הצורות, אולי הערבים והתבניות, חריגות, התנהגויות לא אנומליות. ואז לחלץ כמה סמנטיקה, כלומר איך זה קשור לדברים אחרים שאני יודע, או שלקוח זה הוא לקוח אלקטרוניקה. לקוח זה הוא לקוח לבוש. או שלקוח זה אוהב לקנות מוזיקה.

כך שזיהוי סמנטיקה מסוימת בנושא זה, הלקוחות האלה שאוהבים מוזיקה נוטים לאהוב בידור. אולי נוכל להציע להם נכס בידור אחר. אז הבנת הסמנטיקה וגם קצת פרובנס, שאומרת בעצם: מאיפה זה הגיע, מי סיפק את הקביעה הזו, באיזו שעה, באיזה תאריך, באיזו נסיבות?

אז ברגע שיש לך את כל ההערות והמאפיינים האלה, הוסף לזה ואז השלב הבא, שהוא החוזר, סוג של מי, מה, מתי, איפה ולמה זה. מיהו המשתמש? מה היה הערוץ אליו נכנסו? מה מקור המידע? איזה סוג של שימוש חוזר ראינו במוצר מידע או מידע מסוים זה? ומה זה ערך מסוג זה בתהליך העסקי? ואז לאסוף את הדברים האלה ולנהל אותם, ובעצם לעזור ביצירת בסיס נתונים, אם אתה רוצה לחשוב על זה ככה. הפוך אותם לחיפוש, לשימוש חוזר, על ידי אנליסטים עסקיים אחרים או על ידי תהליך אוטומטי, שבפעם הבאה שאראה את קבוצות התכונות האלה המערכת יכולה לנקוט בפעולה אוטומטית זו. וכך נגיע לסוג כזה של יעילות אנליטית תפעולית, אך ככל שאנו אוספים מידע שימושי ומקיף ואז אוצרים אותו למקרי שימוש אלה.

אנחנו יורדים לעסקים. אנו מבצעים ניתוח נתונים. אנו מחפשים דפוסים מעניינים, הפתעות, מחיקי חידוש, חריגות. אנו מחפשים את המעמדות והמגזרים החדשים באוכלוסייה. אנו מחפשים עמותות וקורלציות וקשרים בין הגורמים השונים. ואז אנו משתמשים בכל זה כדי להניע את תהליך הגילוי, ההחלטה וקבלת הדולר שלנו.

אז שוב, הנה קיבלנו את שקופית הנתונים האחרונה שיש לי היא פשוט לסכם, לשמור על האנליטיקאי העסקי, שוב, אתם לא מוציאים את האנושי הזה והכל חשוב לשמור את האנושי שם.

אז התכונות הללו, כולן ניתנות על ידי מכונות או אנליסטים אנושיים, או אפילו המון משאבים. אנו מיישמים את השילוב הזה של דברים כדי לשפר את מערכי האימונים שלנו עבור הדגמים שלנו ובסופו של דבר עם מודלים חזויים מדויקים יותר, פחות פוזיטיביות ושליליות שגויות, התנהגות יעילה יותר, התערבויות יעילות יותר עם הלקוחות שלנו או עם מי.

אז בסופו של יום, אנו ממש משלבים למידת מכונות ונתונים גדולים עם הכוח הזה של קוגניציה אנושית, וכאן נכנס סוג זה של חתימת תיוג. וזה יכול להוביל דרך ויזואליזציה וסוג ניתוח חזותי. כלים או סביבות נתונים מעצימות או הובלת קהל. ובסופו של יום, מה שזה באמת עושה זה לייצר את הגילוי, התובנות וה- D2D שלנו. ואלה ההערות שלי, אז תודה שהקשבת.

אריק: היי זה נשמע נהדר ותן לי להמשיך ולהעביר את המפתחות לד"ר רובין בלור כדי לתת גם את נקודת המבט שלו. כן, אני רוצה לשמוע אותך מגיב על התייעלות זו של מושג הפעולות ואתה מדבר על ניתוחים תפעוליים. אני חושב שזה תחום גדול שצריך לבחון בצורה די יסודית. ואני מניח, ממש מהר לפני רובין, אני אחזיר אותך, קירק. זה כן מחייב שיהיה לכם שיתוף פעולה די משמעותי בין שחקנים שונים בחברה, נכון? צריך לדבר עם אנשי מבצעים; אתה צריך להשיג את האנשים הטכניים שלך. לפעמים אתה מקבל את אנשי השיווק שלך או את אנשי ממשק האינטרנט שלך. בדרך כלל מדובר בקבוצות שונות. האם יש לך שיטות עבודה מומלצות או הצעות כיצד לגרום לכולם להכניס את העור שלהם למשחק?

ד"ר קירק: ובכן, אני חושב שזה בא עם התרבות העסקית של שיתוף פעולה. למען האמת, אני מדבר על שלושת ה- C של סוג של תרבות האנליטיקה. האחת היא יצירתיות; אחרת היא סקרנות והשלישית היא שיתוף פעולה. אז אתם רוצים אנשים יצירתיים ורציניים, אבל עליכם גם לגרום לאנשים האלה לשתף פעולה. וזה באמת מתחיל מלמעלה, סוג זה של בניית תרבות זו עם אנשים שצריכים לשתף ולפתוח באופן גלוי לעבר המטרות המשותפות של העסק.

אריק: הכל הגיוני. ואתה באמת צריך להשיג מנהיגות טובה בראש כדי שזה יקרה. אז בואו נמשיך למסור אותו לד"ר בלור. רובין, הרצפה שלך.

ד"ר רובין בלור: אוקיי. תודה לך על ההקדמה הזו, אריק. אוקיי, הדרך בה אלה מתפשטים, מופעים אלה, מכיוון שיש לנו שני אנליסטים; אני זוכה לראות את המצגת של האנליטיקאי שהחבר'ה האחרים לא. ידעתי מה קירק הולך להגיד ופשוט אני זווית אחרת לגמרי כדי שלא נעבור יותר מדי חפיפה.

אז מה שאני בעצם מדבר עליו או מתכוון לדבר עליו זה תפקידו של מנתח הנתונים לעומת תפקידו של המטפל העסקי. והדרך בה אני מאפיין את זה, ובכן, לחי לשון במידה מסוימת, היא סוג של דבר ג'קיל והייד. ההבדל הוא שדווקא מדעני הנתונים, לפחות בתיאוריה, יודעים מה הם עושים. בעוד שהאנליסטים העסקיים אינם כל כך, בסדר עם אופן הפעולה של המתמטיקה, על מה ניתן לסמוך ועל מה אי אפשר לסמוך.

אז בואו ונתרשם מהסיבה שאנחנו עושים זאת, הסיבה שניתוח נתונים הפך פתאום לעסקה גדולה מלבד העובדה שאנחנו יכולים למעשה לנתח כמויות גדולות מאוד של נתונים ולשלוף נתונים מחוץ לארגון; האם זה משתלם. הדרך בה אני מסתכל על זה - ולדעתי זה רק הופך למקרה, אבל אני בהחלט חושב שזה מקרה - ניתוח נתונים הוא ממש מו"פ עסקי. מה שאתה בעצם עושה בדרך זו או אחרת בניתוח נתונים, אתה מסתכל על תהליך עסקי מסוג זה או אם זו האינטראקציה עם לקוח, בין אם זה הדרך בה הפעילות הקמעונאית שלך, הדרך בה אתה מפרס החנויות שלך. לא באמת משנה מה הבעיה. אתה בוחן תהליך עסקי נתון ומנסה לשפר אותו.

התוצאה של מחקר ופיתוח מוצלחים היא תהליך שינוי. ותוכלו לחשוב על ייצור, אם תרצו, כדוגמה הרגילה לכך. מכיוון שבייצור אנשים אוספים מידע על הכל כדי לנסות ולשפר את תהליך הייצור. אבל אני חושב שמה שקרה או מה שקורה בנתונים גדולים זה כל זה מיושם כעת על כל העסקים מכל סוג שהוא בכל דרך שמישהו יכול לחשוב עליהם. אז למעשה כל תהליך עסקי עומד לבדיקה אם אתה יכול לאסוף נתונים לגביו.

אז זה דבר אחד. אם תרצה, זה קורה בשאלה של ניתוח נתונים. מה ניתוח נתונים יכול לעשות לעסק? ובכן, זה יכול לשנות את העסק לחלוטין.

הדיאגרמה הספציפית הזו שאני לא מתכוון לתאר לעומק, אבל זו תרשים שעלינו עליו כשיאה של פרויקט המחקר שעשינו בששת החודשים הראשונים של השנה. זוהי דרך לייצג ארכיטקטורת נתונים גדולים. ומספר דברים שכדאי לציין לפני שאמשיך לשקופית הבאה. יש כאן שתי זרימות נתונים. האחד הוא זרם נתונים בזמן אמת, העובר בראש התרשים. השני הוא זרם נתונים איטי יותר שעובר בתחתית התרשים.

התבונן בתחתית התרשים. יש לנו את חאופת כמאגר נתונים. יש לנו מאגרי מידע שונים. יש לנו שם נתונים שלמים עם המון פעילויות שמתרחשות בזה, שרובן פעילות אנליטית.

הנקודה שאני מעלה כאן והנקודה היחידה שאני באמת רוצה להבהיר כאן היא שהטכנולוגיה קשה. זה לא פשוט. זה לא קל. זה לא משהו שמי שחדש במשחק יכול פשוט להרכיב. זה די מורכב. ואם אתה מתכוון לעסק לביצוע ניתוחים אמינים בכל התהליכים האלה, זה לא משהו שהולך לקרות במהירות במיוחד. זה יצטרך להוסיף הרבה טכנולוגיה לתערובת.

בסדר. השאלה מהו מדען נתונים, אני יכול לטעון שאני מדען נתונים כיוון שהייתי מאומן בסטטיסטיקה לפני שאי פעם הוכשרתי למחשוב. ועשיתי עבודה אקטוארית במשך תקופה כך שאדע את הדרך בה עסק מארגן, ניתוח סטטיסטי, גם כדי לנהל את עצמו. זה לא דבר של מה בכך. ויש הרבה אימונים מומלצים ביותר בצד האנושי וגם בצד הטכנולוגי.

אז בשאלת השאלה "מה זה מדען נתונים", הנחתי את התמונות של פרנקנשטיין פשוט כי זה שילוב של דברים שצריך לסרוג יחד. יש ניהול פרויקטים מעורב. יש הבנה עמוקה בסטטיסטיקה. יש מומחיות עסקית בתחום, שהיא יותר בעיה של אנליסט עסקי מאשר מדען הנתונים, בהכרח. יש ניסיון או צורך להבין ארכיטקטורת נתונים ולהיות מסוגלים לבנות אדריכל נתונים ויש בהנדסת תוכנה מעורבים. במילים אחרות, זה כנראה צוות. זה כנראה לא אדם. וזה אומר שכנראה מדובר במחלקה שצריך להיות מאורגן וצריך לחשוב על הארגון שלה באופן נרחב למדי.

זורקים לתערובת את העובדה שלמידת מכונה. לא יכולנו לעשות, זאת אומרת, למידת מכונה אינה חדשה במובן זה שרוב הטכניקות הסטטיסטיות המשמשות בלימוד מכונות ידועות כבר מזה עשרות שנים. יש כמה דברים חדשים, אני מתכוון שרשתות עצביות הן יחסית חדשות, אני חושב שהן רק בנות 20 בערך, ולכן חלקן חדשות יחסית. אבל הבעיה בלימוד מכונות הייתה שבאמת לא היה לנו כוח מחשב לעשות את זה. ומה שקרה, מלבד כל דבר אחר, הוא שכוח המחשב נמצא כעת במקום. וזה אומר הרבה נורא ממה שאנחנו אומרים, מדעני נתונים עשו בעבר במונחים של מצבי דוגמנות, דגימה של נתונים ואז קביעתם על מנת לייצר ניתוח מעמיק יותר של הנתונים. למעשה, אנחנו יכולים פשוט לזרוק לזה כוח מחשב במקרים מסוימים. פשוט בחר באלגוריתמים ללימוד מכונות, זרוק אותם על הנתונים ולראות מה יוצא. וזה משהו שאנליטיקאי עסקי יכול לעשות, נכון? אבל המטפל העסקי צריך להבין מה הוא עושה. כלומר, אני חושב שזה הנושא באמת, יותר מכל דבר אחר.

ובכן, זה רק כדי לדעת יותר על עסקים מהנתונים שלו מאשר בכל אמצעי אחר. אינשטיין לא אמר את זה, אמרתי את זה. פשוט העלתי את תמונתו לאמינות. אך המצב למעשה מתחיל להתפתח הוא כזה בו הטכנולוגיה, אם משתמשים בה נכון, והמתמטיקה, אם משתמשים בה נכון, יוכלו לנהל עסק ככל פרט. צפינו בזה עם יבמ. ראשית, זה יכול לנצח את החבר'ה הטובים ביותר בשחמט, ואז זה יכול לנצח את החבר'ה הטובים ביותר בג'ופרדי; אבל בסופו של דבר נוכל לנצח את החבר'ה הטובים ביותר בניהול חברה. הסטטיסטיקה תנצח בסופו של דבר. וקשה לראות איך זה לא יקרה, זה פשוט לא קרה עדיין.

אז מה שאני אומר וזה סוג של שלם של המצגת שלי, הם שני הנושאים האלה של העסק. הראשונה היא האם אתה יכול להשיג את הטכנולוגיה נכון? האם אתה יכול לגרום לטכנולוגיה לעבוד עבור הצוות שלמעשה יוכל לעמוד בראשו ולקבל יתרונות לעסק? ואז שנית, האם אתה יכול להצליח עם האנשים? ושני אלה נושאים. והם נושאים שלא נקודת זמן זו הם אומרים שנפתרו.

אוקיי אריק, אני אחזיר לך את זה. או שאולי עלי להעביר את זה לוויל.

אריק: למעשה, כן. תודה, וויל גורמן. כן, הנה לך, וויל. אז בואו נראה. תן לי לתת לך את המפתח ל- WebEx. אז מה קרה לך? פנטהו, ברור, אתם קיימים זמן מה וסוג ה- BI עם קוד פתוח במקום בו התחלתם. אבל יש לך הרבה יותר ממה שהיה לך פעם, אז בוא נראה מה יש לך בימים אלה לניתוח.

וויל גורמן: בהחלט. שלום לכולם! שמי וויל גורמן. אני האדריכל הראשי בפנטהו. לאלו מכם שלא שמעו עלינו, הזכרתי רק את פנטהו היא חברת אינטגרציה גדולה של נתונים ואנליטיקה. אנחנו עוסקים בעסק כבר עשר שנים. המוצרים שלנו התפתחו זה לצד זה עם קהילת הנתונים הגדולים, והתחילו כפלטפורמה עם קוד פתוח לשילוב נתונים ואנליטיקה, והתחדשו עם טכנולוגיה כמו Hadoop ו- NoSQL עוד לפני שהתגבשו גורמים מסחריים סביב אותם טק. ועכשיו יש לנו מעל 1500 לקוחות מסחריים ועוד פגישות ייצור רבות יותר כתוצאה מהחדשנות שלנו סביב קוד פתוח.

הארכיטקטורה שלנו ניתנת להטמעה וניתנת להרחבה גבוהה, בנויה במטרה להיות גמישה מכיוון שטכנולוגיית נתונים גדולים במיוחד מתפתחת בקצב מהיר מאוד. פנטהו מציעה שלושה תחומי מוצר עיקריים הם העובדים יחד כדי לטפל במקרי שימוש בנתונים גדולים.

המוצר הראשון בהיקף הארכיטקטורה שלנו הוא שילוב נתונים של Pentaho שמיועד לטכנאי נתונים ומהנדסי נתונים. מוצר זה מציע חוויה חזותית, גרירה ושחרור להגדרת צינורות נתונים ותהליכים לתזמורת נתונים גם בסביבות נתונים גדולים ובסביבות מסורתיות. מוצר זה הוא פלטפורמת שילוב נתונים קלת משקל, מטא-נתונים, הבנויה על ג'אווה, וניתן לפרוס אותה כתהליך בתוך MapReduce או YARN או Storm ופלטפורמות רבות אחרות של אצווה ובזמן אמת.

תחום המוצרים השני שלנו הוא סביב ניתוחים חזותיים. בעזרת טכנולוגיה זו, ארגונים ויצרני ציוד מקורי יכולים להציע חוויית הדמייה ושחרור גרירה ושחרור עשירה של אנליסטים עסקיים ומשתמשים עסקיים על ידי דפדפנים וטאבלטים מודרניים, דבר המאפשר יצירת אד-הוק של דוחות ולוחות מחוונים. כמו גם הצגת לוח המחוונים המושלם לפיקסלים ודיווחים.

תחום המוצרים השלישי שלנו מתמקד באנליטיקה חזויה הממוקדת עבור מדעני נתונים, אלגוריתמים למידת מכונה. כאמור, כמו רשתות עצביות וכאלה, ניתן לשלב בסביבת טרנספורמציית נתונים, מה שמאפשר למדעני נתונים לעבור מדוגמנות לסביבת ייצור, לתת גישה לחיזוי, וזה עשוי להשפיע על תהליכים עסקיים באופן מיידי, מהר מאוד.

כל המוצרים הללו משולבים בחוזקה בחוויה זריזת אחת ומעניקים ללקוחות הארגוניים שלנו את הגמישות הדרושה להם בכדי לטפל בבעיות העסקיות שלהם. אנו רואים נוף המתפתח במהירות של נתונים גדולים בטכנולוגיות מסורתיות. כל מה שאנחנו שומעים מכמה חברות במרחב הנתונים הגדול כי ה- EDW קרוב לסיום. למעשה, מה שאנחנו רואים בלקוחות הארגוניים שלנו הוא שהם צריכים להכניס נתונים גדולים לתהליכים עסקיים ו- IT קיימים ולא להחליף אותם.

דיאגרמה פשוטה זו מציגה את הנקודה בארכיטקטורה שאנו רואים לעתים קרובות, שהיא סוג של ארכיטקטורת פריסת EDW עם מקרי שילוב נתונים ו- BI. כעת הדיאגרמה הזו דומה לשקופית של רובין בנושא ארכיטקטורת נתונים גדולים, היא כוללת נתונים בזמן אמת והיסטורי. ככל שעולים מקורות נתונים חדשים ודרישות בזמן אמת, אנו רואים נתונים גדולים כחלק נוסף בארכיטקטורת ה- IT הכוללת. מקורות נתונים חדשים אלה כוללים נתונים שנוצרו על ידי מכונה, נתונים לא מובנים, הנפח המהיר והמהירות הסטנדרטיים ומגוון הדרישות עליהן אנו שומעים נתונים גדולים. הם לא מתאימים לתהליכי EDW מסורתיים. פנטהו עובד בשיתוף פעולה הדוק עם Hadoop ו- NoSQL בכדי לפשט את הבליעה, עיבוד הנתונים והמחשה של נתונים אלה כמו גם מיזוג נתונים אלה עם מקורות מסורתיים בכדי לתת ללקוחות תצוגה מלאה של סביבת הנתונים שלהם. אנו עושים זאת באופן מפוקח, כך ש- IT יכול להציע פיתרון ניתוח מלא לקו העסק שלהם.

לסיום, ברצוני להדגיש את הפילוסופיה שלנו סביב ניתוח ושילוב של נתונים גדולים; אנו מאמינים כי טכנולוגיות אלה עובדות טוב יותר יחד עם ארכיטקטורה אחידה אחת, ומאפשרות מספר מקרי שימוש שאחרת לא היו מתאפשרים. סביבות הנתונים של הלקוחות שלנו הן יותר מסתם נתונים גדולים, Hadoop ו- NoSQL. כל מידע הוא משחק הוגן. ומקורות נתונים גדולים צריכים להיות זמינים ולעבוד יחד כדי להשפיע על הערך העסקי.

לבסוף, אנו מאמינים שכדי לפתור את הבעיות העסקיות הללו בארגונים בצורה יעילה מאוד באמצעות נתונים, ה- IT וקווי העסקים צריכים לעבוד יחד על גישה מנוהלת ומעורבת בניתוח נתונים גדולים. ובכן תודה רבה שנתת לנו את הזמן לדבר, אריק.

אריק: אתה מתערב. לא, אלה דברים טובים. אני רוצה לחזור לצד ההוא של הארכיטקטורה שלך כשנגיע לשאלות ותשובות. אז בואו נעבור עם שאר המצגת ותודה רבה על כך. אתם בוודאי עוברים מהר בשנתיים האחרונות, אני חייב לומר את זה בוודאות.

אז סטיב, תן לי להמשיך למסור לך את זה. ופשוט לחץ שם על החץ למטה ונלך על זה. אז סטיב, אני נותן לך את המפתחות. סטיב וילקס, פשוט לחץ על החץ הכי רחוק למטה במקלדת שלך.

סטיב וילקס: הנה אנחנו הולכים.

אריק: הנה לך.

סטיב: זו הקדמה נהדרת שנתת לי, בכל זאת.

אריק: כן.

סטיב: אז אני סטיב וילקס. אני המפקח האחראי על WebAction. קיימנו רק בשנתיים האחרונות ובהחלט התקדמנו מהר גם מאז. WebAction היא פלטפורמת ניתוח נתונים גדולים בזמן אמת. אריק הזכיר קודם לכן, סוג של, עד כמה חשוב זמן אמיתי וכמה זמן האפליקציות שלך מקבלות. הפלטפורמה שלנו נועדה לבנות אפליקציות בזמן אמת. וכדי לאפשר את הדור הבא של אפליקציות מונעות נתונים שניתן לבנות עליהן באופן הדרגתי ולאפשר לאנשים לבנות לוחות מחוונים מהנתונים שנוצרים מאותם אפליקציות, אך תוך התמקדות בזמן אמת.

הפלטפורמה שלנו היא למעשה פלטפורמה מלאה מקצה לקצה, ועושה הכל החל מרכישת נתונים, עיבוד נתונים, כל הדרך ועד להמחשת נתונים. ומאפשרת למספר סוגים שונים של אנשים בתוך הארגון שלנו לעבוד יחד כדי ליצור אפליקציות בזמן אמת, ולהעניק להם תובנה לגבי דברים שקורים בארגון שלהם בזמן שהם התרחשו.

וזה קצת שונה ממה שרוב האנשים רואים בנתונים גדולים, כך שהגישה המסורתית - ובכן, המסורתית בשנתיים האחרונות - הייתה גישה לכדי חבורה של מקורות שונים ואז ערמו אותו למאגר או לאגם גדול או איך שלא תרצו לקרוא לזה. ואז עבד אותו כשאתה צריך להפעיל עליו שאילתה; לבצע ניתוח היסטורי בקנה מידה גדול או אפילו סתם לבצע שאילתות אד הוק לגבי כמויות גדולות של נתונים. עכשיו זה עובד במקרי שימוש מסוימים. אבל אם אתה רוצה להיות פרואקטיבי בארגון שלך, אם אתה רוצה שיגידו לך באמת מה קורה במקום לגלות מתי משהו השתבש בסופו של דבר בסוף היום או בסוף השבוע, אז אתה באמת צריך לזוז לזמן אמת.

וזה מסובב מעט את העניינים. זה מעביר את העיבוד לאמצע. אז ביעילות אתה לוקח זרמים אלה של כמויות גדולות של נתונים המופקים ללא הפסקה בתוך הארגון ואתה מעבד אותם ככל שאתה מקבל אותם. ומכיוון שאתה מעבד אותו כפי שאתה מקבל אותו, אתה לא צריך לאחסן הכל. אתה יכול פשוט לאחסן את המידע החשוב או את הדברים שאתה צריך לזכור שקרה בפועל. אז אם אתה עוקב אחר מיקום ה- GPS של כלי רכב הנעים בכביש, לא אכפת לך היכן הם נמצאים בכל שנייה, אינך צריך לאחסן היכן הם נמצאים בכל שנייה. אתה רק צריך לדאוג לך, ​​האם הם עזבו את המקום הזה? האם הם הגיעו למקום הזה? האם הם נסעו, או לא, על הכביש המהיר?

אז באמת חשוב לקחת בחשבון שככל שיותר ויותר נתונים נוצרים, אז שלושת ה- Vs. המהירות קובעת בעצם כמה נתונים מייצרים מדי יום. ככל שנוצרו יותר נתונים עליכם לאחסן יותר. וככל שיש לאחסן יותר, נדרש זמן רב יותר לעיבוד. אבל אם אתה יכול לעבד אותו ככל שתשיג אותו, אז אתה מקבל תועלת גדולה באמת ותוכל להגיב לזה. ניתן לומר לך שדברים קורים ולא לחפש אותם אחר כך.

אז הפלטפורמה שלנו נועדה להיות מדרגית ביותר. יש לו שלושה חלקים עיקריים - קטע הרכישה, קטע העיבוד ואז קטעי הדמיה המסירה של הפלטפורמה. בצד הרכישה, איננו מסתכלים רק על נתוני יומן שנוצרו במכונה כמו יומני אינטרנט או יישומים הכוללים את כל שאר היומנים שנוצרים. אנו יכולים גם להיכנס ולעשות שינוי לכידת נתונים ממאגרי מידע. כך שבאופן בסיסי מאפשר לנו, ראינו את הצד ETL שאותו הציג ואת ETL המסורתי שאתה צריך להפעיל שאילתות כנגד מסדי הנתונים. ניתן לומר לנו מתי דברים קורים בבסיס הנתונים. אנו משנים אותו ואנחנו תופסים אותו ומקבלים את אותם אירועים. ואז יש כמובן העדכונים החברתיים ונתוני המכשירים החיים שנשאבים אליך דרך שקעי TCP או ACDP.

יש המון דרכים שונות לקבלת נתונים. ואם כבר מדברים על נפח ומהירות, אנו רואים כרכים שהם מיליארדי אירועים ביום, נכון? אז מדובר בכמויות גדולות וגדולות של נתונים שנכנסים וצריך לעבד אותם.

זה מעובד על ידי אשכול של השרתים שלנו. לשרתים כולם אדריכלות זהה וכולם מסוגלים לבצע את אותם דברים. אבל אתה יכול לקבוע את התצורה של אותם, לבצע דברים שונים. ובתוך השרתים יש לנו שכבת עיבוד שאילתה במהירות גבוהה המאפשרת לבצע ניתוחים בזמן אמת על הנתונים, לעשות העשרה של הנתונים, לעשות מתאם בין אירועים, לעקוב אחר דברים שקורים בחלונות זמן, לעשות חיזוי. ניתוח מבוסס על תבניות שנראות בנתונים. ואז ניתן לאחסן נתונים במקומות שונים - RDBMS המסורתית, מחסן נתונים ארגוני, Hadoop, תשתית נתונים גדולים.

ואותם נתונים חיים יכולים לשמש גם להפעלת אפליקציות מונעות נתונים בזמן אמת. לאפליקציות האלו יכול להיות מבט בזמן אמת על המתרחש ואפשר גם להתריע בפני אנשים כאשר דברים חשובים קורים. אז במקום שנצטרך להיכנס בסוף היום ולגלות שמשהו רע באמת קרה מוקדם יותר באותו היום, ניתן היה לקבל התראה על כך בשנייה שאנו מזהים אותה והיא עוברת ישר לדף הרשימה כדי לגלות מהי קורה.

אז זה משנה את הפרדיגמה לחלוטין מהצורך לנתח נתונים לאחר מעשה, לסופר כשדברים מעניינים קורים. ואז ניתן להשתמש בפלטפורמה שלנו לבניית יישומים מונעי נתונים. וכאן בדיוק אנו מתמקדים, בונה את היישומים האלה. עבור לקוחות, עם לקוחות, עם מגוון שותפים שונים כדי להציג ערך אמיתי בניתוח נתונים בזמן אמת. כך שמאפשר לאנשים, או לחברות שעושות יישומי אתרים, למשל להיות מסוגלים לעקוב אחר השימוש בלקוחות לאורך זמן ולהבטיח כי איכות השירות מתקיימת, לאתר הונאות בזמן אמת או הלבנת הון, לאתר כניסות מרובות או ניסיונות פריצה וסוגי אירועי אבטחה מסוג זה, לניהול דברים כמו קופות תפאורה או מכשירים אחרים, מכונות כספומט לפקח עליהם בזמן אמת על תקלות, כשלים שקרו, עלולים לקרות, יקרה בעתיד על סמך ניתוח חזוי. וזה חוזר לנקודה של התייעלות של פעולות שאריק הזכיר קודם לכן, כדי להיות מסוגל לזהות מתי יקרה משהו ולארגן את העסק שלך כדי לתקן את הדברים האלה במקום להתקשר למישהו שיעשה משהו אחר מעשה, שהוא הרבה יותר יקר.

ניתוח צרכנים הוא יצירה נוספת שיוכל לדעת מתי לקוח עושה משהו בזמן שהוא עדיין נמצא בחנות שלך. נתונים שנשלחים להנהלה בכדי להיות מסוגלים לפקח בזמן אמת על השימוש במשאבים ולשנות היכן שהדברים פועלים וכדי לדעת מתי הדברים נכשלים בצורה הרבה יותר מתוזמנת.

אז אלה המוצרים שלנו על קצה המזלג ואני בטוח שנחזור לכמה מהדברים האלה בפגישה בנושא שאלות ותשובות. תודה.

אריק: כן, אכן. עבודה טובה. אוקיי טוב. ועכשיו התחנה הבאה בסיבוב הברקים שלנו, יש לנו את פרנק סנדרס שיוזמן מ- MarkLogic. הכרתי על החבר'ה האלה מספר שנים, טכנולוגיית מסדי נתונים מאוד מאוד מעניינת. אז פרנק, אני מעביר לך את זה. פשוט לחץ על מקום אחר. השתמש בחץ למטה במקלדת שלך ותמשיך למירוצים. הנה לך.

פרנק סנדרס: תודה רבה, אריק. אז כמו שאריק ציין, אני עם חברה בשם MarkLogic. ומה שעושה MarkLogic זה שאנו מספקים מסד נתונים NoSQL ארגוני. ואולי, היכולת החשובה ביותר שאנו מביאים לשולחן ביחס לכך היא היכולת להפגיש למעשה את כל מקורות המידע השונים האלה על מנת לנתח, לחפש ולנצל את המידע הזה במערכת הדומה למה שאתה פעם עם מערכות יחסיות מסורתיות, נכון?

וכמה מתכונות המפתח שאנו מביאים לטבלה בהקשר זה כל התכונות הארגוניות שהיית מצפה ממערכת ניהול מסדי נתונים מסורתית, האבטחה שלך, ה- HA שלך, ה- DR שלך, הגיבוי שלך נמצאים בחנות, הנכס שלך עסקאות. כמו גם העיצוב שמאפשר לך להתפשט בענן או בחומרת הסחורה כך שתוכל להתמודד עם הנפח ומהירות המידע שאתה צריך לטפל בכדי לבנות ולנתח סוג זה של מידע.

ואולי, היכולת החשובה ביותר היא העובדה שאנחנו מתכננים אגנוסטי. מה שזה אומר, למעשה, זה שאתה לא צריך להחליט איך הנתונים שלך ייראו כשאתה מתחיל לבנות את היישומים שלך או כשאתה מתחיל לצרף את המידע הזה יחד. אך עם הזמן, תוכלו לשלב מקורות נתונים חדשים, למשוך מידע נוסף ואז להשתמש במינוף ובשאילתה ולנתח את המידע בדיוק כפי שהייתם עושים עם כל מה שהיה שם מאז שהתחלתם בתכנון. בסדר?

אז איך עושים זאת? כיצד אנו למעשה מאפשרים לכם לטעון סוגים שונים של מידע, בין אם זה, משולשים של RDF, נתונים גיאוגרפיים, נתונים זמניים, נתונים וערכים מובנים, או בינאריים. והתשובה היא שבעצם בנינו את השרת שלנו מהיסוד כדי לשלב בתוכו טכנולוגיית חיפוש שמאפשרת להכניס מידע ושאותו מידע מתאר וזה מאפשר לך לבצע שאילתות, אחזור ולחפש מידע זה ללא קשר למקור או לפורמט שלו .

ומה שהמשמעות היא מעשית זה - ומדוע זה חשוב כשאתה עושה ניתוח - האם ניתוחים ומידע הם החשובים ביותר כאשר הם מוגדרים כראוי וממוקדים, נכון? לכן חלק מרכזי מאוד חשוב בכל סוג של ניתוח הוא חיפוש, וחלק המפתח הוא ניתוח ניתוח. אתה באמת לא יכול לקבל אחד בלי השני ולהשיג בהצלחה את מה שציינת להשיג. ימין?

ואני הולך לדבר בקצרה על שלושה וחצי מקרי שימוש שונים של לקוחות שיש לנו בהפקה המשתמשים ב- MarkLogic בכדי להפעיל ניתוח מסוג זה. בסדר. אז הלקוח הראשון כזה הוא מחוז פיירפקס. ומחוז פיירפקס בנה למעשה שני אפליקציות נפרדות. האחד מבוסס על התרת וניהול נכסים. והשני, שהוא כנראה קצת יותר מעניין, הוא אפליקציית האירועים של משטרת מחוז פיירפקס. מה שאפליקציית האירועים המשטרתית עושה בפועל היא שהיא מקבצת מידע כמו דוחות משטרה, דיווחים ותלונות אזרחים, ציוצים, מידע אחר שיש להם כמו עברייני מין וכל מידע אחר שיש להם גישה אליו מסוכנויות וממקורות אחרים. ואז הם מאפשרים להם לדמיין את זה ולהציג את זה בפני האזרחים כדי שיוכלו לבצע חיפושים ולהסתכל על פעילויות פשע שונות, פעילות משטרתית, וכל זאת באמצעות מדד גאוגרפי אחיד אחד, נכון? אז אתה יכול לשאול שאלות כמו "מהו שיעור הפשע בטווח של חמישה מיילים" או "אילו פשעים התרחשו במרחק של חמישה מיילים ממיקומי?" בסדר.

משתמש אחר שיש לנו, לקוח אחר שיש לנו הוא OECD. מדוע OECD חשוב לשיחה זו מכיוון שבנוסף לכל מה שהפעלנו עבור מחוז פיירפקס מבחינת איסוף מידע, נכון; את כל המידע שתקבלו מכל המדינות השונות החברות ב- OECD עליהן מדווחים מנקודת מבט כלכלית. למעשה הנחנו מקדח יעד לזה, נכון. כך שתוכלו לראות מצד שמאל שאנחנו רואים את הנוף של דנמרק ספציפית ותוכלו לראות מעין עלי כותרת של פרחים שמדרגים אותה על צירים שונים. ימין? וזה הכל טוב ויפה. אבל מה שה- OECD עשתה הוא שהם הלכו צעד אחד קדימה.

בנוסף להמחשות היפות האלה ולקירוב כל המידע הזה, הן למעשה מאפשרות לך בזמן אמת ליצור אינדקס חיים טוב יותר משלך, נכון, שתוכל לראות בצד ימין. אז מה שיש לכם הוא שיש לכם סט מחוונים שמאפשר לכם למעשה לעשות דברים כמו לדרג כמה חשוב לכם הדיור או הכנסה, משרות, קהילה, חינוך, סביבה, מעורבות אזרחית, בריאות, שביעות רצון בחיים, בטיחות ועבודתכם / איזון חיים. בהתבסס באופן דינמי על האופן שבו אתה מכניס מידע זה ומשקלל את הדברים האלה, MarkLogic משתמש ביכולת האינדקס בזמן אמת ויכולת השאילתה כדי לשנות את האופן שבו כל אחת ואחת מהמדינות הללו מדורגת כדי לתת לך מושג עד כמה טוב מדינה או מפות החיים שלך דרך מדינה נתונה. בסדר?

והדוגמא הסופית שאני הולך לחלוק היא MarkMail. ומה שבאמת מנסה MarkMail להפגין הוא שנוכל לספק יכולות אלה ותוכלו לבצע ניתוח מסוג זה לא רק על מידע מובנה או על מידע שמגיע בצורה המספרית אלא בעצם על מידע מובנה יותר, לא מובנה, נכון? דברים כמו ש. ומה שראינו כאן הוא שאנחנו בעצם מושכים מידע כמו מיקום גיאוגרפי, א.ר., חברה, ערימות ומושגים כמו Hadoop שמוזכרים במונחים של ואז ואז דמיינו אותו על המפה, כמו גם מסתכלים מי אותם אנשים ומה רשימה על פני זה, נשלח ותאריך. כאן אתה מסתכל על דברים שבאופן מסורתי אינם מובנים, שעשויים להיות מובנים באופן רופף, אך עדיין מצליחים להפיק ניתוח מובנה מאותו מידע מבלי שתצטרך להתאמץ הרבה כדי לנסות ולבנות אותו או לעבד אותו ב זמן. וזה הכל.

אריק: היי, בסדר טוב. ויש לנו עוד אחד. יש לנו את חנה סמלטרי מחברת Treasure Data, חברה מעניינת מאוד. וזה הרבה תוכן נהדר, אנשים. תודה רבה לכולכם שהבאתם שקופיות כל כך טובות ופרטים כל כך טובים. אז חנה, פשוט נתתי לך את המפתחות, לחץ על כל מקום והשתמש בחץ למטה במקלדת שלך. יש לך את זה. קח את זה מפה.

חנה סמלטרי: תודה רבה, אריק. זו חנה סמלטרי מבית Treasure Data. אני במאי עם Treasure Data אבל יש לי עבר כעיתונאי טק, מה שאומר שאני מעריך שני דברים. ראשית, אלה יכולים להימשך זמן רב באמצעות הרבה תיאורים שונים של טכנולוגיה, וכולם יכולים להישמע כאילו הם פועלים יחד, כך שאני באמת רוצה להתמקד במבדל שלנו. והיישומים בעולם האמיתי חשובים באמת, אז אני מעריך שכל חברי העמיתים שלי נהגו לספק אותם.

נתוני אוצר הם סוג חדש של שירות נתונים גדולים. אנו מועברים לגמרי בענן בתוכנה כשירות או מודל שירות מנוהל. אז לנקודת דבריו של ד"ר בלור מוקדם יותר, הטכנולוגיה הזו יכולה להיות קשה מאוד ויכולה לקחת זמן רב לקום ולפעול. עם נתוני אוצר אתה יכול להשיג את כל סוגי היכולות האלה שאתה עשוי לקבל בסביבת Hadoop או בסביבה מסובכת במקום הענן בענן במהירות רבה, מה שמועיל מאוד ליוזמות החדשות הללו של נתונים גדולים.

כעת אנו מדברים על השירות שלנו בכמה שלבים שונים. אנו מציעים כמה יכולות איסוף ייחודיות מאוד לאיסוף נתוני סטרימינג, כך במיוחד נתוני אירועים, סוגים אחרים של נתונים בזמן אמת. נדבר קצת יותר על סוגי הנתונים האלה. זה מבדיל גדול לשירות שלנו. כשאתה נכנס לנתונים גדולים או אם אתה כבר נמצא בזה אתה יודע שאיסוף נתונים זה אינו דבר של מה בכך. כשאתה חושב על מכונית עם 100 חיישנים הכוללים נתונים בכל דקה, אפילו אותם 100 חיישנים שמכניסים נתונים כל עשר דקות, זה מסתכם ממש מהר כשאתה מתחיל להכפיל את כמות המוצרים שיש לך בחיישנים וזה הופך להיות מאוד מאוד קשה לנהל. אז אנחנו מדברים עם לקוחות שיש להם מיליונים, יש לנו לקוחות שיש להם מיליארדי שורות נתונים ביום שהם מכניסים אותנו. והם עושים זאת כאלטרנטיבה לנסות ולנהל את עצמם בעצמם בתשתית מורכבת של אמזון או אפילו לנסות להכניס אותה לסביבה שלהם.

יש לנו סביבת אחסון בענן משלנו. אנחנו מנהלים את זה. אנו עוקבים אחר זה. יש לנו צוות של אנשים שעושה את כל הכוונון בשבילך. וכך הנתונים זורמים פנימה, הם נכנסים לסביבת האחסון המנוהלת שלנו.

לאחר מכן הטמענו מנועי שאילתה כדי שהאנליטיקאי שלכם יוכל להיכנס ולהפעיל שאילתות ולבצע כמה גילויים וחקירה ראשונית של נתונים כנגד הנתונים. יש לנו כמה מנועי שאילתה שונים לזה עכשיו. אתה יכול להשתמש בתחביר SQL, אשר האנליסטים שלך כנראה אוהבים ואוהבים, בכדי לעשות קצת גילוי נתונים בסיסי, לעשות ניתוחים מורכבים יותר שהם פונקציות המוגדרות על ידי המשתמש או אפילו לעשות דברים פשוטים כמו לצבור נתונים אלה ולהפוך אותם קטנים יותר כך אתה יכול להכניס אותו לסביבת מחסני הנתונים הקיימת שלך.

אתה יכול גם לחבר את כלי ה- BI הקיימים שלך, הטאבלו שלך, הוא שותף גדול משלנו; אבל באמת שרוב ה- BIs, הדמיה או כלי ניתוח יכולים להתחבר דרך מנהלי התקנים JDBC ו- ODBC הסטנדרטיים בתעשייה שלנו. אז זה נותן לך קבוצה מלאה זו של יכולות נתונים גדולים. אתה רשאי לייצא את תוצאות השאילתות או מערכי הנתונים שלך בכל עת בחינם, כך שתוכל לשלב נתונים אלה בקלות. התייחס לזה כאל בית זיקוק לנתונים. אני אוהב לחשוב על זה יותר כזיקוק מאשר לאגם כי אתה באמת יכול לעשות איתו דברים. אתה יכול לעבור, למצוא את המידע החשוב ואז להכניס אותו לתהליכים הארגוניים שלך.

בשקף הבא, אנו מדברים על שלושת ה- V של נתונים גדולים - יש אנשים שאומרים ארבעה או חמישה. הלקוחות שלנו נוטים להיאבק בנפח ומהירות הנתונים המגיעים אליהם. וכך כדי לקבל ספציפיות לגבי סוגי הנתונים - קליקסטרים, יומני גישה לאינטרנט, נתונים ניידים הם תחום גדול עבורנו, יומני אפליקציות לנייד, יומני אפליקציות מאפליקציות אינטרנט מותאמות אישית או אפליקציות אחרות, יומני אירועים. ויותר ויותר, יש לנו הרבה לקוחות שמתעסקים בנתוני חיישנים, כך ממכשירים לבישים, ממוצרים, מכוניות וסוגים אחרים של נתוני מכונות. אז כשאני אומר נתונים גדולים, זה סוג ה- Big Data עליו אני מדבר.

כעת, מעטים משתמשים במקרים בפרספקטיבה עבורך - אנו עובדים עם קמעונאי, קמעונאי גדול. הם ידועים מאוד באסיה. הם מתרחבים כאן בארה"ב. תתחיל לראות חנויות; לעתים קרובות הם נקראים איקאה אסייתית, אז עיצוב פשוט. יש להם אפליקציית נאמנות ואתר. ולמעשה, באמצעות Treasure Data הם הצליחו לפרוס את אפליקציית הנאמנות הזו במהירות רבה. הלקוחות שלנו קמים ופועלים תוך ימים או שבועות בגלל התוכנה שלנו וארכיטקטורת השירותים שלנו ומכיוון שיש לנו את כל האנשים שעושים את כל העבודה הקשה הזו מאחורי הקלעים בכדי לתת לכם את כל היכולות הללו כשירות.

לכן הם משתמשים בשירות שלנו לצורך ניתוח אפליקציות סלולריות בוחנים את ההתנהגות, על מה אנשים לוחצים ביישום הנאמנות שלהם לנייד. הם בוחנים את הקליקים באתר ומשלבים את זה עם מסחר אלקטרוני ונתוני קופה שלנו כדי לתכנן מבצעים יעילים יותר. הם למעשה רצו להכניס אנשים לחנויות כי הם גילו שאנשים, כשהם נכנסים לחנויות מוציאים יותר כסף ואני אוהב את זה; כדי להרים דברים אתה מוציא יותר כסף.

מקרה שימוש אחר שאנחנו רואים במשחקי וידאו דיגיטליים, זריזות מדהימה. הם רוצים לראות בדיוק מה קורה במשחק שלהם, ולבצע שינויים במשחק הזה גם תוך שעות מרגע יציאתו. אז מבחינתם, אותה השקפה בזמן אמת חשובה להפליא. פשוט פרסמנו משחק אבל שמנו לב בשעה הראשונה שכולם נושרים ברמה 2; איך אנחנו הולכים לשנות את זה? הם עשויים לשנות את זה באותו יום. אז זמן אמיתי חשוב מאוד. הם מכניסים אלינו מיליארדי יומני אירועים ליום. אבל זה יכול להיות כל סוג של אפליקציה סלולרית בה תרצו איזשהו תצוגה בזמן אמת של איך מישהו משתמש בזה.

ולבסוף, תחום גדול עבורנו הוא התנהגות המוצר וניתוח חיישנים שלנו. אז עם נתוני חיישנים שנמצאים במכוניות, זה בסוגים אחרים של מכונות, כלי עזר, וזה תחום אחר עבורנו, במכשירים לבישים. יש לנו צוותי מחקר ופיתוח שרוצים לדעת במהירות מה ההשפעה של שינוי למוצר או אנשים המעוניינים בהתנהגותם של האופן שבו אנשים מתקשרים עם המוצר. ויש לנו הרבה יותר מקרי שימוש שכמובן אנו שמחים לחלוק איתכם.

ואז לבסוף, רק מראה לך כיצד הדבר יכול להשתלב בסביבתך, אנו מציעים שוב את היכולת לאסוף נתונים אלה. יש לנו טכנולוגיית אוספים ייחודית מאוד. אז שוב, אם איסוף בזמן אמת הוא משהו שאתה מתמודד איתו או שאתה מצפה להתמודד איתו, אנא בוא לבדוק את שירות נתוני האוצר. עשינו באמת יכולות לאיסוף נתוני סטרימינג. אתה יכול גם לטעון בכמויות גדולות את הנתונים שלך, לאחסן אותם, לנתח אותם עם מנועי השאילתה המוטבעים שלנו ואז, כפי שציינתי, אתה יכול לייצא אותם ישירות למחסן הנתונים שלך. אני חושב וויל הזכיר את הצורך להכניס נתונים גדולים לתהליכים הקיימים שלך. אז אל תסתובבו או תיצרו סילו חדש, אבל איך תוכלו לצמצם את הנתונים האלה ואז להעביר אותם למחסן הנתונים שלכם ותוכלו להתחבר ל- BI, להמחשה ולכלי ניתוח מתקדמים.

אבל אולי, נקודות המפתח שאני רוצה להשאיר אותך הן שאנחנו מנוהלים בשירות, זו התוכנה כשירות; זה מאוד חסכוני. שירות מנוי חודשי המתחיל בכמה אלפי דולרים בחודש ונביא אותך לפעולה תוך ימים או שבועות. אז השווה את זה לעלות חודשים על גבי חודשים של בניית תשתית משלך ושכירת האנשים האלה ומציאתה ובזבוז כל הזמן הזה על תשתיות. אם אתה עושה ניסויים או אם אתה צריך משהו אתמול, אתה יכול להתחיל ולהתחיל ממש מהר עם נתוני האוצר.

ואני רק מכוון אותך לאתר שלנו ולשירות המתחילים שלנו. אם אתה אדם נלהב שאוהב לשחק, אנא עיין בשירות המתחילים שלנו. אתה יכול להמשיך, אין צורך בכרטיס אשראי, פשוט שם, ואתה יכול לשחק עם נתוני הדגימה שלנו, לטעון את הנתונים שלך ובאמת לקבל תחושה של מה אנחנו מדברים עליהם. אז תודה רבה. כמו כן, בדוק באתר שלנו. השנה נקראנו הספק המגניב של גרטנר בביג דאטה, מאוד גאה בזה. ואתה יכול גם לקבל עותק של הדו"ח בחינם באתר שלנו, כמו גם מאמרים לבנים רבים של אנליסטים. אז תודה רבה.

אריק: אוקיי, תודה רבה. יש לנו קצת זמן לשאלות כאן, אנשים. גם אנחנו נלך קצת בגלל שיש לנו כאן חבורה של אנשים. ואני יודע שיש לי כמה שאלות בעצמי, אז הרשו לי להמשיך ולקבל את השליטה ואז אני הולך לשאול כמה שאלות. רובין וקירק, אל תהסס לצלול פנימה כראות עיניך.

אז הרשו לי לקפוץ ולקפוץ ימינה לאחת השקופיות הראשונות האלה שבדקתי מפנטהו. אז הנה, אני אוהב את ארכיטקטורת ה- Big Data המתפתחת הזו, האם אתה יכול לדבר על איך זה שהסוג הזה משתלב בחברה? כי ברור שאתה נכנס לאיזה ארגון די גדול, אפילו חברה בגודל בינוני, והולך להיות לך כמה אנשים שכבר יש להם כמה דברים כאלה; איך אתה מפרק את כל זה ביחד? כמו איך נראית האפליקציה שעוזרת לך לתפור את כל הדברים האלה ואז איך נראה הממשק?

רצון: שאלה נהדרת. הממשקים מגוונים בהתאם לפרסונות המעורבים. אבל כדוגמא, אנו אוהבים לספר את סיפורו - אחד מחברי הפאנל שהזכיר את מקרה השימוש בבתי הזיקוק בנתונים - אנו רואים זאת הרבה בלקוחות.

אחת הדוגמאות של הלקוחות שלנו שאנחנו מדברים עליה היא Paytronix, שם יש להם את אותה סביבת EDW נתונים מסורתית. הם מציגים גם את Hadoop, Cloudera בפרט, ועם חוויות משתמש שונות בכך. אז ראשית יש חוויה הנדסית, אז איך מחברים את כל הדברים האלה יחד? איך יוצרים את הדבק בין סביבת Hadoop ל- EDW?

ואז יש לך חווית משתמש עסקית עליה דיברנו, מספר כלי BI שם בחוץ, נכון? לפנטהו יש כלי הניתן להטמעה באיכות OEM יותר של OEM, אך יש כאלה גדולים כמו Tableau ו- Excel, למשל, שם אנשים רוצים לחקור את הנתונים. אבל בדרך כלל, אנו רוצים לוודא שהנתונים מנוהלים, נכון? אחת השאלות בדיונים, מה עם חווית גרסה יחידה, איך אתה מצליח לעשות זאת ובלי הטכנולוגיה כמו שילוב נתונים של פנטהו לשלב נתונים אלה יחד לא על הזכוכית אלא בסביבות ה- IT. כך שהוא באמת מגן על נתונים ומשלט עליהם ומאפשר חוויה יחידה עבור האנליטיקאי העסקי והמשתמשים העסקיים.

אריק: אוקיי, טוב. זו תשובה טובה לשאלה קשה, למען האמת. ותנו לי רק לשאול את השאלה לכל אחד מהמרצים ואז אולי רובין וקירק אם אתם רוצים גם לקפוץ פנימה. אז הייתי רוצה להמשיך לדחוף את השקופית הזו ל WebAction שלדעתי באמת חברה מעניינת מאוד. למעשה, אני מכיר גם את סמי אקבי שהוא אחד המייסדים המשותפים. אני זוכר שדיברתי איתו לפני כמה שנים ואמרתי, "היי גבר, מה אתה עושה? מה אתה עושה? אני יודע שאתה צריך לעבוד על משהו." וכמובן, הוא היה. הוא עבד ב- WebAction, תחת הכיסויים כאן.

שאלה הגיעה בשבילך, סטיב, אז אני אעביר לך את זה, של טיהור נתונים, נכון? האם אתה יכול לדבר על המרכיבים האלה של יכולת זו בזמן אמת? איך מתמודדים עם סוגיות כמו טיהור נתונים או איכות נתונים או איך זה בכלל עובד?

סטיב: אז זה באמת תלוי מאיפה אתה מקבל את ההזנות שלך. בדרך כלל, אם אתה מקבל את העדכונים שלך ממסד נתונים כשאתה משנה את לכידת הנתונים, שוב, זה תלוי שם באופן שבו הנתונים הוזנו. טיהור נתונים באמת הופך לבעיה כשאתה מקבל את הנתונים ממספר מקורות או שאנשים נכנסים אליו ידנית או שיש לך סוגים שרירותיים שעליך לנסות ולשלוף מהם דברים. וזה בהחלט יכול להיות חלק מהתהליך, אם כי סוג זה פשוט לא מתייחס לעיבוד נכון, סוג של מהירות גבוהה בזמן אמת. טיהור נתונים, בדרך כלל, הוא תהליך יקר.

אז יכול להיות שזה יכול להיעשות לאחר מעשה באתר החנות. אבל הדבר האחר שהפלטפורמה באמת, ממש טובה בו הוא מתאם, כך שבמתאם והעשרת נתונים. אתה יכול, בזמן אמת, לתאם בין הנתונים הנכנסים ולבדוק אם הם תואמים לתבנית מסוימת או שהם תואמים נתונים שמועברים ממסד נתונים או מ- Hadoop או מחנות אחרת. כך שתוכלו לתאם בין נתונים היסטוריים, זה דבר אחד שתוכלו לעשות.

הדבר הנוסף שאתה יכול לעשות הוא בעצם לבצע ניתוח על נתונים אלה ולראות אם זה סוג של התאמה לדפוסים נדרשים מסוימים. וזה משהו שאתה יכול לעשות גם בזמן אמת. אבל הסוג המסורתי של טיהור נתונים, שם אתה מתקן שמות של חברות או שאתה מתקן כתובות וכל אותם סוגים של דברים, כנראה שצריך לעשות אותם במקור או בסוג של אחרי מעשה, וזה מאוד יקר ואתה מתפלל שהם לא יעשו את אלה בזמן אמת.

אריק: כן. ואתם באמת מנסים לטפל כמובן בטבע הדברים בזמן אמת, אבל גם להשיג את האנשים בזמן. ודיברנו עליהם, נכון, ציינתי בראש השעה, את כל חלון ההזדמנויות הזה ואתם באמת מכוונים ליישומים ספציפיים בחברות בהן תוכלו לצרף נתונים שלא עוברים את המסלול הרגיל, הולכים על המסלול החלופי הזה ועושים זאת בהשהיה כה נמוכה שתוכל לשמור על לקוחות. לדוגמה, אתה יכול לשמור על אנשים מרוצים וזה מעניין, כשדיברתי עם סמי בהרחבה על מה שאתה עושה הוא עשה נקודה ממש טובה. הוא אמר, אם אתה מסתכל על הרבה מהיישומים החדשים מבוססי האינטרנט; בואו נסתכל על דברים כמו, Bitly או על חלק מהיישומים האחרים האלה; הם שונים מאוד מהיישומים הישנים עליהם הסתכלנו, למשל, על מיקרוסופט כמו Microsoft Word.

לעתים קרובות אני משתמש במיקרוסופט כילד מצליף ובאופן ספציפי ל- Word כדי לדבר על התפתחות התוכנה. מכיוון שמיקרוסופט וורד התחילה, כמובן, כתוכנית לעיבוד תמלילים. אני אחד מאותם אנשים שזוכרים את Word Perfect. אהבתי מאוד להיות מסוגל לבצע את מקשי החשיפה או את קוד החשיפה, בעיקרון, וזה המקום אליו תוכלו לראות את הקוד בפועל. אתה יכול לנקות משהו אם רשימת הכדורים שלך שגויה, אתה יכול לנקות את זה. ובכן, וורד לא מאפשרת לך לעשות זאת. ואני יכול לומר לך ש- Word מטמיע הר של קוד בכל עמוד שאתה עושה. אם מישהו לא מאמין לי, עבור אל Microsoft Word, הקלד "שלום עולם" ואז עשה "ייצא כ" או "שמור בשם" .html. ואז פתח את המסמך בעורך וזה יהיה באורך של ארבעה עמודים של קודים רק לשתי מילים.

אז אתם, חשבתי שזה מאוד מעניין והגיע הזמן שנדבר על זה. וזה המקום בו אתם מתמקדים, נכון, לזהות את מה שאפשר לכנות הזדמנויות בין פלטפורמות או חוצות ארגונים או חוצות דומיינים כדי לאסוף נתונים בזמן כה מהיר שתוכלו לשנות את המשחק, נכון?

סטיב: כן, בהחלט. ואחד המפתחות שלדעתי עשיתם חמק מהם, בכל מקרה, האם אתה באמת רוצה לדעת על דברים שקורים לפני שהלקוחות שלך עושים זאת או לפני שהם באמת הופכים לבעיה. כדוגמה הן התיבות העליונות. תיבות כבלים, הם פולטים טלמטריה כל הזמן, המון והמון טלמטריה. ולא רק סוג הבריאות של הקופסה, אבל זה מה שאתה צופה וכל הדברים האלה, נכון? התבנית האופיינית היא שאתה מחכה עד שהתיבה תיכשל ואז תתקשר לספק הכבלים שלך והם יגידו, "ובכן, נגיע אליך מתישהו בין השעות 6 בבוקר ועד 23:00 בכל חודש נובמבר." זו לא חווית לקוח ממש טובה.

אבל אם הם היו יכולים לנתח את הטלמטריה הזו בזמן אמת, הם היו יכולים להתחיל לעשות דברים כמו שאנחנו יודעים שהתיבות האלה עשויות להיכשל בשבוע הבא בהיסטוריה המבוססת. לפיכך נתזמן את איש תיקון הכבלים שלנו שיופיע בביתו של אדם זה לפני שהוא ייכשל. ואנחנו נעשה את זה בצורה שמתאימה לנו יותר מאשר שנצטרך אליו מסנטה קרוז עד סאניווייל. אנו מתזמן את הכל בסדר נאה, דפוס מכירות נוסע וכו ', כך שנוכל לייעל את העסק שלנו. וכך הלקוח מרוצה מכיוון שאין להם תיבת כבלים נכשלה. ספק הכבלים שמח כי הם פשוט התייעלו דברים והם לא צריכים לאנשים בכל מקום. זו רק דוגמא מהירה מאוד.אבל יש טונות וטונות של דוגמאות בהן הידיעה על דברים בזמן שהם קורים, לפני שהם קורים, יכולה לחסוך לחברות הון ובאמת, באמת לשפר את קשרי הלקוחות שלהם.

אריק: כן, נכון. אין ספק לגבי זה. בואו ונמשיך ימינה אל MarkLogic. כפי שציינתי קודם, ידעתי על החבר'ה האלה די הרבה זמן ולכן אביא אותך לעניין, פרנק. אתם הייתם הרבה לפני כל תנועת ה- Big Data בכל הקשור לבניית האפליקציה שלכם, זה באמת מסד נתונים. אבל לבנות את זה ודיברת על חשיבות החיפוש.

אז הרבה אנשים שעקבו אחר המרחב יודעים שהרבה מאוד כלים של NoSQL שם בחוץ תומכים ביכולות חיפוש בין אם באמצעות צדדים שלישיים או שהם מנסים לעשות בעצמם. אבל אם החיפוש הזה כבר מוטבע בזה, אפוי כביכול, זה באמת עניין גדול. כי אם אתה חושב על זה, אם אין לך SQL, אז איך אתה נכנס לחיפוש בנתונים? איך אתה שואב ממשאב נתונים זה? והתשובה היא להשתמש בדרך כלל בחיפוש כדי להגיע לנתונים שאתה מחפש, נכון?

אז אני חושב שזה אחד המבדלים העיקריים מבחינתכם הבחורים בצד היכולת למשוך נתונים מכל המקורות השונים האלה ולאחסן נתונים ובאמת להקל על הסביבה ההיברידית מסוג זה. אני חושב שיכולת חיפוש היא עניין גדול בשבילך, נכון?

פרנק: כן, בהחלט. למעשה, זו הדרך היחידה לפתור את הבעיה בעקביות כשאתה לא יודע איך כל הנתונים יראו, נכון? אם אינך יכול לדמיין את כל האפשרויות, הדרך היחידה לוודא שתוכל לאתר את כל המידע הרצוי לך, שתוכל לאתר אותו בעקביות ותוכל לאתר אותו ללא קשר לאופן שבו אתה מפתח את מודל הנתונים שלך ואת מערכי הנתונים שלך הוא כדי לוודא שאתה נותן לאנשים כלים גנריים המאפשרים להם לחקור נתונים אלה. והדרך הקלה והאינטואיטיבית ביותר לעשות זאת היא באמצעות פרדיגמת חיפוש, נכון? ובאמצעות אותה גישה בחיפוש מתרחשת היכן שיצרנו אינדקס הפוך. יש לך ערכים שבהם אתה יכול למעשה לבדוק את אלה ואז למצוא רשומות ומסמכים ושורות שמכילים למעשה את המידע שאתה מחפש ואז להחזיר אותו ללקוח ולאפשר לו לעבד אותו כראות עיניהם.

אריק: כן, דיברנו על זה הרבה, אבל אתה נותן לי הזדמנות ממש טובה לחדור לזה - כל הצד של החיפוש והגילוי של המשוואה הזו. אבל קודם כל זה כיף. לכל מי שאוהב את הדברים האלה, זה החלק הכיף, נכון? אבל הצד השני של המשוואה או הצד השני של המטבע, אני צריך לומר, הוא שזה באמת תהליך איטרטיבי. ואתה יכול להיות מסוגל - הנה אני אשתמש בחלק משפת השיווק - לנהל את השיחה הזו עם הנתונים, נכון? במילים אחרות, אתה צריך להיות מסוגל לבדוק את ההשערה, להשתעשע איתה ולראות איך זה עובד. אולי זה לא שם, לבדוק משהו אחר ולשנות כל הזמן דברים ולחזור ולחפש ולחקר ופשוט לחשוב על דברים. וזה תהליך. ואם יש לך מכשולים גדולים, כלומר איחור ארוך או ממשק משתמש קשה או שאתה צריך ללכת לשאול את ה- IT; זה פשוט הורג את כל החוויה האנליטית, נכון?

לכן חשוב לקבל סוג כזה של גמישות ולהיות מסוגלים להשתמש בחיפושים. ואני אוהב את הדרך בה אתה מתאר את זה כאן כי אם אנו מסתכלים על חיפוש סביב מושגים או מקשים שונים, אם תרצו, ערכי מפתח והם ממדים שונים. אתה רוצה להיות מסוגל לערבב ולהתאים דברים אלו כדי לאפשר לאנליטיקאי שלך למצוא דברים שימושיים, נכון?

פרנק: כן, בהחלט. כלומר, ההיררכיה היא גם דבר חשוב, נכון? כך שכשאתה כולל משהו כמו כותרת, נכון, או מונח או ערך ספציפיים, אתה למעשה יכול להצביע על הנכון. אז אם אתה מחפש כותרת של מאמר, אתה לא מקבל כותרות של ספרים, נכון? או שאתה לא מקבל כותרות של פוסטים בבלוג. היכולת להבחין בין אלה ודרך ההיררכיה של המידע חשובה גם כן.

ציינת קודם לכן את ההתפתחות, בהחלט, נכון? היכולת של הלקוחות שלנו למעשה למשוך מקורות נתונים חדשים תוך שעות ספורות, להתחיל לעבוד איתם, להעריך אם הם מועילים או לא, ואז להמשיך לשלב אותם או להשאיר אותם לצד הדרך היא בעלת ערך רב. כשאתה משווה את זה לגישה מסורתית יותר לפיתוח יישומים, כאשר מה שאתה עושה בסופו של דבר זה שאתה צריך להבין אילו נתונים אתה רוצה להכניס, למקור את הנתונים, להבין כיצד אתה מתאים אותם למודל הנתונים הקיים שלך או מודל שבשינוי, שנה את מודל הנתונים כדי לשלב אותו ואז מתחיל בפיתוח, נכון? איפה שאנחנו סוגרים את זה על הראש ואומרים פשוט הביאו אותו אלינו, מאפשרים לכם להתחיל איתו את הפיתוח ואז להחליט אחר כך אם אתם רוצים לשמור עליו או כמעט מייד אם זה בעל ערך או לא.

אריק: כן, זו נקודה ממש טובה. זאת נקודה טובה. אז הרשו לי להביא את הפרזנטור הרביעי שלנו לכאן, Treasure Data. אני אוהב את החבר'ה האלה. לא ידעתי עליהם הרבה אז אני סוג של בועט בעצמי. ואז חנה הגיעה אלינו וסיפרה לנו מה הם עושים. וחנה הזכירה, היא הייתה איש תקשורת והיא עברה לצד האפל.

חנה: עשיתי, ערמתי.

אריק: אבל זה בסדר כי אתה יודע מה אנחנו אוהבים בעולם התקשורת. אז זה תמיד נחמד כשאיש תקשורת ניגש לצד הספק מכיוון שאתה מבין, היי, הדברים האלה לא כל כך קל לנסח, וזה יכול להיות קשה לברר מאתר אינטרנט בדיוק מה המוצר הזה עושה לעומת מה שהמוצר הזה עושה. ועל מה אתם מדברים באמת מעניין. כעת, אתה שירות מנוהל בענן. אז כל מידע שמישהו רוצה להשתמש שהוא מעלה לענן שלך, האם זה נכון? ואז תעברו ETL או CDC, נתונים נוספים עד לענן, האם זה איך זה עובד?

חנה: טוב, כן. אז הרשו לי להבדיל חשוב. רוב הנתונים, הנתונים הגדולים, שלקוחותינו משתמשים בהם נמצאים כבר מחוץ לחומת האש - נתונים ניידים, נתוני חיישנים שנמצאים במוצרים. וכך אנו משמשים לעתים קרובות כאזור בימת ביניים. לכן נתונים לא מגיעים לעתים קרובות מארגון של מישהו לשירות שלנו עד כדי כך שהם נובעים מאתר, אפליקציה סלולרית, מוצר עם המון חיישנים בתוכו - לסביבת הענן שלנו.

כעת אם ברצונך להעשיר נתונים גדולים אלה בסביבתנו, אתה בהחלט יכול להעלות בכמות גדולה נתוני יישומים או נתוני לקוחות כדי להעשיר זאת ולעשות יותר מהניתוח ישירות בענן. אבל הרבה מערך שלנו הוא סביב איסוף הנתונים שכבר נמצאים מחוץ לחומת האש, ומפגישים למקום אחד. כך שגם אם אתה מתכוון להעלות סוג זה של מאחורי חומת האש שלך ולעשות יותר ניתוחים מתקדמים שלך או להכניס אותו לסביבת ה- BI או הניתוח הקיימת שלך, זו נקודת הבמה ממש טובה. מכיוון שאינך רוצה להכניס מיליארד שורות יום למחסן הנתונים שלך, זה לא משתלם. זה אפילו קשה אם אתה מתכנן לאחסן את זה איפשהו ואז להעלות אצווה.

כך שאנחנו לעתים קרובות הנקודה הראשונה בה נאספים נתונים שכבר נמצאים מחוץ לחומת האש.

אריק: כן, זו גם נקודה ממש טובה. מכיוון שהרבה חברות הולכות להיות עצבניות לקחת את נתוני הלקוחות הקנייניים שלהן, להציב אותן בענן ולנהל את כל התהליך.

חנה: כן.

אריק: ומה שאתה מדבר עליו הוא באמת להביא לאנשים משאב לפריצת המספרים הכבדים האלה, כפי שאתה מציע, נתונים שהם צד שלישי כמו נתונים ניידים והנתונים החברתיים וכל אותם דברים מהנים. זה די מעניין.

חנה: כן, בהחלט. וכנראה שהם עצבניים לגבי המוצרים מכיוון שהנתונים כבר בחוץ. אז כן, לפני שהכנסתי אותו, ואני ממש אוהבת את המונח הזיקוק הזה, כפי שציינתי, לעומת האגם. אז אתה יכול לעשות קצת זיקוק בסיסי? הוצא את הדברים הטובים ואז הבא אותם מאחורי חומת האש למערכות ותהליכים אחרים שלך לניתוח מעמיק יותר. אז באמת כל מה שמדענים יכולים לעשות, חקר נתונים בזמן אמת של הנתונים הגדולים החדשים הזורמים פנימה.

אריק: כן, זה נכון. ובכן, הרשה לי להביא את האנליסטים שלנו ונחזור בסדר הפוך. אני אתחיל איתך, רובין, ביחס לנתוני האוצר ואז נלך לקירק לכמה מהאחרים. ואז חזרה לרובין ובחזרה לקירק רק כדי לקבל קצת יותר הערכה של זה.

ואתה מכיר את בית הזיקוק לנתונים, רובין, שחנה מדברת כאן. אני אוהב את המושג הזה. שמעתי רק כמה אנשים מדברים על זה ככה, אבל אני חושב שבוודאי הזכרת זאת לפני כן. וזה באמת מדבר למה שקורה למעשה לנתונים שלך. מכיוון, כמובן, בית זיקוק, זה בעצם מזקק דברים עד לרמת השורש שלו, אם אתה חושב על בתי זיקוק. למעשה למדתי את זה זמן מה וזה די בסיסי, אבל ההנדסה שנכנסת אליו צריכה להיות נכונה בדיוק או שלא תקבלו את הדברים שרוצים. אז אני חושב שזו אנלוגיה נהדרת. מה אתה חושב על כל התפיסה הזו של שירות ענן נתונים של אוצר המסייע לך להתמודד עם כמה מהצרכים האנליטיים הספציפיים האלה מאוד מבלי שתצטרך להביא דברים פנימה?

רובין: טוב, אני מתכוון, ברור תלוי בנסיבות עד כמה זה נוח. אבל כל מי שבאמת עבר תהליך שעבר כבר הולך לשים אותך לקראת המשחק אם לא תהיה לך אחד כזה בעצמך. זה התשלום הראשון למשהו כזה. אם מישהו הרכיב משהו, הם עשו את זה, זה מוכח בשוק ולכן יש איזה סוג של ערך בפועל, ובכן, העבודה כבר נעלמה לזה. ויש גם את העובדה הכללית מאוד כי זיקוק נתונים הולך להיות נושא הרבה יותר גדול מבעבר. כלומר, לא מדברים על זה, לדעתי בכל מקרה, לא מדברים עליו כמו שצריך. פשוט מלבד העובדה שגודל הנתונים גדל ומספר המקורות והמגוון של אותם מקורות גדל במידה ניכרת. והאמינות של הנתונים מבחינת האם הם נקיים, הם צריכים להבדיל את הנתונים, כל מיני נושאים שעולים רק מבחינת ניהול הנתונים.

אז לפני שאתה באמת מסוגל לעשות ניתוח אמין על זה, אתה יודע, אם הנתונים שלך מלוכלכים, התוצאות שלך יהיו מוטות בדרך זו או אחרת. אז זה משהו שיש להתייחס אליו, עליו לדעת. והמשולש לספק למיטב הבנתי שירות בר-קיימא מאוד שיסייע בכך.

אריק: כן, אכן. ובכן, הרשו לי להמשיך ולהחזיר את קירק למשוואה כאן ממש ממש. רציתי להסתכל על אחת השקופיות האחרות ופשוט להתרשם מהדברים, קירק. אז אולי נחזור לשקופית MarkLogic זו. ואגב, קירק סיפק את הקישור, אם לא ראית את זה אנשים, לכמה מהשקופיות שלו בגילוי הכיתה כי זה מושג מאוד מעניין. ואני חושב שזה סוג של מתבשל בחלק האחורי של מוחי, קירק, כשדיברתי על זה לפני רגע. כל השאלה הזו שאחד הנוכחים העלה על השאלה כיצד אתה הולך למצוא שיעורים חדשים. אני אוהב את הנושא הזה כי זה באמת מדבר עם הצד הקשה של הקטגוריות, כי תמיד היה לי קשה לקטלג דברים. אני אוהב, "הו, אלוהים, אני יכול להתאים לחמש קטגוריות, איפה אני מנסח את זה?" אז אני פשוט לא רוצה לסווג שום דבר, נכון?

וזו הסיבה שאני אוהבת חיפוש, מכיוון שאתה לא צריך לקטלג אותו, אתה לא צריך להכניס אותו לתיקיה. פשוט חפש אותו ותמצא אותו אם אתה יודע לחפש. אבל אם אתה נמצא בתהליך הזה של ניסיון לפלח, כי זה בעצם מה הקטגוריזציה, זה פילוח; למצוא שיעורים חדשים, זה סוג של דבר מעניין. האם אתה יכול לדבר באופן מדויק עם כוחם של חיפוש וסמנטיקה והיררכיות, למשל, כפי שפרנק דיבר ביחס ל- MarkLogic ולתפקיד שממלא במציאת שיעורים חדשים, מה אתה חושב על זה?

קירק: ובכן, קודם כל, הייתי אומר שאתה קורא את דעתי. כי זה מה שחשבתי על שאלה עוד לפני שדיברת, כל היצירה הסמנטית הזו כאן שמארק לוגיץ 'הציג. ואם תחזור לשקופית שלי, אינך צריך לעשות זאת, אלא לחזור לשקופית חמש על מה שהצגתי היום אחר הצהריים; דיברתי על סמנטיקה זו שצריך ללכוד את הנתונים.

אז כל הרעיון הזה של חיפוש, הנה. אני מאמין בזה בחוזקה ותמיד האמנתי בכך שעם נתונים גדולים, קח סוג של אנלוגיה של האינטרנט, כלומר, רק הרשת, אני מתכוון שהידע העולמי והמידע והנתונים בדפדפן האינטרנט זה דבר אחד. אבל אם ניתן יהיה לחפש אותו ולשחזר אותו ביעילות כפי שאחת מחברות מנועי החיפוש הגדולות מספקות לנו, אז כאן נמצא הכוח האמיתי של הגילוי. מכיוון שחיבור מונחי החיפוש, סוג אזורי המשתמש המעניין את גרגירת הנתונים הספציפית, לדף האינטרנט הספציפי, אם אתה רוצה לחשוב על דוגמת האינטרנט או את המסמך הספציפי אם אתה מדבר על ספריית מסמכים. או סוג לקוח מסוים של פלח אם זה המרחב שלך.

וסמנטיקה נותנת לך סוג כזה של שכבות ידע על גבי חיפוש מילים בלבד. אם אתה מחפש סוג מסוים של דבר, הבנה שחבר בכיתה של דברים כאלה יכול להיות בקשר מסוים לדברים אחרים. אפילו כלול מידע כזה על מערכות יחסים וזה מידע על היררכיה מעמדית כדי למצוא דברים שדומים למה שאתה מחפש. או לפעמים אפילו ההפך הגמור ממה שאתה מחפש, כי זה בדרך נותן לך סוג של גרעין נוסף להבנה. ובכן, כנראה שזה משהו ההפך מזה.

אריק: כן.

קירק: אז בעצם הבינו את זה. אני יכול לראות משהו הפוך מזה. וכך השכבה הסמנטית היא מרכיב בעל ערך שלעתים קרובות חסר וזה מעניין עכשיו שזה יעלה כאן במצב זה. מכיוון שלימדתי קורס בוגר במאגר מידע, כריית נתונים, למידה ממידע, מדעי נתונים, איך שלא תרצו לקרוא לזה למעלה מעשור; ואחת היחידות שלי בקורס ארוך סמסטר זה היא בנושא סמנטיקה ואונטולוגיה. ולעתים קרובות התלמידים שלי היו מסתכלים עלי, מה זה קשור למה שאנחנו מדברים? וכמובן שבסופו של דבר, אני חושב שאנחנו כן מבינים שהצבת הנתונים האלה מסגרת ידע כלשהי. כך, למשל, אני מחפש מידע על התנהגות לקוח מסוימת, מבין שההתנהגות הזו מתרחשת, זה מה שהאנשים קונים באירוע ספורט. איזה סוג של מוצרים אני מציע ללקוחות שלי כשאני מבחין במדיה החברתית שלהם - על או - שהם אומרים שהם הולכים לאירוע ספורטיבי כמו כדורגל, בייסבול, הוקי, מונדיאל, יהיה אשר יהיה.

אוקיי, כל כך אירוע ספורטיבי. אז הם אומרים שהם הולכים, נניח, משחק בייסבול. אוקיי, אני מבין שבייסבול הוא אירוע ספורט. אני מבין שזה בדרך כלל חברתי ואתה הולך עם אנשים. אני מבין שזה בדרך כלל בחלל חיצוני. זאת אומרת, הבנת כל אותם תכונות קונוסליות, היא מאפשרת פילוח של הלקוח המעורב, עוצמה יותר, סוג, וההתאמה האישית שלך של החוויה שאתה נותן להם כאשר, למשל, הם מתקשרים עם שלך שטח באמצעות אפליקציה לנייד בזמן שהם יושבים באצטדיון.

אז כל אותם דברים מסוג זה פשוט מביאים כל כך הרבה יותר פוטנציאל לגילוי נתונים לנתונים בסוג זה של רעיון לאינדקס של אינדקס גרגרי נתונים לפי מקום סמנטי שלהם ומרחב הידע באמת די משמעותי. וממש התרשמתי שיצא היום. אני חושב שזה סוג של דבר מהותי לדבר.

אריק: כן, זה בטוח. זה מאוד חשוב בתהליך הגילוי, זה מאוד חשוב בתהליך הסיווג. ואם אתה חושב על זה, ג'אווה עובדת בשיעורים. זה מונחה אובייקט, אני מניח, פחות או יותר, אפשר לומר צורת תכנות ועבודות ג'אווה בשיעורים. אז אם אתם בעצם מעצבים תוכנה, כל הרעיון הזה של ניסיון למצוא כיתות חדשות הוא למעשה דברים חשובים למדי מבחינת הפונקציונליות שאתם מנסים לספק. מכיוון שבמיוחד בעולם הפראי והצמרירי החדש הזה של נתונים גדולים, שבהם יש לך כל כך הרבה ג'אווה בחוץ, המריץ כל כך הרבה מהיישומים השונים האלה, אתה יודע שיש 87,000 דרכים ומעלה לעשות כל דבר עם מחשב, להשיג כל סוג של ביט של הפונקציונליות שנעשתה.

אחת מבדיחות הריצה שלי כשאנשים אומרים, "הו, אתה יכול לבנות מחסן נתונים באמצעות NoSQL." אני אוהב, "טוב, אתה יכול, כן, זה נכון. אתה יכול גם לבנות מחסן נתונים באמצעות Microsoft Word." זה לא הרעיון הכי טוב, זה לא יתפקד טוב מאוד אבל אתה באמת יכול לעשות את זה. אז המפתח הוא שאתה צריך למצוא את הדרך הטובה ביותר לעשות משהו.

לך על זה.

קירק: תן לי רק להגיב לזה. מעניין שהזכרת את הדוגמא של כיתת ג'אווה שלא עלה בראשי עד שאמרת זאת. אחד ההיבטים של ג'אווה ומעמדות וכאלה כיוון אובייקט הוא שישנן שיטות המחוברות למעמדות ספציפיים. וזה באמת מסוג זה שניסיתי במצגת שלי ושברגע שאתה מבין כמה גרגירי נתונים אלה - נאגטס הידע האלה, התגיות האלה, ההערות האלה והתוויות הסמנטיות האלה - אתה יכול לאגד שיטה לזה. למעשה יש להם תגובה זו או תגובה זו, והמערכת שלך מספקת סוג כזה של תגובה אוטומטית ופרואקטיבית לדבר זה בפעם הבאה שאנחנו רואים את זה בזרם הנתונים.

כך שהמושג של פעולות ושיטות מחייבות למעמד ספציפי הוא באמת אחת הכוחות של ניתוחים אוטומטיים בזמן אמת. ואני חושב שאתה סוג של מכה על משהו.

אריק: טוב, טוב, טוב. ובכן, זה דברים טובים. אז בוא נראה, וויל, אני רוצה להחזיר לך את זה ולמעשה לזרוק לך שאלה מהקהל. יש לנו כמה כאלה גם כאן. ואנשים, אנחנו הולכים זמן רב כי אנחנו רוצים לקבל כמה מהמושגים הנהדרים האלה בשאלות הטובות האלה.

אז הרשו לי להעביר אליכם שאלה מאחד ממספרי הקהל שאומר, "אני לא ממש רואה איך הבינה העסקית מבדילה סיבה ותוצאה." במילים אחרות, כאשר המערכות מקבלות החלטות המבוססות על מידע נצפה, כיצד הן מפתחות מודלים חדשים כדי ללמוד יותר על העולם? זו נקודה מעניינת, אז אני שומע כאן מתאם של סיבה ותוצאה, ניתוח שורש, וזה חלק מהסוג הזה של דברים מתקדמים יותר באנליטיקה שאתה מדבר עליהם בניגוד ל- BI המסורתי, וזה באמת פשוט סוג של דיווח וסוג הבנה של מה שקרה. וכמובן שכל הכיוון שלכם, פשוט מסתכלים על השקופית שלכם כאן, מתקדם לעבר היכולת החזויה ההיא לקבל החלטות אלה או לפחות לקבל את ההמלצות הללו, נכון? אז הרעיון הוא שאתם מנסים לשרת את כל המגוון של המתרחש ואתם מבינים שהמפתח, הקסם האמיתי, הוא ברכיב המטרה האנליטית שם בצד ימין.

רצון: בהחלט.אני חושב שהשאלה הזו מציגה מעט לעתיד, במובן זה שמדעי הנתונים, כפי שציינתי קודם, ראינו את השקופית עם הדרישות של מדען הנתונים; זה תפקיד די מאתגר עבור מישהו להיות בו. עליו להיות בעל הידע העשיר הזה בסטטיסטיקה ומדע. אתה צריך את הידע בתחום כדי ליישם את הידע המתמטי שלך על התחומים. אז מה שאנו רואים היום האם אין כלים חיזוי מחוץ לתיבה שמשתמש עסקי, כמו, יכול היה להעלות באקסל ולנבא אוטומטית את עתידו, נכון?

זה אכן דורש ידע מתקדם בטכנולוגיה בשלב זה. כעת, יום אחד בעתיד, יתכן שחלק מהמערכות הללו, מערכות ההרחבה האלו הופכות להיות רגישות ומתחילות לעשות כמה דברים פראיים. אבל הייתי אומר בשלב זה, אתה עדיין צריך להיות מדען נתונים באמצע כדי להמשיך לבנות מודלים, ולא את המודלים האלה. מודלים חזויים אלה סביב כריית נתונים וכאלה מכוונים היטב ונבנים על ידי מדען הנתונים. הם לא נוצרים מעצמם, אם אתה יודע למה אני מתכוון.

אריק: כן, בדיוק. זה בדיוק נכון. ואחד השורות שלי הוא "מכונות לא משקרות, לפחות עדיין לא."

וויל: עדיין לא, בדיוק.

אריק: קראתי מאמר - אני צריך לכתוב משהו על זה - על איזה ניסוי שנעשה באוניברסיטה, שם אמרו שתוכנות המחשבים האלה למדו לשקר, אבל אני חייב לומר לך, אני לא באמת מאמין בזה . אנו נעשה מחקר על זה, אנשים.

ולגבי התגובה האחרונה, אז רובין אני אחזיר אותך להביט בפלטפורמת ה- WebAction הזו, מכיוון שזה מאוד מעניין. זה מה שאני אוהבת בחלל שלם זה שאתה מקבל נקודות מבט שונות וזוויות שונות שצולמו על ידי הספקים השונים כדי לשרת צרכים מאוד ספציפיים. ואני אוהב את הפורמט הזה לתוכנית שלנו מכיוון שיש לנו ארבעה ספקים מעניינים באמת, שלמען האמת, לא ממש דורכים זה על קצות האצבעות של האחרים. מכיוון שכולנו עושים חתיכות וקטעים שונים מאותו צורך כולל הכולל להשתמש באנליטיקה, כדי לעשות דברים.

אבל אני רק רוצה לקבל את נקודת המבט שלך על הפלטפורמה הספציפית הזו ועל הארכיטקטורה שלהם. איך הם מתנהלים בעשייה. אני מוצא את זה די משכנע. מה אתה חושב?

רובין: ובכן, אני מתכוון, זה מצביע על תוצאות מהירות במיוחד מהזרמת נתונים וכחיפוש, צריך לארגן את זה. זאת אומרת, אתה לא מתכוון לחמוק מלעשות כלום, חובבני, מכיוון שיש לנו משהו מהדברים האלה. אני שומע שזה מעניין ביותר ואני חושב שאחד הדברים שהיינו עדים להם בעבר; כלומר, אני חושב שאתה ואני, הלסת שלנו נופלת יותר ויותר במהלך השנים האחרונות, כשראינו שיותר ויותר דברים צצים שהיו ממש מהירים במיוחד, חכמים במיוחד ודי חסרי תקדים.

ברור שזו WebAction, זה לא רודיאו הראשון שלה, כביכול. למעשה זה היה שם בחוץ לוקח שמות במידה מסוימת. אז אני לא רואה, אבל אני אמור שנופתע שהארכיטקטורה הוחלפה למדי אבל היא בהחלט כן.

אריק: טוב, אני אגיד לך מה, אנשים. שרפנו כאן 82 דקות מוצקות. כלומר, תודה לכל האנשים האלה שהאזינו כל הזמן. אם יש לך שאלות שלא נענו, אל תתבייש, שלך באמת. עלינו לקבל ממני שוכב איפשהו. ותודה גדולה וגדולה לשני המגישים שלנו היום, לד"ר קירק בורן ולד"ר רובין בלור.

קירק, אני רוצה לחקור עוד כמה דברים סמנטיים איתך, אולי בשידור מקוון בעתיד. כי אני כן חושב שאנחנו עכשיו בתחילת שלב מאוד חדש ומעניין. מה שנוכל למנף הרבה מהרעיונות שיש לאנשים ולגרום להם להתרחש הרבה יותר קל כיוון שנחשוב מה, התוכנה הופכת להיות פחות יקרה, אני צריך לומר. זה הופך להיות שמיש יותר ואנחנו פשוט מקבלים את כל הנתונים האלה מכל המקורות השונים האלה. ואני חושב שזה הולך להיות מסע מאוד מעניין ומרתק במהלך השנים הבאות, כשאנחנו באמת מתחפרים במה שהדברים האלה יכולים לעשות ואיך זה יכול לשפר את העסקים שלנו.

אז תודה גדולה גם ל- Techopedia וכמובן לספונסרים שלנו - Pentaho, WebAction, MarkLogic ו- Treasure Data. ואנשים, וואו, עם זה אנחנו נסיים, אבל תודה רבה לך על זמנך ותשומת לבך. אנו נתפוס אותך בעוד כחודש וחצי לתוכנית הבאה. וכמובן, חדר התדרוכים ממשיך להמשיך; הרדיו ממשיך להמשיך; כל סדרות השידור האחרות שלנו ממשיכות להתנדנד, אנשים. תודה רבה לך. נתפוס אותך בפעם הבאה. ביי ביי.