Share to: share facebook share twitter share wa share telegram print page

DataOps

DataOps היא מערכת של פרקטיקות, תהליכים וטכנולוגיות המשלבת פרספקטיבה משולבת ומכוונת תהליך על נתונים עם אוטומציה ושיטות Agile כדי לשפר את האיכות, המהירות, שיתוף פעולה ולקדם תרבות של שיפור מתמיד בתחום ניתוח הנתונים.[1] בעוד ש-DataOps החלה כמערכת של שיטות עבודה מומלצות, היא התבגרה כעת והפכה לגישה חדשה ועצמאית לניתוח נתונים.[2] DataOps חלה על כל מחזור חיי הנתונים[3] מהכנת הנתונים ועד לדוח. ומכירה באופי המקושר של צוות ניתוח הנתונים ופעולות טכנולוגיית המידע.[4]

DataOps היא הלחם של Data ו-Operations, משלבת את מתודולוגיית פיתוח תוכנה זריז כדי לקצר את זמן המחזור של פיתוח אנליטיקה בהתאם למטרות העסקיות.[3]

DevOps מתמקדת באספקה רציפה על ידי מינוף משאבי IT לפי דרישה ועל ידי אוטומציה של בדיקות ופריסה של תוכנה. מיזוג זה של פיתוח תוכנה ותפעול IT שיפר את המהירות, האיכות, החיזוי וקנה המידה של הנדסת תוכנה ופריסה. DataOps, השואלת שיטות מ-DevOps, שואפת להביא את אותם שיפורים לניתוח נתונים.[4]

DataOps משתמש בבקרת תהליכים סטטיסטית (SPC) כדי לנטר ולשלוט בצינור ניתוח הנתונים. עם SPC קיים, הנתונים הזורמים דרך מערכת תפעולית מנוטרים באופן מתמיד ומאומתים כתקינים. אם מתרחשת אנומליה, ניתן להודיע לצוות ניתוח הנתונים באמצעות התראה אוטומטית.[5]

DataOps אינו קשור לטכנולוגיה, ארכיטקטורה, כלי, שפה או מסגרת מסוימת. כלים התומכים ב-DataOps מקדמים שיתוף פעולה, תזמור, איכות, אבטחה, גישה וקלות שימוש.[6]

היסטוריה

DataOps הוצג לראשונה על ידי לני ליבמן, עורך תורם ב-InformationWeek, בפוסט בבלוג של IBM Big Data & Analytics Hub תחת הכותרת "3 סיבות מדוע DataOps חיוני להצלחה בביג דאטה " ב-19 ביוני 2014.[7] המונח DataOps זכה מאוחר יותר לפופולריות על ידי אנדי פאלמר ב-Tamr.[8][4]

2017 הייתה שנה משמעותית עבור DataOps עם פיתוח משמעותי של המערכת האקולוגית, סיקור אנליסטים, חיפושי מילות מפתח מוגברים, סקרים, פרסומים ופרויקטים בקוד פתוח.[9] גרטנר ציינה את DataOps במחזור ההייפ לניהול נתונים בשנת 2018.[10]

מורשת DataOps מ-DevOps, Agile וייצור

מטרות ופילוסופיה

נפח הנתונים צפוי לגדול בקצב צמיחה שנתי ממוצע (CAGR) של 32% ל-180 זטה-בייט עד שנת 2025 (מקור: IDC).[6] DataOps שואפת לספק את הכלים, התהליכים והמבנים הארגוניים להתמודדות עם העלייה המשמעותית הזו בנתונים.[6] אוטומציה מייעלת את תהליך ה-preboarding, קליטת הנתונים וניהולם של מסדי נתונים משולבים גדולים, ומשחררת את צוות הנתונים לפתח ניתוחים חדשים בצורה יעילה ואפקטיבית יותר.[11][4] DataOps שואפת להגביר את המהירות, האמינות והאיכות של ניתוח הנתונים.[12] היא שמה דגש על תקשורת, שיתוף פעולה, אינטגרציה, אוטומציה, מדידה ושיתוף פעולה בין מדעני נתונים, אנליסטים, מהנדסי נתונים/ETL (חילוץ, טרנספורמציה, טעינה), טכנולוגיית מידע (IT) והבטחת איכות/ממשל.

יישום

טוף ויטמור מחברת Blue Hill Research מציע את עקרונות המנהיגות הבאים של DataOps עבור מחלקת טכנולוגיית המידע:[2]

  • קבעו מדידות התקדמות וביצועים בכל שלב של זרימת הנתונים. במידת האפשר, ביצעו בוחן ביצועים למחזור של זרימת הנתונים.
  • הגדירו כללים לשכבה סמנטית מופשטת. ודאו שכולם "מדברים באותה שפה" ומסכימים על מה הנתונים (והמטאדטה) הם ומה לא.
  • אימות באמצעות "מבחן עין": כלול לולאות משוב אנושיות המכוונות לשיפור מתמיד. צרכנים חייבים להיות מסוגלים לסמוך על הנתונים, וזה יכול לבוא רק באמצעות אימות הדרגתי.
  • אוטומציה של כמה שיותר שלבים בזרימת הנתונים, כולל BI, מדעי נתונים ואנליטיקה.
  • באמצעות בוחן ביצועים ממוחשב, זהה צווארי בקבוק ולאחר מכן אופטימיזציה עבורם. ייתכן שזה ידרוש השקעה בחומרה בסיסית, או אוטומציה של שלב מדעי הנתונים שסופק בעבר על ידי אדם בתהליך.
  • ביסוס משמעת, עם דגש מיוחד על בקרת נתונים דו-כיוונית, בעלות על נתונים, שקיפות ומעקב מקיף אחר שושלת נתונים לאורך כל תהליך העבודה.
  • תהליך תכנון לצמיחה והרחבה. יש לתכנן את מודל זרימת הנתונים כך שיתאים לנפח ולמגוון של נתונים. יש לוודא שטכנולוגיות מתומחרות במחיר סביר בהתאם לצמיחת הנתונים הארגונית.

אירועים

  • דאטה אופטיקון[13]
  • פסגת Data Ops[14]
  • אליפות Data Ops מקוונות[15]

הערות שוליים

  1. ^ Ereth, Julian (2018). "DataOps-Towards a Definition" (PDF). Proceedings of LWDA 2018: 109.
  2. ^ 1 2 "DataOps – It's a Secret". www.datasciencecentral.com. נבדק ב-2017-04-05.
  3. ^ 1 2 "What is DataOps (data operations)? - Definition from WhatIs.com". SearchDataManagement. נבדק ב-2017-04-05.
  4. ^ 1 2 3 4 "From DevOps to DataOps, By Andy Palmer - Tamr Inc". Tamr Inc. 2015-05-07. אורכב מ-המקור ב-2018-07-12. נבדק ב-2017-03-21.
  5. ^ DataKitchen (2017-03-07). "Lean Manufacturing Secrets that You Can Apply to Data Analytics". Medium. נבדק ב-2017-08-24.
  6. ^ 1 2 3 "What is DataOps? | Nexla: Scalable Data Operations Platform for the Machine Learning Age". www.nexla.com. נבדק ב-2017-09-07.
  7. ^ "3 reasons why DataOps is essential for big data success". IBM Big Data & Analytics Hub. נבדק ב-2018-08-10.
  8. ^ Mango Solutions: #DataOps - it's a thing (honest), נבדק ב-2021-06-28
  9. ^ DataKitchen (2017-12-19). "2017: The Year of DataOps". data-ops. נבדק ב-2018-01-24.
  10. ^ "Gartner Hype Cycle for Data Management Positions Three Technologies in the Innovation Trigger Phase in 2018". Gartner. נבדק ב-2019-07-19.
  11. ^ "5 trends driving Big Data in 2017". CIO Dive. נבדק ב-2017-09-07.
  12. ^ "Unravel Data Advances Application Performance Management for Big Data". Database Trends and Applications. 2017-03-10. נבדק ב-2017-09-07.
  13. ^ "DataOpticon - YouTube". www.youtube.com. נבדק ב-2021-06-28.
  14. ^ "DataOps Summit". www.dataopssummit-sf.com. אורכב מ-המקור ב-2021-07-02. נבדק ב-2021-06-28.
  15. ^ Intelligence, Corinium Global. "DataOps Champions Online 2021 | Corinium". dco-dataops.coriniumintelligence.com. נבדק ב-2021-06-28.
Kembali kehalaman sebelumnya