סוגי מודלים של נתונים ושימושיהם

סוגי מודלים של נתונים ושימושיהם

צומת המקור: 1790364

עסקים יכולים להפיק תועלת ממודל נתונים במגוון דרכים חשובות. מודלים של נתונים משרתים שתי מטרות עיקריות. ניתן לעצב אותם כדי לייצג את מערכת הנתונים הנוכחית של הארגון, לספק הבנה כיצד הנתונים זורמים בארגון, או להיות מפותחות כדי להציג מערכת נתונים מבוקשת חדשה. 

המודל יכול לשמש ליצירת מסד נתונים חדש יעיל ויעיל, או לשיפור בסיס נתונים קיים. כתוצאה מכך, דוגמנות נתונים הפך לשלב חשוב בתהליך הפיתוח והשיפור של מערכת מסד נתונים.

מודל נתונים מספק ייצוג חזותי - בדרך כלל בצורה של דיאגרמה - של האופן שבו הנתונים זורמים (או יזרמו) בעסק. בבסיסו, Data Modeling עוסקת בלמידה והבנה של זרימת הנתונים של ארגון כך שניתן יהיה לזהות צווארי בקבוק וחוסר יעילות. בנוסף, ניתן לזהות הזדמנויות ושיפורים נדרשים. 

מודל הנתונים צריך להיות הרחבה של סוג מסד הנתונים. לדוגמה, שימוש במודל נתונים יחסי עם מסד נתונים מונחה עצמים עשוי להיות טעות.

כריסטופר בראדלי, אסטרטג מידע ב-DMA Advisors, אמר המצגת שלו בכנס מקוון של DATAVERSITY, "המטרה העיקרית של מודל נתונים היא למעשה לא לעצב מסד נתונים - זה לתאר עסק." מאוחר יותר הוא הוסיף, "אין הצהרה מוחלטת לגבי מהו מודל נתונים, אבל יש להבין את הנתונים כדי להיות מנוהלים - ומודלי נתונים הם הכלי הטוב ביותר לספק את ההבנה הזו."

מודלים של נתונים יכולים לספק תוכנית לפיתוח זרימת נתונים אופטימלית עבור העסק שלך.

ממשל נתונים כחלק ממודלים של נתונים

כאשר מפתחים מודל נתונים, של הארגון תוכנית ממשל נתונים צריך להיכלל כחלק מהתהליך. רבים מהמטרות זהות, וחלק מהמומחים קובעים כי ציות לרגולציה, מדיניות ממשלתית וכללים עסקיים (המוקצים בדרך כלל לתוכנית Data Governance) צריכים להיות חלק מתהליך מודל הנתונים. בתכנון, מודלים של נתונים מקדמים עקביות במוסכמות שמות, סמנטיקה ו איכות נתונים משופרת, כמו גם תוכניות Data Governance.

אם לא קיימת כרגע תוכנית Data Governance, פיתוח אחת כחלק ממודל הנתונים הוא אידיאלי. יצירתם בנפרד תצרוך הרבה יותר זמן מאשר יצירתם בו זמנית. (ה דייל נתונים, חלק מתוכנית ממשל הנתונים, ניתן להטיל אחריות על יישום ותחזוקת מודל הנתונים.)

שלושת השלבים של בניית מודל נתונים

ישנם שלושה שלבים שמודל הנתונים עובר כשהוא מתפתח: השלב הרעיוני, השלב הלוגי והשלב הפיזי. כל שלב מהווה בסיס לשלב הבא ותומך בהבנת זרימת הנתונים של העסק עם פיתוח המודל. (יש תוֹכנָה זמין עבור תהליך זה.)

מודל הנתונים הרעיוני: השלב הראשוני בפיתוח מודל נתונים הוא השלב הרעיוני. בשלב זה, המטרה היא לזהות את הישויות השונות, התכונות והקשרים שלהן בתוך המערכת - מבלי להיכנס לפרט משמעותי. 

ניתן לתאר ישות כאובייקט (לדוגמה: אדם, מסעדה, רכב) שהנתונים שלו יישמרו במסד הנתונים. תכונות הן פיסות מידע על ישות (לכיתה, כישות, יהיו שמות התלמידים המשתתפים כתכונות). מערכות יחסים מתארות כיצד ישויות אלו בתוך מסד הנתונים קשורות זו לזו. 

נתונים מושגיים מודלים נחשבים לרוב לשלב גילוי בפיתוח מודל הנתונים וצריכים להציג את המבנה הבסיסי במינימום פרטים. 

מודל הנתונים הלוגי: גרסה זו של מודל הנתונים מוסיפה רמה נוספת של מידע למודל הרעיוני ומרחיבה את המסגרת. מערכות יחסים הופכות למוקד בשלב זה, והן מורחבות והופכות למפורטות יותר. יש לרשום את הבעיות והבעיות הקיימות בתוך המערכת בשלב מודל הנתונים הלוגי. 

כאשר מודל הנתונים הלוגי הושלם, מעצבים ומנהלים לעתים קרובות נסוגים אחורה כדי לשקול מה נדרש עבור מסד נתונים חדש, או את השינויים הדרושים כדי לייעל מסד נתונים מבוסס. במהלך שלב זה, לעתים קרובות נשקלת תוכנה חדשה, כמו גם שינויים בהתנהגות הצוות בזמן שהם מטפלים בנתונים.

מודל הנתונים הפיזיים: שלב שלישי זה צריך להיות ממוקד ביצירת דיאגרמה מפורטת למדי של זרימות הנתונים הנוכחיות של המערכת, אך עשוי גם להתפתח לתרשים של מודל עתידי רצוי. 

מודל הנתונים הפיזיים הוא גרסה בוגרת יותר של המודל הלוגי, ומפורטת הרבה יותר. זה צריך להיות מבוסס על ייצוג מדויק ומפורט של זרימת הנתונים של העסק.

השלב השלישי צריך להפוך לשרטוט סופי שניתן לפעולה של זרימת הנתונים הרצויה, עם כל ההוראות הדרושות כדי לשנות את זרימת הנתונים או לבנות את מסד הנתונים.

מודלים ספציפיים של נתונים

סוג מודל הנתונים שנבחר צריך להיות מבוסס על סוג מסד הנתונים שנמצא בשימוש, או שייעשה בו שימוש. בחירת סוג מסד הנתונים תלויה ביעדי הארגון. לארגונים יש מבחר של עיצובים שונים לפיתוח והצגה של מודל נתונים. 

מודלים שונים של נתונים מציעים עיצובים שונים ופותרים בעיות שונות, ובחירה בהתאמה הטובה ביותר דורשת הבנה בסיסית של המודלים הללו. כל אחד מהם יכול להשתנות ולהתאים כדי להתאים לצרכים המיוחדים של העסק.

בחירת המודל הטוב ביותר כדי למקסם את היתרונות שלו עבור העסק שלך דורשת הבנה בסיסית של מודלים הנתונים - והווריאציות שלהם. רשימה של דגמים ספציפיים כוללת:

מודלים של נתונים יחסיים: מודל זה ממפה את החיבורים השונים המקשרים בין טבלאות נתונים שונות. מודל מסד הנתונים היחסי הוא המודל הפופולרי ביותר מאז שנות ה-1970 המאוחרות. החוזקות העיקריות שלו הן שהוא מוכר מאוד, קל לשימוש ויעיל למדי. זהו מודל בוגר ועובד עם מספר הולך וגדל של אפליקציות שימושיות לעשיית עסקים.  

הוא משתמש בטבלאות ועמודות לאחסון נתונים וכל טבלה מאחסנת מידע שרלוונטי לישות אחת; קישורים בין הטבלאות נקראים "יחסים".

מודל נתונים יחסי מגביל בדרך כלל את סוגי פורמט הנתונים שהוא יקבל, ו(אלא אם כן מעורב בענן) יש לו אחסון מוגבל.

מודלים של NoSQL נתונים: מודל זה אינה מחוזקת או נתמכת במערכת ניהול מסדי נתונים יחסיים. כתוצאה מכך, הוא אינו תומך בקשרים בתוך תהליך האחסון. עם זאת, כמערכת מסד נתונים, יש לה כמויות אדירות של אחסון והיא תקבל כל מיני פורמטים של נתונים.

מסדי נתונים של NoSQL משמשים בדרך כלל למטרות מחקר, בעיקר בגלל כמויות הנתונים העצומות שהם יכולים לאחסן. (כמויות גדולות של נתונים נקראו בעבר "ביג דאטה", לפני שביג דאטה הפך לנורמה.) 

מודלים של נתונים היררכיים: דגם זה מזכיר מבנה עץ, בעל גזע ראשי וענפים (לעיתים קרובות העץ מצויר הפוך). תיאורים של מודל נתונים היררכי משתמשים לעתים קרובות באנלוגיה של הורה/ילד, כאשר ההורה הוא הגזע הראשי או ענף בולט, וענפים קטנים המתוארים כילדים. (ענף בולט יכול להיות גם ילד של הגזע הראשי וגם הורה לענפים קטנים יותר.)

זהו תכנון מוקדם של מודל נתונים והוחלף במודל הנתונים ההתייחסותיים. אם ארגון עובד עם כמויות קטנות של נתונים, הוא יכול להיות יעיל למדי בקבלת החלטות. עם זאת, זה לא עובד טוב עם כמויות הנתונים העצומות שזורמות בדרך כלל דרך עסקים מודרניים.

מודלים מונחה עצמים של נתונים: כוחו של מודל הנתונים הזה (עמוד 2,556) היא היכולת שלו לדגמן מקרוב את "העולם האמיתי". מסד הנתונים מונחה עצמים מתקשר לייצוג מדויק ומציאותי יותר של המציאות ויכול לאחסן ולבטא את כל היחסים הקיימים עם אובייקטים אחרים. 

חוזק נוסף הוא שניתן להפוך אובייקטים לאובייקטים מורכבים שמודלים מסורתיים אינם יכולים להתמודד איתם בקלות. מסדי נתונים מונחה עצמים עובדים עם שפות תכנות מונחה עצמים כדי לקדם אחסון ואחזור יעילים. 

שלא כמו מסדי נתונים מסורתיים רבים, מסדי נתונים מונחה עצמים יכולים לאחסן מגוון סוגי נתונים, כגון תמונות, אודיו, וידאו וכו'. מסד נתונים זה הופך לפופולרי יותר, אך מציאת טכנאים שנוח להם לעבוד איתו יכולה להיות בעיה.

מודלים של נתוני רשת: יש להשתמש במסד נתונים של רשת כאשר יש צורך בהצגת אובייקטים ויחסיהם בצורה גמישה. חלק מהיתרונות שלו כוללים את הגמישות שלו בגישה לנתונים ואת היכולת שלו לטפל במערכות יחסים. החסרונות הם המורכבות של המערכת, ואשר לאחר הקמה, המבנה יכול להיות קשה לשינוי. 

מודל נתוני הרשת מבוסס על מחשבי מיינפריים ששימשו לרשת בשנות ה-1970. (כרגע זה לא דגם פופולרי.)

דגמי נתונים גרפים: הגרף Data Modeling תהליך משתמש בצמתים (אובייקטים) ובקצוות/קישורים (יחסים). מסדי נתונים של גרפים הם חסרי סכמה ואינם מאחסנים נתונים באמצעות עמודות ושורות. במהלך פיתוח המודל, מחליטים אילו ישויות/אובייקטים צריכים להיות צמתים, מהם הקישורים/הקשרים, ואילו נתונים יש להשליך. המודל מספק שרטוט של הישויות, הקשרים והתכונות של הנתונים. (חלקם עושים מודלים זה על בסיס קבוע כדי למנוע נתונים מיותרים.)

מודלים של נתוני גרפים הופכים פופולריים במהירות כשיטה לפיתוח בינה מלאכותית.

מודלים של נתונים ביחסי ישויות: מסדי נתונים אלו מספקים הצגה גרפית של מבנה הנתונים של הארגון. הם משמשים לעתים קרובות בשילוב עם מודלים יחסיים. ה מודל ישות-יחסים משתמש בקופסאות עם מספר צורות וקווים שונים כדי לתקשר בין אובייקטים/ישויות ומערכות היחסים השונות ביניהם.

מודל זה מציע מסגרת לניתוח, הבנה ועיצוב מסדי נתונים, וניתן להשתמש בו לעיצוב מסדי נתונים יחסיים.

שמירה על פרספקטיבה של תמונה גדולה

כאשר מעצבים מודל נתונים, עדיף להסתכל על הוליסטית, ולא להתמקד בבעיה אחת. שמירה על פרספקטיבה שמקיפה מגוון בעיות וחיפוש משוב מאלה שיעבדו עם המערכת יפתחו מודל יעיל יותר. המודל צריך להישמר גם כמה שיותר פשוט וגם כמה שיותר קרוב למציאות. 

מודל הנתונים דורש עדכון ותחזוקה שוטפים על מנת להבטיח ששינויים שנעשו בתוך העסק יבואו לידי ביטוי גם במודל. בעוד שרוב דגמי הנתונים דורשים תחזוקה מועטה, תהליך עדכון רשמי מתוזמן ישמור על המודל מעודכן ומתפקד במלואו. 

תמונה בשימוש ברישיון מ- Shutterstock.com

בול זמן:

עוד מ קושי