مفاهیم مدل سازی داده برای مبتدیان

مفاهیم مدل سازی داده برای مبتدیان

گره منبع: 2623283
مفاهیم مدل سازی داده هامفاهیم مدل سازی داده ها

مفاهیم مدل‌سازی داده، تصویری جامع از نحوه حرکت داده‌ها در یک سیستم را پشتیبانی می‌کنند. مدل سازی داده را می توان به عنوان فرآیند طراحی یک سیستم داده یا بخشی از یک سیستم داده توصیف کرد. این مدل‌ها می‌توانند از سیستم‌های ذخیره‌سازی گرفته تا پایگاه‌های داده تا کل ساختار داده‌های سازمان را شامل شوند. مدل های داده را می توان به عنوان طرحی برای پیاده سازی یک سیستم جدید یا به عنوان ماده مرجع برای سیستم هایی که قبلا ایجاد شده اند استفاده کرد. 

یک مدل داده «کامل» باید انواع داده‌هایی را که در یک سیستم داده استفاده و ذخیره می‌شوند، قالب‌های مورد استفاده، روابط بین فایل‌های داده و روش‌هایی که داده‌ها می‌توانند گروه‌بندی و سازماندهی شوند، ارتباط برقرار کند.

بسیاری از کسب‌وکارها مدل‌های داده‌ای منحصربه‌فرد و منحصربه‌فرد (و سیستم‌های داده‌ای منحصربه‌فرد حاصل) را ایجاد می‌کنند که بر اساس نیازها و الزامات خاص سازمان ساخته شده‌اند. از این مدل ها می توان برای تجسم حرکت داده ها در سیستم استفاده کرد. یک مدل داده می تواند سعی کند تمام جنبه های جریان داده را از طریق یک سازمان یا پارامترهای خاص را پوشش دهد، مانند نشان دادن تنها داده های فروش برای اهداف تحقیقاتی.

یک مدل داده ای که به خوبی طراحی شده است، توضیح خواهد داد قوانین کسب و کار، و همچنین نیاز به الزامات قانونی از داده ها

در فرآیند مدلسازی داده سه مرحله وجود دارد: مدل مفهومی، مدل منطقی و مدل فیزیکی. هر مرحله یا مرحله از توسعه مدل، هدف خاصی را دنبال می کند. علاوه بر این، چندین "نوع" مدل وجود دارد.

مدل‌های داده‌های بصری شبیه نقشه‌های یک معمار هستند و می‌توانند با متن پیوندی پشتیبانی شوند تا هنگام توسعه یا تغییر سیستم داده راهنمایی ارائه دهند. نمونه هایی از مدل های داده های بصری را می توان یافت اینجا کلیک نمایید.

مزایا و چالش های مدل سازی داده ها

توسعه یک مدل داده یک نقشه و یک ابزار ارتباطی برای ایجاد یا اصلاح یک سیستم داده فراهم می کند. مفاهیم مدل‌سازی داده، ساخت یک سیستم داده را بسیار آسان‌تر می‌کند. پایگاه داده و/یا سیستم داده جدید ساخته شده باید از ارتباطات سازمانی خوبی پشتیبانی کند. همچنین باید از پروژه های بلادرنگ، از جمله جمع آوری داده ها در مورد الگوهای هزینه، فاکتورها و سایر فرآیندهای تجاری پشتیبانی کند.

فرآیند مدلسازی داده می تواند برای شناسایی استفاده شود مسائل مربوط به کیفیت داده ها، از جمله داده های تکراری، اضافی و از دست رفته.

یکی از مشکلات در ایجاد یک مدل داده، عدم درک سیستم های داده است - مشکلی که معمولاً با ساخت مدل برطرف می شود. مشکل دیگر این است که یک تغییر کوچک در یک زمینه ممکن است نیاز به تغییرات قابل توجهی در زمینه های دیگر داشته باشد. علاوه بر این، می توان آنقدر بر ساختار سیستم داده متمرکز شد که نقاط قوت و ضعف برنامه های کاربردی نادیده گرفته شود.

سوالات مهمی که باید بپرسید

توسعه یک مدل داده با جمع آوری اطلاعات در مورد نیازها، الزامات و اهداف سازمان آغاز می شود. مدل بخشی از سیستم نسبت به توسعه یک مدل برای یک سیستم کاملاً جدید به سؤالات کمتری نیاز دارد. برخی از سوالات اساسی که باید برای مدل بخشی از سیستم بپرسید عبارتند از: 

  • هدف یا هدف از تغییرات چیست؟
  • سیستم در حال حاضر با چه نوع داده هایی کار می کند؟
  • چه داده هایی مورد نیاز است؟
  • برای رسیدن به هدف چه ابزار یا نرم افزاری لازم است؟
  • آیا ابزارها یا نرم افزارها سازگار هستند؟

یک مدل داده باید بر اساس نیازهای سازمان ساخته شود و عامل مهمی در توسعه یک مدل جدید یا تنظیم مدل قدیمی باشد. سؤالاتی که هنگام طراحی یک پایگاه داده یا یک سیستم کاملاً جدید پرسیده می شود، اغلب به پاسخ های بسیار گسترده تری نیاز دارد. بهتر است هنگام پاسخ دادن به این سؤالات، یک طرح کسب و کار پنج ساله در نظر بگیرید: 

  • اهداف کسب و کار (تحقیق، فروش، توسعه اپلیکیشن ها، خدمات حسابداری) چیست؟ این بهترین نوع نرم افزار را برای پشتیبانی از کسب و کار تعیین می کند (NoSQL یا گرافیک برای تحقیق، SQL برای فروش اولیه یا حسابداری، دسترسی به ابرهای مختلف یا چندین سرویس ابری برای توسعه برنامه ها).
  • چه نوع نرم افزارهایی برای سازمان مناسب و مقرون به صرفه هستند؟
  • چند نفر به طور همزمان به سیستم دسترسی خواهند داشت؟
  • چند بخش وجود دارد و در هر بخش چند نفر وجود دارد؟
  • آیا بخش های مختلف به نرم افزارهای مختلفی نیاز دارند؟
  • آیا نیازهای غیرعادی وجود دارد که باید در نظر گرفته شود؟ 
  • چه مقدار داده باید ذخیره شود؟
  • آیا مقیاس پذیری یک مسئله است؟
  • آیا پایگاه داده به آن متصل می شود ابزارهای هوش تجاری?
  • آیا پرس و جوهای تحلیلی آنلاین (OLAP)، پردازش تراکنش (OLTP)، یا هر دو مورد نیاز هستند؟
  • آیا پایگاه داده با پشته فناوری فعلی یکپارچه خواهد شد؟
  • آیا قالب داده ها باید تغییر کند؟
  • زبان های برنامه نویسی مورد علاقه شما چیست؟
  • آیا با هر نرم افزار یادگیری ماشینی ادغام می شود؟

سه فاز مدل سازی داده ها

مدل سازی داده مهم شد در طول 1960s، زمانی که سیستم های اطلاعات مدیریت برای اولین بار محبوب شدند. (قبل از دهه 60، ذخیره اطلاعات واقعی کمی وجود داشت. رایانه های آن زمان اساساً ماشین حساب های غول پیکر بودند.) 

از نظر مفاهیم مدل‌سازی داده، یک مدل داده کاملاً توسعه‌یافته اغلب در سه فاز ساخته می‌شود: مدل مفهومی، مدل منطقی و مدل فیزیکی. این فرآیند طراحی درک روشنی از سیستم داده و نحوه جریان داده از طریق آن ارائه می دهد. این فرآیند همچنین نحوه عملکرد رویه‌های ذخیره‌سازی را نشان می‌دهد و به اطمینان از نمایش تمام اشیاء داده در سیستم کمک می‌کند. (اگر داده ها اطلاعاتی هستند که به صورت الکترونیکی ذخیره شده اند، پس یک شی داده مجموعه ای جداگانه از اطلاعات ذخیره شده الکترونیکی است، مانند یک فایل یا یک جدول داده.)

مدل داده های مفهومی معمولاً برای توصیف اساسی ترین اجزای سیستم و نحوه حرکت داده ها در سیستم استفاده می شود. این مدل داده های مفهومی نحوه انتقال اطلاعات از طریق یک بخش و به بخش بعدی را نشان می دهد. موجودات گسترده (بازنمایی چیزهایی که در واقعیت وجود دارند) و روابط آنها (تداعی هایی که بین دو یا چند موجود وجود دارد) را نشان می دهد. اطلاعات دقیق به طور کلی حذف می شود.

مدل داده های منطقی معمولاً بر روی طرح و ساختار اشیاء داده در مدل تمرکز می کند و روابط بین آنها را برقرار می کند. همچنین پایه ای برای ساخت مدل فیزیکی فراهم می کند. این مدل داده های منطقی اطلاعات مفیدی را به مدل مفهومی اضافه می کند.

مدل داده های فیزیکی در اصل یک است مدل قبل از اجرا و بسیار دقیق است و اغلب بر روی طراحی پایگاه داده متمرکز است. جزئیات لازم برای توسعه پایگاه داده را نشان می دهد (اما می تواند برای پیاده سازی بخش جدیدی از سیستم نیز استفاده شود). این مفهوم مدل‌سازی داده، تجسم ساختار داده را با برقراری ارتباط با محدودیت‌های پایگاه داده، کلیدهای ستون، محرک‌ها و سایر ویژگی‌های مدیریت داده بسیار آسان‌تر می‌کند. این مدل همچنین با پروفایل های دسترسی، مجوزها، کلیدهای اصلی و خارجی و غیره ارتباط برقرار می کند.

انواع مختلف مدل های داده

در زیر چند نمونه از انواع مختلف مدل های داده آورده شده است.

مدل سلسله مراتبی نسبتا قدیمی است و در دهه 1960 و 70 بسیار محبوب بود. داده ها را در ساختارهای درخت مانند سازماندهی می کند. امروزه عمدتاً برای ذخیره سیستم های بایگانی و اطلاعات جغرافیایی استفاده می شود. در مدل سلسله مراتبی، داده ها در یک رابطه یک به چند با فایل های داده سازماندهی می شوند.

مدل شبکه شبیه مدل سلسله مراتبی است و اجازه ایجاد روابط مختلف با رکوردهای مرتبط را می دهد. این مدل شبکه به افراد اجازه می دهد تا با استفاده از مجموعه هایی از رکوردهای مرتبط، مدل را بسازند. هر رکورد با چندین فایل و اشیاء داده مرتبط است و روابط پیچیده را ترویج و ارائه می کند.

مدل نهاد-رابطه یک نمایش گرافیکی از فایل های داده و موجودیت ها و روابط آنهاست. تلاش برای ایجاد سناریوهای دنیای واقعی است. به عنوان یک مدل سیستم داده، مدل نهاد-رابطه مجموعه موجودیت، مجموعه روابط، ویژگی ها و محدودیت ها را توسعه می دهد. آنها اغلب در طراحی پایگاه داده های رابطه ای استفاده می شوند.

مدل داده های نموداری مستلزم تعیین این است که کدام نهادها در مجموعه داده شما باید گره های تعیین شده باشند، کدام پیوندها باید مشخص شوند و کدام یک باید دور ریخته شوند. مدل داده های نموداری طرح‌بندی موجودیت‌ها، ویژگی‌ها و روابط داده‌ها را ارائه می‌دهد. این فرآیند تکراری است، به آزمون و خطا متکی است، و می تواند خسته کننده باشد، اما ارزش انجام درست را دارد.  

مدل پایگاه داده شی گرا بر روی اشیاء داده مرتبط با روش ها و ویژگی ها تمرکز می کند. این شامل جداول است اما لزوما محدود به جداول نیست. داده ها و روابط آن با هم به عنوان یک موجودیت واحد (یک شی داده) ذخیره می شوند. اشیاء داده ها موجودیت های دنیای واقعی را نشان می دهند. این مدل پایگاه داده شی گرا فرمت های مختلفی را مدیریت می کند و برای تحقیق استفاده می شود.

مدل رابطه ایدر حال حاضر، که اغلب با نام SQL شناخته می شود، محبوب ترین مدل داده است. از جداول دو بعدی برای ذخیره داده ها و برقراری ارتباط استفاده می کند. تمام داده های یک نوع خاص در ردیف ها به عنوان بخشی از یک جدول ذخیره می شوند. جداول نشان دهنده روابط هستند و پیوستن به آنها روابط بین داده های ذخیره شده را ایجاد می کند. مدل پایگاه داده رابطه ای یک مدل بالغ است که توسط مقدار زیادی نرم افزار برای اهداف مختلف پشتیبانی می شود.

مدل داده NoSQL از سطرها و ستون ها استفاده نمی کند و واقعاً از هیچ نوع ساختار مجموعه ای استفاده نمی کند. توسعه و طراحی آنها معمولاً بر روی ایجاد مدل‌های داده فیزیکی متمرکز هستند. مقیاس پذیری، با ویژگی ها و مشکلات خاص خود، یک نگرانی قابل توجه است. 

مدل پایگاه داده شی رابطه ای مدل پایگاه داده شی گرا را با مدل پایگاه داده رابطه ای ترکیب می کند. اشیاء، کلاس‌ها، وراثت و غیره را مانند مدل شی گرا ذخیره می‌کند، اما از ساختارهای جدولی مانند مدل پایگاه داده رابطه‌ای نیز پشتیبانی می‌کند. این طرح به طراحان اجازه می دهد تا ویژگی های آن را در ساختار جدول بگنجانند.

اهمیت مفاهیم مدل سازی داده ها

مدل‌های داده مانند نقشه‌ها هستند، اما روابط، موجودیت‌ها و ویژگی‌های یک پایگاه داده یا سیستم داده را تعریف می‌کنند. یک مدل داده سازمان یافته و به خوبی طراحی شده برای توسعه یک پایگاه داده فیزیکی و سیستم داده کارآمد ضروری است. درک خوبی از مفاهیم مدل‌سازی داده برای حذف مشکلات ذخیره‌سازی و مسائل افزونگی و در عین حال پشتیبانی از بازیابی کارآمد داده مورد نیاز است. 

مدل‌سازی داده‌ها می‌تواند یک چالش باشد، و مهم است که بدانیم هر نوع مدل مزایا و معایب خاص خود را دارد. 

تصویر تحت مجوز Shutterstock.com استفاده می شود

تمبر زمان:

بیشتر از DATAVERSITY