تاریخچه پایگاه داده و مدیریت آن
یکی از متداول ترین و اصلی ترین اصطلاحات در مقوله انفورماتیک اصطلاح پایگاه داده است. اصطلاح سیستم مدیریت پایگاه داده ها در معنای عام یکی از سیستم های ذخیره و بازیابی اطلاعات است. پس از طراحی نسل اولیه سیستم های ذخیره و بازیابی اطلاعات برای تقویت مکانیزم ها و الگوریتم های مرتبط با ذخیره بازیابی و پردازش داده ها و همچنین به منظور تسهیل در انجام امور فوق سیستم های مدیریت پایگاه داده ها شکل گرفتند.
فناوری پایگاه داده ها از اواسط دهه شصت میلادی ایجاد شدند. در طول دهه هفتاد مدل های پایگاه سلسله مراتبی توسعه یافته و مورد استفاده قرار گرفتند. در اوایل دهه هشتاد شاخه ای از آن فناوری به نام سیستم مدیریت پایگاه داده ها رابطه ای مورد توجه قرار گرفت.
مهمترین خصیصه سیستم مدیریت پایگاه داده ها مستقل شدن برنامه های کاربردی از جنبه ها و خصوصیات محیط فیزیکی ذخیره سازی است.
از اواسط دهه هشتاد تاکنون سیستم های دیگری هم عرضه شد از جمله:
٫۱سیستم فایلینگ معمولی داده ها
٫۲سیستم مدیریت داده ها و جستجو
٫۳سیستم مدیریت پایگاه داده ها
به مرور زمان به واسطه افزایش حجم و نوع اطلاعات نیازهای جدیدتری مطرح و پایگاه داده متناسب با آن ها نیز ارائه گردید:
۱٫سیستم مدیریت پایگاه دانش
۲٫سیستم معنایی مدیریت پایگاه داده ها
۳٫سیستم هوشمند مدیریت پایگاه داده ها
۴٫سیستم مدیریت پایگاه داده های زمانمند
۵٫سیستم مدیریت چند پایگاهی
سیستم های پایگاهی را می توان به سه نسل زیر تقسیم کرد:
۱٫سیستم های پیش رابطه ای
۲٫سیستم های رابطه ای
۳٫سیستم های پس رابطه ای
پایگاه داده
برای آشنا شدن ذهن خواننده تعریف چند اصطلاح پایه ای در سیستم پایگاه داده در ذیل ارائه می گردد.
٫۱ذخیره و بازیابی اطلاعات: اصطلاح ذخیره و بازیابی اطلاعات در واقع به مجموعه ای از الگوریتم ها و تکنیک ها اطلاق می گردد که در طراحی و تولید یک سیستم به کار گرفته می شود و به کاربر امکان می دهد تا اطلاعات خود را ذخیره سازی بازیابی و پردازش کند.
٫۲داده: اصطلاح داده در مفهوم کلی عبارت است از نمایش ذخیره شده کلیه موجودیت ها واقعیات و رخدادها که در تصمیم گیری به کار می آیند.
٫۳اطلاع: هر نوع داده پردازش شده را اطلاع می نامند. این تعریف یک تعریف بسیار ساده است که بیانگر تفاوت دو اصطلاح، داده و اطلاع است. اطلاع مجموعه داده هایی است که در تصمیم گیری به کار می رود و اساساً کمیتی است نسبی و وابسته به وضعیت مشخص زمان مشخص و نیز خود شخص با سیستم تصمیم گیرنده. در واقع شخص تصمیم گیرنده با تفسیر داده ها در یک وضعیت مشخص اطلاعات لازم برای تصمیم گیری را به دست می آورد.
٫۴دانش: اصطلاح دانش عبارت است از نمایش نمادین بخش هایی از دنیای واقعی؛ به بیانی دیگر دانش نوعی شناخت است که از یک مجموعه از اطلاعات بر اساس یک مجموعه از قواعد مشخص به دست می آید.
تعریف پایگاه داده: پایگاه داده با توصیفی جامع تر مجموعه ای است از داده ها که به صورت مجتمع تا حد ممکن به صورت مرتبط به هم و با کمترین افزونگی ذخیره شده اند که این مجموعه تحت مدیریت یک سیستم کنترل متمرکز برای استفاده یک یا چند کاربر قرار گرفته اند.
شاید در نگاه اول تعریف ارائه شده در مورد پایگاه داده کمی مبهم به نظر برسد در تشریح کلی سیستم پایگاه داده ها می توان گفت که یک سیستم پایگاه داده مجموعه ای از داده های به هم وابسته است که از افزونگی بی حاصل و مضر مبرا است و برای کاربردهای گوناگون استفاده می شود. داده ها به گونه ای ذخیره شده اند که از برنامه هایی که آن ها را به فرمت می گیرند مستقل هستند و راه یافت مشترک کنترل شده برای درج، حذف، تغییر و بازیابی داده های موجود استفاده می شود و داده ها به گونه ای ساخت یافته اند که پایه ای برای توسعه برنامه های کاربردی آینده فراهم می سازد. این داده ها توسط یک سیستم مدیریت پایگاه داده ها مدیریت می شود. با این وصف می توان دریافت که هر مجموعه ای از فایل ها یا هر مجموعه ای از اطلاعات ذخیره شده لزوماً یک پایگاه داده نیست. می توان نتیجه گرفت برای ایجاد پایگاه داده ها وجود حداقل یک سیستم مدیریت پایگاه داده ها به عنوان سیستم واسطه الزامی است. بارزترین برتری یک پایگاه داده نسبت به بانک های داده قبلی سیستم مدیریت پایگاه داده است.
اجزای پایگاه داده: هر سیستم پایگاه داده از چهار جز اساسی تشکیل شده است:
داده ها
سخت افزار
نرم افزار
کاربر
داده ها: یک پایگاه داده گنجینه ای از داده هاست که در کل مجتمع شده به اشتراک گذاشته شده است منظور از مجتمع شدگی اتحاد چندین فایل داده به صورت مجموعه ای است که آن را به نام پایگاه داده می شناسیم و به همین علت است که تمام آن افزونگی ها که در سیستم پردازش فایل ها وجود داشت از میان می رود. منظور از مشترک بودن پایگاه داده ها این است که اطلاعات موجود در پایگاه داده ها بین استفاده کنندگان مختلف به اشتراک گذاشته می شود. داده های ذخیره شده در یک سیستم پایگاهی عبارت اند از:
۱٫داده های کاربران
۲٫داده های سیستمی
سخت افزار: یک پایگاه داده جهت استقرار به مجموعه مناسبی از تجهیزات سخت افزاری نیاز دارد. سخت افزارها به سه دسته تقسیم می گردند:
۱٫سخت افزار ذخیره سازی داده ها
۲٫سخت افزار پردازشگر
۳٫سخت افزار برقرارکننده ارتباط
نرم افزار: بین داده هایی که به صورت فیزیکی روی دستگاه های ذخیره سازی مناسب استقرار می یابد و پایگاه داده ها را به وجود می آورند و استفاده کنندگان یک لایه نرم افزاری قرار می گیرد که آن را سیستم مدیریت پایگاه داده می نامند. تمام تقاضا برای استفاده از اطلاعات پایگاه داده از طریق این سیستم سیر می شود و بازیابی داده ها روی سخت افزارهایی صورت می گیرد.
کاربر: هر استفاده کننده از سیستم پایگاه داده را کاربر می گویند. کاربران پایگاه داده را می توان به سه گروه اساسی و متفاوت تقسیم نمود:
٫۱برنامه نویسان کاربردی
٫۲کاربران واقعی یا نهایی
٫۳مدیر پایگاه داده ها
مزایای پایگاه داده:
- کنترل متمرکز داده
- به اشتراک گذاری داده
- انتخاب کردن داده از برنامه های کاربردی
- کاهش افزونگی
- جلوگیری از نارسانایی ها با تعریف قواعد و استاندارد
- امنیت داده
- امکان ایجاد تغییر در داده بدون ایجاد تأثیر روی مؤلفه های سیستم
مدل پایگاه داده
مدل سلسله مراتبی: قدیمی ترین مدل برای طراحی پایگاه داده مدل سلسله مراتبی است.که در اوایل دهه ۶۰ توسط IBM برای سازمان دهی دنیای تجارت به شکل سلسله مراتبی پیشنهاد شد. در مدل سلسله مراتبی داده ها و ارتباط بین آن ها به کمک یک درخت واره نمایش داده می شود. درخت واره گرافی است دارای یک ریشه و تعدادی گره که بین هر دو گره پیوندی وجود دارد. مسیری از گره سطح پایین تر به گره سطح بالاتر وجود ندارد. برای پایگاه اطلاعاتی مناسب است که بین موجودیت های آن ارتباط “یک به یک” یا “یک به چند” برقرار باشد.
مدل شبکه ای: در سال ۱۹۶۹ توسط Charles Bachman ارائه شد. که بر پایه دو سازه مهم یعنی مجموعه ها و رکورد ها ساخته می شود. علاوه بر روابط ساده از روابط “چند به چند” نیز حمایت می کند. به آن ساختار PLEX نیز می گویند. نسبت به مدل سلسله مراتبی انعطاف پذیری بیشتری دارد و افزونگی داده را بهتر نشان می دهد و همچنین توانایی یکبار ذخیره سازی رکورد در کل پایگاه اطلاعاتی را دارد.
مدل رابطه ای: مدل رابطه ای متداول ترین مدل داده است که داده ها و ارتباط بین آن ها به صورت مجموعه ای از جداول نمایش می دهد. این مدل در سال ۱۹۷۰ توسط Edgar F. Codd ارائه شده است. یک مدل ریاضیاتی بوده و عملگرهای روی داده شامل جبر و حساب رابطه ای می شود. افزونگی در مدل رابطه ای با توجه به قوانین نرمال سازی قابل حذف است. با کمک این مدل می توان روابط پیچیده بین داده ها را نمایش داد. درک مفهوم پایگاه های اطلاعاتی و تهیه نمودار ارتباطات و نگهداری آن به مراتب ساده تر از مدل های دیگراست.
مدل تخت: این مدل توسط Microsoft Excel اجرا شد. که دربردارنده یک آرایه دوبعدی از عناصر داده است. همه اجزای یک ستون به صورت داده های مشابه و همه عناصر در ارتباط باهم اند.
مدل شی گرا: دیدگاه شی گرا از اواسط دهه ۷۰ در مباحث رایانه متولد شد. در این روش برای هر موجودیت یک کلاس یا طبقه ایجاد می شود. طراحی مدل شی گرا بر مبنای پنهان سازی اطلاعات است. داده های بانک اطلاعات در این مدل به صورت اشیایی در می آیند که به طرق مختلف در ارتباط با یکدیگرند. مدل شی گرا به کاربر امکان می دهد که ضمن استفاده از انواع داده ها خود نیز به تعریف داده بپردازد و آن ها را کنترل کند.
سیستم مدیریت پایگاه داده
سیستم مدیریت پایگاه داده یکی از انواع نرم افزارهای واسطه بین محیط فیزیکی ذخیره و بازیابی اطلاعات و محیط منطقی برنامه سازی است. این نرم افزار به کاربر برنامه ساز امکان می دهد تا پایگاه داده های خود را تعریف و ایجاد کند، در پایگاه داده های خود عملیات انجام دهد، روی پایگاه داده های خود تا حدی کنترل داشته باشد.
لازم به ذکر است یک سیستم مدیریت پایگاه داده واقعی باید امکان انجام این سه فعالیت اساسی را قبل از هر چیز به کاربر بدهد.
پایگاه داده از سه بخش اصلی به شرح ذیل تشکیل شده است:
- بخش ساختاری: شامل عناصر ساختاری مدل است که همان ساختار داده ای اصلی و مفاهیم مرتبط با آن است.
- بخش عملیاتی: مجموعه امکاناتی است که به وسیله آنها عملیات مورد نظر کاربر از جمله بازیابی و ذخیره سازی، در کادر ساختار داده ای و مبتنی بر عنصر ساختار اساسی آن انجام می شود.
- بخش جامعیتی: از مجموعه ای از قواعد جامعیتی تشکیل شده است که با استفاده از آن سیستم مدیریت پایگاه داده می تواند صحت دقت و سازگاری داده ها را در هر لحظه از حیات پایگاه داده ها کنترل و تضمین کند.
رده بندی سیستم مدیریت پایگاه داده
سیستم مدیریت پایگاه داده را می توان به چندین صورت دسته بندی نمود:
از نظر مدل داده ای:
- سیستم رابطه ای
- سیستم سلسله مراتبی
- سیستم شبکه ای
ازنظر محیط سخت افزار:
- قابلیت اجرا بر روی یک سخت افزار خاص
- قابلیت اجرا بر روی سخت افزارهای متنوع
ازنظر رده بندی رایانه:
- قابل اجرا بر روی رایانه های بزرگ و خیلی بزرگ
- قابل اجرا بر روی رایانه های متوسط
- قابل اجرا بر روی رایانه شخصی
- قابل اجرا بر روی انواع رایانه ها
از نظر محیط سیستم عامل:
- وابسته به یک نوع خاص از سیستم عامل
- عدم وابستگی به سیستم عامل و قابل اجرا بر روی چند سیستم عامل
ازنظر نوع معماری سیستم پایگاه داده ها:
- دارای معماری پایگاه داده متمرکز
- دارای معماری پایگاه داده نامتمرکز
کاتالوگ سیستم و دیکشنری داده ها (متا داده ها)
یکی از مشخصات مشی پایگاهی این است که سیستم پایگاهی نه تنها حاوی پایگاه داده هاست بلکه تعریف کامل یا توصیف پایگاه داده ها و قواعد ناظر به آن را نیز در خود دارد. کاتالوگ حاوی داده هایی است در مورد داده های ذخیره شده در پایگاه داده های کاربر.
در ادامه نکاتی چند در مورد کاتالوگ سیستم ارائه می گردد:
- داده ها حاوی اطلاعات در مورد داده های ذخیره شده در پایگاه داده به متا داده ها موسوم اند.
- در بعضی از کتاب ها به کاتالوگ سیستم گاه دیکشنری داده ها هم گفته می شود اما در واقع دیکشنری داده ها حاوی اطلاعات بیشتری است.
- متا داده ها معمولاً از دیدگاه کاربر سطح خارجی نهان اند. اما مدیر سیستم یا کاربر مجاز می تواند تا حدی از محتوای کاتالوگ آگاه شود.
ساختار و محتوای کاتالوگ و دیکشنری داده ها در سیستم های مختلف یکسان نیست اما به طور کلی اطلاعات زیر در آن ها ذخیره می شود:
- شماهای خارجی
- شمای ادراکی
- شمای داخلی
- توابع تعریف شده توسط کاربران
- شرح ساختار فیزیکی داده های ذخیره شده
- رویه های مربوط به تبدیلات بین سه سطح معماری
- ضوابط کنترل ایمنی داده ها
پارامترهای شناخت سیستم مدیریت پایگاه داده DBMS
امروزه مرتباً شاهد عرضه سیستم های با نام های گوناگون تحت عنوان DBMS به بازار مصرف هستیم. عدم اطلاع کافی خریداران و استفاده کنندگان چنین سیستمی از پارامترهای انتخاب سبب می شود تا اولاً انتخاب سیستم مناسب برای یک محیط عملیاتی مخصوصاً محیط بزرگ گاه بر اساس ملاحظات غیرعلمی فنی صورت بگیرد و گاه اساساً نوعی سردرگمی در انتخاب بروز کند. همچنین نرم افزار خریداری شده منطبق با نیازهای محیط عملیاتی و جوابگوی احتیاجات اطلاعاتی محیط نباشد و از نرم افزار انتخاب شده به طور بهینه بهره برداری نشود و گاه پیامدهای نامطلوبی بروز کند. تصمیم گیری در مورد انتخاب سیستم مناسب مسئله اساسی هر سازمان است. این مسئله مخصوصاً در شرایطی که تحولات فنّاورانه در نرم افزار و سخت افزار چنان شتابنده است که هر روز تولیدات نرم افزاری و سخت افزاری جدیدی به بازار مصرف عرضه می شوند. با توجه به حل بسیاری از مشکلات فنی در ایجاد سیستم های توزیع شده ناهمگن اینک دیگر مسئله انتخاب فقط یک DBMS و یا فقط یک پیکربندی نرم افزاری سخت افزاری می تواند مطرح نباشد. با این همه انتخاب اجزا تشکیل دهنده پیکربندی یک سیستم ناهمگن به هرحال مطرح است تا یک پیکربندی با بیشترین کارایی طراحی و تأمین شود.
به منظور کسب شناخت تخصصی باید پارامترهای زیادی را در نظر گرفت که این پارامترها را به صورت کلی در ۵ رده به شرح زیر دسته بندی می کنیم:
۱٫پارامترهای مربوط به توانایی ها و کارایی سیستم
۲٫تسهیلات و جنبه های دیگر
۳٫مشخصات کلی سیستم
۴٫پارامترهای مربوط به معماری پایگاه داده
- ۵٫پارامترهای مربوط به زبان داده ای فرعی (واسط کار برنامه ساز)
- فهرستی از سیستم مدیریت پایگاه داده
- Oracle
- Microsoft SQL Server
- My SQL
- PostregSQL
- DB2
- Microsoft Access
برنامه نویسی پایگاه داده
پایگاه داده از سازمان بندی اعمال درونی و عکس العمل بین خریدار و فروشنده حمایت می کند. پایگاه داده اطلاعات اجرایی و داده های ویژه را در دست دارد مثل داده های مهندسی مدل های اقتصادی. مثال هایی از برنامه نویسی پایگاه داده عبارت اند از: کتابخانه های کامپیوتری، سیستم های ذخیره سازی پرواز، سیستم های دارایی و…
سیستم های مدیریت وب سایت ها را به عنوان مجموعه ای از صفحات وب در پایگاه داده ذخیره می کند.
طراحی پایگاه داده
اولین وظیفه طراحی پایگاه داده تولید مدل ادراکی داده است که ساختار اطلاعاتی پایگاه داده را در دست دارد. یک شیوه رایج برای این کار ایجاد کردن یک مدل مستقل به کمک ابزار طراحی است.
یک شیوه دیگر زبان طراحی یکپارچه است. یک مدل داده موفق به دقت وضعیت ممکن از مدل های خارجی را انعکاس می دهد. برای مثال اگر افراد می توانند بیشتر از یک شماره تلفن داشته باشند این مدل به اطلاعات اجازه خواهد داد تا ثبت شوند.
یک طراحی خوب برای مدل داده ادراکی نیاز به درک خوب از حوزه برنامه سازی دارد.
برای مثال پرسیدن سؤالات پیچیده ای درباره چیزهایی که برای سازمان دهی جالب به نظر می آیند.
مثل: «آیا یک مشتری می تواند فروشنده نیز باشد؟» و یا «اگر یک محصول در دو بسته بندی متفاوت فروخته شود آیا یک محصول مشابه است یا یک محصول متفاوت؟»
پاسخ های این سؤالات تعریف هایی از هویت لغات استفاده شده و ارتباط بین آن ها برقرار می کند.
تولید مدل داده ادراکی وارد کردن رونق کسب و کار و یا تجزیه جریان کار در برنامه ریزی را شامل می شود. این می تواند به برقرار کردن این که چه اطلاعاتی در پایگاه داده لازم است یا نه کمک کند؛ برای مثال در تصمیم گیری انتخاب داده های قدیمی و داده های جدید.
یک مدل داده ادراکی که استفاده کنندگان از تولید آن خوشحال اند باید آن را به صورت طرحی که داده های مربوط به هم در ساختارش هستند تفسیر کند. به این عملیات معمولاً طراحی منطقی پایگاه داده گفته می شود و خروجی آن یک مدل داده منطقی است که به صورت یک طرح است. مشهورترین مدل پایگاه داده برای اهداف کلی پایگاه داده مدل نسبی است و یا به طور خلاصه مدل نسبی توسط زبان SQL نمایش داده می شود. در مراحل ساخت طراحی یک مدل منطقی پایگاه داده از روش های منظم شناخته شده نرمالاسیون استفاده می شود. هدف از نرمالاسیون تضمین کردن هر واقعیت ابتدایی فقط در یک جا ثبت می شود. به طوری که تعبیه، به روز رسانی ،حذف به طور خودکار پشتیبانی می شوند.
مرحله نهایی طراحی پایگاه داده موثرکردن مقیاس پذیری بازیافت تضمین و علاقه است.
این معمولاً طراحی فیزیکی پایگاه داده نامیده می شود. یک کلید نهایی در طول این مرحله داده مستقل است. به این معنا که تصمیم های گرفته شده برای اهداف کارایی بهینه باید نامریی باشند برای استفاده کنندگان و برنامه نویسان. طراحی فیزیکی به کمک نیازهای عملی پیش می رود و نیاز به شناسایی حجم کاری و دستیابی به الگوها و درک عمیق از ویژگی های پیشنهاد شده پایگاه مدیریت داده دارد. جنبه دیگر از طراحی فیزیکی امنیت است. این باید هم مشخص کند کنترل دستیابی اشیای پایگاه داده را و همچنین امنیت بخش ها و متدها برای پایگاه داده را مشخص کند.
گردآوری و ترجمه: تانیا منصورفلاح دانشجوی کارشناسی نقشه برداری مؤسسه آموزش عالی دارالفنون قزوین
منابع:
مفاهیم بنیادی پایگاه داده ها تألیف محمد تقی روحانی رانکوهی
سیستم مدیریت پایگاه داده ها تألیف محمد تقی روحانی رانکوهی
جزوه GIS فصل پایگاه داده ها
ترجمه متن انگلیسی/APPLICATIONS DESIGN &MODELING