مدیریت اطلاعات و داده های سازمان یافته
DESCRIPTION
مدیریت اطلاعات و داده های سازمان یافته. بخش سوم کتاب توربان. مبانی مرتب سازی و دستیابی داده ها. سلسله مراتب داده ها: یک بیت، کوچکترین واحد داده قابل پردازش در کامپیوتر؛ یک بایت، یک کاراکتر ساده را معرفی می کند. - PowerPoint PPT PresentationTRANSCRIPT
42510011 0010 1010 1101 0001 0100 1011
مدیریت اطالعات و داده های سازمان یافته
بخش سوم کتاب توربان
4251
0011 0010 1010 1101 0001 0100 1011
مبانی مرتب سازی و دستیابی داده ها ی+ک بی+ت، کوچکتری+ن واحد داده س+لسله مرات+ب داده ه+ا:•
قاب+ل پردازش در کامپیوت+ر؛ ی+ک بای+ت، ی+ک کاراکت+ر ساده را معرفی می کند.
ی+ک ترکی+ب منطق+ی از کاراکت+ر ه+ا در ی+ک کلم+ه، یک فیل+د:•گروه کوچک از کلمه ها، یا یک عدد.
یک ترکیب منطقی از فیلد های مرتبط به هم.رکورد:• یک ترکیب منطقی از از رکورد های مرتبط به هم.فایل:• ترکیب منطقی از فایل های مرتبط به هم.پایگاه داده:•
4251
0011 0010 1010 1101 0001 0100 1011
در موجودی+ت:• رویداد یک ی+ا مکان، ش+ی، ی+ک شخ+ص، ارتباط با اطالعاتی که در یک رکورد نگهداری می شود.
ه+ر ویژگ+ی ی+ا کیفیت+ی ک+ه ی+ک مشخص+ه را توصیف ص+فت:•می کند.
ی+ک فیل+د شناس+ه ک+ه ب+ه تنهای+ی یک رکورد را کلی+د اولی+ه:•مشخص می کند.
ثانوی+ه:• اطالعات کلی+د از بعضی ک+ه شناس+ه فیل+د ی+ک ب+ا دق+ت کامل شناس+ایی را دارد، ام+ا نوع+ا ی+ک فای+ل را
شناسایی نمی کند.
4251
0011 0010 1010 1101 0001 0100 1011
محیط فایلی سنتی
رکورد • از ای مجموعه ای، داده فای+ل ی+ک در باشد. می ه+م ب+ه مرتب+ط منطق+ا های هر ه++ا فای++ل مدیری++ت س++نتی محی++ط
( ی+ک فای+ل داده مرتب+ط به applicationکاربرد)های داده های رکورد شامل ک+ه دارد آ+ن
مورد نیاز آن کاربرد است.
4251
0011 0010 1010 1101 0001 0100 1011
مشکالت مشی فایلینگ
افزونگی داده•ناسازگاری داده•جدایی داده ها•امنیت داده ها•یکپارچگی داده •
هااستقالل •
کاربرد/داده
Data redundancyData inconsistencyData isolationData securityData integrity Application/data independence
4251
0011 0010 1010 1101 0001 0100 1011
پایگاه داده: مشی مدرن یا پایگاهی
گروه منطق+ی از فای+ل های مرتب+ط ب+ه ه+م که •در را ها آ+ن بی+ن های وابس+تگی و ه+ا داده
خود ذخیره می کنند.
4251
0011 0010 1010 1101 0001 0100 1011
ساختن یک پایگاه داده
برای س+اختن ی+ک پایگاه داده طراحان باید •طراحی ی++ک و مفهوم++ی طراح++ی ی++ک
فیزیکی انجام دهند.:ی+ک مدل انتزاعی از پایگاه طراح+ی مفهوم+ی
داده از دید کاربر:ی+ک طرح بندی ک+ه نشان می طراح+ی فیزیک+ی
می مرت+ب حافظ+ه در چگون+ه ه+ا داده ده+د شوند.
4251
0011 0010 1010 1101 0001 0100 1011
رابط+ه:• ++ موجودی+ت یک مدلس+ازی طراح+ی فراین+د پایگاه داده ب+ه وس+یله س+ازماندهی موجودیت داده های
مورد استفاده و شناسایی رابطه ای که با هم دارند. نموداری که موجودیت داده نمودار موجودیت + رابطه:•
ها، صفت ها و رابطه بین آن ها را نشان می دهد. گروه+ی از موجودی+ت های یک کالس های موجودیت+ی:•
نوع داده مشخص. یک موجودیت مشخص از یک نوع موجودیتنمونه:•
4251
0011 0010 1010 1101 0001 0100 1011
ی+ک ص+فت ک+ه ی+ک نمون+ه موجودیت را شناس+ه:•شناسایی+ می کند.
اتص+ال ه+ای مفهوم+ی موجودی+ت ها رابط+ه ه+ا:•در یک پایگاه داده+.
رابطه • ی+ک+ در ک+ه های+ی موجودی+ت تعداد شود. می نامیده رابط+ه آ+ن درج+ه هس+تند، آیت+م رایجت+ر اس+ت و اصطالحا بی+ن دو رابط+ه
رابطه دوگانی نامیده+ می شود.
4251
0011 0010 1010 1101 0001 0100 1011
سه نوع رابطه دوگانی:•یک 1:1• ب+ا موجودی+ت نوع ی+ک از نمون+ه ی+ک ارتیاط :
نمونه از نوع موجودیت دیگر •1:M ب+ا چند نوع موجودی+ت ی+ک از نمون+ه ی+ک ارتباط :
نمونه از نوع موجودیت دیگر •M:N ب+ا چند نوع موجودی+ت ی+ک از نمون+ه ی+ک ارتباط :
نمونه از نوع موجودیت دیگر و برعکس.
4251
0011 0010 1010 1101 0001 0100 1011
(ERDنمودار موجودیت + رابطه )
4251
0011 0010 1010 1101 0001 0100 1011
ی+ک روش برای تحلیل و بهبود نرمال س+ازی:•ی+ک پایگاه داده رابط+ه ای ب+ه شکل+ی ساده و موث+ر ت+ر ب+ه منظور کاس+تن افزونگ+ی، افزایش کارایی بهبود و ه++ا، داده یکپارچگ++ی
پردازشی.
4251
0011 0010 1010 1101 0001 0100 1011
رابطه نرمال سازی نشده
4251
0011 0010 1010 1101 0001 0100 1011
نرمال سازی شده
4251
0011 0010 1010 1101 0001 0100 1011
سیستم های مدیریت پایگاه داده
•DBMS: ی+ک برنام+ه نرم افزاری )ی+ا گروهی از برنام+ه ه+ا( ک+ه دس+ترسی به پایگاه داده را
برای کاربر فراهم می کند.
4251
0011 0010 1010 1101 0001 0100 1011
دیدگاه فیزیکی و دیدگاه منطقی
طرح+ی برای آرای+ش واقعی دیدگاه فیزیک+ی:•در ها داده مکان و فیزیک+ی های DASDو
)حافظ+ه های ب+ا دس+ترسی مس+تقیم( سیستم مدیریت داده.
دی+د کاربر نس+یت ب+ه داده ها دیدگاه منطق+ی:•و برنام+ه های نرم افزاری ک+ه آ+ن داده ها را در سیستم مدیریت داده پردازش می کنند.
4251
0011 0010 1010 1101 0001 0100 1011
DBMSمولفه های یک
داده:• در مدل داده یک اینک+ه چگون+ه برای راه+ی تعری+ف DBMS)ساختاردهی می شود.)به صورت مفهومی
مجموع+ه ای از دس+تور ه+ا که (:DDLزبان تعری+ف داده ه+ا)•س+اختار پایگاه داده را توص+یف م+ی کن+د)انواع رکورد ها و
مجموعه داده ها(و (:Schemaِشم+ا)• داده پایگاه همه از منطق+ی توص+یف
هم++++++++++++++++ه لیس++++++++++++++++ت داده ها و رابطه بین آن ها.
های (:Subschemaزیرِشم+ا)• داده از مشخصی مجموع+ه ( هستند.applicationپایگاه داده که مورد نیاز هر کاربرد )
4251
0011 0010 1010 1101 0001 0100 1011
ها • داده تغیی++ر :(Data Manipulation Language)زبان دس+تورالعمل های+ی ک+ه از زبان های سطح باال بهره کند، جس+تجو را داده پایگاه محتوای ت+ا برد م+ی کاربردهای و کند بهنگام ی+ا ذخیره را اطالعات
پایگاه داده را توسعه دهد.(: SQL(Structured query language))زبان جستجوی ساخت یافته •
زبان عموم+ی پایگاه داده رابط+ه ای که کاربران را قادر ب+ه انجام جس+تجو های پیچیده ب+ا دستورالعمل
های نسبتا ساده، می سازد.
4251
0011 0010 1010 1101 0001 0100 1011
زبان پایگاه داده که کاربر (:QBEجس+تجو ب+ا مثال)•ی+ک فرم، یک پ+ر کردن ب+ا ت+ا قادر م+ی س+ازد را
نمونه یا توصیفی از داده مورد نظر را بسازد.ها• داده واژگان Data dictionary)مجموع+++ه
collection): ویژگی های ه+ا، داده تعری+ف عناص+ر داده های+ی ک+ه عناص+ر داده ه+ا اس+تفاده م+ی کند و افراد، توابع کاری، کاربرد ه+ا و گزارشات+ی ک+ه این
عنصر داده ها را استفاده می کنند.
4251
0011 0010 1010 1101 0001 0100 1011
مدل های منطقی داده س+لسله مراتب+ی، شبک+ه ای و رابط+ه ایس+ه مدل رای+ج:•
رابطه ++ ش+ی بعدی، چن+د مث+ل ه+ا مدل بقی+ه (، object-relationalای)
( و مجازیembedded(،نهفته)hypermediaابررسانه ای )•DBMS:معموال داده های های س+لسله مراتب+ی و شبکه ای
مرتب+ط ب+ه ه+م را از طری+ق لین+ک لیس+ت ب+ه ه+م وص+ل می کنند.
•DBMS:داده ه+ا را ب+ا توج+ه به های چندبعدی و رابط+ه ای هم ب+ه آی+د م+ی ب+ه دس+ت ه+ا داده آ+ن از ک+ه اطالعات+ی
مرتبط می کنند.
4251
0011 0010 1010 1101 0001 0100 1011
DBمدل سلسله مراتبی
داده ه+ا را در ی+ک درخ+ت س+اختاردهی م+ی کن+د ک+ه در آ+ن هر •رکورد شام+ل دو عنص+ر، ی+ک ریش+ه ک+ه اص+طالحاً کلید نامیده
می شود و یک عدد متغیر از میدان های تابعه، می باشد.بهتری+ن مزی+ت ای+ن مدل س+رعت و کارای+ی آ+ن برای جستجو •
در داده ها می باشد.ایراد ه+ا: دس+ترسی ب+ه داده ه+ا از پی+ش تعری+ف شده اس+ت.•
)بوس+یله مدی+ر پایگاه داده قب+ل از نوشت+ن برنام+ه های+ی ک+ه به داده بای+د دس+ترسی داشت+ه باشن+د(. برنام+ه نوی+س ه+ا باید از
سلسله مراتب ساختار داده ها تبعیت کنند.
4251
0011 0010 1010 1101 0001 0100 1011
DBمدل سلسله مراتبی
4251
0011 0010 1010 1101 0001 0100 1011
مدل شبکه ای پایگاه داده
به • را ه+ا داده بی+ن رابط+ه ای ک+ه داده مدل گون+ه ای برقرار م+ی کن+د ک+ه رکورد های تابعه م+ی توانن+د ب+ا بی+ش از ی+ک عنص+ر داده رابطه
داشته باشند.
4251
0011 0010 1010 1101 0001 0100 1011
مدل رابطه ای پایگاه داده
مدل+ی بر پای+ه ی+ک مفهوم س+اده ب+ه نام جدول، به •منظور تمرک+ز بر روی ویژگ+ی های س+طر ها و
ستون های داده ها.ه++ا:• های رابط++ه ستون و س+طرها های جدول
رابطه ایDBاستفاده شده در یک سطر داده در مدل رابطه ای(:Tupleچند تایی)• یک ستون داده در مدل رابطه ایصفت:•
4251
0011 0010 1010 1101 0001 0100 1011
سه عمل اصلی در پایگاه داده رابطه ای
•Select: همه شام+ل زیرمجموع+ه ی+ک ایجاد رکوردهای فایل با یک معیار خاص.
•Join:ترکیب جدول های رابطه ای •Project: ایجاد ی+ک زیرمجموع+ه از ستون های
های جدول ی اجازه کاربر به جدول، ی+ک جدید شامل اطالعات مورد نیاز می دهد.
4251
0011 0010 1010 1101 0001 0100 1011
مزایا و معایب+ مدل ها ی منطقی داده ها
معایبمزایامدلپایگاه داده
سلسله مراتبی دسترسی پیش تعریف به داده ها با • جستجوی سریع و کارا•
روابط سلسله مراتبی انحصاری، مشخص شده توسط مدیر
محدودیت جستجو• سلسله مراتبی نبودن طبیعی همه •
داده هاپایگاه داده شبکه
ای قابلیت تعریف رابطه های •
بیشتر سرعت و بازدهی بیشتر •
نسیت به مدل8 رابطه ای
طراحی، پیاده سازی و نگهداری •سخت و پیچیده
انعطاف جستجویی کمتر نسبت به •مدل رابطه ای
پایگاه داده رابطه ای
سادگی مفهومی• روابط پیش تعریف برای •
داده ها وجود ندارد. انعطاف باال در •
جستجوهای غیر عمومی آسانی افزودن داده و •
رکورد جدید
کم بودن سرعت و کارایی پردازشی• افزونگی داده ها• نیازمند نگهداری اضافی•
4251
0011 0010 1010 1101 0001 0100 1011
مدل های دیگر
یک مدل (:ORDBمدل داده ای ش+ی ++ رابط+ه ای)•ذخیره س+ازی ش+ی) توانای+ی ک+ه به objectداده را )پایگاه داده رابطه ای اضافه می کند.
مدل داده ای که (:Hypermediaمدل ابررس+انه ای)•( را در گره هایی chunkاطالعات ) بخش های بزرگ
ذخیره م+ی کن+د ک+ه م+ی توان+د شام+ل داده هایی از به توان+د م+ی کاربر و باشن+د؛ مختل+ف های گون+ه
داده مربوطه از هر نوع رابطه ای پرش کند.
4251
0011 0010 1010 1101 0001 0100 1011
مدل های خاص
جغرافیایی)• اطالعات داده Geographicalپایگاه
information database:) های داده ای شامل داده مدل مکانی برای قرار دادن روی نقشه ها و تصاویر.
مدل داده ای شان+ل قواعد پایگاه داده دانش+ی:•برای تصمیم گیری توان+د تص+میم گیری ک+ه م+ی
های خبره استفاده شود.
4251
0011 0010 1010 1101 0001 0100 1011
•Small-footprint database: یک از ای زیرمجموع+ه DB بزرگتر برای کارکنان یک میدان خاص.
•( نهفته داده ای :(Embedded databaseپایگاه پایگاه داده ی+ا کاربرده+ا س+اخته می شوند. ک+ه در دس+تگاه ه+ا و طراح+ی شده برای اینک+ه مس+تقل باشن+د و نیاز خیلی
کمی به مدیریت دارند. ی+ک پایگاه داده ک+ه فق+ط شامل پایگاه داده مجازی:•
نرم افزار اس+ت و داده ه+ا را ک+ه از نظ+ر فیزیکی، در باشند، ک+ه نوع+ی ه+ر از و شبک+ه روی جای+ی ه+ر
مدیریت می کند.