آموزش ذخیره و بازیابی اطلاعات - درس هفتم

27
ادرس فره درای نکات مطرح شدر مبنید ها ب این اس« ابیره و بازی آموزش ذخیعات اط» یه ته شده است. جعه نماینک زیر مران آموزش به لی در مورد ای بیشترعاترای کسب اط ب یدfaradars.org/fvsft106 آموزش ذخیره وابی بازیعات اطfaradars.org/fvsft106 ﻓﺮادرسFaraDars.org

Upload: faradars

Post on 16-Apr-2017

74 views

Category:

Education


4 download

TRANSCRIPT

Page 1: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

این اسالید ها بر مبنای نکات مطرح شده در فرادرس

« اطالعاتآموزش ذخیره و بازیابی »

.شده استتهیه

یدبرای کسب اطالعات بیشتر در مورد این آموزش به لینک زیر مراجعه نمایfaradars.org/fvsft106

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

فرادرس

FaraDars.org

Page 2: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

:مدرس

فرشید شیرافکن

دانشگاه تهران دکتری دانشجوی (بیو انفورماتیک: دکتری( )کامپیوتر نرم افزار: کارشناسی و کارشناسی ارشد )

ذخیره و بازیابی اطالعاتساختار ترتیبی شاخص دار: درس هفتم

2

فرادرس

FaraDars.org

Page 3: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

3

معرفی ساختار های شاخص دار

:در ساختار شاخص دار، دو مجموعه ركورد وجود دارد

شدهشاخص بندي فايل -1

فايل شاخص-2

دو قسمت مقدار و آدرس باا از فايل شاخص مدخل هر

. بايت تشكيل شده استV+Pطول

اي از فايال داده نقطه : (Anchor point)لنگرگاه .اي كه مدخل شاخص به آن اشاره دارد

فرادرس

FaraDars.org

Page 4: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

4

انواع شاخص

.استركورد لنگرگاه : (Dense index)متراکمشاخص -1.استبالك ، لنگرگاه:غیرمتراکمشاخص -2

فرادرس

FaraDars.org

Page 5: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

5

تعداد مدخلهاي شاخص زياد باشد، آنارا در نناداگر

.سطح مي سازند

(x)مي گويندسطوح شاخص را عمق شاخص تعداد

باراي بيشتر باشد، تعداد دفعاا دساتيابيxهر نه

. واكشي ركورد بيشتر خواهد بود

.كردشاخص را فشرده مدخل بايد xبراي كاهش

در حافظاه الالي (Master index)سر شاخص

. شودذخيره مي

يك بالك است ، به اندازهسرشاخص

(Multi Level index)شاخص چند سطحی

فرادرس

FaraDars.org

Page 6: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

6

مثال

فرادرس

FaraDars.org

Page 7: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

7

ساختار ترتیبی شاخص دار (indexed sequential)

فرادرس

FaraDars.org

Page 8: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

8

(يفايل ترتيب)ناحيه اللي -1

سرريزيناحيه -2

اشاره گرها -3

مجموعه شاخص -4

دارترتیبی شاخص ساختار اجزا

. فايل ترتيبي روي فيلدكليد مرتب است

. ناظر به ناحيه سرريز نمي باشد و فقط به ناحيه اللي ناظر استشاخص

.زنجيره ها از ناحيه اللي به ناحيه سرريز، امكان پردازش سريال را فراهم مي كندوجود

.بندي را آنقدر ادامه داده تا اندازه فايل شاخص كونكتر يا مساوي اندازه بالك شودشاخص

.شاخص ايستا است، بنابراين شاخص در سازماندهي مجدد تنظيم مي شود نه همروند با عمليا ذخيره سازي در فايل

فرادرس

FaraDars.org

Page 9: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

9

.بايتBبالك بندي شدن فايل داده اي و شاخص با طول هر بالك

بودن سطح اول شاخص غيرمتراكم

بودن فايل داده اي و فايل شاخصهمتوالي

داشتن بالكهاي شاخص در يك استوانه قرار

(.عميال خواندن فايل كاربرد ندارددر )شاخص براي تسريع واكشي ركوردها از استفاده

تخصيص شيارهايي در انتهاي استوانه، به عنوان ناحيه سر ريزي استوانه

. ركوردهاي سرريزي هر استوانه در همان استوانه قرار مي گيرند

.هي شودبا پر شدن ناحيه سرريزي يك استوانه، بايد ناحيه سرريزي ثانويه ايجاد شود و يا فايل مجددا سازماند

پر بودن ناحيه اللي و بالكهاي شاخص و خالي بودن ناحيه سرريز بعد از سازماندهي مجدد

حذف منطقي ركوردها و انجام حذف فيزيكي در سازماندهي مجدد

فرادرس

FaraDars.org

Page 10: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

10

: مدخلهاي يك بالك شاخص تعداد

PV

By

ظرفیت نشانه روی بالك شاخص

فرادرس

FaraDars.org

Page 11: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

11

(V=14 byte , P=6 byte , B=2000 byte)بايتي، نند سطح شاخص نياز است؟200ده ميليون ركورد در فايلي با

6

7

1010

10

fB

nb

10020

2000

pV

By

6

110e b

4

6

210

100

10e

100100

10

y

ee

4

2

3

).بندي را آنقدر ادامه مي دهيم تا اندازه فايل شاخص كونكتر يا مساوي اندازه بالك شودشاخص (. كه برابر اندازه يك بالك است( بايتي20مدخل 100)بايت است 2000مي باشد، نون حجم فايل شاخص سوم برابر 3عمق شاخص برابر

32

66

2

6 10

10

10

100

LogLogLogX b

y

مثال

فرادرس

FaraDars.org

Page 12: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

12

تعداد مدخلها در سطح دوم شاخص كدام است؟. فايلي با مشخصا زير را در نظر بگيريد

(n=1000000 , B=2000 Byte , R=200Byte , V+P=20 Byte )

10R

BB

F

10020

2000

PV

By

5

6

110

10

10

FB

ne

1000100

105

2e

مثال

فرادرس

FaraDars.org

Page 13: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

13

براي شاخص نند بايت است؟( ديسك)ميزان حافظه الزم

)20,3,10,1000,10( 32

5

1 pvxeee

byteSSSSx

i

iI 202000020100020105

21

1

1

.ديسكشود كه سطح سوم در حافظه اللي نگهداري مي شود نه در توجه

مثال

فرادرس

FaraDars.org

Page 14: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

14

: Rمؤثر در محاسبه عوامل حافظه الزم براي يك ركورد از ناحيه اللي -1لي حافظه مصرف شده براي ناحيه سرريزي به ازاء يك ركورد از ناحيه ال-2حافظه مصرف شده براي شاخص به ازاء يك ركورد از ناحيه اللي -3

indexoverdata RRRR

on

SR I

index

كل حافظه مصرف شده براي شاخص: I

S

متوسط اندازه رکورد

)(f

dataB

PavR

)( Pavon

oRover

فرادرس

FaraDars.org

Page 15: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

15

وطاه در سپس درسطح شاخص جستجو كرده تا به مدخل مرب، كرده سرشاخص كه در حافظه اللي است را بررسي ابتدا

ه اللي، در هر سطح شاخص، يك بالك خوانده شده و بعد از پيدا كردن آدرس مورد نظر در ناحييعني . سطح اول برسيم

.(البته احتمال رفتن به ناحيه سرريز و جستجو در زنجيره سرريزي ها وجود دارد. )آنرا مي خوانيم

))(`

2

1

`

`

2

1(2

ttBFbr

n

o

on

oxSCT

واکشی رکورد

. كمتر باشد، زمان واكشي ركورد از ناحيه اللي كمتر خواهد بودxهر نه

فرادرس

FaraDars.org

Page 16: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

16

ر بالكاي از توجه به آخرين ركورد واكشي شده، متوجه مي شويم كه آيا ركورد بعدي در بالكي از ناحيه اللي است ياا دبا

. ناحيه سرريز

مي آيد بدست زمانركورد بعدي در بالكي از ناحيه اللي باشد، با اگر

.آيدمي زمان بدست اگر در ناحيه سرريز باشد، در و

tt

F

bB

1

بازیابی رکورد بعدی

ttbr

)(`

`tttt

F

Nbr

on

ob

BT

1

`

`

on

o

.باشداحتمال اينكه ركورد در ناحيه سرريز :

فرادرس

FaraDars.org

Page 17: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

17

:توجه به وضعيت ركورد بعدي نسبت به ركورد فعلي، شش حالت ممكن است بوجود آيدبا . نيز در همان بالك است و بالك در بافر استبعديدر بالكي از ناحيه اللي است و ركورد فعليركورد -1.است استوانههمان از در بالك بعدي بعدياست و ركورد الليناحيه از آخرين ركورد بالك فعليركورد -2.مي باشددر بالك بعدي از استوانه ديگربعديآخرين ركورد بالك از آخرين بالك استوانه است و ركورد فعليركورد -3.در بالكي از ناحيه سرريزي استبعديآخرين ركورد بالك است و ركورد فعليركورد -4.ستهم در بالكي از ناحيه سرريزي و از همان استوانه ابعديدر بالكي از ناحيه سرريزي است و ركورد فعليركورد -5.در بالكي از ناحيه الليبعديدر بالكي از ناحيه سرريزي است و ركورد فعليركورد -6

))((tt

F

Nbrpro

B

proT

1

)(`)(

`tt

F

F

Nbr

Bon

BonT

'

'

on

opro

ارزیابی دقیق تر

: داشت خواهيم با در نظر گرفتن حاال ششگانه

فرادرس

FaraDars.org

Page 18: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

18

.مي شودجديد در بالك مربوط در ناحيه اللي، در محلي كه منطقاً بايد قرار بگيرد، درج ركورد

.مي شوندسمت انتهاي بالك شيفت داده به (به غير از اولين ركورد بالك)بعدي همان بالك ركوردهاي

. آخر بالك به اولين بالك جادار در ناحيه سرريزي، منتقل مي شودركورد

.دارد و براي هر بالك از ناحيه اللي يك اشاره گر وجود داردوجود هاي بالكزنجيره سرريزي

(Push through)درج با جابجایی

فرادرس

FaraDars.org

Page 19: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

19

:درج یک رکورد مراحل .پيدا كردن بالكي كه ركورد بايد در آن درج شود-1شااره اوارد كردن ركورد در اين بالك و خارج كردن آخرين ركورد بالك و قرار دادن در بافر كمكي و ساختن فيلد -2

.ركورد جابجا شوندهگر به بازنويسي اين بالك -3خواندن بالكي از ناحيه سرريز -4وارد كردن ركورد خارج شده از بالك اللي، در اين بالك-5.بازنويسي همين بالك-6

RWttRWFI TbrTTT

ttFI br5TT

r2TRW

درج

فرادرس

FaraDars.org

Page 20: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

20

. دادانجام مقدار كليد تغيير نكند، مي توان بهنگام سازي درجا اگر ويساي اينكار ركورد بهنگام در آوردني را واكشي كرده و نسخه جديد آن را در باافر ايجااد كارده و ساپس بازنبراي

:مي كنيم

r2TT FUinplace

: ي كنيمحالت كلي، نسخه قديمي ركورد را نشانگر حذف مي زنيم و ركورد جديدي كه در بافر ساخته ايم را درج مدر

IRWFoutplaceU TTTT

ttFoutplaceU brTT 72

بهنگام سازی

فرادرس

FaraDars.org

Page 21: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

21

ترتیبیخواندن -1

t

R`)on(Txseq

خواندن سریال-2.ي شوندركورد واكشي شده و بقيه ركوردها در يك سلسله عمليا بازيابي ركورد بعدي، خوانده ماولين

NFxser T)1on(TT

خواندن کل فایل

فرادرس

FaraDars.org

Page 22: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

22

. كه ناحيه سرريز پر مي شود يا طول زنجيره ها طوالني مي شود، فايل را سازماندهي مجدد مي كنندهنگامي ز اينكار فايل را به طور سريال خوانده و ركوردها را با خارج كردن حاذف شادني ها، باالك بنادي كارده و بعاد ابراي

.بازنويسي نسخه جديد ساختار شاخص را بازسازي مي كنند

t

S

t

R)don(TT I

xsery

زمان بازنويسي بالكهاي شاخص: t

SI

سازماندهی مجدد

فرادرس

FaraDars.org

Page 23: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

23

تقارنعدم -1

شاخصايستا بودن -2

مسئله درج سرريزي ها -3

معایب ساختار ترتیبی شاخص دار

فرادرس

FaraDars.org

Page 24: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

24

(نه لفا ديگر آنها)وقتي كه پردازش سريال برحسب مقادير كليد مطرح است -1

.وقتي كه واكشي تك ركوردها از طريق كليد آنها، عملي رايجي مي باشد-2

.ستم هاي داده پردازي تجاري ا مديريتيسي-3

کاربرد ساختار ترتیبی شاخص دار

فرادرس

FaraDars.org

Page 25: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

25

پارامترهای زمانی ساختار ترتیبی شاخص دار

فرادرس

FaraDars.org

Page 26: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

26

پايان فرادرسفصل هفتم

FaraDars.org

Page 27: آموزش ذخیره و بازیابی اطلاعات - درس هفتم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

این اسالید ها بر مبنای نکات مطرح شده در فرادرس

« اطالعاتآموزش ذخیره و بازیابی »

.شده استتهیه

یدبرای کسب اطالعات بیشتر در مورد این آموزش به لینک زیر مراجعه نمایfaradars.org/fvsft106

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

فرادرس

FaraDars.org