מרץ 2002אלן אזאגורי ©1 ניהול דיסקים disk management

28
ץץץ2002 © ץץץ ץץץץץץץ1 ץץץץץ ץץץץץץDisk Management

Post on 20-Dec-2015

220 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © 1

ניהול דיסקיםDisk Management

Page 2: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד2

נושאים

מבואמבנה דיסק )חזרה(–

זימון גישות לדיסקאמינות וביצועים בדיסקים

–RAIDאבולוצית דיסקים ומערכות בעשרות השנים האחרונות

מבוסס על המאמר– Jim Gray, Prashant Shenoy, Rules of Thumb in Data Engineering,

Technical Report MS-TR-99-100, March 2000, Microsoft Research

Page 3: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד3

מבנה הדיסק

headsector

track

cylinder

Page 4: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד4

הסמוך משמעותית מהיר track ל-track שימו לב! מעבר מ-• מרוחקtrackיותר מאשר מעבר ל-

ביצועים של דיסק "שרת"Seagateדוגמא -

• r סיבובים – לדקה

• l זמן ממוצע – עד trackמהגעה ל-

להגעה לסקטור• s – זמן ממוצע

להזזת זרוע track ל-trackמ-• tr קצב העברת –

נתונים פנימי

Page 5: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד5

זימון גישות לדיסקהקדמה

רקעדיסק מסוגל לשרת רק בקשה אחת בו-זמנית–לכן הדיסק )בעצם בקר הדיסק( מנהל תור של בקשות–

( גודל הכתיבה/קריאה וכו'2( הכתובת בדיסק )1לכל בקשה ידועים )•

המטרהזימון אופטימלי של בקשות–

?מהו קריטריון האופטימליותמינימיזציה זמן גישה ממוצע–מינימיזציה מרחק תנועות הראש–מקסימיזציה של קצב העברת נתונים–

Page 6: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד6

זימון גישות לדיסקFirst Come First Serve

בקשות לפיtrack )משמאל לימין(

–98 ,183 ,37 ,122,14 ,124 ,65 ,67

בהתחלה הראש נמצא –track 53ב-

יתרונות/חסרונותהוגןהזזות ארוכות של הזרוע

53

98

183

37

122

14

124

65 67

0

20

40

60

80

100

120

140

160

180

200

Time

Tra

ck

Nu

mb

er

0

100

200

300

400

500

600

700

Head Movement Cumulative Head Movement

640

Page 7: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד7

זימון גישות לדיסקShortest Seek Time First

הגדרהמשרתים את הבקשה –

קצר seekשדורשת ביותר

יתרונות/חסרונות מקטין את מרחק

התנועה של הראש )אך לא בהכרח אופטימלי!(

עלול לגרום להרעבה

5365 67

37

14

98

122 124

183

0

20

40

60

80

100

120

140

160

180

200

Time

Tra

ck

Nu

mb

er

0

100

200

300

400

500

600

700

Head Movement Cumulative Head Movement

236

Page 8: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד8

זימון גישות לדיסקSCANאלגוריתם המעלית –

הגדרהמשרתים את הבקשה הכי –

קרובה לפי כיוון תזוזת הראש

יתרונות/חסרונותמונע הרעבה כאשר הראש מתקרב לקצה

tracksאחד, הבקשות ל-בקצה השני מופלות לרעה

תזוזה מיותרת לקצה הדיסק

53

37

140

65 67

98

122 124

183

0

20

40

60

80

100

120

140

160

180

200

Time

Tra

ck

Nu

mb

er

0

100

200

300

400

500

600

700

Head Movement Cumulative Head Movement

236

Page 9: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד9

זימון גישות לדיסק-Cאלגוריתם המעלית מעגלי –

SCANהגדרה

משרתים את הבקשה –הכי קרובה לפי כיוון

תזוזת הראש

יתרונות/חסרונות זמן המתנה הוגן יותר

SCANמ- תזוזה מיותרת לקצה

הדיסק

5365 67

98

122124

183199

014

37

0

50

100

150

200

250

Time

Tra

ck

Nu

mb

er

0

100

200

300

400

500

600

700

Head Movement Cumulative Head Movement

382

Page 10: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד10

זימון גישות לדיסקLOOK-ו( C-LOOK)

הגדרה-C )ו-SCANדומה ל-–

SCAN אך לא מזיז )את הזרוע לקצה

הדיסק אלא רק עד למיקום הבקשה

הקיצוני ביותרtrackל-

גישה שבד"כממומשת

53

37

14

65 67

98

122 124

183

0

20

40

60

80

100

120

140

160

180

200

Time

Tra

ck

Nu

mb

er

0

100

200

300

400

500

600

700

Head Movement Cumulative Head Movement

208

Page 11: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד11

אמינות של הדיסקDisk Reliability

הבעיההדיסק הוא יחידה עיקרית במחשב עם חלקים –

מכנייםסיכוי לנפילה גבוה•

מדד – זמן עד לנפילה–Mean Time To Failure עבור דיסק בודד –

שעות200000כ- שעות2000 דיסקים – כ-100במערך של –

Page 12: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד12

פיזור ויתרות – Striping/Redundancy

איך נתגבר על בעיות האמינות של מערךדיסקים?

–Redundancyנשמור מידע נוסף שיאפשר שיחזור מידע במקרה של נפילת •

דיסק או שיבוש בלוק

וכיצד נשפר ביצועי מערך דיסקים )יחסית..לדיסק יחיד(?

–Disk Stripingנפזר בלוקים בין דיסקים שונים כדי לאפשר קריאות/כתיבות •

במקביל

Page 13: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד13

RAID – Redundant Array of Independent Disks

הגדרהמשפחה של פתרונות המשלבים פיזור –

(striping ויתרות )(redundancy) מעל מספר דיסקים כדי להשיג ביצועים יותר טובים ואמינות

גבוהה יותרהנחת יסוד

שימוש ביחידות פשוטות וזולות, במקום להפוך –את הדיסק למורכב ויקר יותר

Page 14: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד14

RAID 0Striping

הגדרהמפזר בלוקים לפי הסדר בין הדיסקים השונים–

מכפיל את מהירות הקריאה/כתיבה הסידרתית פיnאינו משפר )אפילו מריע( את אמינות מערך הדיסקים

…2nn0

…2n+1n+1

1

…3n-12n-1n-1

Page 15: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד15

RAID 1Mirrorring

הגדרהמעתיק כל בלוק בדיסק אחד )או יותר(–

משפר את האמינות)קריאות אקראיות מהירות יותר )יכול לנצל את שתי הזרועות בו זמניתכתיבות דורשות כתיבה נוספתמכפיל )לפחות( את מספר הדיסקים – ולכן את עלות הפיתרון

RAID 0+1 או( RAID 1+0) Striped או RAID 1, Mirrored Striping ו-RAID 0פיתרון משולב של –

Mirroring

…210

…210

Page 16: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד16

RAID 2קוד מתקן שגיאות )כגון

Hamming)הגדרה

כל בלוק מפורק לחתיכות שנכתבות כל אחת בדיסק נפרד–רושם קוד מתקן שגיאות בדיסק/ים האחרון/נים עבור כל –

הבתים באותו מקום בכל הדיסקים

משפר את אמינות-עלות הפיתרון סביר יותר – דיסק נוסף לnדיסקים רוב הדיסקים כבר מממשיםECCברמת דיסק בודד דורש סנכרון בין הדיסקים

b, …

b, …

b, …

b, …

ecc0, ...

Page 17: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד17

RAID 3Byte Interleaved Parity

הגדרהמפזר חלקי בלוקים לפי הסדר בין הדיסקים השונים– עבור כל Parity: בית Parity Diskשימוש בדיסק האחרון כ-–

הבתים באותו מקום בכל הדיסקים

משפר את האמינות עלות הפיתרון סבירה יותר – דיסקparity-נוסף ל nדיסקים קריאות/כתיבות איטיות – דורשות גישה מסונכרנת לכל

הדיסקים

b, …

b, …

b, …

b, …

p0, ...

Page 18: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד18

RAID 4Block Interleaved Parity

הגדרה לפי הסדר בין הדיסקים השוניםבלוקיםמפזר – עבור כל הבלוקים Parity: בלוק Parity Diskשימוש בדיסק האחרון כ-–

באותו מקום בכל הדיסקים

משפר את האמינות עלות הפיתרון סבירה יותר – דיסקparity-נוסף ל nדיסקים כתיבה לבלוק דורשת רק גישה לשני דיסקים-דיסק הparityהינו צוואר בקבוק כתיבה לבלוק בודד דורשת עד ארבע פעולות ק"פ

ניתן לבצע אופטימיזציה בכתיבות סדרתיות–

n

n+1

n+2

2n-1

P1

0 1 2 n-1 P0

Page 19: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד19

RAID 5 - Block Interleaved Distributed Parity

הגדרה לפי הסדר בין הדיסקים השוניםבלוקיםמפזר – בין הדיסקים השוניםParityפיזור בלוקים ה-–

משפר את אמינות עלות הפיתרון סבירה יותר – דיסקparity-נוסף ל nדיסקים כתיבה לבלוק דורשת רק גישה לשני דיסקים מסיר צוואר בקבוק שלRAID-4כתיבה לבלוק בודד דורשת עד ארבע פעולות ק"פ

ניתן לבצע אופטימיזציה בכתיבות סדרתיות–

… …

n

n+1

n+2

2n-1P1

0 1 2 n-1 P0

Page 20: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © 20

Data Engineering?לאן

Page 21: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד21

קצב העברת נתונים

40x/15yrs

צפיפות

בסיביותלשטח

1000x/15yrs

צפיפותtracks/inch

צפיפות בתוך track

kbits/inchב-

Page 22: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד22

הערותעליה בצפיפות בדיסק הינו הגורם הדומיננטי

היום100Gbpsi למעל 1985 ב-20Mbpsiעלתה מ-– כל 10פער בין צפיפות לבין קצב העברה עולה פי

שנים10גם הפער בין צפיפות לזמן גישה עולה בקצב דומה–היום לוקח בערך שעה לסרוק דיסק–בעוד כשלוש שנים, סריקה תיקח כשעתיים; לפני עשר –

שנים, זה לקח חמש דקות!הנתונים בדיסק "קרים" יותר

אם נחלק את נפח הדיסק בגישות לשניה, הפער עולה עם –הזמן

Page 23: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד23

מסקנות

גישות לדיסק הופכות יקרות יותר)יחסית( ולכן עדיף:

שימוש בבלוקים גדולים יותר–שימוש בהעברות נתונים סדרתיות–RAID-5 מאשר ב-Mirroringשימוש ב-–רצוי להרבות בדיסקים–שימוש במטמון גדול יותר להחזיק בלוקים חמים–

Page 24: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד24

פירוטרצוי להפחית גישות לדיסק

)סידרתיים( במקום כתיבות logsכתיבת שינויים ב-–אקראיות

קיבוץ שינויים לכתיבה אחת גדולה וסדרתית••log-structured file systems!

RAID-1 או RAID-5?שניהם מעלים את האמינות––RAID-5חוסך במקום על חשבון גישות לדיסק –RAID-1 מכפיל את קצב הקריאות על חשבון גישה נוספת

לדיסק בכתיבה–RAID-5 גישות לכתיבה אחת!4 עלול לדרוש

Page 25: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד25

ומה לגבי מהירות תקשורת?

שנים3 כל 4קצב העברה על קו בודד גדל פי דומה לקצב גידול הצפיפות בדיסקים– בין התקשורת לבין לכן, מתרחב הפער–

קצב העברת נתונים מדיסק•זמן גישה ממוצע לדיסק•

ומה לגביlatency פרק זמן משליחת בית עד – להגעתו ליעד?

מוגבל ע"י מהירות האור...–•60 msecלהלוך ושוב בתוך ארה"ב

Page 26: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד26

מסקנות

רצוי להעביר כמה שיותר נתונים ללקוח(caching)

בין הלקוח לשרתcachingכולל מספר רמות –דוגמא

–Cooperative Caching cachesלקוחות משתפים פעולה ומחברים את ה-•

אחד גדולcacheשלהם כדי לקבל

peer-to-peerמערכות קבצים –

Page 27: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד27

צווארי בקבוק

גידול מהיר

Page 28: מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management

2002מרץ אלן אזאגורי © עמוד28

סיכום

כאשר ההתקדמות הטכנולוגית אינה אחידהגדלי זכרונות, מהירויותיהם, מהירות תקשורת, מהירות –

מעבדים, דיסקים, ...

רצוי לבחון מחדש את ארכיטקטורת המערכותאיפה נוצרים צווארי בקבוק חדשים?–אילו חלקים הופכים זולים יחסית?–

יכולות להיות השפעות משמעותיות על מבנהמערכת ההפעלה...