מרץ 2002אלן אזאגורי ©1 ניהול דיסקים disk management
Post on 20-Dec-2015
220 views
TRANSCRIPT
2002מרץ אלן אזאגורי © 1
ניהול דיסקיםDisk Management
2002מרץ אלן אזאגורי © עמוד2
נושאים
מבואמבנה דיסק )חזרה(–
זימון גישות לדיסקאמינות וביצועים בדיסקים
–RAIDאבולוצית דיסקים ומערכות בעשרות השנים האחרונות
מבוסס על המאמר– Jim Gray, Prashant Shenoy, Rules of Thumb in Data Engineering,
Technical Report MS-TR-99-100, March 2000, Microsoft Research
2002מרץ אלן אזאגורי © עמוד3
מבנה הדיסק
headsector
track
cylinder
2002מרץ אלן אזאגורי © עמוד4
הסמוך משמעותית מהיר track ל-track שימו לב! מעבר מ-• מרוחקtrackיותר מאשר מעבר ל-
ביצועים של דיסק "שרת"Seagateדוגמא -
• r סיבובים – לדקה
• l זמן ממוצע – עד trackמהגעה ל-
להגעה לסקטור• s – זמן ממוצע
להזזת זרוע track ל-trackמ-• tr קצב העברת –
נתונים פנימי
2002מרץ אלן אזאגורי © עמוד5
זימון גישות לדיסקהקדמה
רקעדיסק מסוגל לשרת רק בקשה אחת בו-זמנית–לכן הדיסק )בעצם בקר הדיסק( מנהל תור של בקשות–
( גודל הכתיבה/קריאה וכו'2( הכתובת בדיסק )1לכל בקשה ידועים )•
המטרהזימון אופטימלי של בקשות–
?מהו קריטריון האופטימליותמינימיזציה זמן גישה ממוצע–מינימיזציה מרחק תנועות הראש–מקסימיזציה של קצב העברת נתונים–
2002מרץ אלן אזאגורי © עמוד6
זימון גישות לדיסקFirst Come First Serve
בקשות לפיtrack )משמאל לימין(
–98 ,183 ,37 ,122,14 ,124 ,65 ,67
בהתחלה הראש נמצא –track 53ב-
יתרונות/חסרונותהוגןהזזות ארוכות של הזרוע
53
98
183
37
122
14
124
65 67
0
20
40
60
80
100
120
140
160
180
200
Time
Tra
ck
Nu
mb
er
0
100
200
300
400
500
600
700
Head Movement Cumulative Head Movement
640
2002מרץ אלן אזאגורי © עמוד7
זימון גישות לדיסקShortest Seek Time First
הגדרהמשרתים את הבקשה –
קצר seekשדורשת ביותר
יתרונות/חסרונות מקטין את מרחק
התנועה של הראש )אך לא בהכרח אופטימלי!(
עלול לגרום להרעבה
5365 67
37
14
98
122 124
183
0
20
40
60
80
100
120
140
160
180
200
Time
Tra
ck
Nu
mb
er
0
100
200
300
400
500
600
700
Head Movement Cumulative Head Movement
236
2002מרץ אלן אזאגורי © עמוד8
זימון גישות לדיסקSCANאלגוריתם המעלית –
הגדרהמשרתים את הבקשה הכי –
קרובה לפי כיוון תזוזת הראש
יתרונות/חסרונותמונע הרעבה כאשר הראש מתקרב לקצה
tracksאחד, הבקשות ל-בקצה השני מופלות לרעה
תזוזה מיותרת לקצה הדיסק
53
37
140
65 67
98
122 124
183
0
20
40
60
80
100
120
140
160
180
200
Time
Tra
ck
Nu
mb
er
0
100
200
300
400
500
600
700
Head Movement Cumulative Head Movement
236
2002מרץ אלן אזאגורי © עמוד9
זימון גישות לדיסק-Cאלגוריתם המעלית מעגלי –
SCANהגדרה
משרתים את הבקשה –הכי קרובה לפי כיוון
תזוזת הראש
יתרונות/חסרונות זמן המתנה הוגן יותר
SCANמ- תזוזה מיותרת לקצה
הדיסק
5365 67
98
122124
183199
014
37
0
50
100
150
200
250
Time
Tra
ck
Nu
mb
er
0
100
200
300
400
500
600
700
Head Movement Cumulative Head Movement
382
2002מרץ אלן אזאגורי © עמוד10
זימון גישות לדיסקLOOK-ו( C-LOOK)
הגדרה-C )ו-SCANדומה ל-–
SCAN אך לא מזיז )את הזרוע לקצה
הדיסק אלא רק עד למיקום הבקשה
הקיצוני ביותרtrackל-
גישה שבד"כממומשת
53
37
14
65 67
98
122 124
183
0
20
40
60
80
100
120
140
160
180
200
Time
Tra
ck
Nu
mb
er
0
100
200
300
400
500
600
700
Head Movement Cumulative Head Movement
208
2002מרץ אלן אזאגורי © עמוד11
אמינות של הדיסקDisk Reliability
הבעיההדיסק הוא יחידה עיקרית במחשב עם חלקים –
מכנייםסיכוי לנפילה גבוה•
מדד – זמן עד לנפילה–Mean Time To Failure עבור דיסק בודד –
שעות200000כ- שעות2000 דיסקים – כ-100במערך של –
2002מרץ אלן אזאגורי © עמוד12
פיזור ויתרות – Striping/Redundancy
איך נתגבר על בעיות האמינות של מערךדיסקים?
–Redundancyנשמור מידע נוסף שיאפשר שיחזור מידע במקרה של נפילת •
דיסק או שיבוש בלוק
וכיצד נשפר ביצועי מערך דיסקים )יחסית..לדיסק יחיד(?
–Disk Stripingנפזר בלוקים בין דיסקים שונים כדי לאפשר קריאות/כתיבות •
במקביל
2002מרץ אלן אזאגורי © עמוד13
RAID – Redundant Array of Independent Disks
הגדרהמשפחה של פתרונות המשלבים פיזור –
(striping ויתרות )(redundancy) מעל מספר דיסקים כדי להשיג ביצועים יותר טובים ואמינות
גבוהה יותרהנחת יסוד
שימוש ביחידות פשוטות וזולות, במקום להפוך –את הדיסק למורכב ויקר יותר
2002מרץ אלן אזאגורי © עמוד14
RAID 0Striping
הגדרהמפזר בלוקים לפי הסדר בין הדיסקים השונים–
מכפיל את מהירות הקריאה/כתיבה הסידרתית פיnאינו משפר )אפילו מריע( את אמינות מערך הדיסקים
…2nn0
…2n+1n+1
1
…3n-12n-1n-1
2002מרץ אלן אזאגורי © עמוד15
RAID 1Mirrorring
הגדרהמעתיק כל בלוק בדיסק אחד )או יותר(–
משפר את האמינות)קריאות אקראיות מהירות יותר )יכול לנצל את שתי הזרועות בו זמניתכתיבות דורשות כתיבה נוספתמכפיל )לפחות( את מספר הדיסקים – ולכן את עלות הפיתרון
RAID 0+1 או( RAID 1+0) Striped או RAID 1, Mirrored Striping ו-RAID 0פיתרון משולב של –
Mirroring
…210
…210
2002מרץ אלן אזאגורי © עמוד16
RAID 2קוד מתקן שגיאות )כגון
Hamming)הגדרה
כל בלוק מפורק לחתיכות שנכתבות כל אחת בדיסק נפרד–רושם קוד מתקן שגיאות בדיסק/ים האחרון/נים עבור כל –
הבתים באותו מקום בכל הדיסקים
משפר את אמינות-עלות הפיתרון סביר יותר – דיסק נוסף לnדיסקים רוב הדיסקים כבר מממשיםECCברמת דיסק בודד דורש סנכרון בין הדיסקים
…
b, …
…
b, …
…
b, …
…
b, …
…
ecc0, ...
2002מרץ אלן אזאגורי © עמוד17
RAID 3Byte Interleaved Parity
הגדרהמפזר חלקי בלוקים לפי הסדר בין הדיסקים השונים– עבור כל Parity: בית Parity Diskשימוש בדיסק האחרון כ-–
הבתים באותו מקום בכל הדיסקים
משפר את האמינות עלות הפיתרון סבירה יותר – דיסקparity-נוסף ל nדיסקים קריאות/כתיבות איטיות – דורשות גישה מסונכרנת לכל
הדיסקים
…
b, …
…
b, …
…
b, …
…
b, …
…
p0, ...
2002מרץ אלן אזאגורי © עמוד18
RAID 4Block Interleaved Parity
הגדרה לפי הסדר בין הדיסקים השוניםבלוקיםמפזר – עבור כל הבלוקים Parity: בלוק Parity Diskשימוש בדיסק האחרון כ-–
באותו מקום בכל הדיסקים
משפר את האמינות עלות הפיתרון סבירה יותר – דיסקparity-נוסף ל nדיסקים כתיבה לבלוק דורשת רק גישה לשני דיסקים-דיסק הparityהינו צוואר בקבוק כתיבה לבלוק בודד דורשת עד ארבע פעולות ק"פ
ניתן לבצע אופטימיזציה בכתיבות סדרתיות–
…
n
…
n+1
…
n+2
…
2n-1
…
P1
0 1 2 n-1 P0
2002מרץ אלן אזאגורי © עמוד19
RAID 5 - Block Interleaved Distributed Parity
הגדרה לפי הסדר בין הדיסקים השוניםבלוקיםמפזר – בין הדיסקים השוניםParityפיזור בלוקים ה-–
משפר את אמינות עלות הפיתרון סבירה יותר – דיסקparity-נוסף ל nדיסקים כתיבה לבלוק דורשת רק גישה לשני דיסקים מסיר צוואר בקבוק שלRAID-4כתיבה לבלוק בודד דורשת עד ארבע פעולות ק"פ
ניתן לבצע אופטימיזציה בכתיבות סדרתיות–
… …
n
…
n+1
…
n+2
…
2n-1P1
0 1 2 n-1 P0
2002מרץ אלן אזאגורי © 20
Data Engineering?לאן
2002מרץ אלן אזאגורי © עמוד21
קצב העברת נתונים
40x/15yrs
צפיפות
בסיביותלשטח
1000x/15yrs
צפיפותtracks/inch
צפיפות בתוך track
kbits/inchב-
2002מרץ אלן אזאגורי © עמוד22
הערותעליה בצפיפות בדיסק הינו הגורם הדומיננטי
היום100Gbpsi למעל 1985 ב-20Mbpsiעלתה מ-– כל 10פער בין צפיפות לבין קצב העברה עולה פי
שנים10גם הפער בין צפיפות לזמן גישה עולה בקצב דומה–היום לוקח בערך שעה לסרוק דיסק–בעוד כשלוש שנים, סריקה תיקח כשעתיים; לפני עשר –
שנים, זה לקח חמש דקות!הנתונים בדיסק "קרים" יותר
אם נחלק את נפח הדיסק בגישות לשניה, הפער עולה עם –הזמן
2002מרץ אלן אזאגורי © עמוד23
מסקנות
גישות לדיסק הופכות יקרות יותר)יחסית( ולכן עדיף:
שימוש בבלוקים גדולים יותר–שימוש בהעברות נתונים סדרתיות–RAID-5 מאשר ב-Mirroringשימוש ב-–רצוי להרבות בדיסקים–שימוש במטמון גדול יותר להחזיק בלוקים חמים–
2002מרץ אלן אזאגורי © עמוד24
פירוטרצוי להפחית גישות לדיסק
)סידרתיים( במקום כתיבות logsכתיבת שינויים ב-–אקראיות
קיבוץ שינויים לכתיבה אחת גדולה וסדרתית••log-structured file systems!
RAID-1 או RAID-5?שניהם מעלים את האמינות––RAID-5חוסך במקום על חשבון גישות לדיסק –RAID-1 מכפיל את קצב הקריאות על חשבון גישה נוספת
לדיסק בכתיבה–RAID-5 גישות לכתיבה אחת!4 עלול לדרוש
2002מרץ אלן אזאגורי © עמוד25
ומה לגבי מהירות תקשורת?
שנים3 כל 4קצב העברה על קו בודד גדל פי דומה לקצב גידול הצפיפות בדיסקים– בין התקשורת לבין לכן, מתרחב הפער–
קצב העברת נתונים מדיסק•זמן גישה ממוצע לדיסק•
ומה לגביlatency פרק זמן משליחת בית עד – להגעתו ליעד?
מוגבל ע"י מהירות האור...–•60 msecלהלוך ושוב בתוך ארה"ב
2002מרץ אלן אזאגורי © עמוד26
מסקנות
רצוי להעביר כמה שיותר נתונים ללקוח(caching)
בין הלקוח לשרתcachingכולל מספר רמות –דוגמא
–Cooperative Caching cachesלקוחות משתפים פעולה ומחברים את ה-•
אחד גדולcacheשלהם כדי לקבל
peer-to-peerמערכות קבצים –
2002מרץ אלן אזאגורי © עמוד27
צווארי בקבוק
גידול מהיר
2002מרץ אלן אזאגורי © עמוד28
סיכום
כאשר ההתקדמות הטכנולוגית אינה אחידהגדלי זכרונות, מהירויותיהם, מהירות תקשורת, מהירות –
מעבדים, דיסקים, ...
רצוי לבחון מחדש את ארכיטקטורת המערכותאיפה נוצרים צווארי בקבוק חדשים?–אילו חלקים הופכים זולים יחסית?–
יכולות להיות השפעות משמעותיות על מבנהמערכת ההפעלה...