szolgáltatási szintek menedzsmentje

39
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Szolgáltatási szintek menedzsmentje Kocsis Imre ikocsis @ mit.bme.hu Intelligens rendszerfelügyelet

Upload: salim

Post on 08-Feb-2016

47 views

Category:

Documents


0 download

DESCRIPTION

Intelligens rendszerfelügyelet. Szolgáltatási szintek menedzsmentje. Kocsis Imre ikocsis @ mit.bme.hu. Motiváció. Motiváció. Új high score … Shiny …. Azt írják, hogy az outsourcing csodaszer lehet: Központi kompetenciákra fókuszálás Erőforrás-hatékonyság (pénz, humán) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Szolgáltatási szintek menedzsmentje

Budapesti Műszaki és Gazdaságtudományi EgyetemMéréstechnika és Információs Rendszerek Tanszék

Szolgáltatási szintek menedzsmentje

Kocsis [email protected]

Intelligens rendszerfelügyelet

Page 2: Szolgáltatási szintek menedzsmentje

Motiváció

Page 3: Szolgáltatási szintek menedzsmentje

MotivációÚj high score…

Shiny…Total Cost of Ownership…(≠Total Cost of Acquisition)

Return On Investment(final value, initial value)

Azt írják, hogy az outsourcing csodaszer lehet:- Központi kompetenciákra fókuszálás- Erőforrás-hatékonyság (pénz, humán)

- Kockázat-megosztás

Page 4: Szolgáltatási szintek menedzsmentje

Motiváció

Mi facsavart gyártunk. Miért kell nekünk web,

levelező- és csoportmunka-szerver?

Szervezzük ki!Ha tényleg azt mutatják a számok, hogy ez kell…

Page 5: Szolgáltatási szintek menedzsmentje

Motiváció

?!@!!!Nem megy a levelezés! Nem tudok dolgozni!

Beperelem a szolgáltatót!

Én nem tehetek semmit (khm).Főnök, SLA ugye volt a szerződésben?

?

Page 6: Szolgáltatási szintek menedzsmentje

Motiváció

SLA: Service Level Agreement.

+ Az utóbbi nyolc hónap hat nagy kiesésével is bőven > 99%. Azaz:

ennyiért ezt kapjuk.

Azt írja, hogy:99.9% rendelkezésreállás/hónap;

99.9%-99%: 3 nap visszatérítés<99%: 15 nap visszatérítés

De amikor évente 50$/user...

Page 7: Szolgáltatási szintek menedzsmentje

Motiváció

Tanulság: kritikus szolgáltatásokra legyen formális megállapodás az elvárt minőségről, ami egyezik az

üzleti célokkal.

Mellesleg: ez az IT/IS/… részlegre, mint belső szolgáltatóra is

vonatkozik.

Page 8: Szolgáltatási szintek menedzsmentje

Szolgáltatás-kategóriák és minőségi metrikáik

Page 9: Szolgáltatási szintek menedzsmentje

Bevezető Egy szolgáltatást nyújtó rendszer egymás számára

szolgáltatást nyújtó komponensekből épül fel

Funkcionális és {nem|extra}funkcionális jellemzőko Értelmezés: általában szolgáltatáson, rendszeren vagy

adaton

Főbb nemfunkcionális jellemző-kategóriák:o Szolgáltatásbiztonságo Teljesítményo Adatbiztonság

Page 10: Szolgáltatási szintek menedzsmentje

A szolgáltatásbiztonság attribútumai Rendelkezésre állás (availability)

o Helyes szolgáltatás nyújtására készen állás Megbízhatóság (reliability)

o Helyes szolgáltatás folyamatos nyújtása Biztonságosság (safety)

o Katasztrofális következmények hiánya Integritás (integrity)

o „Nem megfelelő” rendszerváltozások hiánya Karbantarthatóság (maintainability)

oMódosíthatóság és javíthatóság

Ezek nem metrikák (mérőszámok).

1. Metrika (matematikailag): lásd távolságfüggvények

2. Metrika (IT): - mérhető/számolható…- …rendszer/szolgáltatásjellemző,- rendezett értelmezési tartománnyal- + időintervallum/időpont

Page 11: Szolgáltatási szintek menedzsmentje

Szolgáltatásbiztonsági metrikák Rendelkezésre állás: annak a valószínűsége, hogy egy

rendszer szolgáltatás nyújtására készen áll.

Megbízhatóság: annak a valószínűsége, hogy egy rendszer képes elvégezni a feladatát (egy adott időintervallumban, megadott feltételek mellett).

)()()(

DOWNTIMEEUPTIMEEUPTIMEEA

t

dxxftTPtR )()()(

Hibahatás valószínűségi sűrűség függvény

Page 12: Szolgáltatási szintek menedzsmentje

Szolgáltatásbiztonsági metrikák Ezek valószínűségi változók, mi meg mérni

akarunk…o És sokszor csak mintavételezetten tudunk

Availability: „Tapasztalati várható érték” (mintaátlag)

Periodikus mintavételezésből származó hiba!

UP

DOWN 60 s

Page 13: Szolgáltatási szintek menedzsmentje

Rendelkezésre állás Tfh. A szolgáltatásunk web hoszting (~50 szerver) 97%?

o ~11 nap kiesés megengedett egy évbeno „COTS” hardver elég, „next business day” support sem kell

mindenképpo Pipe: nincsenek különösebb igények

99,9%?o ~9 óra kiesés megengedett egy évbeno Erős monitorozás, legalább napi backupo HW hibák ellen: automatizált helyreállítás még működő node-ra

beépített redundancia (vagy jó HW)o SLA a hálózati kapcsolatra

99,999%?

(Szégyentelen) önreklám: http://www.saforum.org/about/companies/

Page 14: Szolgáltatási szintek menedzsmentje

Az adatbiztonság attribútumai Rendelkezésre állás, Integritás, Bizalmasság (confidentiality).

Magas szintű, két szolgáltatás (implementáció) összehasonlítását lehetővé tevő metrikák?o A háttérben nincs tiszta, SAP állapotgépo Bináris szemlélet

• Megtörték/nem törték meg• Megtörhető/nem megtörhető

oMegfigyelhetőség?

Page 15: Szolgáltatási szintek menedzsmentje

Az adatbiztonság metrikái Az elterjedt (könnyen számolható) metrikák sokszor

korlátozottan használhatóako „Ismert, de nem patch-elt sérülékenységek száma”o „Támadási felület”o „Sérülékenységek historikus alakulása”o…

Elméletben a cél a kockázat szembeállítása lenne a megtérülésselo Esemény kockázata = valószínűség * költségo Számítása…?

Page 16: Szolgáltatási szintek menedzsmentje

Teljesítmény – szolgáltatás-típusok Erősen szolgáltatás-típus függő

o Van értelme a válaszidőnek IPTV esetén?

Kérés-válasz jellegű szolgáltatásoko HTTP, DNS, POP3, adatbázisok, …

(Valósidejű) adatfolyam-szolgáltatásoko Streaming audio/video

Erőforrás-nyújtás szolgáltatásoko „utility computing” (Amazon EC2, S3)

Teljesítmény korlátozottan érdekes:• Erőforrás-hozzáférés (resource allowance)

• CPU, tárhely, memória• Esetleg: ütemezés és áteresztőképességek

• Diszk I/O

Page 17: Szolgáltatási szintek menedzsmentje

Teljesítmény – szolgáltatás-típusok Kötegelt feldolgozás

o Nyomtatás Kliensalkalmazások?

Folyamatok teljesítményeo Általánosan is érdekes – lásd pl. backend rendszereko Kiemelendő: támogató folyamatok (ITIL)

Page 18: Szolgáltatási szintek menedzsmentje

Kérés-válasz szolgáltatások teljesítménye Feldolgozási idő (processing time)

Válaszidő (response time)o Felhasználó által érzékelt (user-percieved): hálózati

késleltetések (latency) + feldolgozási időo Lehet tovább részletezni

Throughput („átmenő teljesítmény” / „áteresztőképesség”)o # feldolgozott „feladatok”/időegység (s)

Fontos:- Sokaságokat vizsgálunk legalább MIN/MAX/AVG- Küszöbellenőrzésnél ált. megengedünk kisszámú kieső értéket - a kérések 95%-ának válaszideje < 5 s

Page 19: Szolgáltatási szintek menedzsmentje

Kérés-válasz szolgáltatások teljesítménye Az iparban használt definíciók nem teljesen egységesek Mi „szabványos”?

o Hálózati szinto Amit az egyes tool-ok mérnek o Benchmark-ok egyes metrikái

Teljesítmény-benchmarkoko Cél: tipikus szolgáltatások egyes megvalósításainak

egymással összehasonlíthatóságao Szabványos szolgáltatás-definícióo Szabványos terheléso Szabványos teljesítmény-metrikáko Általában fizetni kell értük

Page 20: Szolgáltatási szintek menedzsmentje

Kérés-válasz szolgáltatások teljesítménye Standard Performance Evaluation Corporation

(SPEC)o SPECjAppServer2004 (J2EE 1.3)o SPECjbb2005 (nagykereskedelmi rendelésfeldolgozás)o SPECweb2005 (HTTP(S); PHP és JSP)o…

Transaction Processing Performance Councilo TPC-App (alkalmazáskiszolgálók, web service-ek)o TPC-C (adatbázisok)o TPC-W (többrétegű, tranzakciókezelő webes szolg.)

Elsődleges metrikák:- „Web Interactions per Second” (WIPS)- „cost per WIPS”

Page 21: Szolgáltatási szintek menedzsmentje

Metrikák kiválasztása és származtatása Amit eddig elhallgattunk: egy metrikával céljaink

szoktak lenni. Pl.:o „Megfelelő” szolgáltatás-minőség definiálása, követéseoMagas szintű szolgáltatás-minőségi metrikák

származtatásao Rendszerfelügyeleti döntések vezérlése

De: már a szolgáltatási szinten is rengeteg metrika értelmezhető. Mi a fontos? Hogyan válasszunk?

Page 22: Szolgáltatási szintek menedzsmentje

Példa: „Goal – Question - Metric” módszer (GQM)

Goal

Question 1 Question 2

Metric 1 Metric 2 Metric 3

Metric 1' Metric 2' Metric 3'

System

GQMdefinitionphase

Modeling & operation phase

check consistency

Cél: „online” érzet biztosítása

Mennyi ideig kell a felhasználónak várnia, míg megjelenik az oldalunk?

Válaszidő Böngésző renderelési idő

Page 23: Szolgáltatási szintek menedzsmentje

Folyamatok minőségjellemzői: néhány ITIL Configuration Management metrika

• Tartsuk nyilván az összes IT eszközt és konfigurációt

• Adjunk pontos információt ezekről más folyamatoknak

• Nyilvántartás verifikálása és javításaCélok

• Pontos modell hatékony nyilvántartásaMetrika cél

(„Question”) • # rossz CMDB adatól származó

meghiúsult RFC-k• # nem megengedett konfigurációk• # rosszul dokumentált CI-k által okozott,

meghiúsult változtatásokból származó incidensek

• # CMDB hibából származó SLA-sértés

Metrika

Page 24: Szolgáltatási szintek menedzsmentje

Folyamatok minőségjellemzői: néhány ITIL Configuration Management metrika

• Tartsuk nyilván az összes IT eszközt és konfigurációt

• Adjunk pontos információt ezekről más folyamatoknak

• Nyilvántartás verifikálása és javításaCélok

• CMDB pontos információt adjon át más folyamatoknak

Metrika cél(„Question”)

• # RFC-k megfelelő CI-frissítés nélkül• Pontatlan CI-k arányaMetrika

Page 25: Szolgáltatási szintek menedzsmentje

Szolgáltatási szint szerződések

Page 26: Szolgáltatási szintek menedzsmentje

Szolgáltatási szint szerződések Service Level Agreement (SLA)

Szolgáltatátó és igénybevevő közötti megállapodáso A szolgáltatás meghatározó minőségi jellemzőirőlo A vonatkozó kötelezettségekről mindkét oldalono Az SLA megsértése esetén való eljárásrendről

Szolgáltató és vevő között általában formális, valódi szerződéso Lehet nem jogi erejű is: belső SLA-k

Ma már gyakorlatilag minden szolgáltatási szektorbano Eredetileg: telco

Page 27: Szolgáltatási szintek menedzsmentje

SLA-k jellemző elemei

A nyújtott szolgáltatás funkcionális leírása

Minőségi jellemzők és korlátaiko Vonatkozó minőségi metrikák definíciójao Célok (SLO-k)/kiértékelés definíciójao Alacsonyabb szintű metrikákból származtatás

megadása (lehet rekurzív)oMérés mikéntjének precíz definíciója

Page 28: Szolgáltatási szintek menedzsmentje

SLA-k jellemző elemei Szolgáltatási szint monitorozás és jelentés

folyamata

Fontos részkérdés: ki mér?o Vevő

• Hozzáférés szintje a szolgáltatói infrastruktúrához?• Pontatlanságot okozó zavaró tényezők?

o Szolgáltató• Meglevő instrumentáció testre szabása?• Megbízható validálás nélkül?

Page 29: Szolgáltatási szintek menedzsmentje

SLA-k jellemző elemei Problémák jelentésének a folyamata

Problémákra reagálás és megoldásuk időkeretei

SLA sértés következményei

Felmentő- és kivétel-cikkelyek („escape clauses”)o Katasztrófáko Nem megfelelő viselkedés a felhasználó részérőlo Karbantartási időszakok, munkaidőo Üzleti hatás nélküli kiesések

Page 30: Szolgáltatási szintek menedzsmentje

Leíró nyelvek A természetes nyelv sokszor elég. Elektronikus SLA-reprezentáció és megegyezés

(negotiation)? Főleg SOA-forgatókönyvek esetén:

o Automatikus (web) service felderítés (discovery)o (Fél)automatikus szolgáltatás-választás

Néhány példa:o Web Service Level Agreements (WSLA) keretrendszer (IBM)o „Akadémiai” nyelvek: SLAng, WSOL (Web Service Offerings

Language), CC-Pi (concurrent constraint pi calculus), …o WS-Agreement (doménspecifikus nyelv beágyazandó!)

Page 31: Szolgáltatási szintek menedzsmentje

ITIL: Service Level Management

Page 32: Szolgáltatási szintek menedzsmentje

Service Level Management (ITUP)

„Service Level Management is the process of negotiating, defining, measuring, managing and improving the quality of IT services at an acceptable cost.”

Page 33: Szolgáltatási szintek menedzsmentje

„Create and Maintain Service Catalog” ITIL fogalom: szolgáltatás-katalógus

o Röviden: egy szervezet által vagy a részlegeinek/alkalmazottainak, vagy a „vevőinek” nyújtott szolgáltatások katalógusa

Összefoghatja pl.:o A szolgáltatás leírásáto A vonatkozó SLA-kato A felhasználókato A vonatkozó költségeketo A vonatkozó Operational Level Agreement-eketo „Underpinning Contracts”o …

Magyarul: a szolgáltatás, mint önálló entitás jelenjen meg (és legyen adminisztratívan kezelve)

Page 34: Szolgáltatási szintek menedzsmentje

„Create and Maintain SLA-s”

Page 35: Szolgáltatási szintek menedzsmentje

„Create and Maintain SLA-s”

Belső/külső szolgáltatók, OLA-k,

UC-k

„Finalizing, Committing to, Executing upon, Publishing, …”

Page 36: Szolgáltatási szintek menedzsmentje

„Monitor and Report SL Achievements”

Szubjektív elégedettség is!

Page 37: Szolgáltatási szintek menedzsmentje

„Monitor and Report SL Achievements”

Page 38: Szolgáltatási szintek menedzsmentje

Referenciák, linkek D.C. Verma: „Service level agreements on IP networks”.

Proceedings of the IEEE, Volume 92, Issue 9, pp 1382 – 1388, 2004.

A. Keller, H.Ludwig: „The WSLA framework: Specifying and monitoring service level agreements for web services”. Journal of Network and Systems Management, Volume 11, Number 1, pp 57-81, Springer, 2003.

M.G. Bruscemi, U. Montanari: „CC-Pi: A Constraint-Based Language for Specifying Service Level Agreements”. In: Programming Languages and Systems, LNCS 4421, pp 18-32, Springer, 2007.

V. Tosic et al: „Management applications of the web service offerings language (WSOL)”. Information Systems, Volume 30, Number 7, pp 564-586, 2005, Elsevier.

Page 39: Szolgáltatási szintek menedzsmentje

Referenciák, linkek Web services agreement specification (WS-Agreement). Global

Grid Forum, 2004.o http://

www.opengridforum.org/Public_Comment_Docs/Documents/Oct-2006/WS-AgreementSpecificationDraftFinal_sp_tn_jpver_v2.pdf

A Avizienis, J.C. Laprie, B. Randell, C. Landwehr, „Basic Concepts and Taxonomy of Dependable and Secure Computing”, IEEE TRANSACTIONS ON DEPENDABLE AND SECURE COMPUTING, 2004, IEEE Computer Society.

Standard Performance Evaluation Corporationo http://www.spec.org

Transaction Processing Performance Councilo http://www.tpc.org

itSMF: Metrics for IT Service Management. Van Haren Publishing, 2006.