Мониторинг и sla в проектах с постоянным деплоем

38
Мониторинг и SLA в проектах с постоянным деплоем Александр Горник Управляющий партнер, Mindbox @agornik

Upload: agiledays

Post on 25-Dec-2014

261 views

Category:

Technology


4 download

DESCRIPTION

Александр Горник, Mindbox (Москва) Начал карьеру программистом в 2004м, а с 2007го года строю собственную компанию - Mindbox. В числе реализованных проектов: социальные сервисы mtv.com, потребительские CRM системы для Балтики, Danone и JTI. Решаю проблемы роста компании и перехода к продуктовой разработке: занимаюсь настройкой процессов разработки, масштабированием архитектуры, видением и бизнес-моделью продукта, финансовым и кадровым планированием. Я расскажу о пятилетней эволюции систем мониторинга saas приложения с высокой нагрузкой и доступностью. Как в условиях постоянных выкладок мониторятся ошибки, доступность, инфраструктура и производительность. Про реально работающий SLA с существенными финансовыми гарантиями. Всё это на примерах из жизни и с картинками. Доклад будет полезен всем кто собирается строить saas приложения или просто сталкивается с поддержкой сложного нагруженного решения в жизни. Теперь всё это называется модным словом devops.

TRANSCRIPT

SLA agile

SLA , Mindbox@agornik

2 ?

SLA? ( )

3 / / ? - ? ?

, , SLA. .

Q&A.

4 - - Staging

, () ().

. . .5

? ,

6 Fail fast: exception goto .. (xLog): .7

? !

agile: email 5 (!)

: , zero inbox9 HTTP is an application layer protocol

* -, . . 40x: ResourceNotFound (404), AccessDenied (403), InvalidClientRequest (400), 410, 413, 409 503: Timeout, Deadlock . , 500: InvalidOperation ,

: ( ).11 ?404? POST / GET, REST / WebChangeConflict ( ) UI FWAjax api

: ?404? POST / GET, REST / WebChangeConflict: UI FW: Ajax : api

12 , starving (500)

: , , .. : , ,

13

14, ..

: ,

? , . 100% . , .

, .16 (FogBugz)

17 (++). : , . , ..

18 , New Relic

(error rate)

(apdex)

NewRelic , () Java, .NET, Python, Ruby, PHP

/ (Free / 24 / 199 per server)

24

Pingdom, new relic , .. Pingdom

( ) ()

WMI

(SELECT )PRTG

(starving, i/o, locks) Web logs, SQL logs, text logs Web logs

( ) SLA.C . , . Diablo 331 100% . . ,

32 SLA

, , 33 , ,

? ? ? Agile ? !!!

34 % / / 100%

SLA () (SPOF) -, New relic (!)ApdexEmbed chart

!

@mindbox.ru

alexander.gornik @facebookagornik @twitteragornik @[email protected] @