TOAST CloudTENANT ISOLATION김태형 / NHN엔터테인먼트 클라우드개발팀
2015.11.26
시작하며
무엇을 얘기하고 싶은가
▸ Tenant Isolation?
▸ How?
▸ 해결해야 할 수 많은 과제들
TENANT ISOLATION?
TENANT ISOLATION
▸ Cloud == Shared Resource
▸ Isolation
▸ Compute / Storage / Network
▸ Tenant Network Limitation
NETWORK COMPUTE STORAGE
NETWORK
FIP
PROBLEM
NETWORK NODE
COMPUTE
PRIVATE
COMPUTE
PUBLIC
R
장애
BLOODY 4.16
▸ Network node on VM
▸ Rollback Fail
▸ LBaaS, DHCP 부하 분산
▸ 장애가 준 교훈
SOLUTION #1
1ST APPROACH
▸ Network Node 분리
NETWORK
FIP
COMPUTE
PRIVATE
COMPUTE
PUBLIC
R
NETWORK
FIPR
NOT ENOUGH
IS IT OK?
NETWORK
FIP
COMPUTE
R
LOAD BALANCER
WORST CASE
NETWORK
FIP
COMPUTE
R
SOLUTION #2
2ND APPROACH
DVR?
DVR
NETWORK
COMPUTE COMPUTE
R
R R
FIP
BETTER
나눠먹기 시작!
NETWORK
COMPUTE COMPUTE
R
R R
LOAD BALANCER
R FIP
FIP
DVR로 얻은 것과 잃은 것
DVR의 빛과 그림자
▸ 버그...
▸ 장애 구간 검출
▸ 병목 감소
▸ 장애 포인트
NOT ENOUGH YET
병목은 사라졌나?
NETWORK
COMPUTE COMPUTE
R
R R
LOAD BALANCER
R FIP
NEW SOLUTION
LOAD BALANCER FARM
NETWORK
COMPUTE COMPUTE
R
R R
LOAD BALANCER FARM
LB LB LB
FUTURE
또 다른 이슈
TENANT NETWORK 제한
4K vs 16M
계속된 고난
고난의 VXLAN
▸ Flooding
▸ Performance
DPDK
VxLAN Offloading
OVS upgrade
& Partitioning
그래서?
TODO
개선점
남은 이슈는?
▸ DVR + HA Router
▸ Openstack Liberty
▸ Back port
▸ VxLAN 성능 개선
▸ Partitioning
SUMMARY
SUMMARY
▸ Network node 당 Tenant의 수를 줄일 수 있는 방향으로구조 변경
▸ DVR + Network node 분리 성능/확장성 확보
▸ 더 이상 infra 전면 장애는 없음
Q&A
Thank you.