Download - 플래시 시스템, 성능의 제약을 속도로 초월하다 › edm › J1410 › 1030_hdp › FlashSystem.pdf · 의 대역폭(초당 기가바이트)을 제공한다. 게다가
www.ibmitinsight.com01 BIG DATA
플래시 시스템, 성능의 제약을 속도로 초월하다IBM FlashSystem, 스토리지와 애플리케이션의 성능 문제 해결해
www.ibmitinsight.com02 BIG DATA
IBM FlashSystem 기술은 특별히 스토리지와 애플
리케이션 성능 문제를 해결하는 데 초점이 맞춰져 있다.
IT Insight는 IBM FlashSystem 기술의 활용과 관련하여
중점적으로 고려할 사항 및 기업에서 그 가치를 극대화
할 방법에 대해 소개하고자 한다.
플래시의 이점I/O 대기 시간이 솔루션 성능을 저하시키는가? 플
래시 기술은 애플리케이션 가속화의 용도로 가장 많
이 쓰인다. 프로세서 기술의 속도가 기존 스토리지의
속도를 앞질렀고, 그로 인해 I/O 대기 시간이 서버의
성능을 십분 발휘하는 데 커다란 걸림돌이 되곤 한다.
IBM MicroLatency 기능을 갖춘 IBM FlashSystem
기술은 I/O 대기 시간을 디스크와 비교하여 몇 분의 일
수준으로 단축하므로 애플리케이션의 응답 시간이 획
기적으로 향상될 때가 많다.
IBM FlashSystem 기술은 대부분의 애플리케이션에
서 필요한 수준을 능가하는 IOPS(I/O Operations Per
Second) 용량을 제공한다. 이와 같은 성능 확장성 덕분
에 스토리지를 통합하려는 경우, 하나의 이미지에 여러
애플리케이션이 있는 경우 또는 단일 서버나 여러 대의
서버에 걸쳐있는 다수의 가상 머신에서 애플리케이션을
실행하는 경우에 효과적인 기술이다.
데이터 센터에서 스토리지 공간을 줄이고 전력 및 냉
각 비용을 낮추면서 스토리지 성능을 높이길 원한다면,
I/O 밀도, 용량(최대 40TB RAID5), 에너지 및 설치 공
간 절감 효과를 고려할 때 IBM FlashSystem 기술이 2U
폼 팩터에서 뛰어난 효율성을 실현한다. 전력 소비와 냉
각 비용을 줄일 뿐 아니라 스토리지 성능 관련 기능을 강
화하므로 데이터 센터의 무분별한 확장(sprawl) 현상을
해결하는 데도 더없이 효과적인 솔루션이다.
응답 시간과 IOPS의 중요성
플래시 제품 소개에서 보통 IOPS 또는 응답 시간을
강조하는데, 사실 이 두 가지는 밀접하게 연관되어 있
다. 응답 시간은 하나의 I/O를 처리하는 데 걸리는 시간
이며, I/O가 빨리 처리될수록 더 많은 작업이 수행된다.
그리고 IOPS는 시스템의 처리 속도 또는 처리량을 측
정하는 척도이다.
큐잉(Queuing) 원칙에 따르면, 큐에 있는 항목 수(Q)
를 항목당 평균 시간(t)으로 나누면 시스템의 처리 속도
가 나온다(Q/t = 처리량). 예를 들어, 큐의 깊이가 20이
고 응답 시간이 5밀리초라면 4,000IOPS가 된다. 시스
템에서 스토리지에 작업을 전송하는 속도가 고정되어
있다면 가장 중요한 변수는 응답 시간이다. 앞의 예에서
큐는 변화가 없지만 응답 시간이 100마이크로초로 단
축되면 처리 속도는 200,000IOPS로 향상된다.
따라서 시스템에서 I/O 처리에 상당한 시간을 보낸다
고 가정하면, I/O 응답 시간을 낮춰 애플리케이션 성능
에 가장 큰 영향을 줄 수 있다. MicroLatency 기능을 갖
춘 IBM FlashSystem 기술은 업계 최고 수준의 응답 시
간을 실현하도록 설계되었다. 어떤 프로세스에서 데이
터를 기다리는 시간이 단축되면 프로세스 성능이 수동
으로 튜닝했을 때보다 더 빨라질 수 있다. 개발 팀이 성
능 튜닝보다 신규 소프트웨어 배포에 주력할 수 있다면
좋지 않을까?
물론 IOPS 기능 자체도 여전히 중요하다. 대부분의 애
플리케이션에서는 IBM FlashSystem의 처리 확장성이 한
계에 이르지 않겠지만, 수요가 증가하거나 가상화 또는
스토리지 중앙화에 의한 통합을 지원할 경우에 대비하여
넉넉한 IOPS 성능까지 보장된다면 더욱 좋을 것이다.
모든 지표가 동등한 건 아니다
제조사들은 제품 기능의 한계치를 제공하는데, 사용자
가 그 의미를 제대로 알고 있어야 한다. 일반적으로 플래
시 제품에 표시되는 응답 시간 수치는 단일 I/O 작업 또는
큐 깊이가 1인 경우를 기준으로 하는데, 실제 환경 대부
분은 큐 깊이가 5 ~ 20이다. 여기서 큐 깊이 1을 기준으
로 하는 것은 최상 조건의 응답 시간이 단일 I/O 작업에서
측정되기 때문이며, 이 기본적인 능력에 기초하여 큐 깊
이가 1보다 큰 경우의 성능이 결정된다.
그런데 모든 스토리지 제품은 IOPS 성능 향상과 함께
응답 시간도 증가하기 마련이기 때문에 IOPS 성능이 향
상되어도 응답 시간이 길어지지 않도록 설계할 필요가
있다. 그리고 IBM FlashSystem 설계의 장점은 IOPS성
능이 향상되더라도 응답 시간을 상당 구간에서 낮은 수
준으로 유지하면서 일관성 있고 예측 가능한 성능을 제
공하는 데 있다.
플래시가 가장 뛰어난 성능을 제공하는 I/O 작업은
읽기 작업이다. 플래시는 무작위 읽기가 100%일 때 최
고의 처리량(IOPS)을, 순차적 읽기가 100%일 때 최고
의 대역폭(초당 기가바이트)을 제공한다. 게다가 IBM
FlashSystem 기술은 무작위 및 순차적 쓰기 성능도 뛰
어나다. 실제로 쓰기 관리 오버헤드가 발생할 때까지는
읽기보다 짧은 응답 시간으로 무작위 쓰기를 수행할 수
있다(모든 플래시 제품은 가비지 컬렉션을 해결해야 한
다). 현실적으로 어떤 작업 유형이 100%를 차지하는 워
크로드는 드물며, 실제 환경에서는 해당 제품이 복합 워
크로드를 어떻게 처리하고 평균 응답 시간을 낮은 수준
으로 유지하면서 얼마나 버틸 수 있느냐가 중요하다.
소프트웨어 관련 참고 사항
시스템 솔루션은 하드웨어와 소프트웨어의 통합체이
므로, 소프트웨어가 솔루션의 성능과 IBM FlashSystem
기술의 활용 가능 범위를 좌우하는 것도 당연하다. 소
프트웨어 동작이 어떻게 IBM FlashSystem 기술을 보
완할 수 있는가에 대해서는 본 기사 마지막 부분에 있
는 별도의 박스기사 ‘애플리케이션/구현 환경에서 IBM
FlashSystem으로 얻는 이점을 알아보기 위한 5가지 질
문’에서 확인할 수 있다. 다양한 애플리케이션과 미들웨
어에서 IBM FlashSystem으로 큰 효과를 볼 수 있지만,
성능과 확장성을 염두에 두고 신중하게 설계된 소프트
웨어는 IBM FlashSystem 기술의 가치를 최대한 누릴 수
있도록 해준다. 예를 들면, 다음과 같다.
컴퓨터 시스템의 구성 요소에서 일부의 성능이 향상되면 애플리케이션의 성능도 더 좋아질
것으로 기대하게 된다. 그러나 최신 시스템 솔루션은 하드웨어와 소프트웨어의 정교한 통
합체이기 때문에 성능을 제약하는 요인이 아닌 구성 요소를 업그레이드할 경우 성능 향
상에 도움이 되지 않을 것이다. 따라서 어떤 신기술이든 그것을 최대한 활용하기 위해서는 환경의 어
느 부분이 성능을 제약하는지 알아낼 필요가 있다.
• IBM FlashSystem 기술은 IBM DB2를 비롯하여 현
재 출시된 주요 데이터베이스 제품 대부분을 가속화
하는 용도로 널리 사용되고 있다.
• IBM InfoSphere Identity Insights는 더 신속한 범
죄 예측 및 예방을 위해 최적화된 지능적 인식 알고리
즘을 갖춘 고급 엔티티 분석 소프트웨어 솔루션이다.
이 솔루션은 전체 정보 환경을 실시간으로 마이닝하
면서 동일 인물 또는 집단과 관련된 모든 연관 관계와
사건을 밝혀낸다. 의심스러운 상황이나 패턴이 발견
되면 사전 예방적으로 경고를 발효한다. 이 솔루션을
IBM FlashSystem 기술과 함께 사용한 결과, 디스크
를 사용할 때보다 성능이 100배 향상되었고 랙 공간
은 1/24로 줄었다.
• IBM Tealeaf 제품은 항공기의 블랙박스처럼 실제 사
용자의 관점에서 웹 사이트의 상호 작용을 기록한
다. Tealeaf는 미션 크리티컬 웹 사이트를 모니터링하
면서 매일 테라바이트 단위의 데이터를 수집하고 실
시간으로 분석하는 경우가 많다. IBM FlashSystem
이 등장하기 전에 디스크를 사용하던 Tealeaf 고객들
은 심각한 I/O 제약을 겪어야 했다. “손쉽게 처리 속도
를 2배 높였고, 시스템은 어떤 부하 상태에서도 훨씬
더 신속하게 쿼리를 수행할 수 있게 되었습니다.” 라
www.ibmitinsight.com03 BIG DATA
더 이상 I/O 제약은 없다
IBM FlashSystem 기술은 애플리케이션을 가속화하
고 스토리지 통합을 현실화하며 설치 공간을 줄이고 전
력 및 냉각 비용을 감축하면서 비즈니스 환경에 획기적
인 변화를 가져온다. 또한 기존 SAN 환경에서 손쉽게
구현할 수 있다. IBM FlashSystem 기술은 일관성, 예측
가능성, 우수한 확장성, 짧은 응답 시간을 갖춘 업계 최
고의 스토리지 솔루션이 되도록 설계되고 개발되었다.
IT 팀은 IBM FlashSystem 기술을 활용하여 I/O 제약
에서 벗어나 새로운 기능과 기술에 주력할 수 있으며,
경제적인 방식으로 애플리케이션과 데이터 센터 성능
을 획기적으로 향상시킬 수 있다.
고 Tealeaf의 CTO인 Robert Wenig은 말한다. “IBM
FlashSystem 솔루션의 진정한 매력은 코드 변경 없이
강력한 성능을 실현할 수 있다는 것입니다. 정말 탁월
한 장점이죠.”
• IBM General Parallel File System(GPFS)은 짧은 응
답 시간을 필요로 하는 분석, 빠른 속도를 필요로 하
는 백업 복구 및 파일 수집(Ingest) 그리고 데이터 워
크플로우를 최적화하여 비즈니스 프로세스의 성능
을 높이는 작업 등에 활용된다. 클러스터 파일 시스템
인 GPFS가 IBM FlashSystem과 만나면 다음과 같이
세 가지 측면에서 그 장점이 배가된다.
• IBM ProtecTIER 인라인 중복 제거 기술은 중복된
데이터를 줄이거나 없애 어떤 규모의 기업도 더 효
율적으로 데이터를 보호하고 급증하는 신규 데이터
를 관리할 수 있게 한다. IBM FlashSystem 솔루션과
ProtecTIER 기술을 함께 사용함으로써 기업용 플래
시 스토리지 성능을 실현할 뿐 아니라 효율적이고 빠
르며 안정적인 백업/복구 시스템을 구축할 수 있다.
ProtecTIER와 IBM FlashSystem에 관한 최근 연구 조
사에 따르면, ProtecTIER와 디스크를 함께 사용할 경
우와 비교하여 다음과 같은 3가지 장점이 있다.
1 파일 내용의 크기와 범위가 확대됨에 따라 메
타데이터의 크기도 증가하므로 메타데이터
작업이 전반적인 성능을 부분적으로 좌우한다. 메
타데이터 저장/검색에 IBM FlashSystem 기술을
활용하면 클러스터 기반의 어떤 애플리케이션도 가
속화할 수 있다.
2 GPFS는 투명한 방식으로 다른 스토리지 계층
에 파일을 마이그레이션하도록 지원한다. 사용
자는 GPFS의 정책 엔진을 사용하여 I/O 작업량이 많
은 일부 파일을 IBM FlashSystem에서 전담하게 하고
자주 액세스하지 않은 대용량 파일은 계속 디스크 또
는 테이프에서 처리할 수 있다.
3 IBM FlashSystem 기술을 데이터 저장소로 사
용하면 예측 가능하고 일관성 있는 성능과 짧
은 응답 시간을 실현하여 GPFS를 사용하는 가장 까
다로운 애플리케이션의 요구 사항도 충족할 수 있다.
1 백업 및 복원에서 비용대비성능이 최대
50% 향상된다.
2 IBM FlashSystem 솔루션은 디스크에 비
해 랙 사용 공간이 1/18 수준이다.
3 전력 소비가 크게 줄어든다.
플래시는 무작위 읽기가
100%일 때 최고 처리량을,
순차적 읽기가
100%일 때 최고 대역폭을 제공할 수 있다.
IBM FlashSystem과
InfoSphere Identity Insights를
함께 사용한 결과,
디스크를 사용할 때와 비교하여 성능이
100x 향상되고, 랙 공간이
1/24 로 줄었다.
IBM FlashSystem과 ProtecTIER를
함께 사용한 결과,
디스크를 사용할 때와 비교하여
가격 및 성능이
50% 향상되고, 랙 공간이
1/18
로 줄었으며 에너지 사용량도
크게 감축되었다.
애플리케이션/구현 환경에서 IBM FlashSystem으로 얻는 이점을 알아보기 위한 5가지 핵심 질문
IBM FlashSystem 기술을 도입한 기업은 큰
효과를 거둘 수 있다. 이 기술이 어떤 환경에
적합한지 판단하는 데 다음 5가지 질문이
도움이 될 것이다.
애플리케이션에서 I/O 대기 시간이 긴 편인
가 또는 성능 문제를 해결하려면 (쇼트 스트
로킹(short-stroking) 하드디스크 드라이브와 같
은) 고비용의 완화 조치가 필요한가?
애플리케이션에서 엄격한 응답 시간 요구 사
항을 충족해야 하는가? 응답 시간에 민감
한 애플리케이션이라면 IBM FlashSystem 기술의
MicroLatency 기능이 효과적일 수 있다.
무작위 I/O와 순차적 I/O의 비중이 각각 얼
마나 되는가? 무작위 I/O는 디스크 기반 시
스템에 더 큰 부담으로 작용하지만, IBM FlashSys-
tem에서는 이 문제가 손쉽게 해결된다.
해당 애플리케이션 환경에서 몇 개의 스레
드가 I/O를 수행하는가? 이 값이 높을수록
MicroLatency 기술과 IBM FlashSystem의 뛰어
난 처리 확장성이 진가를 발휘한다.
애플리케이션이 수익과 직결되는가 또는
사용자 시간을 중요시하는 다수의 내부
고객을 애플리케이션에서 지원하는가? 이러한
경우에 IBM FlashSystem 기술의 도입으로 경
쟁력을 크게 강화할 수 있다.
1
2
3
4
5
더 자세한 정보는 여기에서!
플래시를 이용한 똑똑하고 더 빠른 통찰력 이용
http://www-903.ibm.com/edm/J1409/0925_hdp/FlashSystemInsight.pdf
더욱 진화된 고객 경험을 실현하는 고속 분석(High Velocity Analytics Take the Customer Experience to the Next Level: IBM FlashSystem과 IBM Tealeaf)
theedison.com/pdf/samples_IBM_FlashSystem_Tealeaf_WP.pdf
똑똑한 데이터 센터에서 플래시의 성능을
활용하여 정보를 보호하기(Protecting Information in a Smarter Data Center with the Performance of Flash: IBM FlashSystem과 IBM ProtecTIER)
theedison.com/pdf/samples_IBM_FlashSystem_ProtecTIER_WP.pdf