플래시 시스템, 성능의 제약을 속도로 초월하다 › edm › j1410 › 1030_hdp ›...

3
www.ibmitinsight.com 01 BIG DATA 플래시 시스템, 성능의 제약을 속도로 초월하다 IBM FlashSystem, 스토리지와 애플리케이션의 성능 문제 해결해

Upload: others

Post on 28-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 플래시 시스템, 성능의 제약을 속도로 초월하다 › edm › J1410 › 1030_hdp › FlashSystem.pdf · 의 대역폭(초당 기가바이트)을 제공한다. 게다가

www.ibmitinsight.com01 BIG DATA

플래시 시스템, 성능의 제약을 속도로 초월하다IBM FlashSystem, 스토리지와 애플리케이션의 성능 문제 해결해

Page 2: 플래시 시스템, 성능의 제약을 속도로 초월하다 › edm › J1410 › 1030_hdp › FlashSystem.pdf · 의 대역폭(초당 기가바이트)을 제공한다. 게다가

www.ibmitinsight.com02 BIG DATA

IBM FlashSystem 기술은 특별히 스토리지와 애플

리케이션 성능 문제를 해결하는 데 초점이 맞춰져 있다.

IT Insight는 IBM FlashSystem 기술의 활용과 관련하여

중점적으로 고려할 사항 및 기업에서 그 가치를 극대화

할 방법에 대해 소개하고자 한다.

플래시의 이점I/O 대기 시간이 솔루션 성능을 저하시키는가? 플

래시 기술은 애플리케이션 가속화의 용도로 가장 많

이 쓰인다. 프로세서 기술의 속도가 기존 스토리지의

속도를 앞질렀고, 그로 인해 I/O 대기 시간이 서버의

성능을 십분 발휘하는 데 커다란 걸림돌이 되곤 한다.

IBM MicroLatency 기능을 갖춘 IBM FlashSystem

기술은 I/O 대기 시간을 디스크와 비교하여 몇 분의 일

수준으로 단축하므로 애플리케이션의 응답 시간이 획

기적으로 향상될 때가 많다.

IBM FlashSystem 기술은 대부분의 애플리케이션에

서 필요한 수준을 능가하는 IOPS(I/O Operations Per

Second) 용량을 제공한다. 이와 같은 성능 확장성 덕분

에 스토리지를 통합하려는 경우, 하나의 이미지에 여러

애플리케이션이 있는 경우 또는 단일 서버나 여러 대의

서버에 걸쳐있는 다수의 가상 머신에서 애플리케이션을

실행하는 경우에 효과적인 기술이다.

데이터 센터에서 스토리지 공간을 줄이고 전력 및 냉

각 비용을 낮추면서 스토리지 성능을 높이길 원한다면,

I/O 밀도, 용량(최대 40TB RAID5), 에너지 및 설치 공

간 절감 효과를 고려할 때 IBM FlashSystem 기술이 2U

폼 팩터에서 뛰어난 효율성을 실현한다. 전력 소비와 냉

각 비용을 줄일 뿐 아니라 스토리지 성능 관련 기능을 강

화하므로 데이터 센터의 무분별한 확장(sprawl) 현상을

해결하는 데도 더없이 효과적인 솔루션이다.

응답 시간과 IOPS의 중요성

플래시 제품 소개에서 보통 IOPS 또는 응답 시간을

강조하는데, 사실 이 두 가지는 밀접하게 연관되어 있

다. 응답 시간은 하나의 I/O를 처리하는 데 걸리는 시간

이며, I/O가 빨리 처리될수록 더 많은 작업이 수행된다.

그리고 IOPS는 시스템의 처리 속도 또는 처리량을 측

정하는 척도이다.

큐잉(Queuing) 원칙에 따르면, 큐에 있는 항목 수(Q)

를 항목당 평균 시간(t)으로 나누면 시스템의 처리 속도

가 나온다(Q/t = 처리량). 예를 들어, 큐의 깊이가 20이

고 응답 시간이 5밀리초라면 4,000IOPS가 된다. 시스

템에서 스토리지에 작업을 전송하는 속도가 고정되어

있다면 가장 중요한 변수는 응답 시간이다. 앞의 예에서

큐는 변화가 없지만 응답 시간이 100마이크로초로 단

축되면 처리 속도는 200,000IOPS로 향상된다.

따라서 시스템에서 I/O 처리에 상당한 시간을 보낸다

고 가정하면, I/O 응답 시간을 낮춰 애플리케이션 성능

에 가장 큰 영향을 줄 수 있다. MicroLatency 기능을 갖

춘 IBM FlashSystem 기술은 업계 최고 수준의 응답 시

간을 실현하도록 설계되었다. 어떤 프로세스에서 데이

터를 기다리는 시간이 단축되면 프로세스 성능이 수동

으로 튜닝했을 때보다 더 빨라질 수 있다. 개발 팀이 성

능 튜닝보다 신규 소프트웨어 배포에 주력할 수 있다면

좋지 않을까?

물론 IOPS 기능 자체도 여전히 중요하다. 대부분의 애

플리케이션에서는 IBM FlashSystem의 처리 확장성이 한

계에 이르지 않겠지만, 수요가 증가하거나 가상화 또는

스토리지 중앙화에 의한 통합을 지원할 경우에 대비하여

넉넉한 IOPS 성능까지 보장된다면 더욱 좋을 것이다.

모든 지표가 동등한 건 아니다

제조사들은 제품 기능의 한계치를 제공하는데, 사용자

가 그 의미를 제대로 알고 있어야 한다. 일반적으로 플래

시 제품에 표시되는 응답 시간 수치는 단일 I/O 작업 또는

큐 깊이가 1인 경우를 기준으로 하는데, 실제 환경 대부

분은 큐 깊이가 5 ~ 20이다. 여기서 큐 깊이 1을 기준으

로 하는 것은 최상 조건의 응답 시간이 단일 I/O 작업에서

측정되기 때문이며, 이 기본적인 능력에 기초하여 큐 깊

이가 1보다 큰 경우의 성능이 결정된다.

그런데 모든 스토리지 제품은 IOPS 성능 향상과 함께

응답 시간도 증가하기 마련이기 때문에 IOPS 성능이 향

상되어도 응답 시간이 길어지지 않도록 설계할 필요가

있다. 그리고 IBM FlashSystem 설계의 장점은 IOPS성

능이 향상되더라도 응답 시간을 상당 구간에서 낮은 수

준으로 유지하면서 일관성 있고 예측 가능한 성능을 제

공하는 데 있다.

플래시가 가장 뛰어난 성능을 제공하는 I/O 작업은

읽기 작업이다. 플래시는 무작위 읽기가 100%일 때 최

고의 처리량(IOPS)을, 순차적 읽기가 100%일 때 최고

의 대역폭(초당 기가바이트)을 제공한다. 게다가 IBM

FlashSystem 기술은 무작위 및 순차적 쓰기 성능도 뛰

어나다. 실제로 쓰기 관리 오버헤드가 발생할 때까지는

읽기보다 짧은 응답 시간으로 무작위 쓰기를 수행할 수

있다(모든 플래시 제품은 가비지 컬렉션을 해결해야 한

다). 현실적으로 어떤 작업 유형이 100%를 차지하는 워

크로드는 드물며, 실제 환경에서는 해당 제품이 복합 워

크로드를 어떻게 처리하고 평균 응답 시간을 낮은 수준

으로 유지하면서 얼마나 버틸 수 있느냐가 중요하다.

소프트웨어 관련 참고 사항

시스템 솔루션은 하드웨어와 소프트웨어의 통합체이

므로, 소프트웨어가 솔루션의 성능과 IBM FlashSystem

기술의 활용 가능 범위를 좌우하는 것도 당연하다. 소

프트웨어 동작이 어떻게 IBM FlashSystem 기술을 보

완할 수 있는가에 대해서는 본 기사 마지막 부분에 있

는 별도의 박스기사 ‘애플리케이션/구현 환경에서 IBM

FlashSystem으로 얻는 이점을 알아보기 위한 5가지 질

문’에서 확인할 수 있다. 다양한 애플리케이션과 미들웨

어에서 IBM FlashSystem으로 큰 효과를 볼 수 있지만,

성능과 확장성을 염두에 두고 신중하게 설계된 소프트

웨어는 IBM FlashSystem 기술의 가치를 최대한 누릴 수

있도록 해준다. 예를 들면, 다음과 같다.

컴퓨터 시스템의 구성 요소에서 일부의 성능이 향상되면 애플리케이션의 성능도 더 좋아질

것으로 기대하게 된다. 그러나 최신 시스템 솔루션은 하드웨어와 소프트웨어의 정교한 통

합체이기 때문에 성능을 제약하는 요인이 아닌 구성 요소를 업그레이드할 경우 성능 향

상에 도움이 되지 않을 것이다. 따라서 어떤 신기술이든 그것을 최대한 활용하기 위해서는 환경의 어

느 부분이 성능을 제약하는지 알아낼 필요가 있다.

• IBM FlashSystem 기술은 IBM DB2를 비롯하여 현

재 출시된 주요 데이터베이스 제품 대부분을 가속화

하는 용도로 널리 사용되고 있다.

• IBM InfoSphere Identity Insights는 더 신속한 범

죄 예측 및 예방을 위해 최적화된 지능적 인식 알고리

즘을 갖춘 고급 엔티티 분석 소프트웨어 솔루션이다.

이 솔루션은 전체 정보 환경을 실시간으로 마이닝하

면서 동일 인물 또는 집단과 관련된 모든 연관 관계와

사건을 밝혀낸다. 의심스러운 상황이나 패턴이 발견

되면 사전 예방적으로 경고를 발효한다. 이 솔루션을

IBM FlashSystem 기술과 함께 사용한 결과, 디스크

를 사용할 때보다 성능이 100배 향상되었고 랙 공간

은 1/24로 줄었다.

• IBM Tealeaf 제품은 항공기의 블랙박스처럼 실제 사

용자의 관점에서 웹 사이트의 상호 작용을 기록한

다. Tealeaf는 미션 크리티컬 웹 사이트를 모니터링하

면서 매일 테라바이트 단위의 데이터를 수집하고 실

시간으로 분석하는 경우가 많다. IBM FlashSystem

이 등장하기 전에 디스크를 사용하던 Tealeaf 고객들

은 심각한 I/O 제약을 겪어야 했다. “손쉽게 처리 속도

를 2배 높였고, 시스템은 어떤 부하 상태에서도 훨씬

더 신속하게 쿼리를 수행할 수 있게 되었습니다.” 라

Page 3: 플래시 시스템, 성능의 제약을 속도로 초월하다 › edm › J1410 › 1030_hdp › FlashSystem.pdf · 의 대역폭(초당 기가바이트)을 제공한다. 게다가

www.ibmitinsight.com03 BIG DATA

더 이상 I/O 제약은 없다

IBM FlashSystem 기술은 애플리케이션을 가속화하

고 스토리지 통합을 현실화하며 설치 공간을 줄이고 전

력 및 냉각 비용을 감축하면서 비즈니스 환경에 획기적

인 변화를 가져온다. 또한 기존 SAN 환경에서 손쉽게

구현할 수 있다. IBM FlashSystem 기술은 일관성, 예측

가능성, 우수한 확장성, 짧은 응답 시간을 갖춘 업계 최

고의 스토리지 솔루션이 되도록 설계되고 개발되었다.

IT 팀은 IBM FlashSystem 기술을 활용하여 I/O 제약

에서 벗어나 새로운 기능과 기술에 주력할 수 있으며,

경제적인 방식으로 애플리케이션과 데이터 센터 성능

을 획기적으로 향상시킬 수 있다.

고 Tealeaf의 CTO인 Robert Wenig은 말한다. “IBM

FlashSystem 솔루션의 진정한 매력은 코드 변경 없이

강력한 성능을 실현할 수 있다는 것입니다. 정말 탁월

한 장점이죠.”

• IBM General Parallel File System(GPFS)은 짧은 응

답 시간을 필요로 하는 분석, 빠른 속도를 필요로 하

는 백업 복구 및 파일 수집(Ingest) 그리고 데이터 워

크플로우를 최적화하여 비즈니스 프로세스의 성능

을 높이는 작업 등에 활용된다. 클러스터 파일 시스템

인 GPFS가 IBM FlashSystem과 만나면 다음과 같이

세 가지 측면에서 그 장점이 배가된다.

• IBM ProtecTIER 인라인 중복 제거 기술은 중복된

데이터를 줄이거나 없애 어떤 규모의 기업도 더 효

율적으로 데이터를 보호하고 급증하는 신규 데이터

를 관리할 수 있게 한다. IBM FlashSystem 솔루션과

ProtecTIER 기술을 함께 사용함으로써 기업용 플래

시 스토리지 성능을 실현할 뿐 아니라 효율적이고 빠

르며 안정적인 백업/복구 시스템을 구축할 수 있다.

ProtecTIER와 IBM FlashSystem에 관한 최근 연구 조

사에 따르면, ProtecTIER와 디스크를 함께 사용할 경

우와 비교하여 다음과 같은 3가지 장점이 있다.

1 파일 내용의 크기와 범위가 확대됨에 따라 메

타데이터의 크기도 증가하므로 메타데이터

작업이 전반적인 성능을 부분적으로 좌우한다. 메

타데이터 저장/검색에 IBM FlashSystem 기술을

활용하면 클러스터 기반의 어떤 애플리케이션도 가

속화할 수 있다.

2 GPFS는 투명한 방식으로 다른 스토리지 계층

에 파일을 마이그레이션하도록 지원한다. 사용

자는 GPFS의 정책 엔진을 사용하여 I/O 작업량이 많

은 일부 파일을 IBM FlashSystem에서 전담하게 하고

자주 액세스하지 않은 대용량 파일은 계속 디스크 또

는 테이프에서 처리할 수 있다.

3 IBM FlashSystem 기술을 데이터 저장소로 사

용하면 예측 가능하고 일관성 있는 성능과 짧

은 응답 시간을 실현하여 GPFS를 사용하는 가장 까

다로운 애플리케이션의 요구 사항도 충족할 수 있다.

1 백업 및 복원에서 비용대비성능이 최대

50% 향상된다.

2 IBM FlashSystem 솔루션은 디스크에 비

해 랙 사용 공간이 1/18 수준이다.

3 전력 소비가 크게 줄어든다.

플래시는 무작위 읽기가

100%일 때 최고 처리량을,

순차적 읽기가

100%일 때 최고 대역폭을 제공할 수 있다.

IBM FlashSystem과

InfoSphere Identity Insights를

함께 사용한 결과,

디스크를 사용할 때와 비교하여 성능이

100x 향상되고, 랙 공간이

1/24 로 줄었다.

IBM FlashSystem과 ProtecTIER를

함께 사용한 결과,

디스크를 사용할 때와 비교하여

가격 및 성능이

50% 향상되고, 랙 공간이

1/18

로 줄었으며 에너지 사용량도

크게 감축되었다.

 

 

애플리케이션/구현 환경에서 IBM FlashSystem으로 얻는 이점을 알아보기 위한 5가지 핵심 질문

IBM FlashSystem 기술을 도입한 기업은 큰

효과를 거둘 수 있다. 이 기술이 어떤 환경에

적합한지 판단하는 데 다음 5가지 질문이

도움이 될 것이다.

애플리케이션에서 I/O 대기 시간이 긴 편인

가 또는 성능 문제를 해결하려면 (쇼트 스트

로킹(short-stroking) 하드디스크 드라이브와 같

은) 고비용의 완화 조치가 필요한가?

애플리케이션에서 엄격한 응답 시간 요구 사

항을 충족해야 하는가? 응답 시간에 민감

한 애플리케이션이라면 IBM FlashSystem 기술의

MicroLatency 기능이 효과적일 수 있다.

무작위 I/O와 순차적 I/O의 비중이 각각 얼

마나 되는가? 무작위 I/O는 디스크 기반 시

스템에 더 큰 부담으로 작용하지만, IBM FlashSys-

tem에서는 이 문제가 손쉽게 해결된다.

해당 애플리케이션 환경에서 몇 개의 스레

드가 I/O를 수행하는가? 이 값이 높을수록

MicroLatency 기술과 IBM FlashSystem의 뛰어

난 처리 확장성이 진가를 발휘한다.

애플리케이션이 수익과 직결되는가 또는

사용자 시간을 중요시하는 다수의 내부

고객을 애플리케이션에서 지원하는가? 이러한

경우에 IBM FlashSystem 기술의 도입으로 경

쟁력을 크게 강화할 수 있다.

1

2

3

4

5

더 자세한 정보는 여기에서!

플래시를 이용한 똑똑하고 더 빠른 통찰력 이용

http://www-903.ibm.com/edm/J1409/0925_hdp/FlashSystemInsight.pdf

더욱 진화된 고객 경험을 실현하는 고속 분석(High Velocity Analytics Take the Customer Experience to the Next Level: IBM FlashSystem과 IBM Tealeaf)

theedison.com/pdf/samples_IBM_FlashSystem_Tealeaf_WP.pdf

똑똑한 데이터 센터에서 플래시의 성능을

활용하여 정보를 보호하기(Protecting Information in a Smarter Data Center with the Performance of Flash: IBM FlashSystem과 IBM ProtecTIER)

theedison.com/pdf/samples_IBM_FlashSystem_ProtecTIER_WP.pdf