중국의 슈퍼컴퓨터 연구개발

13
중국의 슈퍼컴퓨터 연구개발 국가슈퍼컴퓨팅연구소 한국과학기술정보연구원

Upload: lee-jysoo

Post on 10-Jul-2015

410 views

Category:

Technology


3 download

DESCRIPTION

최근 두각을 나타내고 있는 중국의 슈퍼컴퓨터 연구개발 역사 및 현황에 대한 간단한 소개.

TRANSCRIPT

Page 1: 중국의 슈퍼컴퓨터 연구개발

중국의 슈퍼컴퓨터 연구개발

이 지 수

국가슈퍼컴퓨팅연구소

한국과학기술정보연구원

Page 2: 중국의 슈퍼컴퓨터 연구개발

Contents 슈퍼컴시스템

핵심기술

산업체육성

평가

2

Page 3: 중국의 슈퍼컴퓨터 연구개발

슈퍼컴 시스템 (1/3)

3

▣ 1980~1995

Galaxy I & II (1983, 1992)

100MFLOPS, 1GFLOPS

Vector 형

자체개발 (NUDT)

Galaxy I

Computer 757 (1983)

10MFLOPS

Vector 형

자체개발 (CAS ICT)

Global Standard

•1964: 1MF

• 1968: 10MF

• 1975: 100MF

• 1987: 1GF

• 1992: 10GF

• 1993: 100GF

• 1997: 1TF

• 2000: 10TF

• 2004: 100TF

• 2008: 1PF

• 2013: 10PF

Page 4: 중국의 슈퍼컴퓨터 연구개발

슈퍼컴 시스템 (2/3)

4

▣ 1996~2005

Global Standard

•1964: 1MF

• 1968: 10MF

• 1975: 100MF

• 1987: 1GF

• 1992: 10GF

• 1993: 100GF

• 1997: 1TF

• 2000: 10TF

• 2004: 100TF

• 2008: 1PF

• 2013: 10PF

Sunway I (1999)

384GF, DEC

자체구축 (JICT)

Dawning Series

1000 (2GF, 1995, Intel)

2000 (20GF, 1998, Motorola)

3000 (400GF, 2000, IBM)

4000 (11TF, 2004, AMD)

자체구축 (Dawning & CAS ICT)

Dawning 4000A

Page 5: 중국의 슈퍼컴퓨터 연구개발

슈퍼컴 시스템 (3/3)

5

▣ 2006~

Global Standard

•1964: 1MF

• 1968: 10MF

• 1975: 100MF

• 1987: 1GF

• 1992: 10GF

• 1993: 100GF

• 1997: 1TF

• 2000: 10TF

• 2004: 100TF

• 2008: 1PF

• 2013: 10PF

TFLOPS System

Dawning 5000 (230TF, 2008, AMD)

Lenovo Deepcomp 7000 (160TF, 2008, Intel)

PFLOPS System

Dawning Nebulae (3PF, 2010, Intel & Nvidia)

Tianhe-1A (4.7PF, 2010, Intel & Nvidia)

Tianhe-1A

Page 6: 중국의 슈퍼컴퓨터 연구개발

핵심기술 (1/2)

6

▣ Tianhe-1A의 사례

Arch Interconnect

Bi-directional bandwidth: 160Gbps

Single-hop latency: 1.57 micro-second

NRC interconnect switch, NIC interface chip

FeiTeng-1000 Stream processor (SPARC-based)

System Software & Tools

Kylin Linux: parallel program optimization,

power management, resource management

Hybrid programming infrastructure: parallel

system support, parallel algorithm, application

interface layers

Flexible service environment: Eclipse-based

development environment

Page 7: 중국의 슈퍼컴퓨터 연구개발

핵심기술 (2/2)

7

▣ CPU 개발

Godson Processor (MIPS-based)

Godson 1 (2002)

Godson 2 B/C/E/F/G/H (2003~2011)

Godson 3 A/B (4/8 Core, 2009~2011)

CAS ICT, Dawning 공동개발

Dawning 6000에 활용

Shenwei Processor (Alpha-based)

SW-1 (Single core, 2006)

SW-2 (Dual core, 2008)

SW-3 (16 Core, 2010)

JCRL에서 개발, 중국정부가 IP 소유

Sunway Bluelight에 활용 (SW1600)

Feiteng (SPARC-based), …

Page 8: 중국의 슈퍼컴퓨터 연구개발

산업체 육성

8

▣ 대표기업

Dawning (36%)

창립: 1995

CAS ICT 3백만불 투자 (by IP)

중국 대표적 HPC 기업

매출의 5%를 R&D에 투자

연구개발인력 30명

Lenovo (1%) 직원: 27,000, 연매출: 3백억불

HPC 사업개시: 2001

시스템: CAS CNIC

비교: IBM (33%), HP (11%)

Inspur (12%)

직원: 5000, 연매출: 55억불

미국 등 R&D 센터 운영

점유율: China HPC Top100 (2012) 기준

Page 9: 중국의 슈퍼컴퓨터 연구개발

성능 이론성능: 54.89 PFLOPS

CPU: 6.75 PFLOPS (2.2 GHz x 8 FLOPS x

12 core x 2 socket x 2 node x 16 board x 4

frame x 125 cabinet)

Phi: 48.14 PFLOPS (1.1GHz x 4 FLOPS x

4 thread x 57 core x 3 socket x 2 node x 16

board x 4 frame x 125 cabinet)

실측성능: 33.9 PFLOPS

Tianhe-2 (1/3)

9

▣ 시스템 사양

계산노드

1 노드: 2 Intel Ivy Bridge CPU + 3 Xeon Phi

1 보드: 2 노드

1 프레임: 16 보드

1 캐비닛: : 4 프레임

시스템: 125 캐비닛

32000 CPU + 48000 Phi

전력: 17.5 MW, 소요면적: 218 평

Page 10: 중국의 슈퍼컴퓨터 연구개발

Tianhe-2 (2/3)

10 Slide from Lu (NUDT)

Page 11: 중국의 슈퍼컴퓨터 연구개발

Software OS: Kylin Linux

OpenMC for heterogeneous programming

Tianhe-2 (3/3)

11

▣ 핵심기술

Interconnect

TH Express 2

Broadcast bandwidth: 6.36 GB/s, latency 9 nano-second

NRC: 2.56 Tbps, 90 nm feature

NIC: PCI-G2 16X, 90 nm feature

Stream Processor FeiTeng-1500

SPARCv9 based, 16 core, 1.8 GHz

성능: 144 GFLOPS

Page 12: 중국의 슈퍼컴퓨터 연구개발

평가

12

▣ Good

30+년간 일관된 정책

세계수준의 슈퍼컴퓨터 시스템 구축

국내 슈퍼컴퓨팅 산업기반 확립

슈퍼컴퓨팅 연구개발 생태계 확립: 학-연-산

▣ Bad

제한적 하드웨어 핵심기술 확보

• “Never to lead, but follow”

활용 및 시스템 소프트웨어 역량 미흡

• 소프트웨어 투자 예산 전체의 10% (cf. 30% of US)

슈퍼컴퓨터 사용자그룹 미성숙

Page 13: 중국의 슈퍼컴퓨터 연구개발

13