healthcare data 익명화 개념 및 사례

72

Upload: soo-yong-shin

Post on 07-Jan-2017

452 views

Category:

Healthcare


0 download

TRANSCRIPT

Page 1: Healthcare Data 익명화 개념 및 사례
Page 2: Healthcare Data 익명화 개념 및 사례

Ⅰ 의료 정보 보호/보안과 관련된 법률들

Ⅱ 익명화

Ⅲ ABLE 소개

Page 4: Healthcare Data 익명화 개념 및 사례

?

Page 5: Healthcare Data 익명화 개념 및 사례

개인정보

• 살아 있는 개인에 관한

정보로서 성명, 주민등

록번호 및 영상 등을 통

하여 개인을 알아볼 수

있는 정보

• 해당 정보만으로는 특정

개인을 알아볼 수 없더

라도 다른 정보와 쉽게

결합하여 알아볼 수 있

는 것을 포함

민감정보

• 사상/신념, 노동조합/정

당의 가입/탈퇴, 정치적

견해, 건강, 성생활 등에

관한 정보

• 유전자검사 등의 결과로

얻어진 유전정보나 범죄

경력자료에 해당하는 자

고유식별정보

• 개인을 고유하게 구별하

기 위하여 부여된 식별

정보로 다음의 어느 하

나에 해당하는 정보

• 주민등록번호

• 여권번호

• 운전면허번호

• 외국인등록번호

Page 6: Healthcare Data 익명화 개념 및 사례

Page 7: Healthcare Data 익명화 개념 및 사례

개인정보 보호법

•2011년 9월 30일 시행

•2014년 8월 7일 개정안 시행

•개인정보 이용 제한

•제18조 2항 “통계작성 및 학술연구 등의 목적을 위하여 필요

한 경우로서 특정 개인을 알아볼 수 없는 형태로 개인정보를

제공하는 경우” 예외로 인정

•제24조 고유식별정보* 사용 원칙적 금지

• 제24조 2항 고유식별정보 중 주민등록번호는 다음의 경우를

제외하고는 처리 금지

•법령에서 구체적으로 주민등록번호의 처리를 요구 또는 허

용한 경우 (예: 의료법)

•정보주체 또는 제3자의 급박한 생명, 신체, 재산의 이익을 위

한 경우

•안전행정부장관이 고시하는 경우

•보유하고 있는 주민등록번호는 법령에 구체적인 근거가 없는

경우 법 시행 후 2년 이내 파기 (’16년 8월까지 파기)

생명윤리 및 안전에 관한 법률

•2015년 12월 29일 일부개정안 시행

•개인정보 이용 제한

•제18조, 제38조, 제43조: 연구를 위해서 반드시 개별 동의를

받거나 또는 익명화 처리를 하여 기관위원회의 심의를 받아

야 함

•인간대상연구

•사람을 대상으로 물리적으로 개입하는 연구

•설문조사, 행동관찰 등으로 자료를 얻는 연구

•개인을 식별할 수 있는 정보를 이용하는 연구

•인체유래물연구

* 고유식별정보: 주민등록번호, 외국인등록번호, 여권번호, 운전면허번호

Page 8: Healthcare Data 익명화 개념 및 사례
Page 9: Healthcare Data 익명화 개념 및 사례
Page 11: Healthcare Data 익명화 개념 및 사례
Page 12: Healthcare Data 익명화 개념 및 사례
Page 13: Healthcare Data 익명화 개념 및 사례

Ⅰ 의료 정보 보호/보안과 관련된 법률들

Ⅱ 익명화

Ⅲ ABLE 소개

Page 14: Healthcare Data 익명화 개념 및 사례

Page 15: Healthcare Data 익명화 개념 및 사례
Page 16: Healthcare Data 익명화 개념 및 사례

Page 19: Healthcare Data 익명화 개념 및 사례

Page 20: Healthcare Data 익명화 개념 및 사례
Page 21: Healthcare Data 익명화 개념 및 사례
Page 22: Healthcare Data 익명화 개념 및 사례
Page 23: Healthcare Data 익명화 개념 및 사례

Variables

Rare diagnoses*

Uncommon procedures

Some occupations (e.g. tennis professional)

Certain recessive traits uncharacteristic of the population

in the information resources

Distinct deformities

Page 24: Healthcare Data 익명화 개념 및 사례
Page 25: Healthcare Data 익명화 개념 및 사례

Page 26: Healthcare Data 익명화 개념 및 사례
Page 27: Healthcare Data 익명화 개념 및 사례
Page 30: Healthcare Data 익명화 개념 및 사례

(excluding physician’s name)

Page 31: Healthcare Data 익명화 개념 및 사례

http://privacyruleandresearch.nih.gov/pr_08.asp

Page 32: Healthcare Data 익명화 개념 및 사례
Page 33: Healthcare Data 익명화 개념 및 사례
Page 34: Healthcare Data 익명화 개념 및 사례
Page 35: Healthcare Data 익명화 개념 및 사례

Page 36: Healthcare Data 익명화 개념 및 사례
Page 37: Healthcare Data 익명화 개념 및 사례

Page 38: Healthcare Data 익명화 개념 및 사례

혹은 익명화를 하더라도 상업적 목적은 불가

Page 41: Healthcare Data 익명화 개념 및 사례

Ⅰ 의료 정보 보호/보안과 관련된 법률들

Ⅱ 익명화

Ⅲ ABLE 소개

Page 42: Healthcare Data 익명화 개념 및 사례
Page 43: Healthcare Data 익명화 개념 및 사례
Page 44: Healthcare Data 익명화 개념 및 사례
Page 45: Healthcare Data 익명화 개념 및 사례

Structured data Non-structured

data

Page 46: Healthcare Data 익명화 개념 및 사례

성능 점검 방법

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4278030/

Page 47: Healthcare Data 익명화 개념 및 사례

Patterns of identifiers Rules Examples

Names

홍길동님은 ⇒ 이름:****님은

Name of patient (1) Exact match using list of patients

Relatives of patient (2) Exact match using list of relatives of physicians and employees. If found, remove the physicians or employees name.

Addresses

현주소: 서울 송파구 … ⇒ 주소:**********

8 provinces + gun (county) (3) (강원|경기|경상|전라|제주|충청).*군.*[읍면리로].*\d

8 provinces + si (city) (4) (강원|경기|경상|전라|제주|충청).*시.*[동면리로].*\d

6 metropolitan cities & 1 special city (5) (울산|인천|대구|부산|서울|대전|광주).*구.*[동로길].*\d

Phone numbers

keywords +(: or space) + numbers

(6) (전.*화.*)[0-9]{2,3}[\:\s\;-][0-9]{3,4}[\:\s\;-][0-9]{4}

Tel: 010-1234-5678 ⇒ 전화:***-***-***

(7) (TEL.*|Tel.*|tel.*)[0-9]{2,3}[\:\s\;-][0-9]{3,4} [\:\s\;-][0-9]{4}

(8) (HP|Hp|hp|H.P|H.p|h.p).*[0-9]{2,3}[\:\s\;-][0-9]{3,4} [\:\s\;-][0-9]{4}

(9) .*폰.*[0-9]{2,3}[\:\s\;-][0-9]{3,4}[\:\s\;-][0-9]{4}

(10) \d{2,3}[-.\s]\d{3,4}[-.\s]\d{4}

(11) 팩.*스.*[0-9]{2,3}.*[0-9]{2,4}.*[0-9] ⇒ 팩스:***-***-***

(12) (FAX|fax|Fax).*[0-9]{2,3}.*[0-9]{2,4}.*[0-9]

Patient IDs (13) (등록번호|등록 번호|환자번호|환자 번호|환자 정보| ID|id|IDNO|idno|NO|No|Baby|baby|기증자|수혜자| Donor|donor|Recipient|recepient)\D{0,5}\d{8}

등록번호: 12345678 ⇒ 등록번호:********

Birth dates

(14) (생.*일|birth|BIRTH|Birth).*\d{2,4} [;:#%\s]*\d{1,2} [;:#%\s] *\d{1,2} [;:#%\s] (15) 출.*생.*\d{2,4}[;:#%/\s.]*\d{1,2}[;:#%/\s.] *\d{1,2}[;:#%\s]

생년월일: 44.5.25

⇒ 생년월일:44.5.***

Page 48: Healthcare Data 익명화 개념 및 사례

총 기록지 개수 6,039

총 기록지 종류 20종 (응급 6/입원 11/외래 3)

총 개인식별 정보 개수 1862 (0.31 개/기록지)

정확도1) 99.08%

민감도2) 98.66%

1) PHI라고 제거한 정보 중 정확하게 지워진 비율 2) 제거대상 PHI 중 실제로 지워진 비율

Page 49: Healthcare Data 익명화 개념 및 사례

총 기록지 개수1) 5,000

총 기록지 종류 33종 (응급 7/입원 15/외래 11)

총 개인식별 정보 개수 773 (0.15 개/기록지)

정확도 99.87%

민감도 96.25%

1) 각 기록지의 저장된 정보의 양에 따라 일정 비율로 추출

Page 50: Healthcare Data 익명화 개념 및 사례

Automatic de-identification systems (2012년 Cincinnati Children's Hospital Medical Center Paper)

Name Document Types PHI Precision Recall

MIST1

22 note types (incl. ER, OR, inpatient, outpatient)

3503 clinical notes

18 PHIs

92.05 91.02

MIST2 92.79 92.81

MCRF1 95.25 89.86

MCRF2 95.08 91.92

Human Annotator 1

22 note types, 10% of 3503 clinical notes

93.95 92.15

Human Annotator 2 88.45 94.55

MCRF2 95.73 92.91

Page 51: Healthcare Data 익명화 개념 및 사례

ABLE: Asan BiomedicaL research Environment

Page 52: Healthcare Data 익명화 개념 및 사례

ABLE Statistics (as of November 2015)

4M+ Total registered patients

743M+ Total orders

221M+ Total medications

960M+ Total lab results

464M+ Total clinical notes

25M+ Total images (DICOM)

Page 53: Healthcare Data 익명화 개념 및 사례

AMIS CIS ABLE

1 • AMIS ID 보유

2 • GCP 교육 이수 후 eIRB 등록/승인

3 • ABLE 사용 교육 이수 후 서약서 제출

Page 54: Healthcare Data 익명화 개념 및 사례
Page 55: Healthcare Data 익명화 개념 및 사례
Page 56: Healthcare Data 익명화 개념 및 사례

기본 검색 항목

상세 검색 항목

Inclusion 조건

Exclusion 조건

모수 확인 (몇 명의 환자가 해당 되는가?)

조회 결과

Page 57: Healthcare Data 익명화 개념 및 사례

코드값 선택

처방 코드로 조회

Page 58: Healthcare Data 익명화 개념 및 사례

검색 결과 (환자 수만 제공)

Page 59: Healthcare Data 익명화 개념 및 사례
Page 60: Healthcare Data 익명화 개념 및 사례

조회 결과 선택시 차트리뷰 팝업

차트 리뷰 후 연구대상포함, 연구대상제외, 연구대상 확인 선택

Page 61: Healthcare Data 익명화 개념 및 사례

개인식별정보 제거

필요한 모든 항목 조회 가능 연구용 번호

Page 62: Healthcare Data 익명화 개념 및 사례

개인식별정보 제거

CT, MR, PET, 초음파, 내시경, 핵의학, X-Ray, 투시조영 등

Page 63: Healthcare Data 익명화 개념 및 사례

Cohort 검색 시스템에서 선정한 연구군 연결

추출하고 싶은 항목 추가

Page 64: Healthcare Data 익명화 개념 및 사례

자료추출 시스템

Text로 입력된 검사결과, EMR 기록의 특정 키워드 검색

(Brain meta)

구조화된 EMR 서식 및 병리구조화 결과 추출 (등록번호 대신 연구ID로 제공)

Page 65: Healthcare Data 익명화 개념 및 사례

IRB 연계 화면

Page 66: Healthcare Data 익명화 개념 및 사례

엑셀로 저장 가능

Page 67: Healthcare Data 익명화 개념 및 사례

연구자 개인의 Excel 파일을 UPLOAD하여 다른 임상정보 추출

개인 Excel 자료 Upload

Page 68: Healthcare Data 익명화 개념 및 사례
Page 69: Healthcare Data 익명화 개념 및 사례

Routine Validation of Performance

• Regular validation should be required.

• We validate de-identification performance of ABLE annually.

• And update the regular expression rules.

Page 70: Healthcare Data 익명화 개념 및 사례

• 대상

– 2014년 9월 한달 동안 익명 chart review 대상이 된 기록지

– 18종(외래 2, 응급실 5, 입원 11) 1,275개 서식지

• 방법

– Honest broker(간호사)가 익명화 결과를 EMR

차트를 확인하여 검증

Page 71: Healthcare Data 익명화 개념 및 사례

총 기록지 개수1) 1,275

총 기록지 종류 18종 (응급 5/입원 11/외래 2)

총 개인식별 정보 개수 195 (1.17 개/기록지)

정확도2) 69.93%

민감도 71.81%

1) 2014년 9월 한달 동안 익명 chart review 대상이 된 기록지 2) Honest broker(간호사)가 익명화 결과를 EMR 차트를 확인하여

검증

Page 72: Healthcare Data 익명화 개념 및 사례

[email protected]

@likesky3