disclaimer - s-space.snu.ac.krs-space.snu.ac.kr/bitstream/10371/132775/1/000000039284.pdf ·...
TRANSCRIPT
저 시-비 리- 경 지 2.0 한민
는 아래 조건 르는 경 에 한하여 게
l 저 물 복제, 포, 전송, 전시, 공연 송할 수 습니다.
다 과 같 조건 라야 합니다:
l 하는, 저 물 나 포 경 , 저 물에 적 된 허락조건 명확하게 나타내어야 합니다.
l 저 터 허가를 면 러한 조건들 적 되지 않습니다.
저 에 른 리는 내 에 하여 향 지 않습니다.
것 허락규약(Legal Code) 해하 쉽게 약한 것 니다.
Disclaimer
저 시. 하는 원저 를 시하여야 합니다.
비 리. 하는 저 물 리 목적 할 수 없습니다.
경 지. 하는 저 물 개 , 형 또는 가공할 수 없습니다.
1
학 사 학 논
Legg-Calvè-Perthes 병에 변 외 주
분 법 찰자내 찰자간 신뢰도:
개 분 용
Intra and interobserver reliability of the modified
lateral pillar classification in Legg-Calvè-Perthes
disease: Usefulness of the refined criteria
2015 6 월
울 학 학원
학과 사 과
이 동
2
국
목 : LCP 병에 후 단에 도움이 는 단 후 사진 이용하는 Herring 변
외 주 분 법 재 지도 리 쓰고 있 나, 이 분 법 그간 찰자간 찰
자내 신뢰도가 높지 게 보고 고 있다. 본 연구 주목 자가 고 한 보다 개
분 들 용할 경우, Herring 변 외 주 분 법 신뢰도를 높일 있
는지 평가해 보고자 하는 것이다. 부차 인 목 , 사진 이용하여 후 주
장 이 도도 함께 감 하여 평가하 신뢰도를 높일 있는지도 조사하
고자 하 다.
상 법: 1985 12월부 2012 3월 지 울 소 병원에 내원한 1321명 ,
편 LCP 병 진 분 사 사진이 있는 36 명 를 상 산출
작 추출하 다. 자 증상 시 평균 연 6.8 (범 , 2~9.4) 고, 평균
추시 간 4.4 (범 , 1~12 ) 이었다. 조 내지 분 (fragmentation
stage) 양 고 후 사 사진 명 스태프 명 임
가 평가하 다. 1단계에 는 존 변 외 주 분 를, 2단계에 는 보다 개
자 분 법 한 후 시행한 외 주 분 를, 3단계에 는 사진상
장 이 도 후 주 분 를, 그리고 4단계에 는 후 상 모
를 참고하여 Herring 변 외 주 분 를 각각 소 2주 이상 간격 번
복 평가하 다. 각 단계에 찰자간 찰자 내 신뢰도를 하 해
weighted kappa 값 불일 도를 구하 다.
3
결과: 찰자간 신뢰도(weighted kappa)는 1단계는 0.221~0.805, 2단계는
0.492~0.807, 3단계 장 평가는 0.095~0.843 후 주 평가는 0.194~0.798
이었 며, 4단계 신뢰도는 0.426~0.764 이었다. 조사한 각 단계간 에 ,
찰자내 불일 도는 4단계에 가장 낮 나 통계학 2단계보다 하게 낮
지는 다. 한편, 찰자간 불일 도는 2단계에 가장 낮 고 그 다 4단계
가 낮 나, 그 차이 역시 하지는 다.
결 : Herring 변 외 주 분 는 자 개 분 법 경우, 존 분 법
에 하여 찰자내 신뢰도는 향상 다. 상 경우, 후 사 상
함께 참고하여 평가 한다 하 라도 신뢰도를 향상시키지는 는다.
----------------------------------------------
주요어: 고 , LCP 병, 외 주 분 , 신뢰도
학 번: 2013-21685
4
List of Table
Table 1. Original modified LP classification and the modified LP classification
according to the refined criteria
Table 2. Rater’s agreement on the modified lateral pillar classification according to
the phase of assessment
Table 3. Summary of intraobserver reliability (weighted κ value)
Table 4. Summary of the 1stphase(original modified lateral pillar classification):
intra- and interobserver reliability (κ value)
Table 5. Summary of the2nd phase (modified lateral pillar classification using the
refined criteria: intra- and interobserver reliability (κ value)
Table 6.Summary of the 3rd phase (grading of growth plate involvement): intra-
and interobserver reliability (κ value)
Table 7. Summary of the3rd phase(grading of posterior pillar classification): intra-
and interobserver reliability (κ value)
Table 8. Summary of the 4th phase (modified lateral pillar classification using the
refined criteria plus grading of physeal involvement and posterior pillar
involvement): intra- and interobserver reliability (κ value)
Table 9. Summary of intraobserver reliability (mean and SD of disagreement)
Table 10. Interobserver reliability: (mean and SD of disagreement)
5
List of Figures
Figure 1.Lateral pillar A according to the refined criteria. Lateral pillar height of the
epiphysis is well-maintained. Outer sclerotic margin of the lateral pillar and
subphyseal sclerotic line of the epiphysis are intact. There is little radiolucency
inside the lateral pillar.
Figure 2. Lateral pillar B according to the refined criteria. (1) Lateral pillar height
of the epiphysis is more than 50%. Outer sclerotic margin of the lateral pillar is
intact. There is some radiolucency inside the lateral pillar. (2) Subphyseal sclerotic
line of the epiphysis is preserved.
Figure 3. Lateral pillar B/C border according to the refined criteria. (A) Lateral
pillar height maintained but very narrow pillar (2~3mm): falciform-shaped viable
lateral pillar (arrow). Outer sclerotic margin is distinct. Subphyseal sclerotic line is
disrupted. (B) and (C) Lateral pillar height is at least 50%. There is very little
ossification inside the lateral pillar (arrow). Outer sclerotic margin is indistinct. (D)
Lateral pillar height is exactly 50% of original epiphyseal height. However, there is
mixed sclerosis and radiolucency inside the epiphysis of the lateral pillar. There is
no collapse of central part: lateral pillar is depressed relative to central pillar.
Figure 4. Lateral pillar C according to the refined criteria. Lateral pillar height is
less than 50%, sometimes showing cocked hat deformity (arrow).
Figure 5. Grading of growth plate involvement of the proximal femur. The extent of
involved growth plate was determined according to several factors, i.e. site of
disruption, extent of irregularity, widening, proximal convexity, but seemingly not
associated with metaphyseal cyst location.
Figure 6. Grading of posterior pillar involvement. The posterior pillar classification
assesses 15% to 30% of the femoral epiphysis according to the same criteria as
those of the original lateral pillar classification. In this radiograph, the height of the
posterior column is between 50% and 100% of the original height.
6
목 차
…………………………………………………………………………………….
연구 상 법……………………………………………………………………….
결 과………………………………………………………………………………………
고 찰………………………………………………………………………………………
결 ………………………………………………………………………………………
참고 헌…………………………………………………………………………………….
Abstract……………………………………………………………………………………
7
Legg-Calve-Perthes 병 (이하 LCP 병) 소 에 퇴 골 장 인해
골단 사가 생하는 질 , 이후 자연 해 는 과 에 골
구 변 이 일어나 40~60 이후 조 골 염 일 킬 있다는 에 요한
병이다.1) 그러나 100여 이 병이 처 소개 이후 많 연구가 이루어 에
도 불구하고 직 실한 원인이나 분 법, 료시 , 료 침 등에 하여 상당한
이견이 남 있는 상태이며, 이 인해 상당 부분에 경험 인 료가 이루어지고
있는 실 이다.1-8)
이러한 특 에 하여, LCP 병 질병 이 이 나고 난 뒤 개 가 상 생
하게 다는 주장에 부 부분 경우에 후가 좋지 다는 연구 지 다양
한 견이 어 다. 그러나 한가지 분명한 것 , 체 자 퇴 골 구
변 인해 이차 염 조 이 일어나 그 후가 좋지 특 자
군이 존재한다는 것이다. 라 임상 사에게 이 병 한 후를 단하 한
요소들 내는 것 주 요하며,9) 이에 지 지 LCP 병 후 인자들 규명
하고자 하는 다양한 연구들이 보고 었다.
LCP 병 후에 향 미 있는 인자는 다양한데, 리 료, 보조 , 고고
포함한 보존 료법과 퇴 내 골 , 외 골 , 회 골 골 Salter
골 , Pemberton 골 , 삼 명골 골 , 구 , Chiari 골 등 다
양한 료법 포함한 료 법에 부 별, 병시 연 , 사 학 소견
등 포함하고 있다.6, 10-18) 이 , 사 학 소견에 해 는 역사 몇 가지
사 학 분 법이 개 , 어 는데 Catterall 분 법, Salter-Thompson 분 법
등이 소개 었 나 재는 후 단 사 상만 하는 변 외 주 분
8
(modified lateral pillar classification)가 리 쓰이고 있는 실 이다.19, 20)
라 , LCP 병 진단과 료 법 시 를 결 하 해 리 쓰이는 변 외
주 분 찰자내 찰자간 신뢰도, 그리고 후를 하는 타당도가 높 야 할
것이다. 그러나 실 임상 는, 질병 후가 달라질 있다는 에
요함에도 불구하고, 변 외 주 분 에 있어 B 과 B/C , 그리고 B/C 과 C
구분하는 것이 월 다. 재 지 변 외 주 분 찰자내 찰자간 신뢰도
에 한 보고는 별 없는데, 근 보고에 하면 신뢰도가 높지 다.9)
이에 자는 변 외 주 분 시, 외 주 특 보다 체계 하게 하는 소
견들 모 단 개 하 다. 본 논 주목 보다 개 새 운 단
들 용하여 변 외 주 분 를 할 , 과연 찰자내 찰자간 신뢰도가
높 지는지 보고자 하는 것이다. 부차 인 목 , 사진 이용하여 후 주
장 이 도도 함께 감 하여 평가하 신뢰도를 높일 있는지도 검
증하고자 하 다.
연구 상 법
연구 상
이 연구는 과 사 자료를 이용한 후향 연구이다. 1985 12 월부
2012 3 월 지 울 학 어린이 병원에 LCP 병 진단 고 료를
는 1321 명 이었다. 이들 에 양 고 이 이 나 첫 시에 이미
잔여 에 다다른 경우, 스 이드 료를 거나 감염, 다 골단 이 증, 갑상
능 하증, 당뇨나 그 외 사 질 , 신부 증 등 과거 이 있는 경우,
9
이나 사 사진이 미 한 경우, 그리고 충분한 데이 보가 불가능한 경우를 외
하 다.그 다 에 한 과 사 상이 보 자들 에 작 36
명 추출하여 연구 상 삼 다. 이들 병 연 평균 6.8 (범 2~9.4 ),
첫 내원시 평균 연 7.3 (범 3~10 ) 고, 평균 추시 간 4.4 (범
1~12 ) 이었다. 남 는 33명 (91.7%), 여 는 3명 (8.3%)이었다. 모집단 경우
1145명 (86.7%)이 남 , 176명 (13.3%)이 여 , 집단 별 구 에 한 차
이는 없었다(p =0.615). 36개 사 상에 30 는 분 , 6 는 조 분
에 해당 는 소견 보 다.
사 학 분 법
외 주 분 는 이미 보고 분 에 후 양 고 사 상에
평가하 다2). 자는 조 내지 분 후 3개월 에 단 사
상 추가 인하고 하여 이 에 명한 상 사용하 다.2) 이 연구에
찰자내 찰자간 신뢰도를 조사하고자 사용 분 법 다 가지이다.
즉, 존 변 외 주 분 법과 자가 고 한 개 사 학 용시킨
변 외 주 분 법(Table 1), 단 사 상에 평가한 장 후 주
(posterior pillar)침범 등 한 분 법 후 상모 를 종합
단한 개 변 외 주 분 법이다. 보고 원래 변 외 주 분 를 이용하
는 첫 번째 조사가 난 다 에 연구에 참여한 찰자들 5명이 모 모여, 자 개
외 주 분 를 한 단 이 는 지침 소견(Table 1, Figures 1,2,3,4)들에
한 충분한 토 시간(약 30분 이상) 가 다. 특히, 번째 단계에 는,
Akazawa 등이 한 단 사 면 상에 찰 는 후 주는 체 장
10
15~30% 뒤편에 편과 한 골단 상 인 높이에 라 100%, 50~100%,
50% 미만 나 어 분 하 며21, 22) 이를 각각 0 , 0.5 , 1 평가하 다.
(Figure 5) 여 에 덧붙여 Domzalski 등이 한 퇴 근 부 장 이
도를 역시 단 사 면 상에 평가하 다23). 장 이 여부는 장 과
맞닿는 골단 골경 (epiphyseal sclerotic line) 함 여부, 장 곽
불규 , 장 , 근 볼 함 등 종합 찰하여 침범 도를
하 다. 이 , 골간단 낭포(metaphyesal cyst) 존재 여부는 평가시에 고 다.
이 게 평가하 , 체 장 3등분하여 이 도가 부 1/3 이하일
0.5 , 간부 지 이 이 었 1 , 후 부 지 이 이 었 2 평가
하 다. (Figure 6)
마지막 4단계에 는, 후 상 모 를 이용하여 변 외 주 분 를
시행하 다.
사 학 평가 법
사 학 평가는 4단계에 걸쳐 이루어 는데, 각 단계에 10 이상 경험
가지고 있는 3명 소 외과 스태프 3 미만 경험 가진 2명 임
가 소 2주간 간격 고 번 복 평가 하 고, 단계간에도 소 2주 이상
간격 었다. 1단계는 존 외 주 분 에 해 5명 찰자가 하 다.
2단계는 자가 개 한 분 지침 지하도 찰자들에게 내용 강 한 뒤 다
시 상 하도 하 고, 3단계를 어갈 사진 는 작 꾸
어 평가하도 하 다. 이 단계에 는 고 면 단 사 상 찰자들에게
보여주고 각각 후 주 분 장 이 도를 평가하도 하 며, 4단계에
11
는 단 후 사 상과 단 면 사 상 사진 모 찰자들에게 보여
주었다. 이 2단계 3단계에 사용하 분 참고하여, 상 했
같이 할 있도 하 다.
통계 분
모집단과 연구집단 별 분포 는 Fisher’s exact test 검 하 다. 각 찰
자에 첫 번째 평가 결과 번째 평가 결과 신뢰도를 보 해 weighted
kappa 를 추 하 고, 각 단계에 찰자간 신뢰도를 5명 찰자에 가능한 모든
조합에 해 weighted kappa 를 추 하 다.
각 단계 신뢰도를 시에 weighted kappa 를 사용할 없 에, 모든 단계
에 찰 를 0~6 산 통일한 다 , 한 단계 불일 도가 다른 단
계들과 동일하게 도 한 후 찰자 내 진단값 차이를 요약하 다.
찰자 내 신뢰도 경우, 찰자 내에 진단 불일 를 계산하여 단계에 라
평균 편차 요약하 다. 단계 간 불일 도가 하게 다른지를 검 하
하여 진단 법 고 효과 , 상과 찰자를 작 효과 하여 합모 분
행하 다. 찰자간 신뢰도 경우 한 상 특 평가 시 내에 진단 불일
를 계산하 고, 단계에 라 평균 편차 요약하 다. 즉, 한 상에 시
별 찰자에 른 다 개 진단 평균 계산하 다. 한 상에 찰자간
불일 도는 각 진단 평균 차이 하 다. 각 진단 그 평균
차이가 클 찰자간 진단 차이가 큼 나타낸다. 단계별 불일 도가 하
게 다른지 검 하 하여 진단 법, 평가 시 를 고 효과 , 상과 찰자를 작
효과 하여 합 모 분 행하 다.
12
모든 통계 분 시에 R (ver 2.14.1) 과 SAS 9.2 version (SAS Institute Inc., Cary,
NC, USA), OR-DBM 2.4 프 그램 사용하 다.
결과
사 학 평가 분
체 36명 자료 3명 스태프 평가 결과가 동일한 상 , 2명 임
를 포함한 모든 찰자 평가가 동일한 상 를 단계별 요약하 며, 번째
시 에 한 결과 첫 번째 시 에 한 결과를 하 , 번째 시 에
일 하는 상 가 항상 증가하는 것 니었다. 1 단계, 2 단계 4 단계에
모든 찰자 견이 일 하는 상 는 시 를 통틀어 평균 11.5 개 부
동일하 다. 스태프만 평가 결과 는, 면에 평가한 후 주 높이에 일 하는
상 가 평균 22.5개 가장 많 고, 그 다 많 상 를 한 분 는 개
한 분 지침 외 주 평가 , 평균 18개 다. (Table 2)
찰자내 신뢰도: weighted kappa
각 찰자 내에 첫 번째 시 평가 결과 번째 시 평가 결과 신뢰도를 보
해 weighted kappa 를 추 하 다. (Table 3) 각 찰자에 1단계 2단계
결과를 해보면, weighted kappa 가 증가한 찰자 감소한 찰자도 있었 나
체 는 weighted kappa 값이 평균 0.714 에 0.856 증가하 다.
단 면 사 상 평가한 3단계 결과는 체 인 찰자내 신뢰도가 장
경우 평균 0.697, 후 주 평가 경우 평균 0.763 이었다.
13
후면 면 단 사 상 모 참고하여 평가한 4단계 경우 weighted
kappa 평균 값 0.875 (범 0.67~0.983) 다.
찰자간 신뢰도: weighted kappa
찰자간 신뢰도를 보 해 5명 찰자에 가능한 모든 조합에 해 각각
단계별 weighted kappa 를 추 하 다. (Table 4~ Table 7) 그 결과를 살펴보면,
1단계 0.805, 2단계 0.807, 3단계 장 평가 0.843, 3단계 후 주 평가
0.798, 4 단계 0.764 weighted kappa 값 나타내었다.
찰자내 신뢰도 단계별
Weighted kappa 값 단계별 할 없 에 상 에 한 같이 모
든 단계에 찰 를 0~6 변 한 뒤 찰자 내 평가 값 차이를 요약하
다. (Table 9)
3단계 장 이 평가법 경우, 찰자 내 불일 도가 평균 0.91 가장
컸다.이에 하여 4단계 결과는 0.22 찰자 내 불일 도가 가장 작 다. 단
계 별 평가 법에 라 인 불일 도는 하게 달랐 며(p<0.001), 이에
종 4단계 결과를 다른 단계 결과 한 , 4단계 는 1단계보다 불일
도가 낮 다. (p=0.035) 한 4단계 결과는 3단계 장 평가 (p<0.001)
3단계 후 주 평가 (p=0.035) 보다 찰자 내 불일 도가 하게 작 다. 그
리고 4단계는 2단계보다 불일 도는 작 지만 그 차이는 통계 하지는
다. (p=0.552), (Table 9)
14
찰자간 신뢰도 단계별
한 상에 첫 번째 번째 시 별 찰자에 른 다 개 평가 평균
계산하 다. 한 상에 찰자 간 불일 도는 각 평가 에 구한 평
균 차이 하 다. 각 평가 그 평균 차이가 클 찰자간 평가 차
이가 크다는 것 한다.
찰자간 평가 차이 도를 평가 법인 단계별 요약한 결과, 3단계 장 평
가 시 평균 1.32 찰자간 불일 도가 가장 컸고, 2단계에 평균 0.49
찰자간 불일 도가 가장 작 다. (Table 10)
찰자간 불일 도가 평가 시 별 차이가 있는지 검 하 나 하지 고
(p=0.903), 평가 시 평가 법 간 작용도 하지 다 (p=0.090).
라 찰자간 불일 도를 검 하 하여 평가 법 고 효과 사 상과
찰자를 작 효과 하여 합 모 분 행하 다. 찰자간 불일 도는
평가 법에 라 하게 달랐는데 (p<0.001), 4단계는 3단계 가지 평가보
다 (p<0.001) 불일 도가 하게 작 고, 1단계보다는 불일 도가 작 경향
이 있 나 통계 하지는 며 (p=0.728), 2단계보다는 찰자간 불일
도가 컸지만 한 차이는 니었다 (p=0.728).
고 찰
LCP 병 명 한 병인과 료 법 시 등에 있어 직 야 할 부분이 많
질 이다. 일단 생하면, 에 걸쳐 자연 해 지 퇴 골 구
변 이 진행 는데, 이 변 도에 라 증상부 조 염 인한
료 지 다양한 임상 경과를 가 에 임상 사 는 자를 마주했
15
료 시 법 결 하 해 가능하면 히 자 후를 단하는 것이
요하다. Joseph 등 15) 이러한 후를 단하 한 인자가 갖춰야 할 항목
신뢰도, 타당도 조 에 그 인자를 얻 있는가 가지 요소가 필요하다고 하 다.
그 후 인자 진 것 다양한데, 시 나이, 별, 그리고 사 상에
인할 있는 분 법들 등 여러 가지가 있다.
이 사 학 인 분 법에 해 는 존 연구에 도 그 후를 히 하
한 여러 가지 분 들이 시 어 고 24), 특히 Rajan 등 람직한 분 법이란
찰자가 해당 분 법 통해 빨리 그 단계를 할 있어야 하며 신뢰 과 재
후를 히 하는가를 모 갖춰야 한다고 하 다.9) 여 에 자는 존 연구
결과들 탕 , 평가에 리 쓰이고 있는 후 사 상만이 니라
사 상에 도 가 있는 보를 있다고 가 하여 보 다.25, 26)Sugimoto 등 21)
이 이미 외 주 상 평가하는 후 주 결합 분 복합 외 주
(combined pillar score)를 시한 있 나, 이는 변 외 주 분 법이 나
이 보고 외 주 분 법 이용한 것이었 에 변 외 주 분 법
사용할 경우에도 같 결과가 나 지는 없다. 라 자들 변 외 주
분 법 용시키는 후 상뿐만 니라 상에 평가하는 장 분
후 주 평가도 포함시 보다 개 분 지침 효용 하고자 하 다.
이번 연구 결과에 3 단계 장 평가 분 가 찰자내 불일 도 찰자간
불일 도 모 에 모든 단계 일 높 다. 즉, 상만 가지고 한 분 가
가장 찰자내 찰자간 신뢰도가 떨어 는데, 이는 상 분 익 함이
상 후 상만 가지고 단하는 분 보다 했 추 할 있다.
후 주 평가 경우, 그 이 후 상 가지고 평가하는 원래 외 주 평가
16
슷한 식이 에 쉽고 익 하여 장 평가 분 보다 그 불일 도가
했 것 단 다.
번 연구에 새 이 시도했 여타 단계 분 들과 달리 2 단계 즉, 보다 개 한
분 지침 뒤 시행한 자 분 법이 가장 높 weighted kappa
값(0.807)이 스태프들 사이에 산출 신뢰도라는 , 분 주체인 임상 사
경험이 신뢰도를 높이는 데 있어 매우 요한 요소임 다시 한번 상 시킨다. Wiig
등 27) 역시 과거 상학 분 법들 시, 경험이 많 찰자 찰자
사이 결과가 다름 보고하 었다.
한편, 후 사 상과 면 사 상 모 고 한 4 단계 외 주 분
결과가 체 는 찰자내 불일 도가 가장 작 나, 2 단계 결과에 해
하게 작지는 다. 한 찰자간 불일 도도 4 단계 2 단계 사이에는
통계학 인 한 차이가 없었는데, 자 개 외 주 분 법이 용하다는 것
시사한다고 여겨진다.
도 신뢰도를 할 Herring 등 2)이나 Walter 등 28) 상 다양 이나
찰자 집 도 피 도를 감 하여 20 여개 상 사용하 고, 이 도 상
개 가 이라고 주장하 다.29) 근 변 외 주 분 신뢰도를 다룬 Rajan9)
등 35 개 상 사용하 는데, 본 연구 역시 36 명 자군 상
찰하 며 자들 이를 통해 한 상 다양 얻 면 도 찰자들
집 도 피 도에 해가 지 해 2 주 이상 평가 간격 고 단 사
상 를 작 뒤 는 등, 연구 결과 객 높이 고 노 하 다.
17
자 연구에 도 듯이 존 외 주 분 법 일부 보고 9)에 지 한
같이 만족스러운 일 도 후 도를 보여주지 못하 다. 변 외 주 분 법
한 Herring 등 연구에 는 찰자들에게 10 분간 실시한 후 사
상 평가하여 만족스러운 weighted kappa 값 얻었다고 보고하 다. 이에 하여,
근 Rajan 등 1 시간여 에도 Herring 등이 보고한 만큼 좋 신뢰도를
얻 없었다고 보고하 다. 본 연구에 도 변 외 주 분 는 보다 개
분 지침 이용한다 하 라도 찰자내 신뢰도는 높일 있었 나 찰자간 신뢰도는
높이는 데는 어느 도 한계가 있 게 었다. 라 임상 료 법
택이나 후 에 결 인 인자인 외 주 분 를 해 는 보다 하고
용한 보를 담고 있는 검사법, 컨 자 공명 상 검사, 등 이용한 새 운
삼차원 인 분 법이 필요하다고 생각한다.
본 연구는 몇 가지 한계 과 개 해야 할 사항 가지고 있다. 첫 번째 , 본 연구
상 자군에는 추시 도 에 료를 보존 료만 가
여있었 며, 남 별이나 병 연 등 존에 진 후 인자를 모 통일시키지
다. 즉, 균일한 자군 상 하지 에 본 연구에 시한 여러
가지 사 학 분 법 타당도(validity)를 분 할 없었다. 연구 상
자군이 다양한 란 변 를 내포하고 있어 Stulberg 분 를 포함한 사 학 인
분 뿐 니라 다른 어떤 결과 지 를 사용하 라도 히 사 학 분 에 한
후를 하지 못하 것이다. 그러나 균일한 자군 동일한 병 별 나 어
료 법 통일하고 그 후를 찰하는 것 후향 이든 향 이든 간에 리 인
실 인 어 운 일이다. 에 향후 이를 보 한 연구 계가
필요하다. 번째 , 단 사 상에 가지 분 법이 찰자들에게
18
생소하 에 이에 한 했다 하 라도, 랜 간 찰자들에게
익 했 존 외 주 분 법과 인 는 어 울 있었다. 특히 장
이 도를 평가하는 데 있어 찰자 내 찰자 간 신뢰도가 특히 낮
에 향후 이에 한 충분한 과 지를 통해 같 연구를 다시 행한다면
나 결과가 나 있 가능 할 없다.
결
변 외 주 분 시, 자가 고 한 개 사 소견 감 한 변 외 주
분 법 미있는 찰자내 신뢰도 향상 보 나 찰자간 신뢰도 차이는 없었다.
한편 사 상 그 자체, 존 분 함께 사용해도 신뢰도 향상에
뚜 한 도움 주지 못했다.
19
참 고 헌
1. Joseph B, Varghese G, Mulpuri K, Narasimha Rao KNair N S, Natural evolution of
Perthes disease: a study of 610 children under 12 years of age at disease onset. J
Pediatr Orthop, 2003. 23(5): 590-600.
2. Herring J A, Kim H TBrowne R, Legg-Calve-Perthes disease. Part I: Classification
of radiographs with use of the modified lateral pillar and Stulberg classifications. J
Bone Joint Surg Am, 2004. 86-A(10): 2103-20.
3. Nguyen N A, Klein G, Dogbey G, McCourt J BMehlman C T, Operative versus
nonoperative treatments for Legg-Calve-Perthes disease: a meta-analysis. J
Pediatr Orthop, 2012. 32(7): 697-705.
4. Stulberg S D, Cooperman D RWallensten R, The natural history of Legg-Calve-
Perthes disease. J Bone Joint Surg Am, 1981. 63(7): 1095-108.
5. Ippolito E, Tudisco CFarsetti P, The long-term prognosis of unilateral Perthes'
disease. J Bone Joint Surg Br, 1987. 69(2): 243-50.
6. Wiig O, Terjesen TSvenningsen S, Prognostic factors and outcome of treatment in
Perthes' disease: a prospective study of 368 patients with five-year follow-up. J
Bone Joint Surg Br, 2008. 90(10): 1364-71.
7. Joseph B, Rao N, Mulpuri K, Varghese GNair S, How does a femoral varus
osteotomy alter the natural evolution of Perthes' disease? J Pediatr Orthop B, 2005.
14(1): 10-5.
8. Terjesen T, Wiig OSvenningsen S, The natural history of Perthes' disease. Acta
Orthop, 2010. 81(6): 708-14.
9. Rajan R, Chandrasenan J, Price K, Konstantoulakis C, Metcalfe JJones S, Legg-
Calve-Perthes: interobserver and intraobserver reliability of the modified herring
20
lateral pillar classification. J Pediatr Orthop, 2013. 33(2): 120-3.
10. Herring J A, Kim H TBrowne R, Legg-Calve-Perthes disease. Part II: Prospective
multicenter study of the effect of treatment on outcome. J Bone Joint Surg Am,
2004. 86-A(10): 2121-34.
11. Kim H K, Legg-Calve-Perthes disease: etiology, pathogenesis, and biology. J
Pediatr Orthop, 2011. 31(2 Suppl): S141-6.
12. Sharma S, Sibinski MSherlock D A, A profile of Perthes' disease in Greater Glasgow:
is there an association with deprivation? J Bone Joint Surg Br, 2005. 87(11): 1536-
40.
13. Kamegaya M, Saisu T, Miura YMoriya H, A proposed prognostic formula for
Perthes' disease. Clin Orthop Relat Res, 2005. 440: 205-8.
14. Farsetti P, Tudisco C, Caterini R, Potenza VIppolito E, The Herring lateral pillar
classification for prognosis in Perthes disease. Late results in 49 patients treated
conservatively. J Bone Joint Surg Br, 1995. 77(5): 739-42.
15. Joseph B, Prognostic factors and outcome measures in Perthes disease. Orthop Clin
North Am, 2011. 42(3): 303-15, v-vi.
16. Canavese FDimeglio A, Perthes' disease: prognosis in children under six years of
age. J Bone Joint Surg Br, 2008. 90(7): 940-5.
17. Schoenecker P L, Stone J WCapelli A M, Legg-Perthes disease in children under 6
years old. Orthop Rev, 1993. 22(2): 201-8.
18. Fabry K, Fabry GMoens P, Legg-Calve-Perthes disease in patients under 5 years
of age does not always result in a good outcome. Personal experience and meta-
analysis of the literature. J Pediatr Orthop B, 2003. 12(3): 222-7.
19. Ritterbusch J F, Shantharam S SGelinas C, Comparison of lateral pillar classification
and Catterall classification of Legg-Calve-Perthes' disease. J Pediatr Orthop, 1993.
21
13(2): 200-2.
20. Park M S, Chung C Y, Lee K M, Kim T WSung K H, Reliability and stability of three
common classifications for Legg-Calve-Perthes disease. Clin Orthop Relat Res,
2012. 470(9): 2376-82.
21. Sugimoto Y, Akazawa H, Miyake Y, et al., A new scoring system for Perthes'
disease based on combined lateral and posterior pillar classifications. J Bone Joint
Surg Br, 2004. 86(6): 887-91.
22. Akazawa H, Miyake Y, Nagasawa F. , Posterior pillar classification of Perthes’
disease. J Jpn Paed Orthop Ass, 2000. 9: 212-15.
23. Domzalski M E, Inan M, Guille J T, Glutting JKumar S J, The proximal femoral
growth plate in Perthes disease. Clin Orthop Relat Res, 2007. 458: 150-8.
24. Kim H T, Woo S H, Jang J H, Lee S G, Kim H KBrowne R, What is the usefulness of
the fragmentation pattern of the femoral head in managing Legg-Calve-Perthes
disease? Clin Orthop Surg, 2014. 6(2): 223-9.
25. Yoo W J, Choi I H, Cho T J, Chung C Y, Park M SLee D Y, Out-toeing and in-toeing
in patients with Perthes disease: role of the femoral hump. J Pediatr Orthop, 2008.
28(7): 717-22.
26. Yoo W J, Choi I H, Chung C Y, Cho T JKim H Y, Valgus femoral osteotomy for hinge
abduction in Perthes' disease. Decision-making and outcomes. J Bone Joint Surg Br,
2004. 86(5): 726-30.
27. Wiig O, Terjesen TSvenningsen S, Interobserver reliability of radiographic
classifications and measurements in the assessment of Perthes' disease. Acta
Orthop Scand, 2002. 73(5): 523-30.
28. Walter S D, Eliasziw MDonner A, Sample size and optimal designs for reliability
studies. Stat Med, 1998. 17(1): 101-10.
22
29. Donner AEliasziw M, Sample size requirements for reliability studies. Stat Med,
1987. 6(4): 441-8.
23
Abstract
Intra and interobserver reliability of the modified lateral pillar classification:
Usefulness of the refined criteria
Dong-Oh Lee
Department of Pediatric Orthopedic Surgery
Seoul National University School of Medicine,
Seoul, Korea
Purpose: Modified lateral pillar classification has been widely used for diagnosing
LCP disease and for predicting the prognosis of the disease. However, the
classification system was reported to show lower intra-and interobserver
reliability than expected. Therefore, we examined whether intra- and
interobserver reliability could be improved by the use of the refined criteria or
additional lateral radiographs.
Materials and methods: From December 1985 to March 2012, 1321 patients visited
our institution and were diagnosed as LCP disease. Thirty six patients with
unilateral LCP disease who met the inclusion criteria were randomly selected.
Medical records and radiographs were retrospectively reviewed. The mean age at
onset in 36 patients was 6.8 years (range, 2 to 9.4) years, and the mean follow-up
period was 4.4 years (range, 1 to 12). Intra- and interobserver reliability test for
24
modified lateral pillar classification was conducted by three full time staffs and two
fellows. In the first phase, lateral pillar types were determined according to original
modified lateral pillar classification. In the second phase, lateral pillar types were
determined with use of the refined criteria. In the third phase, lateral radiographs
were evaluated to determine the extent/grading of involvement of the growth plate
and posterior pillar. In the fourth phase, lateral pillar type was determined based
upon the observations made on anteroposterior and lateral radiographs. To
calculate intra- and interobserver reliability, examination in each phase was
repeated at least two weeks apart between the test and retest. Statistically,
weighted kappa and the degree of disagreement were calculated to determine the
reliability.
Results: In the first phase, the weighted kappa values for each pairing of the
observers ranged from 0.221 to 0.805. In the second phase, the kappa ranged from
0.492 to 0.807. In the third phase, the weighted kappa of growth plate involvement
classification ranged from 0.095 to 0.843 and that of posterior pillar classification
ranged from 0.194 to 0.798. In the 4th phase, the weighted kappa values ranged
from 0.426 to 0.764. The best interobserver reliability was observed at the second
phase, followed by fourth phase, however, no statistical significance between the
two.
Conclusion: Intraobserver reliability of modified lateral pillar classification
significantly increased, but not interobserver reliability, when lateral pillar type
was determined according to the refined criteria. However, even when taking into
25
consideration of the extent of involvement of growth plate and posterior pillar, the
reliability of the modified lateral pillar classification could not be improved.
--------------------------------------------------
Key Words: hip, LCP disease, lateral pillar classification, reliability
Student number: 2013-21685
26
Table 1. Original modified LP classification and the modified LP classification
according to the refined criteria
Type of LP Original Modified LP classification Modified LP classification
according to the refined criteria
A No involvement of the LP*
1)LP height of the epiphysis (15
~30%): well-maintained
2)Intact outer sclerotic margin of
the LP
3)Intact subphyseal sclerotic line
of the epiphysis
4)Little radiolucency inside the LP
B LP at least 50% of its height
1) LP height : at least 50%
2) intact sclerotic outer margin
3) Subphyseal sclerotic line of the
epiphysis is preserved
4) The presence of some radio-
lucency inside the LP
B/C
1)a very narrow pillar
(2-3 mm wide) that is >50% of
the original height
2)a LP with very little ossification,
but with at least 50%of the original
height
3)a LP with exactly 50% of the
original height that is depressed
relative to the central pillar
1) LP height maintained but very
narrow pillar (2-3 mm):
falciform-shaped viable LP
2) Indistinct outer sclerotic margin
or very little ossification inside the
LP
3) LP height : exactly 50% of the
original epiphyseal height with no
collapse of central part
4) Subphyseal sclerotic line of the
epiphysis is disrupted
5) Mixed sclerosis and radio-
lucency inside the epiphysis of the
LP
27
C A loss of more than 50% of the
original height of the LP
1) LP height : less than 50%,
sometimes showing cocked hat
deformity
2) Indistinct sclerotic outer margin
3) Subphyseal sclerotic line of the
epiphysis is disrupted
4)Mixed sclerosis and radio-
lucency inside the remaining
epiphysis of the LP
*means lateral pillar
28
Table 2. Rater’s agreement on the modified lateral pillar classification according to
the phase of assessment
Phase
Number of hips assessed 1st period 2nd period
1st
Staff's agreement 36 17 12
All agreement 36 14 9
2nd
Staff's agreement 36 19 17
All agreement 36 12 11
3rd(GP)
Staff's agreement 36 15 17
All agreement 36 8 9
3rd(PP)
Staff's agreement 36 19 26
All agreement 36 11 11
4th
Staff's agreement 36 16 17
All agreement 36 12 11
GP: growth plate grading, PP: posterior pillar grading
29
Table 3. Summary of intraobserver reliability (weighted κ value)
Phase
Reviewer
A B C D E
1st
weighted kappa
(95% CI*)
0.917
[0.838,0.9
96]
0.234
[-
0.046,0.515
]
0.929
[0.791,1]
0.7
[0.514,0.88
6]
0.792
[0.62,0.963
]
#(agreement)/to
tal 30/36 17/36 35/36 27/36 28/36
2nd
weighted kappa
(95% CI)
0.9
[0.807,0.9
93]
0.886
[0.754,1]
0.806
[0.678,0.93
3]
0.739
[0.542,0.93
6]
0.948
[0.89,1]
#(agreement)/to
tal 30/36 31/36 28/36 27/36 33/36
3rd
(GP)
weighted kappa
(95% CI)
0.743
[0.56,0.92
6]
0.843
[0.696,0.98
9]
0.913
[0.816,1]
0.671
[0.49,0.852
]
0.316
[-
0.021,0.653
]
#(agreement)/to
tal 27/36 28/36 31/36 22/36 24/36
3rd(PP
)
weighted kappa
(95% CI)
0.952
[0.859,1]
0.629
[0.398,0.86
]
0.69
[0.382,0.99
8]
0.786
[0.555,1]
0.757
[0.586,0.92
7]
#(agreement)/to
tal 35/36 25/36 31/36 33/36 29/36
4th
weighted kappa
(95% CI)
0.953
[0.897,1]
0.953
[0.899,1]
0.817
[0.692,0.94
3]
0.67
[0.446,0.89
5]
0.983
[0.95,1]
#(agreement)/to33/36 33/36 28/36 26/36 35/36
30
tal
*means confidence interval, GP: growth plate grading, PP: posterior pillar grading
31
Table 4. Summary of the 1st phase(original modified lateral pillar classification):
intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.917 0.606 0.221 0.444 0.6 0.771 0.5 0.662 0.645
A2 1 0.663 0.256 0.457 0.62 0.715 0.515 0.657 0.644
B1 1 0.234 0.571 0.639 0.637 0.615 0.62 0.532
B2 1 0.328 0.403 0.311 0.491 0.349 0.286
C1 1 0.929 0.563 0.692 0.737 0.63
C2 1 0.746 0.769 0.805* 0.699
D1 1 0.7 0.727 0.687
D2 1 0.679 0.6
E1 1 0.792
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
32
Table 5. Summary of the2nd phase (modified lateral pillar classification using the
refined criteria: intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.9 0.656 0.706 0.807* 0.75 0.656 0.494 0.629 0.622
A2 1 0.602 0.62 0.739 0.68 0.59 0.492 0.592 0.557
B1 1 0.886 0.742 0.649 0.724 0.502 0.536 0.637
B2 1 0.773 0.589 0.767 0.55 0.694 0.737
C1 1 0.806 0.727 0.598 0.642 0.66
C2 1 0.692 0.514 0.536 0.589
D1 1 0.739 0.741 0.792
D2 1 0.727 0.743
E1 1 0.948
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
33
Table 6.Summary of the 3rd phase (grading of growth plate involvement): intra-
and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.743 0.659 0.574 0.381 0.335 0.609 0.732 0.228 0.324
A2 1 0.679 0.592 0.531 0.483 0.502 0.595 0.099 0.311
B1 1 0.843 0.471 0.344 0.665 0.843* 0.294 0.414
B2 1 0.457 0.349 0.687 0.813 0.273 0.294
C1 1 0.913 0.592 0.363 0.092 0.241
C2 1 0.476 0.264 0.095 0.223
D1 1 0.671 0.183 0.343
D2 1 0.324 0.183
E1 1 0.316
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
34
Table 7. Summary of the3rd phase (grading of posterior pillar classification):
intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.952 0.498 0.71 0.575 0.64 0.222 0.244 0.673 0.798*
A2 1 0.536 0.755 0.625 0.696 0.245 0.269 0.64 0.765
B1 1 0.629 0.542 0.52 0.277 0.291 0.551 0.422
B2 1 0.665 0.736 0.273 0.299 0.68 0.655
C1 1 0.69 0.25 0.274 0.492 0.61
C2 1 0.242 0.255 0.619 0.73
D1 1 0.786 0.194 0.246
D2 1 0.212 0.26
E1 1 0.757
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
35
Table 8. Summary of the 4th phase (modified lateral pillar classification using the
refined criteria plus gradings of physeal involvement and posterior pillar
involvement): intra- and interobserver reliability (κ value)
A1 A2 B1 B2 C1 C2 D1 D2 E1 E2
A1 1 0.953 0.488 0.45 0.583 0.516 0.426 0.471 0.712 0.727
A2 1 0.479 0.439 0.615 0.541 0.443 0.491 0.716 0.732
B1 1 0.953 0.708 0.751 0.6 0.462 0.666 0.628
B2 1 0.685 0.729 0.61 0.468 0.617 0.58
C1 1 0.817 0.757 0.565 0.764* 0.748
C2 1 0.67 0.491 0.739 0.725
D1 1 0.67 0.734 0.723
D2 1 0.725 0.677
E1 1 0.983
E2 1
The boxes highlighted in gray color are the intraobserver scores
*Asterisk means the largest kappa value
36
Table 9. Summary of intraobserver reliability (mean and SD of disagreement)
rater
Phases
phase 1 phase 2 phase 3(1) phase 3(2) phase 4
A 0.25(0.57) 0.25(0.57) 0.89(1.69) 0.08(0.5) 0.13(0.42)
B 1.21(1.28) 0.25(0.67) 0.67(1.43) 1(1.6) 0.13(0.42)
C 0.08(0.5) 0.38(0.75) 0.33(0.89) 0.5(1.34) 0.33(0.63)
D 0.5(0.95) 0.42(0.77) 1.22(1.68) 0.25(0.84) 0.46(0.79)
E 0.38(0.75) 0.13(0.42) 1.44(2.22) 0.58(1.2) 0.04(0.25)
overall 0.48(0.93) 0.28(0.65) 0.91(1.67) 0.48(1.19) 0.22(0.55)
p-
value1) <0.001 - - - -
p-
value2) 0.035 0.552 <0.001 0.035 -
1) means possibility for significant difference among overall phases. 2) means comparison phase 4 with other phases, which is corrected with Hochberg
method.
37
Table 10. Interobserver reliability (mean and SD of disagreement)
Phases
phase 1 phase 2 phase 3(1) phase 3(2) phase 4
Mean(SD) 0.55(0.61) 0.49(0.54) 1.32(1.28) 0.84(0.92) 0.51(0.57)
p-value1) <0.001 - - - -
p-value2)
0.728 0.728 <0.001 <0.001 -
1) means possibility for significant difference among overall phases. 2) means comparison phase 4 with other phases, which is corrected with Hochberg
method.
38
Figure 1.Lateral pillar A according to the refined criteria. Lateral pillar height of the
epiphysis is well-maintained. Outer sclerotic margin of the lateral pillar and
subphyseal sclerotic line of the epiphysis are intact. There is little radiolucency
inside the lateral pillar.
39
Figure 2. Lateral pillar B according to the refined criteria.(1) Lateral pillar height of
the epiphysis is more than 50%. Outer sclerotic margin of the lateral pillar is intact.
There is some radiolucency inside the lateral pillar. (2) Subphyseal sclerotic line of
the epiphysis is preserved.
40
Figure 3. Lateral pillarB/C border according to the refined criteria. (A) Lateral
pillar height maintained but very narrow pillar (2~3mm): falciform-shaped viable
lateral pillar (arrow). Outer sclerotic margin is distinct. Subphyseal sclerotic line is
disrupted. (B) and (C) Lateral pillar height is at least 50%. There is very little
ossification inside the lateral pillar (arrow). Outer sclerotic margin is indistinct. (D)
Lateral pillar height is exactly 50% of original epiphyseal height. However, there is
mixed sclerosis and radiolucency inside the epiphysis of the lateral pillar. There is
no collapse of central part: lateral pillar is depressed relative to central pillar.
41
Figure 4. Lateral pillar C according to the refined criteria. Lateral pillar height is
less than 50%, sometimes showing cocked hat deformity (arrow).
42
Figure 5. Grading of growth plate involvement of the proximal femur. The extent of
involved growth plate was determined according to several factors, i.e. site of
disruption, extent of irregularity, widening, proximal convexity, but seemingly not
associated with metaphyseal cyst location.
43
Figure 6. Grading of posterior pillar involvement. The posterior pillar classification
assesses 15% to 30% of the femoral epiphysis according to the same criteria as
those of the original lateral pillar classification. In this radiograph, the height of the
posterior column is between 50% and 100% of the original height.