공공 의료데이터 상세

썸네일

피부질환 병리검사 이미지 데이터

##헬스케어 의료
서울대병원, 가톨릭대학교, 국립암센터, 삼성서울병원이라는 국내 최대 규모의 병원 과 대학들이 확보하고 있는 피부암 병리 이미지를 데이터셋으로 구축하여 국내 환자 군을 대표할 수 있는 피부암 병리 코호트를 구축 - 임상적으로 중요하고 발병률이 높은 주요 피부질환 6종과 정상피부조직에 대해 인공지능 알고리즘 개발을 위한 레이블링 및 병변 아노테이션이 결합된 피부 병리 데이터셋을 구축
분야
헬스케어
유형
텍스트,이미지
생성 방식
안심존(온라인)
  • 구축년도 : 2022
  • 버전 : 1.2
AI-HUB

데이터 변경이력

데이터 변경이력
버전 일자 변경내용 비고
1.2 2024-04-02 데이터 변경 라벨링데이터 추가
1.1 2024-01-26 데이터 최종 개방
1.0 2023-07-31 데이터 개방 Beta Version

데이터 히스토리

데이터 히스토리
일자 변경내용 비고
2025-01-06 데이터셋 변경 메타데이터 데이터 구축량 정보 수정
2024-01-31 산출물 최종 공개

소개

서울대병원, 가톨릭대학교, 국립암센터, 삼성서울병원이라는 국내 최대 규모의 병원 과 대학들이 확보하고 있는 피부암 병리 이미지를 데이터셋으로 구축하여 국내 환자 군을 대표할 수 있는 피부암 병리 코호트를 구축
- 임상적으로 중요하고 발병률이 높은 주요 피부질환 6종과 정상피부조직에 대해 인공지능 알고리즘 개발을 위한 레이블링 및 병변 아노테이션이 결합된 피부 병리 데이터셋을 구축

구축목적

- 흔한 피부질환들과 정상 피부의 병리 조직을 고해상도 디지털 병리 이미지 파일로 구축
- 특히 피부종양들과 그와 감별이 필요한 질환, 정상 피부를 각각 병리 이미지 데이터셋으로 구축하여 향후 인공지능 학습 효과를 극대화하고, 향후 피부질환 병리 영상의 객관적이고 정확한 판독 및 신속한 진단이 가능하도록 진단 보조역할을 수행하는 인공지능 모델 개발의 기반을 형성하고자 함

1. 데이터 구축 규모

1. 데이터 구축 규모
질환명 구축량
질환 1. 표피낭종 (Epidermal cyst) 환자 4,330명 / 이미지 5,036건
질환 2. 지루각화증 (Seborrheic keratosis) 환자 4,516명 / 이미지 5,133건
질환 3. 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma) 환자 3,199명 / 이미지 5,031건
질환 4. 기저세포암 (Basal cell carcinoma) 환자 3,362명 / 이미지 5,419건
질환 5. 멜라닌세포모반 (Melanocytic nevus) 환자 4,293명 / 이미지 5,036건
질환 6. 흑색종 (Malignant melanoma) 환자 1,534명 / 이미지 3,000건
정상 1. 정상 피부 조직 (Normal) 환자 3,467명 / 이미지 5,721건

2. 데이터 분포
1) 질환별 분포

2. 데이터 분포 1) 질환별 분포
품질특성 Clinical_information  이미지(건)  비율
요건적 다양성 질환 1. 표피낭종 (Epidermal cyst)              5,036 14.65
질환 2. 지루각화증 (Seborrheic keratosis)              5,133 14.93
질환 3. 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)              5,031 14.64
질환 4. 기저세포암 (Basal cell carcinoma)              5,419 15.76
질환 5. 멜라닌세포모반 (Melanocytic nevus)              5,036 14.65
질환 6. 흑색종 (Malignant melanoma)              3,000 8.73
정상 1. 정상 피부 조직 (Normal)              5,721 16.64
합계            34,376 100.00%

2) 속성별 분포

2. 데이터 분포 2) 속성별 분포
품질특성 세부데이터명 데이터 규모 파일 규모 구분 분류  이미지(건)  결과(%)
통계적 다양성 질환 1. 표피낭종 (Epidermal cyst) 5,036 5,036 위치별 분포 HEAD_NECK       2,212 43.92
TRUNK       2,323 46.13
EXTREMITY          467 9.27
NS           34 0.68
시술명 분포 Biopsy       2,423 48.11
Resection       2,613 51.89
남녀 성비 M       2,891 57.41
F       2,145 42.59
연령대별 분포 0세~9세           67 1.33
10세~19세          184 3.65
20세~29세          536 10.64
30세~39세          713 14.16
40세~49세          912 18.11
50세~59세          993 19.72
60세~69세          964 19.14
70세~79세          513 10.19
80세~89세          147 2.92
90세~99세             7 0.14
질환 2. 지루각화증 (Seborrheic keratosis) 5,133 5,133 위치별 분포 HEAD_NECK       2,897 56.44
TRUNK       1,681 32.75
EXTREMITY          531 10.34
NS           24 0.47
시술명 분포 Biopsy       4,726 92.07
Resection          407 7.93
남녀 성비 M       2,751 53.59
F       2,382 46.41
연령대별 분포 0세~9세             2 0.04
10세~19세           26 0.51
20세~29세           58 1.13
30세~39세          166 3.23
40세~49세          521 10.15
50세~59세       1,103 21.49
60세~69세       1,549 30.18
70세~79세       1,174 22.87
80세~89세          463 9.02
90세~99세           71 1.38
질환 3. 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma) 5,031 5,031 위치별 분포 HEAD_NECK       2,442 48.54
TRUNK       1,095 21.77
EXTREMITY       1,418 28.19
NS           76 1.51
시술명 분포 Biopsy       2,073 41.21
Resection       2,958 58.79
남녀 성비 M       2,624 52.16
F       2,407 47.84
연령대별 분포 0세~9세             1 0.02
10세~19세             - 0
20세~29세           23 0.46
30세~39세           98 1.95
40세~49세          216 4.29
50세~59세          633 12.58
60세~69세       1,022 20.32
70세~79세       1,443 28.69
80세~89세       1,281 25.47
90세~99세          311 6.18
100세 이상             3 0.06
질환 4. 기저세포암 (Basal cell carcinoma) 5,419 5,419 위치별 분포 HEAD_NECK       4,767 87.97
TRUNK          445 8.21
EXTREMITY          150 2.77
NS           57 1.05
시술명 분포 Biopsy       1,968 36.31
Resection       3,451 63.69
남녀 성비 M       2,486 45.88
F       2,933 54.12
연령대별 분포 0세~9세             2 0.04
10세~19세           47 0.87
20세~29세          106 1.96
30세~39세          172 3.17
40세~49세          343 6.33
50세~59세          839 15.48
60세~69세       1,259 23.23
70세~79세       1,532 28.27
80세~89세          997 18.4
90세~99세          121 2.23
100세 이상             1 0.02
질환 5. 멜라닌세포모반 (Melanocytic nevus) 5,036 5,036 위치별 분포 HEAD_NECK       2,506 49.76
TRUNK       1,529 30.36
EXTREMITY          945 18.76
NS           56 1.11
시술명 분포 Biopsy       3,775 74.96
Resection       1,261 25.04
남녀 성비 M       1,893 37.59
F       3,143 62.41
연령대별 분포 0세~9세          170 3.38
10세~19세          617 12.25
20세~29세          886 17.59
30세~39세          974 19.34
40세~49세          846 16.8
50세~59세          790 15.69
60세~69세          490 9.73
70세~79세          206 4.09
80세~89세           55 1.09
90세~99세             2 0.04
질환 6. 흑색종 (Malignant melanoma) 3,000 3,000 위치별 분포 HEAD_NECK          447 14.9
TRUNK          565 18.83
EXTREMITY       1,997 66.57
NS           21 0.7
시술명 분포 Biopsy       2,331 77.7
Resection          669 22.3
남녀 성비 M       1,501 50.03
F       1,499 49.97
연령대별 분포 0세~9세           27 0.9
10세~19세             4 0.13
20세~29세           38 1.27
30세~39세          122 4.07
40세~49세          305 10.17
50세~59세          533 17.77
60세~69세          962 32.07
70세~79세          686 22.87
80세~89세          297 9.9
90세~99세           26 0.87
정상 1. 정상 피부 조직 (Normal)  5,732  5,732 위치별 분포 HEAD_NECK       1,908 33.29
TRUNK       2,513 43.84
EXTREMITY       1,261 22
NS           50 0.87
시술명 분포 Biopsy       3,953 68.96
Resection       1,779 31.04
남녀 성비 M       2,151 37.53
F       3,581 62.47
연령대별 분포 0세~9세           86 1.5
10세~19세           77 1.34
20세~29세          221 3.86
30세~39세          335 5.84
40세~49세          531 9.26
50세~59세          980 17.08
60세~69세       1,106 19.3
70세~79세       1,186 20.69
80세~89세       1,161 20.25
90세~99세           48 0.84
100세 이상             1 0.02

 

 

1. 모델학습
1) 학습모델 후보군 및 선정 근거

1. 모델학습 1) 학습모델 후보군 및 선정 근거
학습 모델 후보  알고리즘 및 성능지표  후보 선정 사유 최종 선정 여부 
인공지능 기반 피부질환 분할 모델1 U-Net(Dice-coefficient) 다양한 의료 영상 분할 연구에서 사용하는 대표적인 알고리즘
인공지능 기반 피부질환 분할 모델2 FPN 여러 데이터셋에서의 pre-trained weight를 가지고 있는 모델로써 전이학습에 용이함
인공지능 기반 피부질환 분할 모델3 Mask R-CNN 여러 데이터셋에서의 pre-trained weight를 가지고 있는 모델로써 전이학습에 용이함
인공지능 기반 피부질환 분할 모델4 DeepLab v3 최선 분할 모델로써 다양한 타스크에서 준수한 성능을 보임

 

2) 성능 평가 지표 선정 및 의의
- U-Net기반의 알고리즘으로 학습하여 Dice-coefficient의 결과값에 따라 성능 평가
- Dice-coefficient는 영역 기반 라벨링에 대한 인공지능 분할 모델 평가 방식 중 가장 대표적인 지표
- 병리 이미지 분할 연구에서 Dice-coefficient 값이 75%를 상회하는 경우 실제 임상 현장에서 사용 가능한 모델 성능을 보일 수 있으리라 예상되며, 충분한 임상적 의의가 있을 것



성능 평가 지표 선정 및 의의

[ 피부계 데이터 학습 모델 검증 예시 ]

2. 활용 모델
1) 피부계 데이터셋 활용AI모델 개발
- AI 기반의 주요 6가지 피부질환별 분할 모델 개발
2) 질환별 AI데이터 적용 임무 및 향후 AI모델 활용 방안

데이터 명  피부계 데이터
학습 모델  인공지능 기반 피부질환 분할 모델
모델 U-Net
성능 지표 각 질환별 Dice-coefficient 75% 이상
개발 내용 구축된 인공지능 학습용 데이터셋을 활용하여, U-Net을 기반으로 WSI에 대한 질환별 분할 모델을 개발

 

1) 표피낭종 (Epidermal cyst)
- 표피낭종이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
(2) 지루각화증 (Seborrheic keratosis)
- 지루각화증이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
(3) 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)
- 보웬병/편평상피암이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
- 악성 종양 병변의 범위를 자동으로 제시해 줌으로써, 병변의 크기, 절제연과의 거리 등의 병리 판독에 보조적 도구로 활용
(4) 기저세포암 (Basal cell carcinoma)
- 기저세포함이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
- 악성 종양 병변의 범위를 자동으로 제시해 줌으로써, 병변의 크기, 절제연과의 거리 등의 병리 판독에 보조적 도구로 활용
(5) 멜라닌세포모반 (Melanocytic nevus)
- 멜라닌세포모반이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
- 추후 악성흑색종과 합성 데이터셋을 구축하여 악성/양성 병변을 감별하는 모델 개발에 활용
(6) 흑색종 (Malignant melanoma)
- 흑색종이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
- 악성 종양 병변의 범위를 자동으로 제시해 줌으로써, 병변의 크기, 절제연과의 거리 등의 병리 판독에 보조적 도구로 활용
- 추후 멜라닌세포모반과 합성 데이터셋을 구축하여 악성/양성 병변을 감별하는 모델 개발에 활용
3) 인공지능 데이터 및 모델 개발을 적용한 기술혁신 지원 방안
- Github를 통한 모델 학습법 노하우와 최적화 방법 공유
- 데이터 구축사업을 통해 수집된 데이터 기반의 인공지능 모델을 활용을 활성화하기 위하여 플랫폼 서버에 포팅하는 등의 오픈소스화 진행
 

1. 데이터 설명
1) 세부 데이터 구성
(1) 표피낭종 (Epidermal cyst)
- 피부 아래 생기는 피부 각질과 부산물을 함유한 양성 낭종성 질환으로 외과적으로 치료하는 가장 흔한 양성 피부 질환 중 하나임. 정상 과립층을 가진 층상 구조의 편평세포로 둘러싸인 병변으로 표피각질형성세포 기원의 다른 종양성 병변들과 감별할 흔한 질환 중 하나로 고려되며, 드물게 해당 병변에서 피부암이 발생하는 경우가 있어 이에 대한 감별도 필요한 병변
(2) 지루각화증 (Seborrheic keratosis)
- 표피각질형성세포로 구성된 사마귀양 가장 흔한 양성 질환으로 외과적으로 치료하는 가장 흔한 양성 피부 질환 중 하나임. 각질형성세포에서 유래한 악성종양인 기저세포암, 보웬병, 편평상피암 뿐만 아니라 임상적으로는 멜라닌세포 기원의 흑색종까지도 감별질환으로 고려되는 등 주요한 피부암들과 감별이 필요한 병변
(3) 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)
- 표피의 각질형성세포에서 유래한 악성종양으로 피부암 중 두 번째로 흔함. 평균 수명 증가, 자외선 노출 증가에 따라 발생률이 최근 계속 증가하고 있음. 보웬병은 상피 내 편평세포암으로 5% 이하에서 침윤 편평세포암으로 진행함. 편평세포암은 일반적인 다른 암종에 비해서는 수술적 치료로 완치율이 높은 편이나 기저세포암에 비해 재발과 전이가 더 흔하여 5년 전이율은 5%까지 보고되고 있음. 재발과 전이의 위험 인자로는 원발 종양의 크기나 침윤 깊이 등이 거론되고 있어 정확한 병리진단으로 초기에 수술적 치료를 받는 것이 치료에 중요
(4) 기저세포암 (Basal cell carcinoma)
- 피부암 중에서 가장 흔한 암종인 기저세포암은 인간에서 가장 흔한 암종이고 고령화 및 자외선 노출 증가로 인해 유병률도 증가하고 있음. 60세 이상에서 발생하는 경우가 가장 흔하나 최근에는 더 젊은 사람들에게서도 점점 증가하고 있으며 자외선 노출이 발병과 연관된 것으로 알려져 있음. 수술적 치료만으로 99% 완치율을 보일 정도로 정확한 진단이 선행된다면 예후는 매우 좋음
(5) 멜라닌세포모반 (Melanocytic nevus)
- 선천성 또는 후천성으로 발생하는 양성 멜라닌세포 증식성 질환으로 그 자체로도 흔하며 한 환자에서 다발성으로 존재함. 선천성 멜라닌세포모반의 경우 1-2%에서 흑색종으로 진행하는 경우가 있으며 후천성 멜라닌세포모반의 경우 전형적이지 않은 경우에 병리검사를 통해 악성 병변인 흑색종과의 감별 필요
(6) 흑색종 (Malignant melanoma)
- 세계적으로 흑색종은 증가 추세이며 발병률에 비해 높은 사망률을 보임. 미국에서는 흑색종이 전체 피부암의 4%를 차지하지만 피부암 연관 사망의 75%를 보임. 국내에서도 고령화 및 피부 질환에 대한 관심 증가로 인해 점점 발병률이 올라가고 있음. 특히 흑색종의 경우에는 인종 간 차이에 따른 아형별 차이가 큰데 비해 기존 데이터들은 대부분 서양인을 중심으로 해서 동양인의 흑색종에 대한 관심이 높아지고 있음. 진단 및 예후 예측을 위해서는 병리조직검사가 필수적이며 림프절 침범, 침윤깊이, 유사분열 수, 혈관-림프관 침윤, 미세위성병소, 종양 내 침윤림프구 등이 예후와 연관된 병리 소견으로 알려져 있음EfficientNetB0에서 가장 높은 성능을 보였음.

1. 데이터 설명 1) 세부 데이터 구성
진단명 질환 구분 (세포 기원) 질환 구분 (양성/악성)
질환 1. 표피낭종 (Epidermal cyst) 상피세포 기원(Keratinocytic/epidermal) 양성
질환 2. 지루각화증 (Seborrheic keratosis) 양성
질환 3. 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma) 악성
질환 4. 기저세포암 (Basal cell carcinoma) 악성
질환 5. 멜라닌세포모반 (Melanocytic nevus) 멜라닌세포 기원(Melanocytic) 양성
질환 6. 흑색종 (Malignant melanoma) 악성
정상 1. 정상 피부 조직 (Normal) - -

 

2) 데이터 구축 공정별 형식
(1) 수집·정제 단계
- 이미지 데이터: 2000년부터 2021년까지 참여기관 또는 참여기관 산하 대학병원에서 피부조직 병리검사(펀치 생검, 절제 생검, 수술적 절제 등)를 시행 받은 환자이면서 본 사업에서 데이터셋 구축 대상으로 정한 6가지 질환군으로 진단된 환자의 검체 중 선정 요건을 충족하는 검체를 대상으로 디지털 병리 이미지(WSI, Whole slide images) 데이터 수집
- 텍스트 데이터: 병리 진단문 데이터로, 병원정보시스템 및 검색시스템을 활용하여 수집, 대상 증례 리스트에 새로운 일련번호 부여하고 일련번호를 통해 WSI 데이터와 매칭 가능하도록 구조화하여 수집
- 수집된 데이터 중 중복된 데이터 또는 노이즈나 메타데이터가 포함된 데이터들은 정제하도록 함
(2) 가공·검수 단계
- 정제 완료된 데이터 중 정상피부조직을 제외한 질환별 WSI 데이터에 라벨링 작업을 진행하며, 이때 1개의 원천데이터(svs, mrxs, tiff)에 대하여 1개의 라벨링 데이터(json)가 생성됨 

 

1. 데이터 설명 2) 데이터 구축 공정별 형식
구분  수집/정제 단계  가공/검수 단계
세부데이터 질환별 데이터 및 정상피부조직 질환별 데이터
데이터 구분 원시데이터/원천데이터 최종데이터(라벨링데이터)
데이터 형태 glass slides → whole slide images(digital scan files)
HIS → clinical information file
JSON 파일 형태로 산출
데이터 포맷 WSI 데이터포맷: SVS, MRXS, TIFF 가공(라벨)데이터: XML 형태
임상정보파일 데이터 포맷: CSV 최종(라벨링)데이터: JSON 형태

 

 

2. 세부데이터 예시

2. 세부데이터 예시

1) 세부데이터별 원천데이터와 데이터 가공 예시
- 표피낭종 (Epidermal cyst)

 

) 세부데이터별 원천데이터와 데이터 가공 예시 - 표피낭종 (Epidermal cyst)

- 지루각화증 (Seborrheic keratosis)
 

- 지루각화증 (Seborrheic keratosis)

- 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)

- 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)

- 기저세포암 (Basal cell carcinoma)

- 기저세포암 (Basal cell carcinoma)

- 멜라닌세포모반 (Melanocytic nevus)

- 멜라닌세포모반 (Melanocytic nevus)

 

- 흑색종 (Malignant melanoma)

- 흑색종 (Malignant melanoma)

 

- 정상피부조직 (Normal)

- 정상피부조직 (Normal)

2) 라벨링 데이터 구성 및 실제 예시
(1) 라벨링 데이터 구성
- 표피낭종 (Epidermal cyst)

2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 표피낭종 (Epidermal cyst)
구분 항목명 타입 필수 여부 설명 범위 비고
1 Clinical_information Object Y 공통임상정보    
1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
'02' : 가톨릭대학교 산학협력단
'03' : 국립암센터
'04' : 삼성서울병원
1-2 Clinical_information.PATIENT_NO String Y 환자번호    
1-3 Clinical_information.CASE_NO String Y 증례번호    
1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
1-5 Clinical_information.SEX String Y 성별 F, M  
1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
- TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
- EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
- NS : NS
1-9 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
2 Layer1[] List Y Candidate region 구분    
2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
3 Layer2[] List Y Lesion 구분    
3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

- 지루각화증 (Seborrheic keratosis)

2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 지루각화증 (Seborrheic keratosis)
구분 항목명 타입 필수 여부 설명 범위 비고
1 Clinical_information Object Y 공통임상정보    
1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
'02' : 가톨릭대학교 산학협력단
'03' : 국립암센터
'04' : 삼성서울병원
1-2 Clinical_information.PATIENT_NO String Y 환자번호    
1-3 Clinical_information.CASE_NO String Y 증례번호    
1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
1-5 Clinical_information.SEX String Y 성별 F, M  
1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
- TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
- EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
- NS : NS
1-9 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
2 Layer1[] List Y Candidate region 구분    
2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1

NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음

 

2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
3 Layer2[] List Y Lesion 구분    
3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

 

- 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)

2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)
구분 항목명 타입 필수 여부 설명 범위 비고
1 Clinical_information Object Y 공통임상정보    
1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
'02' : 가톨릭대학교 산학협력단
'03' : 국립암센터
'04' : 삼성서울병원
1-2 Clinical_information.PATIENT_NO String Y 환자번호    
1-3 Clinical_information.CASE_NO String Y 증례번호    
1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
1-5 Clinical_information.SEX String Y 성별 F, M  
1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
- TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
- EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
- NS : NS
1-9 Clinical_information.INVASIVENESS String N 침윤여부 In situ, Invasive - In situ : 상피내암(침윤여부 : N)
- Invasive : 침윤암(침윤여부: Y)
1-10 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
2 Layer1[] List Y Candidate region 구분    
2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
3 Layer2[] List Y Lesion 구분    
3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

 

- 기저세포암 (Basal cell carcinoma)

2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 기저세포암 (Basal cell carcinoma)
구분 항목명 타입 필수 여부 설명 범위 비고
1 Clinical_information Object Y 공통임상정보    
1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
'02' : 가톨릭대학교 산학협력단
'03' : 국립암센터
'04' : 삼성서울병원
1-2 Clinical_information.PATIENT_NO String Y 환자번호    
1-3 Clinical_information.CASE_NO String Y 증례번호    
1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
1-5 Clinical_information.SEX String Y 성별 F, M  
1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
- TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
- EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
- NS : NS
1-9 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
2 Layer1[] List Y Candidate region 구분    
2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
3 Layer2[] List Y Lesion 구분    
3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

 

- 멜라닌세포모반 (Melanocytic nevus)

2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 멜라닌세포모반 (Melanocytic nevus)
구분 항목명 타입 필수 여부 설명 범위 비고
1 Clinical_information Object Y 공통임상정보    
1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
'02' : 가톨릭대학교 산학협력단
'03' : 국립암센터
'04' : 삼성서울병원
1-2 Clinical_information.PATIENT_NO String Y 환자번호    
1-3 Clinical_information.CASE_NO String Y 증례번호    
1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
1-5 Clinical_information.SEX String Y 성별 F, M  
1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
- TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
- EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
- NS : NS
1-9 Clinical_information.TYPE String N 조직학적 분류 InvasiveIntradermal, Compound, Spitz - InvasiveIntradermal: 진피내모반
- Compound: 합성모반
- Spitz: 스피츠모반
1-10 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
2 Layer1[] List Y Candidate region 구분    
2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
3 Layer2[] List Y Lesion 구분    
3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

 

- 흑색종 (Malignant melanoma)

2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 흑색종 (Malignant melanoma)
구분 항목명 타입 필수 여부 설명 범위 비고
1 Clinical_information Object Y 공통임상정보    
1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
'02' : 가톨릭대학교 산학협력단
'03' : 국립암센터
'04' : 삼성서울병원
1-2 Clinical_information.PATIENT_NO String Y 환자번호    
1-3 Clinical_information.CASE_NO String Y 증례번호    
1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
1-5 Clinical_information.SEX String Y 성별 F, M  
1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
- TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
- EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
- NS : NS
1-9 Clinical_information.LN_METASTASIS String N 병리학적 림프절 전이 여부 Yes, No, NS No : pN0
Yes : pN1 이상
1-10 Clinical_information.DISTANT_METASTASIS String N 병리학적 원격 전이 여부 Yes, No, NS -
1-11 Clinical_information.INVASIVENESS String N 침윤여부 In situ, Invasive - In situ : 상피내암(침윤여부 : N)
- Invasive : 침윤암(침윤여부: Y)
1-12 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
2 Layer1[] List Y Candidate region 구분    
2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
3 Layer2[] List Y Lesion 구분    
3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

 

- 정상피부조직 (Normal)

2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 정상피부조직 (Normal)
구분 항목명 타입 필수 여부 설명 범위 비고
1 Clinical_information Object Y 공통임상정보    
1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
'02' : 가톨릭대학교 산학협력단
'03' : 국립암센터
'04' : 삼성서울병원
1-2 Clinical_information.PATIENT_NO String Y 환자번호    
1-3 Clinical_information.CASE_NO String Y 증례번호    
1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
1-5 Clinical_information.SEX String Y 성별 F, M  
1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
- TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
- EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
- NS : NS
1-9 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   

 

(2) 라벨링 데이터 실제 예시

[ 라벨링 데이터 실제 예시 ]

[ 라벨링 데이터 실제 예시 ]

데이터셋 구축 담당자

수행기관(주관) : 서울대학교병원
수행기관(주관)
책임자명 전화번호 대표이메일 담당업무
이철 02-2072-4919 andrei@snuh.org 데이터 구축 총괄
수행기관(참여)
수행기관(참여)
기관명 담당업무
가톨릭대학교 산학협력단 데이터 수집 및 검수
국립암센터 데이터 수집 및 검수
삼성서울병원 데이터 수집 및 검수
㈜서르 데이터 가공
데이터 관련 문의처
데이터 관련 문의처
담당자명 전화번호 이메일
이철 02-2072-4919 andrei@snuh.org