| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.0 | 2022-07-13 | 데이터 개방 | 데이터 최초 개방 |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 수정 |
| 2022-07-13 | 산출물 공개 | 콘텐츠 최초 등록 |
핵의학 PET/CT 영상에서 폐암, 혈액암 및 정상대조군의 데이터를 수집, 정제, 가공한 AI학습용 데이터셋
종양 전신 PET의 다차원적 정량적 평가를 도울 수 있는 인공지능 모델 개발 및 PET 판독과 환자 종양상태 평가에 대한 객관적 지표 제공, 여러 임상 AI 연구에 활용하고자 함.
| 데이터 영역 | 헬스케어 | 데이터 유형 | 이미지 |
|---|---|---|---|
| 데이터 형식 | dcm(dicom) | 데이터 출처 | 자체 수집 |
| 라벨링 유형 | 폴리곤(이미지) | 라벨링 형식 | Nifti(*.nii.gz), JSON |
| 데이터 활용 서비스 | 국내 영상 및 병리분야 AI 진단 보조모델 등 | 데이터 구축년도/ 데이터 구축량 |
2021년/3,566,024 |
1) 데이터 구축 규모
| 질환명 | 서울대병원 | 분당서울대병원 | 국립암센터 | 세브란스병원 | 아주대병원 | 서울성모병원 | 소계 |
|---|---|---|---|---|---|---|---|
| 폐암 | 476 | 108 | 292 | 542 | 292 | 290 | 2,000 |
| 혈액암 | 468 | 860 | 468 | 468 | 468 | 468 | 3,200 |
| 정상인 | 58 | 58 | 58 | 58 | 410 | 58 | 700 |
| 소계 | 1,002 | 1,026 | 818 | 1,068 | 1,170 | 816 | 5,900 |
2) 데이터 분포
| 원격전이 여부 | 비율(%) |
|---|---|
| 없음 | 85 |
| 있음 | 15 |
| 치료상태 | 비율(%) |
|---|---|
| 치료 전 | 48 |
| 치료 후 | 52 |
| 연령대 | 비율(%) |
|---|---|
| 60세 미만 | 73 |
| 60세 이상 | 27 |
1) 모델학습
* 폐암/혈액암 종양 영역 분할 모델 개발
| - Optimizer : Adam - Loss Function : Dice Cross Entropy Loss - Batch Size : 2 - Crop Size : 128*128*160 - Epoch : 200 |
|---|

2) 서비스 활용 시나리오

3) 기타 정보
포괄성
독립성
유의사항
1) 데이터 포맷
| 영상 모달리티 | 데이터포맷 | 어노테이션 항목 |
|---|---|---|
|
3D PET 이미지
|
DICOM | 정상인 장기(organ), |
| 폐암/혈액암 종양 3D segmentation | ||
|
3D CT 이미지
|
DICOM | |

2) 데이터 구성

3) 어노테이션 포맷
| 구분 | 항목명 | 타입 | 필수여부 | 설명 | 범위 | 비고 | |
|---|---|---|---|---|---|---|---|
| 1 | 기본정보 | Object | 기본정보 | ||||
| 1-1 | AGE | NUMBER | M | 나이 | |||
| 1-2 | SEX | String | M | 성별 | “F”or“M” | ||
| 1-3 | SMOKING | String | O | 흡연력 | |||
| 1-4 | DM | String | O | 과거력:당뇨 | |||
| 1-;5 | HTN | String | O | 과거력:고혈압 | “Y” or “N” | ||
| 1-6 | PTID | String | M | 익명화ID | |||
| 1-7 | IMAGEDATE | String | C | 영상획득날짜 | 혈액암 | ||
| 2 | 임상정보 | Object | 임상정보 | ||||
| 2-1 | Purpose | String | C | 촬영목적 | "BASELINE", "INTERIM", "EOT", null | 혈액암 | |
| 2-2 | Diagnosis | String | O | 진단명 | 폐암, 림프종, 정상 | ||
| 2-3 | CStaging | String | O | 임상병기 | TNM 병기 | ||
| 2-4 | PStaging | String | O | 병리병기 | TNM 병기 | ||
| 2-5 | BX_LOCATION | String | O | 바이오마커 | "Squamous cell carcinoma", "Adenocar cinoma", "Small cell lung cancer", "Adenosquamous cell carcinoma", "Large cell carcinoma", "Others", NULL | ||
| 2-6 | SUBTYPE_ADC | String | O | 바이오마커 | "Papillary", "Micropapillary", "Acinar", "Lepidic", "Solid", "Others", NULL | 폐암 관련 바이오마커 | |
| 2-7 | EGFR | String | O | 바이오마커 | Negative, "Positive", NULL | 폐암 관련 바이오마커 | |
| 2-8 | EGFR_LOC | String | O | 바이오마커 | 폐암 관련 바이오마커 | ||
| 2-9 | ALK | String | O | 바이오마커 | "PSTAGE", "P_T", "Negative", "Positive" | 폐암/혈액암 관련 바이오마커 | |
| 2-10 | OTHER_MUTATION | String | O | 바이오마커 | "BRAF", "HER-2", "ROS1", "KRAS", "RET", "Others" | 폐 암 관 련 바이오마커 | |
| 2-11 | PD-L1_IHC_2 | String | O | 바이오마커 | "22C3", "28-8", "SP263", "SP142" | 폐 암 관 련 바이오마커 | |
| 2-12 | PD-L1_IHC_3 | String | O | 바이오마커 | 22C3, "28-8", "SP263", "SP142" | 폐 암 관 련 바이오마커 | |
| 2-13 | B_SYMPTOMS | String | O | 바이오마커 | "Fever", "Night sweats", "Weight loss", "NA" | ||
| 2-14 | ECOG_PS | String | O | 바이오마커 | "0", "1", "2", "3", "4" | 혈액암관련 바이오마커 | |
| 2-15 | PREV_CTX | String | O | 바이오마커 | "ECOG_P S", "G_CSF_D ATE" | 혈액암관련 바이오마커 | |
| 2-16 | BIOPSY_SITE | String | O | 바이오마커 | "LN region", "Spleen", "Bone marrow", "Other extranodal organ" | ||
| 2-17 | PATHOLOGY_SUBTYPE | String | O | 바이오마커 | "DLBCL", "FL", "HL", "MM", "etc" | 혈액암 관련 병리소견 | |
| 2-18 | CD45 | String | O | 바이오마커 | "Positive", "Negative" | 혈액암관련 바이오마커 | |
| 2-19 | CD3 | String | O | 바이오마커 | "Positive", "Negative", "reactive T cells" | 혈액암관련 바이오마커 | |
| 2-20 | HHV8 | String | O | 바이오마커 | "Positive", "Negative" | 혈액암관련 바이오마커 | |
| 2-21 | SOX11 | String | O | 바이오마커 | "Positive", "Negative" | 혈액암관련 바이오마커 | |
| 2-22 | MYC | String | O | 바이오마커 | "Positive", "Negative" | 혈액암관련 바이오마커 | |
| 2-23 | BLC6 | String | O | 바이오마커 | "Positive", "Negative" | 혈액암관련 바이오마커 | |
| 3 | 라벨영역정보 | Object | 라벨영역정보 | ||||
| 3-1 | ROI.type | String | C | ROI의 종류 | 정상군(NULL) | ||
| "Primary", "Lymph Node 1", "Lymph Node 2", "Lymph Node 3", "Metastasis", “-” | 폐암("Primary", "Lymph Node 1", "Lymph Node 2", "Lymph Node 3", "Metastasis", “-”) | ||||||
| "Above Diaphragm", "Below Diaphragm", "Tonsil", "Spleen", "Bone marrow", "Liver", "ETC", “-”, NULL | 혈액암("Above Diaphragm", "Below Diaphragm", "Tonsil", "Spleen", "Bone marrow", "Liver", "ETC", “-”, NULL) | ||||||
| 3-2 | ROI.organ | String | C | ROI 내의 장기 | "Aorta", "Liver", "Lumbar Bone Marrow", "Mediastinal Blood Pool“, NULL | 정상군 | |
| 폐암(NULL) | |||||||
| 혈액암(NULL) | |||||||
| 3-3 | ROI.name | String | M | ROI 이름 | "aor, "liv", "lbm", "mbp“ | 정 상 군 | |
| "P", "N1", "N2", "N3", "M“ | 폐암 | ||||||
| "0_AD", "0_BD", "0_TN", "0_SP", "0_BM", "0_LV", "0_ETC", "1_AD", "1_BD", "1_TN", "1_SP", "1_BM", "1_LV", "1_ETC", "2_AD", "2_BD", "2_TN", "2_SP", "2_BM", "2_LV", "2_ETC", "3_AD", "3_BD", "3_TN", "3_SP", "3_BM", "3_LV", "3_ETC", "4_AD", "4_BD", "4_TN", "4_SP", "4_BM", "4_LV", "4_ETC", "-" | 혈액암 | ||||||
| 3-4 | ROI.method | String | M | ROI 생성 방법 | "40%", "n", "-" | Semi-auto 방식으로 생성시 방법. | |
| 정상군("n"),폐암("40%","n",“-”),혈액암("n",“-”) | |||||||
| 3-5 | ROI.id | String | M | “-” | |||
4) 실제 예시
| 폐암 | 혈액암 | 정상인 |
|---|---|---|
![]() |
![]() |
![]() |
| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 최홍윤 | 02-2072-3347 | chy1000@gmail.com | 데이터 수집, 정제, 가공, 검수, 알고리즘 개발 |
| 기관명 | 담당업무 |
|---|---|
| 국립암센터 | 데이터 수집, 정제, 가공, 검수 |
| 분당서울대병원 | 데이터 수집, 정제, 가공, 검수 |
| 아주대 산학협력단 (아주대병원) | 데이터 수집, 정제 및 가공 교육, 가공, 검수 |
| 연세대 산학협력단 (세브란스병원) | 데이터 수집, 정제, 가공, 검수 |
| 가톨릭대 산학협력단 (서울성모병원) | 데이터 수집, 정제 및 가공 교육, 가공, 검수 |
| 서울아산병원 | 데이터 검수 및 QC |
| ㈜에이아이더뉴트리진 | 데이터 정제, 가공, 검수 및 QC, DB 구축, 알고리즘 개발, 서비스 개발, 홍보 |