공공 의료데이터 상세

썸네일

NEW 소아 복부 x-ray 멀티모달 데이터

##헬스케어 의료
소아 복부 질환 진단을 위한 동일 환자의 X-ray와 CT 영상과 임상데이터 쌍으로 2,000명 이상 환자의 병리학적 진단 구별을 포함한 총 2,000건의 인공지능 학습용 데이터 구축 • 소아 복부 X-ray, CT 영상이 있는 환자에 대한 검사 2,000건 이상 • 데이터 1건 : 비식별화된 X-ray 이미지 1장, CT 이미지 1장으로 구성된 이미지 셋
분야
헬스케어
유형
텍스트,이미지
생성 방식
안심존(온라인)
  • 구축년도 : 2024
  • 버전 : 1.1
AI-HUB

데이터 변경이력

데이터 변경이력
버전 일자 변경내용 비고
1.1 2025-06-30 데이터 최종 개방
1.0 2025-04-16 데이터 개방 Beta Version

데이터 히스토리

데이터 히스토리
일자 변경내용 비고
2025-04-16 산출물 최종 공개

소개

소아 복부 질환 진단을 위한 동일 환자의  X-ray와 CT 영상과 임상데이터 쌍으로 2,000명 이상 환자의 병리학적 진단 구별을 포함한 총 2,000건의 인공지능 학습용 데이터 구축
• 소아 복부 X-ray, CT 영상이 있는 환자에 대한 검사 2,000건 이상
• 데이터 1건 : 비식별화된 X-ray 이미지 1장, CT 이미지 1장으로 구성된 이미지 셋

구축목적

• 데이터 구축 목적은 소아 복부 질환을 효과적으로 진단 보조하고 치료계획 수립을 보조하는 인공지능(AI) 모델을 개발하는 데 있음.
• 초거대 AI 학습데이터로 학습된 모델은 X-ray, CT 의료 영상 분석을 통해 소아 복부 질환의 존재 및 유형을 자동으로 식별하고, 복부 내 이상을 정확히 파악하는 데 중요한 역학을 함.
• 복부 종괴 질환 그룹과 장폐색 질환 그룹을 포함한 다양한 소아 복부 질환에 대한 진단 지원을 복적으로 함.

□ 데이터 구축 규모 

□ 데이터 구축 규모 
구분 원천
데이터 건수
라벨링
데이터 건수
복부종괴 장폐색 대조군
소아복부 질환 122,510 122,510 47,920 43,194 31,396
항목 요구사항
데이터 수량 o (원천데이터) 소아 복부 질환 진단을 위한 동일 환자의 X-ray와 기타 의료 영상과 임상데이터 쌍으로 2천 건 이상
- (라벨링 데이터) 주요 임상증상, 진단명 및 치료 방법 레발링
- 원시데이터 수량 (X-ray/CT set 2,000건 이상)
- 원천데이터 수량 (X-ray/CT set 2,000건 이상)
- 라벨링 데이터 수량 (JSON 4,000개 이상)
데이터 구성 o (원천데이터) 동일 환자의 X-ray, CT 영상과 임상데이터 쌍으로 2,000건 이상 수집
o 복부 종괴 주요 임상증상 라벨링
- 종괴, 석회화
o 장폐색 주요 임상증상 라벨링
- 공기액체음영, 장 확장, 이물질
o 복부 종괴 주요 진단명 구성
- 신경모세포종, 기형종, 간모세포종, 림프관낭종, 윌름스 종양, 육종, 신경종양, 난조 종양, 혈관 기형, 복강 내 혈액암, 비간모세포종 간 종양, 췌장 종양
o 장폐색 주요 진단명 구성
- 멕켈게실, 장충접증, 중복장, 용종, 장 염전, 이물질, 합병증 동반한 충수 돌기염, 염증성 장질환, 장유착에 의한 장폐색
o 치료 방법 라벨링
- 비수술적 치료, 수술적 치료

 

□ 데이터 분포

□ 데이터 분포
데이터명 원천데이터 구분 구축 비율
소아 복부 멀티모달 데이터 복부 종괴 질환 그룹 750장(37.5%)
장폐색 질환 그룹 750장(37.5%)
대조군 500장(25.0%)

□ 소아 복부질환

□ 소아 복부질환
데이터명 AI모델 task AI모델(후보) 성능 지표 및 목표값 Data I/O
소아복부X-ray멀티모달 데이터 임무1:소아 복부질환 영상 진단 분석 모델 MIAC(자체개발),
SAT+GPT-3,
mDiNAP-transformer-ewp
ROUGE-1 Recall
>= 75%
Input data : X-Ray, CT Series,메타데이터
output data : X-Ray및CT에 대한 종합 진단 소견
임무1: 소아 복부질환 영상 진단 분석 모델
AI모델task AI모델(후보) 성능 지표 및 목표값 Data I/O
임무2:소아 복부질환 주요 소견 검출 모델(X-ray)
(Object Detection)
Faster R-CNN,
Retinanet,
YOLO
Sensitivity >= 80% Input data : X-ray Image
output data :소아복부 질환의 주요 소견(종괴,석회화,장확장,공기액체음영,이물질)의Bounding Box
임무2: 소아 복부질환 주요 소견 검출 모델(X-ray) (Object Detection)
AI모델 task AI모델(후보) 성능 지표 및 목표값 Data I/O
임무3:소아 복부종괴 및 장확장 분할 모델(CT)
(Semantic Segmentation)
U-net,
Attention U-net,
U2-net
Dice Similarity
Coefficie >= 85%
Input data :CT Image
output data :종괴,장확장Binary mask
임무3: 소아 복부종괴 및 장확장 분할 모델(CT) (Semantic Segmentation)

□ 원천 데이터

□ 원천 데이터
2차 경로 3차 경로 4차 경로 파일 포맷
01.복부종괴 ANO_1001 01. CR DICOM
02. CT  
02.장폐색 ANO_2001 01. CR DICOM
02. CT
03.대조군 ANO_3001 01. CR DICOM
02. CT
총 수량 122,510

 

□ 라벨링 데이터

□ 라벨링 데이터
2차 경로 3차 경로 4차 경로 파일 포맷
01.복부종괴 ANO_1001 01. CR DICOM
02. CT  
02.장폐색 ANO_2001 01. CR DICOM
02. CT
03.대조군 ANO_3001 01. CR DICOM
02. CT
총 수량 122,510

 

□ 폴더명 구성 정보

□ 폴더명 구성 정보
경로 구분 정보 구분자 정보
1차 경로 데이터 종류 원천데이터/라벨링데이터
2차 경로 질환 종류 복부종괴/장폐색/대조군
3차 경로 환자별 가명화된 환자 아이디 폴더ANO_1001
4차 경로 이미지 종류 이미지 데이터 종류CR / CT

 

□ 파일명 구성 정보

□ 파일명 구성 정보
예시 세부 구성 설명
ANO_1001_CR_NBL_0001.dcm 가명화 환자명-데이터그룹명(질환별)-가명화 환자번호-모탈리티 분류(CR/CT)-세부질환명 분류-슬라이드 인덱스-데이터 포맷 분류

 

□ 라벨 구성요소
 - 소아 복부 질환

□ 라벨 구성요소  - 소아 복부 질환
구분 속성명 타입 설명 예시 비고
공통 filename string 데이터명 ANO_1001.dcm  
format string 포맷 dcm  
data string X-ray / CT영상시행일, X-ray와 Ct영상의 시행일이 따로 들어감 YYYY.MM.DD  
성별 string 성별 F : Female,
M: Male
 
연령 Number 연령 0~18  
영상 당시 키 Number 0~300  
영상 당시 몸무게 Number 몸무게 0~300  
치료 방법 string 치료 방법 비수술적 치료 or
수술적 치료 or null
 
수술 여부 string 수술 여부 Y : Yes,
N : No or null
 
수술일 string 수술일 YYYY.MM.DD or null  
수술명 string 수술명 -  
진단명 String 진단명은 복부 종괴/장폐색/대조군에 따라 다르게 진단됨 [복부 종괴]
신경모세포종, 기형종, 간모세포종, 림프관낭종, 윌름스 종양, 육종, 신경종양, 난소종양, 혈관 기형, 복강 내 혈액암, 비간모세포종 간 종양, 췌장 종양

[장폐색]
멕켈게실, 장중첩증, 중복장, 용종, 장 염전, 이물질, 합병증 동반한 충수 돌기염, 염증성 장질환, 장유착에 의한 장폐색

[대조군]
대조군
 
복부종괴 위치 String 복부종괴 위치, 장폐색 그룹, 대조군의 경우 null RUQ,RLQ, LUQ, LLQ
or null
 
복부종괴 석회화 String 복부종괴 석회화, 장폐색 그룹, 대조군의 경우 null Y : Yes,
N : No,
or null
 
장폐색 그룹
Transition
String 장폐색 그룹 Transition, 복부종괴 그룹, 대조군의 경우 null Y : Yes,
N : No,
or null
 
장폐색 그룹
Ischemia, perfusion 저하
String 장폐색 그룹 Ischemia, perfusion 저하, 복부종괴 그룹, 대조군의 경우 null Y : Yes,
N : No,
or null
 
장폐색 그룹
Closed loop
여부
String 장폐색 그룹 Closed loop 여부, 복부종괴 그룹, 대조군의 경우 null Y : Yes,
N : No,
or null
 
장폐색 그룹
Pneumoperitoneum 여부
String 장폐색 그룹 Pneumoperitoneum여부, 복부종괴 그룹, 대조군의 경우 null Y : Yes,
N : No,
or null
 
rescale Slope Number 픽셀 값을 변환할 때 사용되는 선형변환의 기울기 -  
rescale
Intercept
Number 셀 값을 변환할 때 사용되는 선형 변환의 y절편 -  
pixel size Number 픽셀 중심 사이의 물리적 거리,단위, mm -  
slice thickness Number 슬라이스 두께, 단위mm -  
종괴
Bbox
Dict 해당 라벨링은 복부종괴 그룹에서 그리는 라벨링으로 장폐색 그룹 및 대조군 그룹의 경우 null로 표기
복부종괴 그룹에서 x-ray데이터 중 종괴가 보이지 않는 경우 null로 표기
   
석회화 Bbox Dict 해당 라벨링은 복부종괴 그룹에서 그리는 라벨링으로 장폐색 그룹 및 대조군 그룹의 경우 null로 표기
복부종괴 그룹에서 CT와 X-ray에서 석회화가 보이지 않는 경우 null로 표기
   
공기액체음영
Bbox
Dict 해당 라벨링은 장폐색 그룹에서 그리는 라벨링으로 복부종괴 그룹 및 대조군 그룹의 경우 null로 표기
장폐색 그룹에서 x-ray 데이터 중 공기액체음영이 보이지 않는 경우 null로 표기
   
이물질
Bbox
Dict 해당 라벨링은 장폐색 그룹에서 그리는 라벨링으로 복부종괴 그룹 및 대조군 그룹의 경우 null로 표기
장폐색 그룹에서 CT와 x-ray데이터 중 이물질이 보이지 않는 경우 null로 표기
   
장확장
Bbox
Dict 해당 라벨링은 장폐색 그룹에서 그리는 라벨링으로 복부종괴 그룹 및 대조군 그룹의 경우 null로 표기
장폐색 그룹에서 x-ray데이터 중 장확장 영역이 보이지 않는 경우 null로 표기
   
종괴 mask Dict 해당 라벨링은 복부종괴 그룹에서 그리는 라벨링으로 장폐색 그룹 및 대조군 그룹의 경우null로 표기
CT데이터 특성 상 모든 슬라이스에 라벨링이 존재하지 않는 경우가 있다.
이에 해당 케이스에 복부종괴가 존재하나, 해당 슬라이스에 라벨링이 없는 경우는 리스트 안에 string "None"으로 표기하며, 해당 슬라이스에 라벨링이 있는 경우는 리스트 안에 리스트로 좌표값을 기입
   
장확장 종괴
mask
Dict 해당 라벨링은 장폐색 그룹에서 그리는 라벨링으로 복부종괴 그룹 및 대조군 그룹의 경우 null로 표기
장폐색 그룹에서 CT 데이터 중 장확장 영역이 보이지 않는 경우 null로 표기

CT 데이터 특성 상 모든 슬라이스에 라벨링이 존재하지 않는 경우가 있다.
이에 해당 케이스에 장확장은 존재하나, 해당 슬라이스에 라벨링이 없는 경우는 리스트 안에 string "None"으로 표기하며, 해당 슬라이스에 라벨링이 있는 경우는 리스트 안에 리스트로 좌표값을 기입
   

 

□ json 실제예시

json 실제예시

데이터셋 구축 담당자

수행기관(주관) : 서울대학교병원
수행기관(주관)
책임자명 전화번호 대표이메일 담당업무
김현영 02-2072-2478 spkhy02@snu.ac.kr 사업 총괄, 데이터 수집 / 정제 / 검수
수행기관(참여)
수행기관(참여)
기관명 담당업무
(의료)길의료재단 데이터 정제 / 가공 / AI 모델링
㈜어반데이터랩 사업 관리 총괄, 데이터 품질 관리
데이터 관련 문의처
데이터 관련 문의처
담당자명 전화번호 이메일
안치성 02-743-1257 ceo@urbancorp.co.kr
이승호 02-743-1257 leesh@urbancorp.co.kr
AI모델 관련 문의처
AI모델 관련 문의처
담당자명 전화번호 이메일
김영재 032-458-2879 kimyj10528@gmail.com
박준영 032-458-2879 jun0613@gachon.ac.kr
저작도구 관련 문의처
저작도구 관련 문의처
담당자명 전화번호 이메일
김영재 032-458-2879 kimyj10528@gmail.com
이소현 032-458-2879 l03hyun99@gachon.ac.kr