| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.1 | 2024-01-19 | 데이터 최종 개방 | |
| 1.0 | 2023-05-26 | 데이터 개방(Beta Version) |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-05-08 | 데이터셋 변경 | 구축업체정보 수정 |
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 수정 |
| 2024-03-20 | 산출물 최종 공개 |
2· 11개의 의료기관에서 획득한 소아 엑스레이 데이터로 소아 복부 질환으로 소아 복부 엑스레이 이미지 50,000장 이상의 다양한 영상을 Annotaion한 데이터셋으로 임상 정보와 관련한 구조화된 데이터를 구축
• 소아는 연령별로 복강의 크기와 모양이 다양하며, 성인과 현저히 다르고, 소아 연령에서 흔히 오는 복부 통증의 양상도 성인과 다름 • 따라서, 성인 복부 X-ray 기반으로 학습된 딥러닝 모델들을 소아에게 적용하는데 한계점이 있음. • 소아복부 X-Ray 인공지능학습데이터를 구축하여 소아 복부 질환 조기진단 등 의료진을 지원하는 다양한 인공지능모델을 개발하기 위한 학습데이터 구축.
| 데이터 영역 | 헬스케어 | 데이터 유형 | 텍스트 , 이미지 |
|---|---|---|---|
| 데이터 형식 | txt | 데이터 출처 | 소아 복부 엑스레이 : 병원에서 진료 목적으로 촬영된 이미지 데이터 EMR : 병원에서 치료 목적으로 수집한 임상 데이터 |
| 라벨링 유형 | 세그멘테이션(이미지) | 라벨링 형식 | JSON |
| 데이터 활용 서비스 | 데이터 구축년도/ 데이터 구축량 |
2022년/133,318 |
1. 데이터 구축 규모
-각 의료기관별 수집 규모
| 병원명 | 정상군 | 정상 총계 | 질환군 | 총계 | |||
|---|---|---|---|---|---|---|---|
| 10kg 미만 | 10kg 이상 -20kg미만 | 20kg 이상 -30kg미만 | 30kg 이상 | ||||
| 총계 | 5,500 | 10,150 | 6,000 | 8,500 | 30,150 | 19,850 | 50,000 |
| 고려대학교 산학협력단 | 1,834 | 3,382 | 1,998 | 2,836 | 10,050 | 6,626 | 16,676 |
| 삼성서울병원 | 611 | 1,128 | 667 | 944 | 3,350 | 2,204 | 5,554 |
| 가톨릭대학교 산학협력단 | 611 | 1,128 | 667 | 944 | 3,350 | 2,204 | 5,554 |
| 아주대학교 산학협력단 | 611 | 1,128 | 667 | 944 | 3,350 | 2,204 | 5,554 |
| 충북대학교병원 | 611 | 1,128 | 667 | 944 | 3,350 | 2,204 | 5,554 |
| 계명대학교 산학협력단 | 611 | 1,128 | 667 | 944 | 3,350 | 2,204 | 5,554 |
| 차의과학대학교 | 611 | 1,128 | 667 | 944 | 3,350 | 2,204 | 5,554 |
| 분당차 | |||||||
-질환별 수집 규모
| 병원명 | 기복증 | 종괴 | 장중첩증 | 공기액체음영 | 이물 | 변비 | 석회화 | 비비대 | 간비대 | 전내장 역위증 | 총계 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 병변 | |||||||||||
| 총계 | 1,650 | 1,100 | 3,300 | 2,200 | 1,000 | 6,600 | 1,000 | 1,000 | 1,000 | 1,000 | 19,850 |
2. 데이터 분포
| 구분 | |
|---|---|
| 체중별 분포 | D00 : 38,039(57.07%) |
| D01 : 2,148(3.22%) | |
| D02 : 1,294(1.94%) | |
| D03 : 6,151(9.23%) | |
| D04 : 2,215(3.32%) | |
| D05 : 1,874(2.81%) | |
| D06 : 6,807(10.21%) | |
| D07 : 1,498(2.25%) | |
| D08 : 2,535(3.80%) | |
| D09 : 3,033(4.55%) | |
| D10 : 1,054(1.58%) | |
| 정상 및 질환군별 분포 | W01 : 11,496(17.25%) |
| W02 : 26,970(40.47%) | |
| W03 : 10,361(15.55%) | |
| W04 : 17,821(26.74%) | |
소아 엑스레이 영상에서의 복부 질환 분류 모델
- 기능: 소아 엑스레이 영상에서 총 11가지 종류의 복부 질환(정상, 기복증, 종괴, 장중첩증, 공기액체음영, 이물, 변비, 석회화병변, 비장비대, 간비대, 전내장역위증)을 분류
- 사용 모델: EfficientNet-B0


- 모델 출력: 질환에 해당하는 질환 번호를 출력 (정상: 0, 기복증: 1, 종괴: 2, 장중첩증: 3, 공기액체음영: 4, 이물: 5, 변비: 6, 석회화병변: 7, 비장비대: 8, 간비대: 9, 전내장역위증: 10)
- 모델 성능: 테스트 세트 6,664건에 대해 accuracy 83% 달성하였으며, 각 질환에 대한 혼동 행렬 (confusion matrix)는 아래와 같음
| 모델 예측 | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 정답 | 정상 | 기복증 | 종괴 | 장중첩증 | 공기액체음영 | 이물 | 변비 | 석회화병변 | 비장 비대 | 간비대 | 전내장역위증 | |
| 정상 | 3369 | 137 | 43 | 78 | 67 | 17 | 35 | 14 | 35 | 8 | 1 | |
| 기복증 | 22 | 167 | 5 | 0 | 10 | 2 | 1 | 4 | 1 | 3 | 0 | |
| 종괴 | 0 | 0 | 130 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
| 장중첩증 | 0 | 0 | 0 | 615 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
| 공기액체음영 | 0 | 0 | 0 | 0 | 221 | 0 | 0 | 0 | 0 | 0 | 0 | |
| 이물 | 0 | 0 | 0 | 0 | 0 | 187 | 0 | 0 | 0 | 0 | 0 | |
| 변비 | 0 | 0 | 0 | 0 | 0 | 0 | 681 | 0 | 0 | 0 | 0 | |
| 석회화병변 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 150 | 0 | 0 | 0 | |
| 비장 비대 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 253 | 0 | 0 | |
| 간비대 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 303 | 0 | |
| 전내장역위증 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 105 | |
데이터 구성
| Key | Description | Type |
|---|---|---|
| annotation | 어노테이션정보 | array |
| m_isClosed | 폴리곤 개방여부 | boolean |
| m_area | 면적 | number |
| m_points | 객체좌표 | array |
| x | x좌표 | number |
| y | y좌표 | number |
| label | 카테고리 분류 | string |
| type | 라벨링 타입 | string |
| images | 이미지 | object |
| width | 넓이 | string |
| dataCaptured | 촬영날짜 | string |
| height | 높이 | string |
| dataInfo | 데이터 정보 | string |
| 기복증 | 복강에 공기가 들어간 질환 | string |
| 종괴 | 종양 | string |
| 석회화병변 | 혈관 또는 장기에 석회화 | string |
| 정상 | 질병없음 | string |
| 비장비대 | 비장 커진 상태 | string |
| 장중첩증 | 대장에 소장 삽입 | string |
| 간비대 | 간이 커진 상태 | string |
| 공기-액체음영 | 공기와 액체가 섞인 상태 | string |
| 이물 | 금속,플라스틱 이물 | string |
| 변비 | 변비 | string |
| 자세 | Supine, Erect | string |
| Clinic_info | 병원 정보 | object |
| Acquisition_date | 취득일 | string |
| PatientID | 환자ID | string |
| Height | 키 | number |
| Gender | 성별 | string |
| Body_weight | 체중 | number |
| Wt_group | 체중 그룹코드 | string |
| Type | 질환 타입 | string |
어노테이션 포맷
| 구 분 | 속성명 | 속성설명 | 데이터 타입 | 필수여부 | 예시 | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | annotation | 어노테이션정보 | array | Y | |||||||
| 1-1 | object | object | Y | ||||||||
| 1-1-1 | m_isClosed | (커브)폴리곤 개방여부 | boolean | N | |||||||
| 1-1-2 | m_area | 면적 | number | N | |||||||
| 1-1-3 | m_points | 객체좌표 | array | N | |||||||
| 1-1-3-1 | object | object | N | ||||||||
| 1-1-3-1-1 | x | x좌표 | number | N | |||||||
| 1-1-3-1 -2 | y | y좌표 | number | N | |||||||
| 1-1-4 | label | 카테고리 분류 | string | N | 비장비대 | ||||||
| 1-1-5 | type | 라벨링 타입 | string | N | curvPoly | ||||||
| 2 | images | 이미지 | object | Y | |||||||
| 2-1 | width | 넓이 | string | Y | 1806 | ||||||
| 2-2 | dataCaptured | 촬영날짜 | string | Y | 20180705 | ||||||
| 2-3 | height | 높이 | string | Y | 2251 | ||||||
| 3 | dataInfo | 데이터 정보 | array | Y | |||||||
| 3-1 | object | object | Y | ||||||||
| 3-1-1 | 기복증 | 복강에 공기가 들어간 질환 | string | Y | 1 | ||||||
| 3-1-2 | 종괴 | 종양 | string | Y | 1 | ||||||
| 3-1-3 | 석회화병변 | 혈관 또는 장기에 석회화 | string | Y | 1 | ||||||
| 3-1-4 | 정상 | 질병없음 | string | Y | 2 | ||||||
| 3-1-5 | 비장비대 | 비장 커진 상태 | string | Y | 1 | ||||||
| 3-1-6 | 장중첩증 | 대장에 소장 삽입 | string | Y | 1 | ||||||
| 3-1-7 | 간비대 | 간이 커진 상태 | string | Y | 1 | ||||||
| 3-1-8 | 공기-액체음영 | 공기와 액체가 섞인 상태 | string | Y | 1 | ||||||
| 3-1-9 | 이물 | 금속,플라스틱 이물 | string | Y | 1 | ||||||
| 3-1-10 | 변비 | 변비 | string | Y | 1 | ||||||
| 3-1-11 | 자세 | Supine, Erect | string | Y | 1 | ||||||
| 4 | Clinic_info | 병원 정보 | object | Y | |||||||
| 4-1 | Acquisition_date | 취득일 | string | N | 2020-06-16 0:00 | ||||||
| 4-2 | PatientID | 환자ID | string | Y | 01-00005461 | ||||||
| 4-3 | Height | 키 | number | N | 0 | ||||||
| 4-4 | Gender | 성별 | string | N | M | ||||||
| 4-5 | Body_weight | 체중 | number | Y | 0 | ||||||
| 4-6 | Wt_group | 체중 그룹코드 | string | Y | W01 | ||||||
| 4-7 | Type | 질환 타입 | string | Y | D01 | ||||||
데이터 포맷
| 소아 복부 이미지 데이터 |
|---|
| 원천 데이터 : DICOM |
| 라벨링 데이터 : JSON[PNG, DICOM] |
| 소아 복부 임상 의료 데이터 |
|---|
| 메타 데이터 : TXT |
| 라벨링 데이터 : JSON |
실제예시

| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 최병민 | 031-412-5579 | cbmin@korea.ac.kr | 연구원 |
| 기관명 | 담당업무 |
|---|---|
| 가톨릭대학교 산학협력단 | 데이터 수집 |
| 계명대학교 산학협력단 | 데이터 수집 |
| 삼성서울병원 | 데이터 수집 |
| 아주대학교 산학협력단 | 데이터 수집 |
| 연세대학교 산학협력단 | 데이터 수집 |
| 차의과대학교 분당차병원 | 데이터 수집 |
| 충북대학교병원 | 데이터 수집 |
| 미소정보기술 | 데이터셋 정제, 비식별화 도구, 저작도구 |
| 코어라인소프트 | 학습모델 구현 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 김형진 | 031-412-5579 | unk1004@hanmail.net |