공공 의료데이터 상세

썸네일

화상 이미지 및 임상 데이터

##헬스케어## 의료## 인공지능## 딥러닝## 화상## 창상## 시계열##헬스케어 의료
화상 진단을 보조하고 화상 단계를 판정하는 인공지능 기술 개발을 위한 데이터로 본 데이터를 통해 화상 치료의 표준화를 이루고 의료비 상승을 촤소화 하고자 함
분야
헬스케어
유형
이미지
생성 방식
안심존(온라인)
  • 구축년도 : 2022
  • 버전 : 1.1
AI-HUB

데이터 변경이력

데이터 변경이력
버전 일자 변경내용 비고
1.1 2023-12-01 데이터 최종 개방
1.0 2023-05-04 데이터 개방 Beta Version

데이터 히스토리

데이터 히스토리
일자 변경내용 비고
2025-01-06 데이터셋 변경 메타데이터 데이터 구축량 정보 수정
2024-01-24 산출물 최종 공개

소개

화상 진단을 보조하고 화상 단계를 판정하는 인공지능 기술 개발을 위한 데이터로 본 데이터를 통해 화상 치료의 표준화를 이루고 의료비 상승을 촤소화 하고자 함

구축목적

본 화상 데이터를 구축함으로써 화상 진단을 보조하고 화상 단계를 판정하는 인공지능 기술 개발과 시계열 데이터를 통한 치료 예측 인공지능 기술을 개발하고자 함
 
구분 단계 목표 수량 구축
진단 화상1도 750 750 100%
화상2도 표재성 3,250 3,250 100%
화상2도 심재성 5,000 5,000 100%
화상3도 5,000 5,000 100%
화상4도 1,000 1,000 100%
15,000 15,000 100%
시계열 화상1도 250 250 100%
화상2도 표재성 1,250 1,833 147%
화상2도 심재성 1,500 2,796 186%
화상3도 1,500 1,505 100%
화상4도 500 626 125%
5,000 7,010 140%
Dicom  1,000 1,331 133%
21,000 23,341 111%

 

 
 
화상 단계별 데이터 구성비

화상 단계별 데이터 구성비 차트

 

 ① 인공지능 기반 화상 피부 진단 검출 모델
   - 화상 5단계(1도, 표재성 2도, 심재성 2도, 3도, 4도)를 학습하고, 이를 기반으로 화상 단계를 진단 
   - 실시간 영상 판독이 가능하도록 정확도-추론 속도의 trade-off 관계를 최소화하는 EfficientNetV2 small model을 기반으로 사용. 
   - 입력과 검출 결과가 한 번에 이루어지는 end-to-end 구조의 one-stage object detection model로 학습

 

EfficientNetV2 small 모델 구조

EfficientNetV2 small 모델 구조

 

One-stage model 구조

One-stage model 구조

 

② 인공지능 기반 화상 피부 치유 단계 예측 모델
   - 시계열 데이터의 기간 및 치유 범위 (사분위의 단계)를 학습하고, 이를 기반으로 일정 기간 후에 환부의 호전 정도를 예측
   - ConvLSTM은 기존 Fully Connected LSTM (CNN + LSTM)이 공간적 특성을 반영하지 못하는 단점을 보완한 모델. 
   - 기존 모델과 학습 방법은 동일하지만 입/출력, 상태 레이어가 3차원 벡터로 연산되며 일반 행렬곱 대신 합성곱으로 이루어져 시간적, 공간적 특성을 동시에 학습할 수 있는 장점이 있음. 
   - 기존 LSTM, FC-LSTM 모델보다 우수한 성능을 나타냄. 
   - 학습 시 예측된 자료를 다시 입력 자료로 활용.

 

ConvLSTM
 

- 데이터셋은 크게 화상 이미지 데이터, 영상 검사 데이터, 임상정보 데이터로 구성

  (1) 화상 이미지 데이터 : 원천데이터(이미지, 형식 : JPG) - 라벨링데이터(JSON)
  (2) 영상 검사 데이터 : 원천데이터(이미지, 형식 : DICOM)
  (3) 임상 정보 데이터 : 메타데이터(JSON)
     * 영상 검사 원천데이터(DICOM)는 라벨링 데이터가 존재하지 않으며, 화상 이미지 라벨링 데이터와 임상 정보 라벨링 데이터는 하나의 JSON으로 구성됨

 

 
구분  획득(수집) 단계 정제 단계 가공(라벨링) 단계

데이터

구분

원시 데이터 원천 데이터 최종 데이터

데이터

형태

화상 이미지 → 이미지
(자르기, 비식별화)
화상 이미지 → 이미지
(중복제거, 세그멘테이션)
화상 이미지 → 이미지
(Polygon, 바운딩박스)
영상 이미지 → 이미지 영상 이미지 → 이미지 영상 이미지 → 이미지

데이터

포멧

데이터(이미지)포맷 : JPG파일
해상도 (1280*720) 
데이터(이미지)포맷 : JPG파일
해상도 (1280*720) 
데이터(이미지)포맷 : JPG파일
해상도 (1280*720) 
데이터(영상)포맷 : DICOM파일
해상도 (1280*720) 
데이터(영상)포맷 : DICOM파일
해상도 (1280*720) 
데이터(영상)포맷 : DICOM파일
해상도 (1280*720) 
    임상 정보 : JSON

 

* 데이터 예시

* 데이터 예시- 원천데이터 -
- 원천데이터 -
화상 이미지데이터 JPG 영상 검사 데이터 DICOM
화상 이미지데이터(JPG) 영상 검사 데이터(DICOM)

 

 
* 데이터 예시- 라벨링 데이터 -
- 라벨링 데이터 -
라벨링 데이터 예시 1
라벨링 데이터 예시 2

 

* 어노테이션 포맷

* 어노테이션 포맷
구분 속성명 타입 필수 설명 범위 비고
여부
1 info Object   기타 정보 속성 그룹    
  1-1 segmentation String Y 세그멘테이션 ‘0’, ‘1’ 0: 단일
1: 멀티
1-2 time_series String   시계열 ‘0’, ‘1’ 0: 시계열
1: 단일
1-3 dicom String   Dicom ‘0’, ‘1’ 0: 포함
1: 미포함
1-4 device String   촬영디바이스 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’ 0: DSLR
1: 스마트폰
2: CT
3: X-RAY
4: 뼈 스캔
5. 정보없음
1-5 date String   촬영일자 (시계열)   주관식(예시:D+0, D+3)
1-6 folder String Y 이미지들이 저장된 폴더명   예시:dataset
2 patient Object   환자정보 속성 그룹    
  2-1 id String Y 환자ID (암호화)   주관식
2-2 age String Y 나이 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’ 0: 20~29
1: 30~39
2: 40~49
3: 50~59
4: 60~69
5: 70~79
6: 80이상
7: 정보없음
8: 9이하
9: 10~19
2-3 gender String Y 성별 ‘0’, ‘1’, ‘2’ 0: 남
1: 여
2: 정보없음
2-4 height String     주관식
2-5 weight String   몸무게   주관식
2-6 bmi String   BMI ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’ 0: 23.0 미만
1: 23.0 이상 - 25.0 미만
2: 25.0 이상 - 28.0 미만
3: 28.0 이상 - 30.0 미만
4: 30.0 이상 - 33.0 미만
5: 33.0 이상 - 35.0 미만
6: 35.0 이상
7: 정보 없음
2-7 underlying_ String   기저질환   0: 건강한 환자
disease 1: 당뇨
  2: 고혈압
  3: 심장질환
  4: 뇌혈관질환
  5: 간질환
  6: 폐질환
  7: 신장질환
  8: 암
  9: 기타
  &: 구분자
  none: 정보없음
2-8 stage String Y 진단명 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’ 0: 1도
1: 2도 (superficial)
2: 2도 (deep)
3: 3도
4: 4도
2-9 burn_date String   화상발생일자   주관식
2-10 location String   화상 부위 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’, ‘10’, ‘11’, ‘12’, ‘13’, ‘14’, ‘15’, ‘16’, ‘17’, ‘18’, ‘19’, ‘20’, ‘21’, ‘22’, ‘23’, ‘24’, ‘25’, ‘26’, ‘27’, ‘28’, ‘29’, ‘30’, ‘31’, ‘32’, ‘33’ 0: 정보없음
1: 얼굴
2: 머리
3: 귀
4: 목
5: 앞가슴
6: 복부
7: 등
8: 어께
9: 겨드랑이
10: 상완
11: 팔꿈치
12: 하완
13: 손목
14: 손 전체
15: 손등
16: 손바닥
17: 손가락
18: 둔부
19: 사타구니
20: 성기
21: 허벅지
22: 무릎
23: 종아리
24: 발목
25: 발 전체
26: 발꿈치
27: 발등
28: 발바닥
29: 발가락
30: 허리
31: 옆구리
32: 볼
33: 골반
2-11 direction String   화상 부위 방향 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’ 0: 정보없음
1: 상
2: 하
3: 좌
4: 우
5: 앞
6: 뒤
7: 전체
8: 내측
9: 외측
2-12 extremity_num String   신체 말단 순번 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’ 0: 정보없음
0.042361111
0.084722222
0.127083333
0.169444444
0.211805556
2-13 burn_area_total String   화상 범위 (전신) ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’, ‘10’ 0: 0%-10%
1: 11% - 20%
2: 21% - 30%
3: 31% - 40%
4: 41% - 50%
5: 51% - 60%
6: 61% - 70%
7: 71% - 80%
8: 81% - 90%
9: 91% - 100%
10: 정보없음
2-14 burn_area_local String   화상 범위 (국소) ‘0’, ‘1’, ‘2’, ‘3’, ‘4’ 0: 0%-5%
1: 6% - 10%
2: 11% - 15%
3: 16% - 20%
4. 정보없음
2-15 vascularity String   흉터 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’ 0: normal
(혈관성) 1: pink
  2: red
  3: purple
  4: 정보없음
2-16 pigmentation String   흉터 ‘0’, ‘1’, ‘2’, ‘3’ 0: normal
(색소침착) 1: hypopigmentation
  2: hyperpigmentation
  3: 정보없음
2-17 pliability String   흉터 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’ 0: no contracture
(유연성) 1: supple
  2: yeilding
  3: firm
  4: rope
  5: contracture
  6: 정보없음
2-18 burn_height String   흉터(높이) ‘0’, ‘1’, ‘2’, ‘3’, ‘4’ 0: flat
1: <2mm
2: 2-5mm
3: >5mm
4: 정보없음
2-19 burn_scar_ String   화상반흔구축(국소) ‘0’, ‘1’, ‘2’ 0: normal
contracture 1: contracture
  2: 정보없음
2-20 cause_of_burn String   화상원인 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’ 0: 열탕 화상 (scalding burn) 
1: 화염 화상 (flame burn)
2: 전기 화상 (electrical burn)
3: 접촉 화상 (contact burn)
4: 화학 화상 (chemical burn)
5: 햇빛 화상 (sun burn)
6: 흡입화상 (inhalation burn)
7: 정보없음
2-21 treatment String   치료방법 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’ 0: 소독치료
1: 변연절제
2: 근막절개
3: 피부이식(부분층)
4: 피부이식(전층)
5: 국소피판
6: 유리피판
7: 절단
8: 정보없음
  2-22 healRange String   치유범위 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’ 0: 정보없음
1: 0%~24%
2: 25%~49%
3: 50%~74%
4: 75%~100%
3 images Object   이미지 정보 속성 그룹    
  3-1 filename String Y 이미지 파일명   1_f_0_22_220719_154257_hangang13_20210730.jpg
(진단명_성별_나이_병변부위_수집날짜_수집시간_담당자_시계열정보)
3-2 path String Y 이미지 위치   2 degree (superficial)/jpg/
3-3 extension String Y 이미지 확장자   jpg
3-4 width String Y 이미지 가로 크기(픽셀)   1920
3-5 height String Y 이미지 세로 크기(픽셀)   1080
3-6 depth String Y 이미지 채널 수(RGB 등)   3
4 annotations Object   annotation 정보 속성 그룹    
  4-1 stage_id Object   진단명 ‘0’, ‘1’, ‘2’, ‘3’, ‘4’ 0: 1도
1: 2도 (superficial)
2: 2도 (deep)
3: 3도
4: 4도
  4-1-1 bbox List Y 환부 bounding box 좌표(픽셀)   [[124, 196, 372, 356]]
x, y, width, height 다중리스트
[[x, y, width, height],
[x, y, width, height],
...]
  4-1-2 segmentation List Y 환부 segmentation   [[147, 396, 158, 355, 244, 196, 251, 202]]
정점 x, y 좌표 연속
다중 리스트
[[x1,y1, x2,y2, x3,y3, ...],
[x1,y1, x2,y2, x3,y3, ...],
...] 

 

* 데이터 폴더 구조

* 데이터 폴더 구조
폴더 구조
데이터 폴더 구조
파일명 구조
데이터 파일명 구조

데이터셋 구축 담당자

수행기관(주관) : 서울대학교 산학협력단
수행기관(주관)
책임자명 전화번호 대표이메일 담당업무
김병준 02-2072-2370 bjkim79@gmail.com 사업 총괄, 데이터 확보 및 제공
수행기관(참여)
수행기관(참여)
기관명 담당업무
한림대학교 산학협력단 데이터 수집
순천향대학교 산학협력단 데이터 수집
수원대학교 산학협력단 데이터 가공 및 검수
서울아산병원 데이터 검수 및 품질관리
㈜이노아이엔씨 데이터 정제 및 가공, 품질관리 솔루션 개발
㈜에이치에스힐링솔루션 데이터 정제 및 가공, 품질관리
㈜몰팩바이오 데이터 정제 및 가공, 모델 개발
데이터 관련 문의처
데이터 관련 문의처
담당자명 전화번호 이메일
김병준 02-2072-2370 bjkim79@gmail.com