| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.1 | 2024-10-30 | 데이터 최종 개방 | |
| 1.0 | 2024-06-28 | 데이터 개방 | Beta Version |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 수정 |
| 2024-06-28 | 산출물 공개 | Beta Version |
- 수면무호흡증이 발생하는 폐쇄 부위와 폐쇄 정도 분석을 위한 약물유도 수면내시경 환자 영상을 사용하여 구축된 폐쇄부위별 클립동영상 데이터와 이미지 데이터
- 주관적으로 판독되고 있는 폐쇄 부위와 폐쇄 정도를 정확하게 판별하는 인공지능 개발이 가능한 데이터셋 개발
| 데이터 영역 | 헬스케어 | 데이터 유형 | 비디오 , 이미지 |
|---|---|---|---|
| 데이터 형식 | mp4, png | 데이터 출처 | 자체 수집 |
| 라벨링 유형 | 세그멘테이션(이미지), 임상정보(이미지, 동영상) | 라벨링 형식 | json |
| 데이터 활용 서비스 | 약물유도 수면내시경 검사 판독 보조서비스 | 데이터 구축년도/ 데이터 구축량 |
2023년/55,462 |
- 데이터 통계
데이터 구축 규모
약물유도 수면내시경 영상에서 폐쇄가 발생하는 Velum 영역과 OTE 영역에서 2호흡 길이를 가지는 클립동영상(mp4)와 이에 대한 영상 정보와 임상정보로 작성된 라벨링데이터(json)로 구성
| 구분 | 영역 | 수면여부 및 수면자세 |
원천데이터 규모 | 라벨링데이터 규모 | ||
|---|---|---|---|---|---|---|
| Clip Video | Velum | Awake | 1,198 | 4,703 | 1,198 | 4,703 |
| Supine | 1,400 | 1,400 | ||||
| Lateral | 1,326 | 1,326 | ||||
| Resupine | 779 | 779 | ||||
| OTE | Awake | 1,357 | 4,538 | 1,357 | 4,538 | |
| Supine | 1,493 | 1,493 | ||||
| Lateral | 1,082 | 1,082 | ||||
| Resupine | 606 | 606 | ||||
| 합 계 | 9,241 | 9,241 | ||||
| Images | Velum | Awake | 5,990 | 23,515 | 5,990 | 23,515 |
| Supine | 7,000 | 7,000 | ||||
| Lateral | 6,630 | 6,630 | ||||
| Resupine | 3,895 | 3,895 | ||||
| OTE | Awake | 6,785 | 22,690 | 6,785 | 22,690 | |
| Supine | 7,465 | 7,465 | ||||
| Lateral | 5,410 | 5,410 | ||||
| Resupine | 3,030 | 3,030 | ||||
| 합 계 | 46,205 | 46,205 | ||||
| 합 계 | 55,446 | 55,446 | ||||
데이터 분포
성별 분포
| 구분 | 비율 |
|---|---|
| 남성 | 82.55% |
| 여성 | 17.45% |
| 합계 | 100% |

연령대별 분포
| 구분 | 비율 |
|---|---|
| 20대 미만 | 2.32% |
| 20대 | 11.84% |
| 30대 | 19.97% |
| 40대 | 20.81% |
| 50대 이상 | 45.07% |
| 합계 | 100% |

클래스별 세그멘테이션 수량 분포
| 구분 | 구성비 |
|---|---|
| Velum | 17.47% |
| Airway1 | 17.11% |
| Oropharynx_posterior_lateral_walls | 16.61% |
| Tongue_Base | 15.18% |
| Epiglottis | 16.80% |
| Airway2 | 16.82% |
| 합계 | 100% |

수면 상태별 분포
| 구분 | 비율 |
|---|---|
| Awake | 27.65% |
| Supine | 31.31% |
| Lateral | 26.06% |
| Resupine | 14.99% |
| 합계 | 100% |

정상 및 질환 분포
| 구분 | 구성비 |
|---|---|
| 정상 | 7.83% |
| 질환 | 92.16% |
| 합계 | 100% |

폐쇄영역별 분포
| 구분 | 구성비 |
|---|---|
| Velum 영역 | 50.89% |
| OTE 영역 | 49.11% |
| 합계 | 100% |
| 구성비 중첩률 |
|---|
| 98.23% |

데이터 구성별 분포
| 구분 | 구성비 |
|---|---|
| clip_Videos | 16.67% |
| Images | 83.33% |
| 합계 | 100% |
| 구성비 중첩률 |
|---|
| 99.99% |

- 활용 모델
Ⅰ. Velum 영역 폐쇄정도 예측 모델
Velum 영역 폐쇄정도 예측 모델 학습을 위해 Velum 영역 이미지에서 검증용 데이터와 시험용 데이터를 각각 전체 데이터의 10%로 제시한다.
| 학습(Training) | 검증(Validation) | 시험(Test) | |
|---|---|---|---|
| 비율 | 80% | 10% | 10% |
• YOLOv8
- Velum 영역 이미지에서 폐쇄정도 예측을 위해 광범위한 객체 감지 및 추적, 인스턴스 분할, 이미지 분류 및 포즈 추정 작업에 탁월한 YOLOv8 모델 사용

Figure 1. YOLOv8 structure
A YOLOv8-Based Approach for Real-Time Lithium-Ion Battery Electrode Defect Detection with High Accuracy
논문 출처 : https://doi.org/10.3390/electronics13010173
Ⅱ. OTE 영역 폐쇄정도 분류 모델
OTE 영역 폐쇄정도 분류 모델 학습을 위해 OTE 영역 이미지에서 검증용 데이터를 전체 데이터의 10%로, OTE 영역 클립동영상에서 시험용 데이터를 전체 데이터의 10%로 제시한다.
| 학습(Training) | 검증(Validation) | 시험(Test) | |
|---|---|---|---|
| 비율 | 80% | 10% | 10% |
※ 학습 및 검증에서는 OTE 영역 이미지를 사용하며, 시험에서는 OTE 영역 클립동영상을 사용함
• YOLOv8
- OTE 영역 클립동영상에서 폐쇄정도 분류를 위해 광범위한 객체 감지 및 추적, 인스턴스 분할, 이미지 분류 및 포즈 추정 작업에 탁월한 YOLOv8 모델 사용

Figure 1. YOLOv8 structure
A YOLOv8-Based Approach for Real-Time Lithium-Ion Battery Electrode Defect Detection with High Accuracy
논문 출처 : https://doi.org/10.3390/electronics13010173
Ⅲ. OTE 영역 인식 모델
OTE 영역 인식 모델 학습을 위해 OTE 영역 이미지에서 검증용 데이터와 시험용 데이터를 각각 전체 데이터의 10%로 제시한다.
| 학습(Training) | 검증(Validation) | 시험(Test) | |
|---|---|---|---|
| 비율 | 80% | 10% | 10% |
• U-Net
- OTE 영역 이미지에서 아나토미 인식을 위해 U-Net 모델을 사용

U-Net: Convolutional Networks for Biomedical Image Segmentation
논문 출처 : https://arxiv.org/abs/1505.04597
Ⅳ. OTE 영역 폐쇄주원인 분류 모델
OTE 영역 폐쇄주원인 분류 모델 학습을 위해 OTE 영역 클립동영상에서 검증용 데이터와 시험용 데이터를 각각 전체 데이터의 10%로 제시한다.
| 학습(Training) | 검증(Validation) | 시험(Test) | |
|---|---|---|---|
| 비율 | 80% | 10% | 10% |
• Attention MIL
- OTE 영역 클립동영상에서 폐쇄주원인 분류를 위해 인스턴스들의 묶음에 대한 레이블을 학습하는 Attention MIL 모델 사용

Attention-based Deep Multiple Instance Learning
논문 출처 : https://arxiv.org/abs/1802.04712
- 서비스 활용 시나리오
○ 구축한 모델들은 약물유도 수면내시경 영상에 대한 분석에 활용하거나 수면무호홉증 연구에 활용할 수 있음
○ 약물유도 수면내시경 영상에서 정확한 폐쇄부위 및 폐쇄정도를 진단하는데 보조적 어시스턴 시스템 개발에 활용
- 기타 정보
대표성/독립성
약물유도 수면내시경 환자 영상은 5개 대학병원(서울대학교병원, 경북대학교병원, 부산대학교병원(통합), 삼성서울병원, 전남대학교병원)에서 자체수집
- 데이터 구성
Ⅰ. Clip_Videos
| Key | Description | Type | Child Type |
|---|---|---|---|
| videos | 동영상정보 | JsonObject | |
| id | 동영상식별자 | String | |
| width | 동영상너비(pixel) | String | |
| height | 동영상높이(pixel) | String | |
| filename | 동영상파일명 | String | |
| metas | 메타정보 | JsonObject | |
| id | 연관메타데이터식별자 | String | |
| age | 나이 | String | |
| gender | 성별 | String | |
| phase | 영역 | String | |
| position | 수면여부 및 수면자세 | String | |
| SpO2 | 최소산소포화도 | String | |
| AHI | 무호흡-저호흡지수 | String | |
| diag | 진단정보 | String | |
| bmi | BMI | String | |
| obstruction | 폐쇄 정도 | String | |
| cause | 폐쇄 주 원인 | String |
Ⅱ. Images
| Key | Description | Type | Child Type |
|---|---|---|---|
| images | 이미지정보 | JsonObject | |
| id | 이미지식별자 | String | |
| width | 이미지너비(pixel) | String | |
| height | 이미지높이(pixel) | String | |
| filename | 이미지파일명 | String | |
| metas | 메타정보 | JsonObject | |
| id | 연관메타데이터식별자 | String | |
| age | 나이 | String | |
| gender | 성별 | String | |
| phase | 영역 | String | |
| position | 수면여부 및 수면자세 | String | |
| SpO2 | 최소산소포화도 | String | |
| AHI | 무호흡-저호흡지수 | String | |
| diag | 진단정보 | String | |
| bmi | BMI | String | |
| obstruction | 폐쇄 정도 | String | |
| cause | 폐쇄 주 원인 | String | |
| annotations | 라벨링정보 | JsonObject | |
| [ | JsonObject | ||
| { | JsonAray | JsonObject | |
| id | 라벨링식별자 | String | |
| image_id | 연관이미지식별자 | String | |
| category_id | 클래스정보 | String | |
| category_name | 클래스명 | String | |
| types | 라벨링방법 | String | |
| color | 색상값 | ||
| points | 라벨링폴리곤 | List | |
| [ | 좌표 | JsonAray | JsonObject |
| [ | |||
| ] | |||
| ] | |||
| } | |||
| ] |
- 어노테이션 포맷
Ⅰ. Clip_Videos
| 구분 | 항목 | 타입 | 필수여부 | 비고 | ||
|---|---|---|---|---|---|---|
| 한글명 | 영문명 | |||||
| 1 | 동영상정보 | videos | Object | |||
| 1-1 | 동영상식별자 | videos[].id | String | Y | ||
| 1-2 | 동영상너비(pixel) | videos[].width | String | Y | 예) 1920 | |
| 1-3 | 동영상높이(pixel) | videos[].height | String | Y | 예) 1080 | |
| 1-4 | 동영상파일명 | videos[].filename | String | Y | ||
| 2 | 메타정보 | metas | Object | |||
| 2-1 | 연관메타데이터식별자 | metas[].id | String | Y | ||
| 2-2 | 나이 | metas[].age | String | Y | ||
| 2-3 | 성별 | metas[].gender | String | Y | F,M | |
| 2-4 | 영역 | metas[].phase | String | Y | Velum, OTE | |
| 2-5 | 수면여부 및 수면자세 | metas[],position | String | Y | awake, supine, lateral, resupine | |
| 2-6 | 최소산소포화도 | metas[].minSpO2 | String | N | ||
| 2-7 | 무호흡-저호흡지수 | metas[].AHI | String | Y | ||
| 2-8 | 진단정보 | metas[].diag | String | Y | normal, sleepapnea | |
| 2-9 | BMI | metas[].bmi | String | N | ||
| 2-10 | 폐쇄 정도 | metas[].obstruction | String | Y | no. partial, complete | |
| 2-11 | 폐쇄 주 원인 | metas[].cause | String | Y | no,Velum,Oropharynx_posterior_lateral_walls,Tongue_Base,Epiglottis | |
Ⅱ. Images
| 구분 | 항목 | 타입 | 필수여부 | 비고 | ||
|---|---|---|---|---|---|---|
| 한글명 | 영문명 | |||||
| 1 | 이미지정보 | Images | Object | |||
| 1-1 | 이미지식별자 | images[].id | String | Y | ||
| 1-2 | 이미지너비(pixel) | images[].width | String | Y | 예) 1920 | |
| 1-3 | 이미지높이(pixel) | images[].height | String | Y | 예) 1080 | |
| 1-4 | 이미지파일명 | images[].filename | String | Y | ||
| 2 | 메타정보 | metas | Object | |||
| 2-1 | 연관메타데이터식별자 | metas[].id | String | Y | ||
| 2-2 | 나이 | metas[].age | String | Y | ||
| 2-3 | 성별 | metas[].gender | String | Y | F,M | |
| 2-4 | 영역 | metas[].phase | String | Y | Velum, OTE | |
| 2-5 | 수면여부 및 수면자세 | metas[],position | String | Y | awake, supine, lateral, resupine | |
| 2-6 | 최소산소포화도 | metas[].minSpO2 | String | N | ||
| 2-7 | 무호흡-저호흡지수 | metas[].AHI | String | Y | ||
| 2-8 | 진단정보 | metas[].diag | String | Y | normal, sleepapnea | |
| 2-9 | BMI | metas[].bmi | String | N | ||
| 2-10 | 폐쇄 정도 | metas[].obstruction | String | Y | no. partial, complete | |
| 2-11 | 폐쇄 주 원인 | metas[].cause | String | Y | no,Velum,Oropharynx_posterior_lateral_walls,Tongue_Base,Epiglottis | |
| 3 | 라벨링정보 | annotations | Object | |||
| 3-1 | 라벨링식별자 | annotations[].id | String | Y | ||
| 3-2 | 연관이미지식별자 | annotations[].image_id | String | Y | ||
| 3-3 | 클래스(아나토미) 정보 | annotations[].category_id | String | Y | ||
| 3-4 | 클래스명(아나토미명) | annotations[].category_name | String | Y | Velum, Airway1, Oropharynx_posterior_lateral_walls, Tongue_Base, Epiglottis, Airway2 | |
| 3-5 | 라벨링방법 | annotations[].types | String | Y | poly(polygon) | |
| 3-6 | 색상값 | annotations[].color | String | Y | ||
| 3-7 | 라벨링좌표 | annotations[].points | List | Y | ||
- 데이터 포맷
Ⅰ. Clip_Videos
약물유도 수면내시경 영상에서 폐쇄가 발생하는 Velum 영역과 OTE 영역에서 2호흡 길이를 가지는 클립동영상(mp4)와 이에 대한 영상 정보와 임상정보로 작성된 라벨링데이터(json)로 구성
1. 원천데이터 – mp4 포맷

2. 라벨링데이터 – json 포맷

Ⅱ. Images
약물유도 수면내시경 영상에서 폐쇄가 발생하는 Velum 영역과 OTE 영역에서 추출한 이미지(png)와 이에 대한 영상 정보와 임상정보, 세그멘테이션 정보로 작성된 라벨링데이터(json)로 구성
1. 원천데이터 – png 포맷

2. 라벨링데이터 – json 포맷

- 실제 예시

| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 이재서 | 02-2072-3991 | csrhee@snu.ac.kr | 사업총괄, 데이터 수집 및 검수 |
| 기관명 | 담당업무 |
|---|---|
| 가천대학교 산학협력단 | 데이터 가공 및 AI 모델 개발 |
| 경북대학교병원 | 데이터 수집 및 검수 |
| 동국대학교 산학협력단 | 데이터 검수 및 품질관리 |
| 부산대학교 산학협력단 | 데이터 수집 및 검수 |
| 삼성서울병원 | 데이터 수집 및 검수 |
| 에스앤유에이치벤처 | 데이터 가공 |
| 엠티이지 | 데이터 설계, 가공, 검수, 품질관리 및 AI 모델 개발 |
| 전남대학교병원 | 데이터 수집 및 검수 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 김덕석 | 02-859-3585 | laurent@mteg.co.kr |
| 이상호 | 02-859-3585 | warpspace@mteg.co.kr |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 김덕석 | 02-859-3585 | laurent@mteg.co.kr |
| 이상호 | 02-859-3585 | warpspace@mteg.co.kr |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 김덕석 | 02-859-3585 | laurent@mteg.co.kr |
| 이상호 | 02-859-3585 | warpspace@mteg.co.kr |