| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.1 | 2023-12-01 | 데이터 최종 개방 | |
| 1.0 | 2023-07-26 | 데이터 개방 | Beta Version |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-06-25 | 데이터셋 변경 | 구축업체정보 수정 |
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 추가 |
| 2023-12-22 | 산출물 최종 공개 |
귀질환 조기 진단을 위한 인공지능 학습용 데이터셋 구축을 위한 정상 및 6개 귀질환(만성중이염, 유착성중이염, 삼출성중이염, 진주종성중이염, 선천성진주종, 외이도염 및 고막염) 고막내시경 검사 이미지 데이터
귀질환 진단의 정확성과 효율성을 향상시킬 수 있는 인공지능 기반 스마트 귀질환 진단시스템 개발을 위한 고품질의 고막 내시경 검사 이미지 학습데이터셋 구축
| 데이터 영역 | 헬스케어 | 데이터 유형 | 텍스트 , 이미지 |
|---|---|---|---|
| 데이터 형식 | PNG, JSON | 데이터 출처 | 자체 수집 |
| 라벨링 유형 | 분류태그(이미지), 세그멘테이션(이미지) | 라벨링 형식 | JSON |
| 데이터 활용 서비스 | 스마트 난청진단 서비스, 난청 질환 관련분야 연구지원 | 데이터 구축년도/ 데이터 구축량 |
2022년/62,247 |
데이터 통계
원천데이터 62.147건 / 라벨링데이터 62,147건
| 구분 | 구축량 (건) | ||
|---|---|---|---|
| 원천데이터 (PNG) | 라벨링데이터 (JSON) | ||
| 1.질환데이터 | 정상 | 14,991 | 14,991 |
| 만성중이염 | 9,846 | 9,846 | |
| 유착성중이염 | 5,666 | 5,666 | |
| 삼출성중이염 | 6,496 | 6,496 | |
| 진주종성중이염 | 5,853 | 5,853 | |
| 선천성진주종 | 5,965 | 5,965 | |
| 외이도염 및 고막염 | 6,232 | 6,232 | |
| 합 계 | 55,049 | 55,049 | |
| 2.병변데이터 | 천공 | 3,659 | 3,659 |
| 진주종 | 1,506 | 1,506 | |
| 선천성진주종 | 1,933 | 1,933 | |
| 합 계 | 7,098 | 7,098 | |
| 총 합 | 62,147 | 62,147 | |
| 구분 | 비율(%) | 수량(건) |
|---|---|---|
| 9세 이하 | 18.1 | 11,248 |
| 10대 | 8.29 | 5,150 |
| 20대 | 6.14 | 3,818 |
| 30대 | 5.85 | 3,634 |
| 40대 | 9.88 | 6,142 |
| 50대 | 16.88 | 10,493 |
| 60대 | 19.68 | 12,233 |
| 70대 | 11.52 | 7,160 |
| 80대 | 3.3 | 2,053 |
| 90세 이상 | 0.35 | 216 |
| 합계 | 100 | 62,147 |
| 구분 | 비율(%) | 수량(건) |
|---|---|---|
| 정상 | 24.12 | 14,991 |
| 만성중이염 | 21.37 | 13,279 |
| 유착성중이염 | 9.13 | 5,676 |
| 삼출성중이염 | 10.45 | 6,496 |
| 진주종성중이염 | 11.95 | 7,426 |
| 선천성진주종 | 12.71 | 7,898 |
| 외이도염 및 고막염 | 10.27 | 6,381 |
| 합계 | 100 | 62,147 |
| 구분 | 비율(%) | 수량(건) |
|---|---|---|
| 남성 | 50.79 | 31,564 |
| 여성 | 49.21 | 30,583 |
| 합계 | 100 | 62,147 |
활용 모델
Ⅰ. 귀질환 분류 모델
귀질환 분류 모델 학습을 위해 검증용 데이터와 시험용 데이터를 각각 전체 데이터의 10%로 제시한다.
| 학습(Training) | 검증(Validation) | 시험(Test) | |
|---|---|---|---|
| 비율 | 80% | 10% | 10% |
● 학습 알고리즘 : EfficientNet-B4
- Image Classification Task에 대하여 기존보다 훨씬 적은 수의 파라미터로 더욱 좋은 성능을 내서 State-Of-The-Art(SOTA)를 달성한 모델.
- Depth/width/resolution의 scale-up에 대한 최적의 조합을 AutoML을 통해 찾은 모델로써, 3가지 방법을 효율적으로 조절할 수 있는 compound scaling 방법을 제안한다. 제한된 resource 범위에서 최적의 조합을 고려한다. 이를 통해 기존보다 훨씬 적은 수의 파라미터로 더욱 좋은 성능을 내어 State-Of-The-Art(SOTA)를 달성할 수 있다.

출처: MingxingTan, Quoc V. Le. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks. arXiv:1905.11946, 2020
Ⅱ. 병변 탐지 모델
병변 탐지 모델 학습을 위해 검증용 데이터와 시험용 데이터를 각각 전체 데이터의 20%와 10%로 제시한다.
| 학습(Training) | 검증(Validation) | 시험(Test) | |
|---|---|---|---|
| 비율 | 70% | 20% | 10% |
● 학습 알고리즘 : Modified U-Net with WGAN
- U-Net is a convolutional neural network that was developed for biomedical image segmentation. The U-Net architecture consist of encoder and decoder section. The modified U-net used in the project has been modified from the vanilla U-net by adding attention and using resnet-18 layers as backbone

서비스 활용 시나리오
○ 귀 질환 AI 자동 판별 제품 개발에 활용
- 개발된 학습데이터셋을 기반으로 인공지능 판별 알고리즘을 생성하고 이를 적용한 제품 개발을 진행하여 검사 능력이 상대적으로 부족한 국가에 서비스
○ 귀 질환 원격진료를 위한 진단보조 서비스 개발에 활용
- 개발된 학습데이터셋을 기반으로 인공지능 판별 알고리즘을 생성하고 이를 적용한 원격 진단보조장치 개발 및 이를 활용한 서비스 개발
데이터 포맷
Ⅰ. 질환데이터
고막 내시경 검사 이미지에서 귀질환 7종에 대하여 질환 분류 태그로 작성된 라벨링데이터(json)로 구성
1. 원천데이터 – png 포맷


정상 만성중이염 유착성중이염

삼출성중이염 진주종성중이염 선천성진주종

외이도염 및 고막염
2. 라벨링데이터 – json 포맷

Ⅱ. 병변데이터
고막 내시경 검사 이미지에서 병변 3종에 대해 폴리곤 세그멘테이션한 라벨링데이터(json)로 구성
1. 원천데이터 – png 포맷

천공 진주종 선천성진주종
2. 라벨링데이터 – json 포맷

데이터 구성
| Key | Description | Type | Child Type |
|---|---|---|---|
| images | 고막 이미지정보 | JsonObject | |
| id | 이미지식별자 | String | |
| width | 이미지너비(pixel) | Number | |
| height | 이미지높이(pixel) | Number | |
| filename | 이미지파일명 | String | |
| metas | 메타정보 | JsonObject | |
| id | 연관메타데이터식별자 | String | |
| gender | 성별 | String | |
| age | 나이 | Number | |
| position | 위치 | String | |
| disease_id | 질환정보 | Number | |
| disease_name | 질환명 | String | |
| hearingloss | 난청여부 | String | |
| hlstage | 난청정도 | String | |
| pathology | 병리정보 | String | |
| confirm | 검수여부 | Number | |
| annotations | 라벨링정보 | JsonObject | |
| [ | JsonObject | ||
| { | JsonAray | JsonObject | |
| id | 라벨링식별자 | String | |
| image_id | 연관이미지식별자 | String | |
| category_id | 병변정보 | String | |
| category_name | 병변명 | String | |
| types | 라벨링방법 | String | |
| color | 라벨링색상값 | String | |
| points | 라벨링폴리곤 | List | |
| [ | 좌표 | JsonAray | JsonObject |
| [ | |||
| ] | |||
| ] | |||
| } | |||
| ] |
|
어노테이션 포맷
| 구분 | 항목명 | 필수 여부 | 타입 | 비고 | ||
|---|---|---|---|---|---|---|
| 한글명 | 영문명 | |||||
| 1 | 고막 이미지 정보 | images | Object | |||
| 1-1 | 이미지식별자 | images[].id | Y | String | ||
| 1-2 | 이미지너비 | images[].width | Y | Number | ||
| 1-3 | 이미지높이 | images[].height | Y | Number | ||
| 1-4 | 이미지파일명 | images[].filename | Y | String | ||
| 2 | 메타정보 | metas | Object | |||
| 2-1 | 연관메타데이터식별자 | metas[].id | String | |||
| 2-2 | 성별 | metas[].gender | Y | String | ||
| 2-3 | 나이 | metas[].age | Y | Number | ||
| 2-4 | 위치 | metas[],position | Y | String | ||
| 2-5 | 질환정보 | metas[].disease_id | Y | Number | ||
| 2-6 | 질환명 | metas[].disease_name | Y | String | ||
| 2-7 | 난청여부 | metas[].hearingloss | String | |||
| 2-8 | 난청정도 | metas[].hlstage | String | |||
| 2-9 | 병리정보 | metas[].pathology | String | |||
| 2-10 | 검수여부 | metas[].confirm | Number | 검수 확인 등에 활용 | ||
| 3 | 라벨링정보 | annotations | Object | |||
| 3-1 | 라벨링식별자 | annotations[].id | Y/N | String | ||
| 3-2 | 연관이미지식별자 | annotations[].image_id | Y/N | String | ||
| 3-3 | 병변정보 | annotations[].category_id | Y/N | Number | ||
| 3-4 | 병변명 | annotations[].category_name | Y/N | String | ||
| 3-5 | 라벨링방법 | annotations[].type | Y/N | String | poly (polygon) | |
| 3-6 | 라벨링색상값 | annotations[].color | Y/N | String | ||
| 3-7 | 라벨링좌표 | annotations[].points | Y/N | String |
|
|
실제 예시

| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 이도경 | 02-3288-7900 | dk.lee@namutech.co.kr | 사업 총괄 |
| 기관명 | 담당업무 |
|---|---|
| ㈜엠티이지 | 이상호 |
| 가톨릭서울성모병원 | 수집, 검수 |
| 강남세브란스병원 | 수집, 검수 |
| 고려대학교구로병원 | 수집, 검수 |
| 부산대학교병원 | 수집, 검수 |
| 분당서울대학교병원 | 수집, 검수 |
| 서울대학교병원 | 수집, 검수 |
| 전남대학교병원 | 수집, 검수 |
| 전북대학교병원 | 수집, 검수 |
| 충남대학교병원 | 수집, 검수 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 이도경 | 02-3288-7900 | dk.lee@namutech.co.kr |