| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.1 | 2023-12-29 | 데이터 최종 개방 | |
| 1.0 | 2023-04-30 | 데이터 개방 | Beta Version |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 수정 |
| 2024-02-27 | 산출물 최종 공개 |
난임 환자의 체외수정 과정을 통해서 얻어지는 데이터로써, 정자와 난자를 수정시킨 배아를 배양하고 특정 시점에 촬영한 데이터
난임시술의 성공률을 높이기 위해서 질 좋은 배아를 선택하는 AI 모델을 만들어 제공하기 위함
| 데이터 영역 | 헬스케어 | 데이터 유형 | 이미지 |
|---|---|---|---|
| 데이터 형식 | png | 데이터 출처 | 컨소시엄 참여 병원 |
| 라벨링 유형 | 세그멘테이션, 바운딩박스 | 라벨링 형식 | JSON |
| 데이터 활용 서비스 | 배아 선별 서비스 | 데이터 구축년도/ 데이터 구축량 |
2022년/15,805 |
● 데이터 구축 규모
| 과제번호 | 과제명 | 데이터 유형 | 데이터 설명 | 데이터 건수 |
|---|---|---|---|---|
| 27 | 배아 이미지 데이터 | 원천데이터(PNG,JPG) | 원본이미지 | 14,989 |
| 라벨링데이터(JSON) | labels | 14,989 | ||
| meta | 14,989 | |||
| 메타데이터(JSON) | 임상정보 | 8,559 |
● 데이터 분포
- 다양성(통계)
| 항목명 | 속성명 | 비율 |
|---|---|---|
| 산모 연령대별 분포 | 0~10 | 0.02% |
| 10~20 | 0.02% | |
| 20~30 | 6.46% | |
| 30~40 | 77.63% | |
| 40~50 | 15.75% | |
| 기타 | 0.22% | |
| 임신 여부 분포 | 임신 | 49.54% |
| 비임신 | 50.29% |
- 다양성(요건)
| 항목명 | 속성명 | 비율 |
|---|---|---|
| 현미경 이미지 배아 촬영 일자별 분포 | 3일 | 64.13% |
| 5일 | 35.87% | |
| 타임랩스 이미지 배아 촬영 일자별 분포 | 3일 | 54.91% |
| 5일 | 45.09% | |
| 배아 단계별 이미지 분포 | 1 | 3.81% |
| 2 | 9.40% | |
| 3 | 17.63% | |
| 4 | 27.41% | |
| 5 | 23.67% | |
| 6 | 18.07% |
- Resnet은 이미지 인식을 위해 개발된 아키텍처로써 ImageNet에서 그 성능을 검증받음
| 학습 (Training) | 검증 (Validation) | 시험 (Test) | |
|---|---|---|---|
| 데이터 | 구축데이터 80% | 구축데이터 10% | 구축데이터 10% |
| 내용 | 학습 데이터는 많을수록 좋음 | 학습 중 모델 성능 평가 및 비교 | 최종 학습 된 모델의 성능 평가 |

서비스 활용 시나리오
구축한 모델을 활용해 배아 선별이나 배아 추적 서비스에 활용할 수 있음
1. 배아선별 서비스: 연구원들이 이식할 배아를 결정할 때 도움을 받을 수 있음
2. 배아추적 서비스: 배아를 배양하는 과정에서 각 배아를 개별 탐지함으로써 배아를 구분하여 추적할 수 있음
● 난임시술 배아이미지 데이터
- 원천데이터 (PNG)

- 라벨링데이터 (JSON)
① labels

② meta

● 전자 의료 기록 데이터
- 환자의 임상정보

● 어노테이션 포맷
- 라벨링 데이터 (meta)
| NO. | 속성명 | 타입 | 필수여부 | 설명 | 범위 | 비고 | |
|---|---|---|---|---|---|---|---|
| 1-1 | data_key | string | Y | 데이터 경로 | |||
| 1-2 | dataset | string | Y | 작업 세트 | |||
| 1-3 | image_info | object | Y | 이미지 정보 | |||
| 1-4 | width | number | Y | 이미지 너비 | |||
| 1-5 | height | number | Y | 이미지 높이 | |||
| 1-6 | label_id | string | Y | 라벨링 파일 이름 | |||
| 1-7 | label_path | array | Y | 라벨링 파일 경로 | |||
| 1-8 | last_updated_date | string | 마지막 수정 일자 | ||||
| 1-9 | tags | array | 이미지와 관련된 정보 | ||||
| 1-10 | id | string | 이미지 정보의 키값 | ||||
| 1-11 | name | string | 이미지 정보의 실제 값 | ||||
| 1-12 | work_assignee | string | 작업 할당 정보 | ||||
| 1-13 | status | string | 작업 상태 | ||||
- 라벨링 데이터 (labels)
| No. | 항목명 | 타입 | 필수여부 | 설명 | 범위 | 비고 | |
|---|---|---|---|---|---|---|---|
| 1 | objects | object | Y | 데이터셋 정보 | |||
| 1-1 | id | string | Y | 객체 아이디 | |||
| 1-2 | class_id | string | Y | 클래스 아이디 | |||
| 1-3 | tracking_id | int | N | 어노테이션 생성 번호 | |||
| 1-4 | class_name | string | Y | 클래스 명 | zona_outer,zona_inner, TE, ICM, fertilized_egg, cell, fragmentation | ||
| 1-5 | annotation_type | string | Y | 어노테이션 형태 | polygon, box | ||
| 1-6 | annotation | object | N | 어노테이션 정보 | |||
| 1-7 | multiple | boolean | Y | true,false | |||
| 1-8 | coord | object | Y | 어노테이션 좌표 | |||
| 1-9 | points | object | Y | 어노테이션 실제 좌표값 | |||
| 1-10 | meta | object | N | 어노테이션 속성과 관련한 정보 | |||
| 1-11 | z_index | number | N | 어노테이션의 계층 (이번 배아 과제와는 상관없음) | |||
| 1-12 | visible | boolean | N | 어노테이션 시각화 설정 | |||
| 1-13 | alpha | number | N | 어노테이션 투명도 설정 | |||
| 1-14 | color | string | N | 어노테이션 색상 | |||
| 1-15 | properties | list | N | 어노테이션의 속성 | |||
| 1-16 | fertilized_egg_id | number | Y | 수정란 아이디값 | |||
| 1-17 | x | number | N | 바운딩박스 x좌표 | |||
| 1-18 | y | number | N | 바운딩박스 y좌표 | |||
| 1-19 | width | number | N | 바운딩박스 길이 | |||
| 1-20 | height | number | N | 바운딩박스 높이 | |||
| 1-21 | type | string | N | ||||
| 1-22 | property_id | string | N | 어노테이션 아이디값 | |||
| 1-23 | property_name | string | Y | 등급 속성 | |||
| 1-24 | option_id | string | N | 등급 아이디값 | |||
| 1-25 | option_name | string | Y | 등급 | |||
| 1-26 | cell_count | number | Y | 셀 수 | |||
| 1-27 | cell_circumference | array | Y | cell 둘레 | |||
| 1-28 | zona_inner_area | number | Y | zonna_inner 면적 | |||
| 1-29 | framentation_area | number | N | fragmentation 면적 | |||
| 1-30 | fragmentation_percentage | number | N | Cell 면적 대비 fragmentation 면적 비율 | |||
| 1-31 | categories | object | N | fertilized egg 값 | |||
| 1-32 | properties | array | N | Grade 등급 값 | |||
- 메타 데이터 (임상정보)
| NO. | 항목명 | 타입 | 필수여부 | 설명 | 비고 |
|---|---|---|---|---|---|
| 1 | Patient.ID | string | Y | 환자번호 | |
| 2 | Embryo.ET date | string | Y | 배아 이식 일자 | |
| 3 | Embryo.OPU date | string | Y | 난자 채취 일자 | |
| 4 | Patient.Femaleage | string | Y | 여성 나이 | |
| 5 | Patient.Maleage | string | N | 남성 나이 | |
| 6 | Patient.Cause | string | N | 난임 원인 | 난임 원인 |
| 남성 요인: 1 | |||||
| 배란기능장애: 2 | |||||
| 난소기능 저하: 3 | |||||
| 난관요인: 4 | |||||
| 자궁요인: 5 | |||||
| 자궁내막증: 6 | |||||
| 원인불명: 7 | |||||
| 복합요인 (2개 이상이 원인인 경우): 8 | |||||
| 기타요인: 9 | |||||
| 7 | Cycle.G-sac | string | Y | 아기 집 | ex) 1,2 (아기집 개수) |
| 8 | Cycle.Egg no | string | Y | 총 난자 수 | |
| 9 | Cycle.Mll no | string | Y | 성숙된 난자 수 | |
| 10 | Cycle.2PN no | string | Y | 수정된 난자 수 | |
| 11 | Cycle.ET no | string | Y | 이식한 배아 수 | |
| 12 | Cycle.Camera | string | Y | 촬영 카메라 | |
| 13 | Cycle.Microscope | string | Y | 촬영 현미경 | |
| 14 | stop character | string | Y | 항목의 끝 |
| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 김미란 | 031-219-5300 | kmr5300@ajou.ac.kr | 데이터 확보, 추출, 검증, 인공지능 모델 개발과 검증, 홍보 활동 등 전 단계 관리 감독 |
| 기관명 | 담당업무 |
|---|---|
| 슈퍼브에이아이 | 이미지 데이터 정제 및 라벨링 도구 개발 및 교육, 크라우드 워커 관리, 데이터 관리 |
| 카이헬스 | 총괄보조 및 진도관리, 인공지능 모델 개발, 모델 학습 및 검증, 데이터품질관리 |
| 피트케어 | 데이터 전처리 및 1차 정제, S/W도구 개발 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 허진 | 0507-1302-9698 | info@kaihealth.tech |