| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.1 | 2024-10-30 | 데이터 최종 개방 | |
| 1.0 | 2024-07-05 | 데이터 개방 | Beta Version |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-10-31 | 데이터셋 변경 | 구축업체정보 수정 |
| 2025-10-14 | 데이터셋 변경 | 구축업체정보 수정 |
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 수정 |
| 2024-07-05 | 산출물 공개 | Beta Version |
- 경동맥 환자의 진단을 위해 MRI/MRA/CT/CTA 데이터를 각각 18,750건씩 구축. 협착이 발생한 혈관의 영역을 polygon 가공하여 경동맥 협착 확인 가능하게 함.
- 경동맥 혈관 질환을 진단할 수 있는 AI 학습용 이미지 데이터 구축
| 데이터 영역 | 헬스케어 | 데이터 유형 | 이미지 |
|---|---|---|---|
| 데이터 형식 | *.jpg | 데이터 출처 | 자체수집 |
| 라벨링 유형 | 세그멘테이션 | 라벨링 형식 | *.JSON |
| 데이터 활용 서비스 | 해당사항 없음 | 데이터 구축년도/ 데이터 구축량 |
2023년/82,500 |
- 데이터 구축 규모 및 분포
| 구분 | 규모 | 파일 형태 |
|---|---|---|
| CT | 2D 이미지 18,750장 | JPG, JSON |
| MRI | 2D 이미지 18,750장 | JPG, JSON |
| CTA | 2D 이미지 18,750장 | JPG, JSON |
| MRA | 2D 이미지 18,750장 | JPG, JSON |
- 클래스별 데이터 비율
| 데이터명 | 세부 데이터명 | 원천데이터 구분 | 구축 비율 | |
|---|---|---|---|---|
| 경동맥 혈관 CT 및 MRI 데이터 | MRI/MRA/CT/CTA 데이터 | 중증도별 | Normal (정상) |
10.00% |
| Mild Stenosis | 35.00% | |||
| Moderate Stenosis | 30.00% | |||
| Severe Stenosis | 25.00% | |||
| 협착위치별 | Common Carotid Artery (CCA) | 15.00% | ||
| Internal Carotid Artery (ICA) | 85.00% | |||
| 장비별 | Philips | 5.00% | ||
| Simens | 40.00% | |||
| GE | 50.00% | |||
| 기타 | 5.00% | |||
| 데이터명 | 세부 데이터명 | AI모델 task | AI모델 (후보) |
성능 지표 및 목표값 | Data I/O |
|---|---|---|---|---|---|
| 경동맥 혈관 CT 및 MRI 데이터 | 경동맥 MRI 데이터 | Object Detection / Segmentation | UNet | mIoU(0.8) | Input data : MRI 이미지 |
| output data : 협착 발생 영역 | |||||
![]() |
|||||
| Classification | ResNet | ACC(80%) | Input data : MRI 이미지 | ||
| output data : 중증도 | |||||
![]() |
|||||
| 경동맥 MRA 데이터 | Object Detection / Segmentation | 3D ResNet + 3D UNet | mIoU(0.8) | Input data : MRA 이미지 | |
| output data : 협착 영역 | |||||
![]() |
|||||
| Classification | 3D ResNet | ACC(80%) | Input data : MRA 이미지 | ||
| output data : 중증도 | |||||
![]() |
|||||
| 경동맥 CT 데이터 | Object Detection / Segmentation | UNet | mIoU(0.8) | Input data : CT 이미지 | |
| output data : 협착 발생 영역 | |||||
![]() |
|||||
| Classification | ResNet | ACC(80%) | Input data : CT 이미지 | ||
| output data : 중증도 | |||||
![]() |
|||||
| 경동맥 CTA 데이터 | Object Detection / Segmentation | 3D ResNet + 3D UNet | mIoU(0.8) | Input data : CTA 이미지 | |
| output data : 협착 영역 | |||||
![]() |
|||||
| Classification | 3D ResNet | ACC(80%) | Input data : CTA 이미지 | ||
| output data : 중증도 | |||||
![]() |
|||||
- 경동맥 MRI/CT 데이터
· Object Detection / Segmentation
- Biomedical 분야에서 초음파 영상 분석에 많이 활용되는 인공지능 모델인 UNet을 경동맥 영상 분석에 활용할 수 있도록 적절하게 모델을 변형
- Encoder, Decoder에 포함되는 Block의 형태를 변형하여 모델을 커스터마이즈하여 개발
- 의료 영상의 특성을 고려하여, Encoder에 사용되는 Block에 Feature 값을 Remapping 하는 방식으로 모델 커스터마이즈 예정

· Classification
- 단일 ResNet을 활용할 계획이지만, 파라미터가 매우 많아 성능이 다소 떨어질 수 있음을 고려하여, SqueezeNet이나 AlexNet 과같이 적은 파라미터의 모델을 앙상블 학습하여 모델을 개발

- 경동맥 MRA/CTA 데이터
· Object Detection / Segmentation
- MRA/CTA 데이터는 기본적으로 촬영 시 3-axis 데이터가 수집이 되어 초음파나 MRI,CT 데이터와 다르게, 3D 데이터의 형식으로 구성됨
- 이를 고려하여, 3D ResNet과 3D UNet을 결합하여 특징영역을 추출하는 방식으로 학습하여 인공지능 모델을 개발
· Classification
- 3D 데이터 분석 성능이 뛰어난 3D ResNet을 활용해 Classification 모델을 구현함
- 3D ResNet을 통해 생성된 특징맵을 Fully Connected 한 이후, 환자의 정보와 같은 학습에 활용 가능한 추가 데이터를 덧붙여, 간단한 MLP를 구성하여 최종 중증도에 대한 클래스를 계산함
- 데이터 구성
| 데이터명 | 세부 데이터명 | AI 모델 Task | 어노테이션 방법 | 주요 어노테이션 속성 | 속성 설명 | 라벨링 데이터 포맷 |
|---|---|---|---|---|---|---|
| 경동맥 혈관 CT 및 MRI 데이터 | MRI 데이터 | Object Detection, Segmentation, Classification | BBox, Polygon | bbox | 협착부위 바운딩박스 정보 (좌표,라벨값) |
JSON |
| polygon | 협착부위 바운딩박스 정보 (좌표,라벨값) |
|||||
| CT 데이터 | Object Detection, Segmentation, Classification | BBox, Polygon | bbox | 협착부위 바운딩박스 정보 (좌표,라벨값) |
JSON | |
| polygon | 협착부위 바운딩박스 정보 (좌표,라벨값) |
|||||
| 번호 | 속성명 | 속성설명 | 타입 | 형식/범위 | 예시 | ||
|---|---|---|---|---|---|---|---|
| 1 | image_info | 이미지정보 | Object | ||||
| 1_1 | filename | 파일명 | String | [파일명] | 20230504_123 | ||
| 1_2 | hospital | 수집병원 | String | - | 삼성서울병원 | ||
| 1_3 | file_format | 파일포맷 | String | - | JPG | ||
| 1_4 | image_size | 이미지크기 | String | - | 6400KB | ||
| 1_5 | device | 촬영장비정보 | String | - | SS900N | ||
| 1_6 | resolution | 해상도 | String | - | 1920x1080 | ||
| 2 | annotation_info | 어노테이션정보 | List | - | |||
| 2_1 | id | 어노테이션 ID | String | - | A_1234567 | ||
| 2_2 | label | 라벨명 | String | - | plaque | ||
| 2_3 | bbox_info | 바운딩박스 정보 | Objcet | - | |||
| 2_3_1 | id | 바운딩박스 ID | String | - | |||
| 2_3_2 | points | 바운딩박스 좌표 | List | - | |||
| 2_4 | polygon_info | 폴리곤 정보 | Object | - | |||
| 2_4_1 | id | 폴리곤 ID | String | - | |||
| 2_4_2 | points | 폴리곤 좌표정보 | List | - | |||
| 3 | patient_info | 환자 메타정보 | Object | - | |||
| 3_1 | code | 환자번호 | String | - | SS000001 | ||
| 3_2 | age | 연령대 | String | - | 30대 | ||
| 3_3 | sex | 성별 | String | - | M | ||
| 3_4 | c_date | 검사연월 | String | YYYYMM | 202305 | ||
| 4 | severity | 중증도 | String | - | Moderate | ||
| 5 | location | 협착위치 | String | - | ICA, CCA | ||
- 데이터 분포
| 세부 데이터명 |
데이터 구분 | 구축수량 (명/건) |
|---|---|---|
| CT | 소계 | 2,046/18,750 |
| * 협착 중증도 별 | ||
| · Normal · Mild · Moderate · Severe |
367 / 2,542 1,023 / 9,616 350 / 3,321 306 / 3,271 |
|
| MRI | 소계 | 828 / 18,750 |
| * 협착 중증도 별 | ||
| · Normal · Mild · Moderate · Severe |
53 / 1,210 339 / 7,903 284 / 6,206 152 / 3,431 |
|
| CTA | 소계 | 945 / 18,750 |
| * 협착 중증도 별 | ||
| · Normal · Mild · Moderate · Severe |
26 / 299 807 / 16,417 60 / 1,205 52 / 829 |
|
| MRI | 소계 | 1,081 / 18,750 |
| * 협착 중증도 별 | ||
| · Normal · Mild · Moderate · Severe |
38 / 650 882 / 15,351 69 / 1,100 92 / 1,649 |
|
| 합계 | 4,900 / 75,000 | |
- 어노테이션 포맷
| 번호 | 속성명 | 속성설명 | 타입 | 형식/범위 | 예시 | ||
|---|---|---|---|---|---|---|---|
| 1 | image_info | 이미지정보 | Object | ||||
| 1_1 | filename | 파일명 | String | [파일명] | 20230504_123 | ||
| 1_2 | hospital | 수집병원 | String | - | 삼성서울병원 | ||
| 1_3 | file_format | 파일포맷 | String | - | JPG | ||
| 1_4 | image_size | 이미지크기 | String | - | 6400KB | ||
| 1_5 | device | 촬영장비정보 | String | - | SS900N | ||
| 1_6 | resolution | 해상도 | String | - | 1920x1080 | ||
| 2 | annotation_info | 어노테이션정보 | List | - | |||
| 2_1 | id | 어노테이션 ID | String | - | A_1234567 | ||
| 2_2 | label | 라벨명 | String | - | plaque | ||
| 2_3 | bbox_info | 바운딩박스 정보 | Objcet | - | |||
| 2_3_1 | id | 바운딩박스 ID | String | - | |||
| 2_3_2 | points | 바운딩박스 좌표 | List | - | |||
| 2_4 | polygon_info | 폴리곤 정보 | Object | - | |||
| 2_4_1 | id | 폴리곤 ID | String | - | |||
| 2_4_2 | points | 폴리곤 좌표정보 | List | - | |||
| 3 | patient_info | 환자 메타정보 | Object | - | |||
| 3_1 | code | 환자번호 | String | - | SS000001 | ||
| 3_2 | age | 연령대 | String | - | 30대 | ||
| 3_3 | sex | 성별 | String | - | M | ||
| 3_4 | c_date | 검사연월 | String | YYYYMM | 202305 | ||
| 4 | severity | 중증도 | String | - | Moderate | ||
| 5 | location | 협착위치 | String | - | ICA, CCA | ||
- JSON 포맷 실제 예시
{"image_info": {"filename": "DATA_00281635", "hospital": "양산부산대학교병원", "file_format": "jpg", "file_size": "10KB", "device": "SIEMENS / Definition Flash", "file_type":
"CT", "resolution": "512x512"}, "annotation_info": [{"polygon_info": {"id": "PLY_202312211310340000002", "points": [[206.4703546099291, 294.9190378006873], [
202.20973995271868, 297.7341580756014], [200.27309692671395, 298.2971821305842], [195.6251536643026, 299.4232302405498], [189.81522458628842, 298.2971821305842], [
187.87858156028366, 294.3560137457045], [186.71659574468086, 288.1627491408935], [187.1039243498818, 281.9694845360825], [190.58988179669032, 275.7762199312715], [
194.07583924349882, 274.087147766323], [199.1111111111111, 274.087147766323], [203.75905437352245, 275.7762199312715], [206.4703546099291, 279.71738831615113], [
207.6323404255319, 286.473676975945]]}, "label_cd": "12", "label": "혈관", "id": "ANT_202312211310340000002", "diameter": [[186.3538360595703, 285.16925048828125], [
206.7846221923828, 287.72308349609375]]}, {"polygon_info": {"id": "PLY_202312211310340000003", "points": [[324.9929078014184, 278.5913402061856], [320.73229314420803,
280.28041237113405], [314.5350354609929, 277.4652920962199], [312.21106382978724, 273.5241237113402], [310.66174940898344, 269.0199312714777], [310.66174940898344,
263.9527147766323], [312.59839243498817, 261.1375945017182], [316.4716784869976, 261.1375945017182], [319.57030732860517, 261.70061855670104], [322.66893617021276,
263.9527147766323], [325.38023640661936, 269.5829553264605], [325.76756501182035, 273.5241237113402]]}, "label_cd": "12", "label": "혈관", "id": "ANT_202312211310340000003",
"diameter": [[311.800048828125, 272.60003662109375], [323.800048828125, 266.60003662109375]]}], "patient_info": {"code": "PCT09201238470002", "age": "60대", "sex": "2",
"c_date": "201109"}, "location": "ICA", "severity": "Modereate"}
| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 최훈녕 | 010-9456-3520 | aihubinquirydata@gmail.com | 과제총괄 |
| 기관명 | 담당업무 |
|---|---|
| 경북대학교병원 | 데이터 획득 |
| 양산부산대학교병원 | 데이터 획득 |
| 삼성서울병원 | 데이터 획득 |
| ㈜모니터코퍼레이션 | 데이터 정제 |
| ㈜인비즈 | 데이터 정제 |
| ㈜선도소프트 | 데이터 가공 |
| ㈜코코아플러스 | 데이터 가공 |
| 대한심장혈관영상의학회 | 데이터 검수 및 자문 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 이명재 | 02-6247-0770 | aihubinquirydata@gmail.com |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 이명재 | 02-6247-0770 | aihubinquirydata@gmail.com |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 이명재 | 02-6247-0770 | aihubinquirydata@gmail.com |