공공 의료데이터 상세

썸네일

말초 혈관 초음파 데이터

##멀티모달##헬스케어 의료
- 말초 혈관 환자의 진단을 위해 초음파데이터 35,000장을 구축하여 각각의 데이터는 인공지능 학습이 가능하도록 가공하되, plaque, 근육, 피하지방, 동맥, 정맥, 혈관벽 등 해부학적 영역에 대해 polygon 가공함
분야
헬스케어
유형
이미지
생성 방식
안심존(온라인)
  • 구축년도 : 2023
  • 버전 : 1.1
AI-HUB

데이터 변경이력

데이터 변경이력
버전 일자 변경내용 비고
1.1 2024-10-30 데이터 최종 개방
1.0 2024-07-05 데이터 개방 Beta Version

데이터 히스토리

데이터 히스토리
일자 변경내용 비고
2025-10-31 데이터셋 변경 구축업체정보 수정
2025-10-14 데이터셋 변경 구축업체정보 수정
2025-01-06 데이터셋 변경 메타데이터 데이터 구축량 정보 수정
2024-07-05 산출물 공개 Beta Version

소개

- 말초 혈관 환자의 진단을 위해 초음파데이터 35,000장을 구축하여 각각의 데이터는 인공지능 학습이 가능하도록 가공하되, plaque, 근육, 피하지방, 동맥, 정맥, 혈관벽 등 해부학적 영역에 대해 polygon 가공함

구축목적

- 말초 혈관 질환을 진단할 수 있는 AI 학습용 이미지 데이터 구축

- 데이터 구축 규모 및 분포

데이터 구축 규모 및 분포
구분 규모 파일 형태
Artery 2D 이미지 4,564장 JPG, JSON
Carotid 2D 이미지 23,242장 JPG, JSON
Vein 2D 이미지 7,194장 JPG, JSON

 

데이터 구축 규모 및 분포2
세부
데이터명
데이터 구분 구축수량 (명/건)
경동맥 협착 소계 3,069 / 23,242
* 협착 중증도 별  
· Normal
· Mild
· Moderate
· Severe
93 / 167
2,019 / 16,018 
377 / 2,736  
580 / 4,321
하지동맥 협착 소계 404 / 4,564
* 협착 중증도 별
· Normal
· Mild
· Moderate
· Severe
31 / 85
279 / 3,456 
53 / 453  
41 / 570
세부
데이터명
데이터 구분 구축수량 (명/건)
심부정맥 혈전증 소계 859 / 7,194
* 혈전 유무별
· Normal
· Abnormal
68 / 400
791 / 6,794
합계  4,332 / 35,000

 

- 클래스별 데이터 비율

클래스별 데이터 비율

AI 모델 상세
데이터명 세부
데이터명
AI모델 task AI모델
(후보)
성능 지표
및 목표값
Data I/O
말초혈관
초음파
데이터
말초혈관
초음파
데이터
Object Detection / Segmentation UNet ACC(80%) Input data : 초음파 이미지
output data : plaque, 혈관 영역
Unet 모델 이미지
Classification ResNet ACC(80%) Input data : 초음파 이미지
output data : 질환명
ResNet 모델 이미지

- 말초혈관 초음파 데이터
  ·Object Detection / Segmentation
    - Biomedical 분야에서 초음파 영상 분석에 많이 활용되는 인공지능 모델인 UNet을 말초혈관 초음파 영상 분석에 활용할 수 있도록 적절하게 모델을 변형
    - Encoder, Decoder에 포함되는 Block의 형태를 변형하여 모델을 커스터마이즈하여 개발
    - 초음파 영상의 특성을 고려하여, Encoder에 사용되는 Block에 Feature 값을 Remapping 하는 방식으로 모델 커스터마이즈 예정

Object Detection Segmentation
  ·Classification
    - 초음파 데이터를 활용한 Classification에 많이 활용되는 ResNet을 활용하여 AI 모델을 개발
    - 단일 ResNet을 활용할 계획이지만, 파라미터가 매우 많아 성능이 다소 떨어질 수 있음을 고려하여, SqueezeNet이나 AlexNet 과같이 적은 파라미터의 모델을 앙상블 학습하여 모델을 개발

Classification

- 데이터 구성

데이터 구성
데이터명 세부
 데이터명
클래스 구분 구축 비율
말초혈관
초음파 데이터
말초혈관
초음파 데이터
영역별 plaque 30.00%
혈전 20.00%
근육 및 지방 20.00%
혈관 30.00%
질환별 경동맥 협착 48.00%
하지동맥 협착 17.00%
심부정맥혈전증 35.00%

 

- 어노테이션 포맷

어노테이션 포맷
번호 속성명 속성설명 타입 형식/범위 예시
1 image_info 이미지정보 Object    
  1-1 filename 파일명 String [파일명] 20230504_1
23
1-2 hospital 수집병원 String - 삼성서울병원
1-3 file_format 파일포맷 String - JPG
1-4 image_size 이미지크기 String - 6400KB
1-5 device 촬영장비정보 String - SS900N
1-6 resolution 해상도 String - 1920x1080
2 annotation_info 어노테이션정보 List -  
  2-1 id 어노테이션 ID String - A_1234567
2-2 label 라벨명 String - plaque
2-3 polygon_info 폴리곤 정보 Objcet -  
  2-3-1 id 폴리곤 ID String -  
2-3-2 points 폴리곤 좌표정보 List -  
3 patient_info 환자 메타정보 Object -  
  3-1 code 환자번호 String - SS000001
3-2 age 연령대 String - 30대
3-3 sex 성별 String - M
3-4 c_date 검사연월 String YYYYMM 202305
4 type 질환종류 String - 하지동맥협착
5 severity 중증도 String -  
6 blood_vessel_type 혈관종류 String - 동맥,정맥
7 plane_type 축 종류 String - Longitudinal,
Axial

 

- 실제 json 예시

{"image_info": {"filename": "DATA_00100779", "hospital": "경북대학교병원", "file_format": "jpg", "file_size": "69KB", "device": 
"GE Healthcare / LOGIQE9", "file_type": "US", "resolution": "960x720"}, "annotation_info": [{"polygon_info": {"id": 
"PLY_202312211302040000002", "points": [[280.7375886524895, 179.91753632580156], [337.92907801419153, 175.9587734392036], [
408.7375886524894, 173.97939199590462], [462.2978723404327, 172.98970127425508], [514.0425531914966, 172.98970127425508], [
563.0638297872413, 173.97939199590462], [575.7730496453972, 180.90722704745102], [573.0496453900781, 218.51547447013144], [
484.9929078014256, 221.4845466350799], [351.5460992907873, 227.42269096497677], [307.9716312056809, 228.41238168662628], [
283.4609929078086, 226.43300024332729]]}, "label_cd": "13", "label": "근육 및 지방", "id": "ANT_202312211302040000002"}, {
"polygon_info": {"id": "PLY_202312211302040000003", "points": [[281.25621911123653, 267.44782666568733], [319.02075811832884, 
263.6474142945533], [379.3699943929902, 260.48278850004186], [402.6097107050469, 254.14876788148518], [442.11722843554327, 
254.14876788148518], [482.86075811832865, 248.44576481001724], [556.0658645013075, 238.31133182032653], [580.9745334000822, 
233.24649984024802], [580.9745334000822, 247.8147472629285], [503.1214837546923, 261.7495926237532], [449.0891433291604, 
266.8168091185986], [412.486590137671, 268.0836132423099], [351.48233481852213, 276.9512421082893], [307.9078667334157, 
286.4522730361243], [307.9078667334157, 286.4522730361243], [282.34417879015325, 291.5194895309697]]}, "label_cd": "12", "label":
 "혈관", "id": "ANT_202312211302040000003", "diameter": [[580.7303466796875, 238.3805160522461], [280.39146423339844, 
279.1504821777344]]}], "patient_info": {"code": "KAR09180032450005", "age": "50대", "sex": "1", "c_date": "202306"}, "type": 
"하지동맥협착", "blood_vessel_type": "동맥", "plane_type": "Longitudinal", "location": "", "severity": "Moderate"}

데이터셋 구축 담당자

수행기관(주관) : ㈜브랜드콘텐츠
수행기관(주관)
책임자명 전화번호 대표이메일 담당업무
최훈녕 010-9456-3520 aihubinquirydata@gmail.com 과제총괄
수행기관(참여)
수행기관(참여)
기관명 담당업무
경북대학교병원 데이터 획득
양산부산대학교병원 데이터 획득
삼성서울병원 데이터 획득
㈜모니터코퍼레이션 데이터 정제
㈜인비즈 데이터 정제
㈜선도소프트 데이터 가공
㈜코코아플러스 데이터 가공
대한심장혈관영상의학회 데이터 검수 및 자문
데이터 관련 문의처
데이터 관련 문의처
담당자명 전화번호 이메일
이명재 02-6247-0770 aihubinquirydata@gmail.com
AI모델 관련 문의처
AI모델 관련 문의처
담당자명 전화번호 이메일
이명재 02-6247-0770 aihubinquirydata@gmail.com
저작도구 관련 문의처
저작도구 관련 문의처
담당자명 전화번호 이메일
이명재 02-6247-0770 aihubinquirydata@gmail.com