| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.1 | 2023-12-06 | 데이터 최종 개방 | |
| 1.0 | 2023-07-24 | 데이터 개방 | Beta Version |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-05-08 | 데이터셋 변경 | 구축업체정보 수정 |
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 수정 |
| 2024-03-19 | 산출물 최종 공개 |
청진은 심장이나 폐 질환자에서 비침습적으로 진행되는 일차검사로 임상현장에서 추가적인 비용 발생없이 반복적으로 획득할 수 있는 생체신호이며, 심장·폐 질환의 진단과정에서 필수적으로 시행되는 절차임.
흉부 청진 절차에서 다양한 인공지능 연구개발에 활용될 수 있도록 잡음이 최소화된 양질의 청진음을 실제 현장의 질환빈도를 반영해 수집하고, 전문인력과 절차에 따른 참값 라벨링과 관련 임상의료데이터를 함께 수집한 학습용 빅데이터를 구축하여 ‘관련 연구개발을 촉진’하고 ‘전문 인력을 양성’하고자 함.
| 데이터 영역 | 헬스케어 | 데이터 유형 | 오디오 , 이미지 , 텍스트 |
|---|---|---|---|
| 데이터 형식 | wav, jpg, csv | 데이터 출처 | 자체 수집 |
| 라벨링 유형 | 진단(음성/이미지), 바운딩박스(이미지) | 라벨링 형식 | JSON |
| 데이터 활용 서비스 | 자가진단 보조 서비스, 심폐 질환 1차 스크리닝 서비스 | 데이터 구축년도/ 데이터 구축량 |
2022년/59,950 |
| 원천 데이터 종류 | 순환기계 | 호흡기계 | ||
|---|---|---|---|---|
| 청진음 | 유관데이터 | 청진음 | 유관데이터 | |
| 심장음 | 심전도/혈압 | 호흡음 | 흉부X선 | |
| 원천 자료형태 | 음성 | 생체신호/텍스트 | 음성 | 2D 의료영상 |
| 원천 데이터 포멧 | .wav | .jpg, .csv | .wav | .jpg |
| 라벨링데이터 | 24,000건 | 6,000건 | 25,195건 | 5,000건 |
| 구축 규모 | (6,000 x 4개 부위) | (6,000 x 4개 이상 부위) | ||
| 심장음별 분포 | |||
|---|---|---|---|
| 심장음 레이블 | COUNT | 비율 | 비고 |
| 1 | 22,358 | 93.16% | 정상(normal) |
| 2 | 804 | 3.35% | 수축기 심잡음(systolic murmur) |
| 3 | 105 | 0.44% | 이완기 심잡음(diastolic murmur) |
| 4 | 171 | 0.71% | 복합 심잡음(murmur) |
| 9 | 562 | 2.34% | 판독불가 |
| 합계 | 24,000 | 100% |
|
| 호흡음별 분포 | |||
|---|---|---|---|
| 호흡음 레이블 | COUNT | 비율 | 비고 |
| 0 | 15,561 | 61.76% | 정상(normal) |
| 1 | 34 | 0.13% | 거친 수포음(coarse crackle) |
| 2 | 494 | 1.96% | 천명(wheezing) |
| 3 | 7,804 | 30.97% | 가는 수포음(fine crackle) |
| 4 | 10 | 0.04% | 건성 수포음(rhonchi) |
| 9 | 1,292 | 5.13% | 판독불가 |
| 합계 | 25,195 | 100% |
|
| 심전도 파형별 분포 | |||
|---|---|---|---|
| 심전도 레이블 | COUNT | 비율 | 비고 |
| 1 | 4,052 | 81.04% | Sinus Rhythm(SR) |
| 2 | 666 | 13.32% | Atrial Fibrillation(AFIB) |
| 3 | 14 | 0.28% | Bundle Branch Block(BBB) |
| 4 | 268 | 5.36% | Others |
| 합계 | 5,000 | 100% |
|
•심장음에 대하여 정상, 수축기 심잡음, 이완기 심잡음, 복합 심잡음, 판독불가를 분류하는 인공지능 모델 개발
• 심장음에서 MFCC(Mel-frequency cepstral coefficients) 특징을 추출하여 1D컨볼루션기반의 U-Net의 입력으로 넣어 학습 및 추론을 수행

활용 방안
• AI를 활용한 심장음 기반 심장판막, 부정맥, 등 심장질환 일차진단 솔루션: 심장판막 질환, 등 청진음이 특징적인 주요 심장 질환을 일차진단하는 솔루션은 물론, 심장질환이 이미 진단된 환자에서 질환의 악화여부를 추적 관리함으로써 개별화된 예방 지침 및 추적 검사 일정을 제시하는 솔루션 개발이 가능함
• 심장 질환 자가 모니터링 솔루션: 심장 질환 의심환자 혹은 유질환자가 자택에서 스스로 건강상태를 모니터링 하기위한 생체신호 분석 및 해석 솔루션 제공 가능. 가정용 혈압계와 같이 반복적인 측정을 통해 의료기관 내원이 필요한 질환악화, 등을 조기판별
활용 모델
• 호흡음에 대하여 정상, 거친수포음, 천명, 고른수포음, 건성수포음, 판독불가를 분류하는 인공지능 모델 개발
• 호흡음의 MFCC 특징을 기반으로 1D컨볼루션기반의 U-Net을 통해 학습 및 추론을 수행

활용 방안
• AI를 활용한 호흡음 기반 주요 호흡기질환 일차 진단 솔루션: 호흡음 학습데이터를 활용하여 1차 진료 및 응급의료 현장에서 인공지능 기반 호흡음 분석을 통해 호흡기질환을 조기에 선별하여 신속한 진단 및 즉각적인 처치가 가능하게 함
• AI를 활용한 호흡음 기반 유행성 호흡기 감염질환 진단 솔루션: 코로나19 같은 감염 전파 비중이 큰 질환의 경우 감염 취약 시설 일반인 및 자가 격리자를 대상으로 호흡기 감염병 징후를 조기에 스크리닝해 확산을 신속히 차단하고 대규모 감염확산을 예방·관리 할 수 있는 솔루션 개발이 가능함
• 폐 질환 자가 모니터링 솔루션: 폐 질환 의심환자 혹은 유질환자가 자택에서 스스로 건강상태를 모니터링 하기위한 생체신호 분석 및 해석 솔루션.
활용 모델
• 흉부 X 선 영상에서 심장과 폐영역을 탐지하는 물체 탐지(object detection)모델 개발
• 입력된 흉부X선 영상과 심/폐 영역 마스크를 기반으로 YOLO v5 모델을 통해 학습한 후, 심장 및 폐 영역에 대한 bounding box 생성

활용 방안
• 심장의 구조적 문제 (심장 비대 및 석회화 등)의 시각적 확인을 통해 심장질환 진단을 지원
• 폐 영역 내 구조적 변화의 시각적 확인을 통해 폐 질환 진단을 지원
| [순환기계-청진음] 심장음 데이터 구성 및 어노테이션 포맷 | ||
|---|---|---|
| 원시/원천데이터 (심장음 수집 4개 위치) | 심장음 라벨링 | |
| (1) MA | Mitral Valve Area | label: 1 |
| - 5종의 심잡음 인덱스 중 하나 (1-4, 9) | ||
| <심잡음 5종> | ||
| 1) 정상(normal), | ||
| 2) 이완기 심잡음(systolic murmur), | ||
| (2) TA | Tricuspid Valve Area | 3) 수축기 심잡음(diastolic murmur), |
| (3) AA | Aortic Valve Area | 4) 복합 심잡음(murmur), |
| (4) PA | Pulmonary Valve Area
|
9) 판독 불가(cannot analyze) |
| 구분 | 속성명 | 타입 | 필수여부 | 설명 | 범위 | 비고 | |
|---|---|---|---|---|---|---|---|
| 1 | study_date | string | Y | 데이터 생성일시 | yyyyMMdd | ||
| 2 | patient_id | string | Y | 환자 ID (비식별화) | |||
| 3 | pcg_files | array array of object | Y | 심장음 파일 정보 | |||
| 3-1 | id | string | Y | 심장음 파일 식별자 | |||
| 3-2 | file_name | string | Y | 심장음 파일 이름 | |||
| 3-3 | 3-4+G28:L40 | string | Y | 심장음 수집 위치 | MA, TA, AA, PA | ||
| 3-4 | murmur_label | integer | Y | 심장음 카테고리 | 1,2,3,4,9 | 1: 정상(normal) | |
| 2: 수축기 심잡음 (systolic murmur) | |||||||
| 3: 이완기 심잡음 (diastolic murmur) | |||||||
| 4: 복합심잡음 | |||||||
| (murmur) | |||||||
| 9: 판독불가 | |||||||
| { | |||||||
| "patient_id": "1234567", | |||||||
| "study_date": “20190917”, | |||||||
| "pcg_files": [ | |||||||
| [ | |||||||
| { | |||||||
| "id": "hs_00001_01_MA", | |||||||
| "file_name": "hs_00001_01_MA.wav", | |||||||
| "location": "MA“, | |||||||
| "murmur_label": 1 | |||||||
| } | |||||||
| ], | |||||||
| [ | |||||||
| { | |||||||
| "id": "hs_00001_01_TA", | |||||||
| "file_name": "hs_00001_01_TA.wav", | |||||||
| "location": "TA" | |||||||
| "murmur_label": 1 | |||||||
| } | |||||||
| ], | |||||||
| [ | |||||||
| { | |||||||
| "id": "hs_00001_01_AA", | |||||||
| "file_name": "hs_00001_01_AA.wav", | |||||||
| "location": "AA" | |||||||
| "murmur_label": 1 | |||||||
| } | |||||||
| ], | |||||||
| [ | |||||||
| { | |||||||
| "id": "hs_00001_01_PA", | |||||||
| "file_name": "hs_00001_01_PA.wav", | |||||||
| "location": "PA" | |||||||
| "murmur_label": 1 | |||||||
| } | |||||||
| ] | |||||||
| ] | |||||||
| } | |||||||
| [순환기계-청진음] 호흡음 구성 및 어노테이션 포맷 | ||
|---|---|---|
| 원시/원천데이터 (호흡음 수집 12개 위치 중 4개 위치 이상) | 호흡음 라벨링 | |
| Front view | label: 1 | |
| - 6종의 호흡음 인덱스 중 하나 (0-4, 9) | ||
| (1) FRUL | (2) FLUL | <호흡음 6종> |
| right upper lung | left upper lung | 0) 정상(normal), |
| (3) FRML | (4) FRML | 1) 거친수포음(coarse crackle), |
| right mid lung | left mid lung | 2) 가는수포음(fine crackle), |
| (5) FRLL | (6) FLLL | 3) 건성수포음(rhonchi), |
| right lower lung | left lower lung | 4) 천명(wheezing), |
| Back view | 9) 판독 불가(cannot analyze) | |
| (7) BLUL | (8) BRUL | |
| left upper lung | right upper lung | |
| (9) BLML | (10) BRML | |
| left mid lung | right mid lung | |
| (11) BLLL | (12) BRLL | |
| left lower lung | right lower lung | |
| 구분 | 속성명 | 타입 | 필수여부 | 설명 | 범위 | 비고 | |
|---|---|---|---|---|---|---|---|
| 1 | study_date | string | Y | 데이터 생성일자 | yyyyMMdd | ||
| 2 | patient_id | string | Y | 환자 ID (비식별화) | |||
| 3 | respiratory_files | array array of object | Y | 호흡음 파일 정보 | |||
| 3-1 | id | string | Y | 호흡음 파일 식별자 | |||
| 3-2 | file_name | string | Y | 호흡음 파일 이름 | |||
| 3-3 | location | string | Y | 호흡음 수집 위치 | FRUL, FLUL, FRML, FLML, FRLL, FLLL, BRUL, BLUL, BRML, BLML, BRLL, BLLL | ||
| 3-4 | label | integer | Y | 호흡음 카테고리 | 0,1,2,3,4,9 | 0:정상(normal) | |
| 1:거친수포음 (coarse crackle), | |||||||
| 2:천명(wheezing), | |||||||
| 3:가는수포음 | |||||||
| (fine crackle), | |||||||
| 4:건성수포음 | |||||||
| (rhonchi), | |||||||
| 9:판독불가 | |||||||
| { | |||||||
| "patient_id": "1234567", | |||||||
| "study_date": “20190917”, | |||||||
| "respiratory_files": [ | |||||||
| [ | |||||||
| { | |||||||
| "id": "rs_00001_01_BLLL", | |||||||
| "file_name": "rs_00001_01_BLLL.wav", | |||||||
| "location": "BLLL", | |||||||
| "label": 1 | |||||||
| } | |||||||
| ], | |||||||
| [ | |||||||
| { | |||||||
| "id": "rs_00001_01_BLUL", | |||||||
| "file_name": "rs_00001_01_BLUL.wav", | |||||||
| "location": "BLUL", | |||||||
| "label": 1 | |||||||
| } | |||||||
| ], | |||||||
| [ | |||||||
| { | |||||||
| "id": "rs_00001_01_BRLL", | |||||||
| "file_name": "rs_00001_01_BRLL.wav", | |||||||
| "location": "BRLL", | |||||||
| "label": 1 | |||||||
| } | |||||||
| ], | |||||||
| [ | |||||||
| { | |||||||
| "id": "rs_00001_01_BRUL", | |||||||
| "file_name": "rs_00001_01_BRUL.wav", | |||||||
| "location": "BRUL", | |||||||
| "label": 1 | |||||||
| } | |||||||
| ] | |||||||
| ] | |||||||
| } | |||||||
| [순환기계 및 호흡기계 유관데이터] 흉부 X선 구성 및 어노테이션 포맷 | |
|---|---|
| 원시/원천데이터 | 심장 및 폐 어노테이션 |
| 흉부 X선 이미지 | 1: 심장 영역 bounding box |
| 2. 폐 영역 bounding box | |
| 구분 | 속성명 | 타입 | 필수여부 | 설명 | 범위 | 비고 | |
|---|---|---|---|---|---|---|---|
| 1 | id | string | Y | 흉부 X선 이미지 식별자 | |||
| 2 | file_name | string | Y | 흉부 X선 이미지 파일명 | |||
| 3 | width | number | Y | 이미지 가로 크기 (픽셀) | |||
| 4 | height | number | Y | 이미지 세로 크기 (픽셀) | |||
| 5 | study_date | string | Y | 생성일자 | yyyyMMdd | ||
| 6 | patient_id | string | Y | 환자 ID (비식별화) | |||
| 7 | bounding_boxes | array of object | Y | bounding box 정보 | |||
| 7-1 | bbox_id | integer | Y | bounding box 카테고리 | [1,2] | 1:심장 영역, | |
| 2:폐 영역 | |||||||
| 7-2 | bbox_name | string | Y | bounding box 이름 | heart, lung | ||
| 7-3 | type | string | Y | 어노테이션 타입 | bounding_box | ||
| 7-4 | upper_left | array of number | Y | b-box 좌상단 x,y 좌표 | |||
| 7-5 | bottom_right | array of number | Y | b-box 우하단 x,y 좌표 | |||
| { | |||||||
| "id": "rscxr_00001_01", | |||||||
| "file_name": "rscxr_00001_01.jpg", | |||||||
| "patient_id": "1234567", | |||||||
| "study_date": "20190909", | |||||||
| "width": 100, | |||||||
| "height": 200, | |||||||
| "bounding_boxes": [ | |||||||
| { | |||||||
| "bbox_id": 1, | |||||||
| "bbox_name": "heart", | |||||||
| "type": "bounding_box", | |||||||
| "upper_left": [ | |||||||
| 1, | |||||||
| 2 | |||||||
| ], | |||||||
| "bottom_right": [ | |||||||
| 3, | |||||||
| 4 | |||||||
| ] | |||||||
| }, | |||||||
| { | |||||||
| "bbox_id": 2, | |||||||
| "bbox_name": "lung", | |||||||
| "type": "bounding_box", | |||||||
| "upper_left": [ | |||||||
| 5, | |||||||
| 6 | |||||||
| ], | |||||||
| "bottom_right": [ | |||||||
| 7, | |||||||
| 8 | |||||||
| ] | |||||||
| } | |||||||
| ] | |||||||
| } | |||||||
| [순환기계 유관데이터] 심전도 구성 및 어노테이션 포맷 | |
|---|---|
| 원시/원천데이터 | 심전도 파형 어노테이션 |
| 심전도 파형 이미지 | label: 1 |
| - 4종의 심전도 파형 인덱스 중 하나 (1-4) | |
| <심전도 파형 4종> | |
| 1) Sinus rhythm (SR) | |
| 2) Atrial fibrillation (AFIB), | |
| 3) Bundle branch block (BBB) | |
| 4) Others | |
| 구분 | 속성명 | 타입 | 필수여부 | 설명 | 범위 | 비고 |
|---|---|---|---|---|---|---|
| 1 | id | string | Y | 심전도 데이터 식별자 | ||
| 2 | file_name | string | Y | 심전도 데이터 파일명 | ||
| 3 | study_date | string | Y | 데이터 생성일자 | yyyyMMdd | |
| 4 | patient_id | string | Y | 환자 ID (비식별화) | ||
| 5 | labels | integer | Y | 심전도 파형 카테고리 | [1,4] | 1:Sinus rhythm (SR), |
| 2:Atrial fibrillation (AFIB), | ||||||
| 3:Bundle branch block (BBB), | ||||||
| 4:Others | ||||||
| { | ||||||
| "id": "hsecg_00001_01", | ||||||
| "file_name": "hsecg_00001_01.jpg", | ||||||
| "patient_id": "1234567", | ||||||
| "study_date": “20190917”, | ||||||
| "labels": 1 | ||||||
| } | ||||||
| [순환기계 유관데이터] 혈압 구성 및 어노테이션 포맷 | |
|---|---|
| 원시/원천데이터 | 혈압데이터 어노테이션 |
| 혈압 수치 데이터 | 해당없음 |
| 구분 | 속성명 | 타입 | 필수여부 | 설명 | 범위 | 비고 |
|---|---|---|---|---|---|---|
| 1 | id | string | Y | 혈압 데이터 식별자 | ||
| 2 | file_name | string | Y | 혈압 데이터 파일명 | ||
| 3 | study_date | string | Y | 데이터 생성일자 | yyyyMMdd | |
| 4 | patient_id | string | Y | 환자 ID (비식별화) | ||
| 5 | sbp | number | Y | 수축기 최고 혈압 | 측정치로 범위없음 | |
| 6 | dbp | number | Y | 이완기 최저 혈압 | 측정치로 범위없음 | |
| { | ||||||
| “id”: “hsbp_00001_01”, | ||||||
| “filename”: “hsbp_00001_01.csv”, | ||||||
| “study_date”: “20190917”, | ||||||
| “patient_id”: “1234567”, | ||||||
| “sbp”: 130, | ||||||
| “dbp”: 80, | ||||||
| } | ||||||
| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 장혁재 | 070-4105-5371 | HJCHANG@yuhs.ac | 총괄 책임 / 데이터 수집, 정제, 가공 및 사업총괄 |
| 기관명 | 담당업무 |
|---|---|
| 주식회사 온택트헬스 | 데이터 정제, 가공 |
| 순천향대학교 산학협력단 | 데이터 수집, 가공 |
| ㈜데이터웨이 | 데이터 검수 |
| 주식회사 스마트사운드 | 데이터 수집 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 장혁재 | 070-4105-5371 | HJCHANG@yuhs.ac |