| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.1 | 2023-12-13 | 데이터 최종 개방 | |
| 1.0 | 2023-07-12 | 데이터 개방 | Beta Version |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-06-17 | 데이터셋 변경 | 구축업체정보 수정 |
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 수정 |
| 2024-02-27 | 산출물 최종 공개 |
상급 종합병원의 중환자실의 경우 환자 중 40% 이상 인공호흡기를 적용하지만 사망률은 15~23%로 높고, 지역별 및 전담 전문의 배치에 따른 사망률 편차가 크기 때문에 호흡부전 환자에서 근거 중심의 표준화 지침에 따른 양질의 인공호흡기 치료가 필수적임.
중환자 치료에 가장 중요한 역할을 담당하는 인공호흡기 관리와 관련하여 다양한 AI연구개발에 활용할 수 있도록, 정밀 웨이브폼, 라벨링, 관련 임상의료 데이터를 수집하여 학습용 빅데이터를 구축함.
| 데이터 영역 | 헬스케어 | 데이터 유형 | 텍스트 |
|---|---|---|---|
| 데이터 형식 | wav, csv | 데이터 출처 | 자체 수집 |
| 라벨링 유형 | 세그멘테이션 | 라벨링 형식 | JSON |
| 데이터 활용 서비스 | 온디바이스 | 데이터 구축년도/ 데이터 구축량 |
2022년/359,087 |
1. 데이터 구축 규모
| 후향적 수집 (1500건) | ||
|---|---|---|
| [인공호흡기] | [유관데이터] | |
| 파형데이터 | 전자의무기록정보 | |
| 구축 규모 | 1,500건 | 6,000건 |
• 인공호흡기파형데이터
- 1건 : 최소 24시간이상 인공호흡기를 유지하면서 파형데이터가 유지기간의 60% 이상을 포함하는 경우
- 60Hz의 압력(pressure) 및 흐름(flow) 파형데이터로 구성됨
• 유관데이터
- 혈액검사 : 동맥혈가스검사
- 간호기록 : 진정상대점수
- 활력징후 : 혈압, 맥박, 호흡수, 체온, 산소포화도
- 투약 : 강심제, 진정제, 진통제
- 인구학적정보 : 키, 몸무게, 입실진단명, 중환자실입퇴실시간, 사망시간
2. 데이터 수집 담당 의료기관
| 항목 | 서울대학교 | 연세대학교 (신촌) | 아주대학교 | 항목별 | ||
|---|---|---|---|---|---|---|
| 총합 | ||||||
| 호흡 | 인공호흡기 | 인공호흡기 | 750 | 250 | 500 | 1,500건 |
| 기계 | 파형 데이터 | |||||
| 유관 데이터 | 전자의무기록 | 3000 | 1000 | 2000 | 6,000건 | |
| 기관별 데이터 총 수집 건수 | 3,750건 | 1,250건 | 2,500건 | 12,000건 | ||
3. 데이터 분포
1) 중환자실 Unit 유형별 분포
| 구분 | 구성비 | 수량 |
|---|---|---|
| 내과계 중환자실 | 29.80% | 447건 |
| 외과계 중환자실 | 29.93% | 449건 |
| 내외과계 중환자실 | 19.53% | 293건 |
| 기타 중환자실 | 20.73% | 311건 |
| 합계 | 100% | 1,500건 |
2) 연령대별 분포
| 구분 | 구성비 | 수량 |
|---|---|---|
| 성인 | 94.80% | 1,422건 |
| 소아(18세 미만) | 5.20% | 78건 |
| 합계 | 100% | 1,500건 |
1. 모델링 활용
| 데이터 항목 | 모델링 항목 | 담당 기업 | ||
|---|---|---|---|---|
| 호흡기계 | 인공호흡기 | 인공호흡기파형데이터 | 환자-인공호흡기 부조화 검출 | ㈜버드온 |
| 유관데이터 | 임상기록, 검사결과, 간호기록, CXR기록 | 인공호흡기 이탈 검출 | ||
| 총 모델링 수 | 2건 | |||
2. 모델 정의
[인공호흡기 이탈 성공 예측 모델]
환자가 인공호흡기를 뗀 이후 48시간 동안 인공호흡기 이탈이 성공할지를 예측함
이진 분류(Binary classification)
[인공호흡기 파형 노이즈 및 부조화 감지 모델]
기계환기 중 비정상 파형과 인공호흡기와 환자의 호흡 주기 비동시성을 감지함
이상치 탐지(Anomaly detection) 및 이진 분류(Binary classification)
3. 모델 유형
[인공호흡기 이탈 성공 예측 모델]
| ⓵ 분류 | ⓶ 탐지 | ⓷ 추정 | ⓸ 이해 | ⓹ 합성 | ⓺ 기타 |
|---|---|---|---|---|---|
| ■ | □ | □ | □ | □ | □ |
[인공호흡기 파형 노이즈 및 부조화 감지 모델]
| ⓵ 분류 | ⓶ 탐지 | ⓷ 추정 | ⓸ 이해 | ⓹ 합성 | ⓺ 기타 |
|---|---|---|---|---|---|
| □ | ■ | □ | □ | □ | □ |
4. 서비스활용 시나리오
[인공호흡기 이탈 성공 예측 모델]
인공호흡기로부터의 이탈이 지연될 경우 여러 합병증을 초래하며 이는 치료의 효율성을 저하시키고 입원기간을 연장시키는 부작용이 발생함
이탈 성공 예측은 기계환기 사용일, 인공호흡기 이탈 과정 소요 시간과 중환자실 재실 기간을 낮출 수 있음
[인공호흡기 파형 노이즈 및 부조화 감지 모델]
환자와 인공호흡기의 호흡 주기가 맞지 않으면 환자의 불편감이 초래되며, 폐손상의 악화로 인해 예후가 좋지 않음. 따라서 지속적으로 기계환기 그래프 파형을 관찰하여 비동시성을 감시해야 함
그러나 이에 따라 전문의료인의 노동력이 소모되므로 호흡 주기 부조화를 자동적으로 감지하는 모델은 불필요한 의료 비용을 감소시킬 수 있음
부착 오류, 기기 이동에 따라 발생하는 인공호흡기의 파형의 노이즈와 환자-인공호흡기의 부조화는 정상 파형에 비해 다른 형태를 띤다는 공통점이 있지만, 각기 다른 원인에 의한 것으로 이를 구분하는 알고리즘 개발이 필요함
1. 데이터 포맷
1) 구축 데이터 명세
- 인공호흡기 수집장비를 적용하여 인공호흡기 파형 데이터를 구축함.
- 유관데이터로 전자의무기록에서 추출 가능한 데이터를 모두 수집함
인공호흡기 원시데이터 수집 기준
● 최소 24시간 이상 인공호흡기 데이터가 있어야 함
● 인공호흡기 적용시간 전체 데이터의 60% 이상이 파형(waveform) 데이터이어야 함
● 인공호흡기 적용 시 환자의 위치는 중환자실 외부여도 되지만 이탈 시 환자의 위치는 중환자실 이내여야 함
인공호흡기관련 유관데이터 수집 기준
● 인공호흡기 적용 시간 전 48시간 유관데이터 와 이탈 후 48시간 유관데이터 추출해야함
● 인공호흡기 관련 유관데이터는 활력기록정보(혈압, 맥박, 체온, 호흡수, 산소포화도), 투약정보(주사제-강심제, 수액, 진정제, 진통제), 검사결과정보(혈액검사), 간호기록정보 (의식상태 등) 포함해야함
● 단, 성별, 연령, 주진단명, 기저진단명, 체중, 몸무게, 입원정보, 수술/시술정보, 퇴원정보, 입실정보, 퇴실정보, 사망정보는 관련 인공호흡기 적용 시관과 관계 없이 추출해야 함
2) 구축 데이터 포맷 및 규모
| 호흡기계 | |||
|---|---|---|---|
| 인공호흡기 | 유관데이터 | ||
| 파형데이터 | 전자의무기록 (num, sting) | ||
| 원시 자료 형태 | num, wave | num, sting | |
| 원시 데이터 포맷 | .csv | .csv | |
| 확보방안 | 자체개발 수집 장치/서버 | 의료기관 전자의무기록 추출 | |
| 데이터 | 데이터 | 100-200 MB | 10 MB |
| 규모 | 건당 크기 (MB) | ||
| 총 수집 용량 (GB) | 1.0 ~ 2.0 TB | 50GB | |
| 수집 건수 | 1,500건 | 6,000건 | |
2. 데이터 예시
| 원시 데이터 종류 | 데이터 예 | ||
|---|---|---|---|
| 호흡기계 | 인공호흡기 | 파형데이터 | ![]() |
| 유관 | 투약정보 | ![]() |
|
| 데이터 | 검사결과 | ||
| 간호기록 | |||
| 활력징후 | |||
| [호흡기계] 인공호흡기 라벨링 데이터 파일형식 | ||||||
|---|---|---|---|---|---|---|
| 원천데이터 (인공호흡기 파형 데이터) | 인공호흡기 라벨링 | |||||
| 인공호흡기 파형 데이터 | ![]() |
label: | ||||
| - 인공호흡기 이탈 및 부조화 관련 | ||||||
| (인공호흡기 이벤트) | ||||||
| 1) 인공호흡기 이탈 성공 | ||||||
| 2) 인공호흡기 이탈 실패 | ||||||
| 3) 환자-인공호흡기 조화 | ||||||
| 4) 환자-인공호흡기 부조화 (거짓값) | ||||||
| 5) 환자-인공호흡기 부조화 (참값) | ||||||
| .json 파일 구조 | ||||||
| { | ||||||
| "patient_id": 1234567, | ||||||
| "study_date": 20220218, | ||||||
| "event_ventilator": 1, | ||||||
| "vent_files.id": "vw_00001_01_vent", | ||||||
| "vent_files.filename": "vw_00001_01_vent_pre.wav", | ||||||
| "vent_files.filename": "vw_00001_01_vent_flo.wav", | ||||||
| "vent_files.filename": "vw_00001_01_vent_vol.wav", | ||||||
| "vent_files.location": "vent", | ||||||
| "patient_status": "intensive_care_unit", | ||||||
| "start_time": 41.55778, | ||||||
| "end_time": 46.965 | ||||||
| "ventilator weaning": "success", | ||||||
| "ventilator status": “ventilator harmony” | ||||||
| } | ||||||
| 속성 설명 | ||||||
| No. | 속성명 | 속성 설명 | Type | 예시 | ||
| 1 | patient_id | 환자 ID (비식별화) | number | 1234567 | ||
| 2 | study_date | 데이터 생성일자 | number | yyyy-mm-dd | ||
| 3 | event_ventilator | 인공호흡기 이벤트 카테고리 | number | 1 | ||
| 4 | vent_files.id | 인공호흡기 파일 식별자 | number | vw_00001_01_vent | ||
| 5 | vent_files.filename | 인공호흡기 파일 이름 (유속) | number | vw_00001_01_vent_flo.wav | ||
| 6 | vent_files.filename | 인공호흡기 파일 이름 (압력) | number | vw_00001_01_vent_pre.wav | ||
| 7 | vent_files.filename | 인공호흡기 파일 이름 (용적) | number | vw_00001_01_vent_vol.wav | ||
| 8 | vent_files.location | 인공호흡기 수집 위치 | number | vent | ||
| 9 | patient_status | 환자 상태 | string | intensive_care_unit | ||
| 10 | start_time | 이벤트 발생시간 | number | 41.55778 | ||
| 11 | end_time | 이벤트 종료시간 | number | 46.965 | ||
| 12 | ventilator weaning | 인공호흡기 이탈 여부 | string | 성공 | ||
| 13 | ventilator status | 인공호흡기 조화 여부 | string | 환자 인공호흡기 조화 | ||
| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 장혁재 | 070-4105-5371 | HJCHANG@yuhs.ac | 인공호흡기 작동 데이터 업무 총괄 |
| 기관명 | 담당업무 |
|---|---|
| 서울대학교 산학협력단 [서울대학교 본원] | 서울대학교 데이터 수집 |
| 아주대학교 산학협력단 [아주대학교 병원] | 아주대학교 산학협력단 데이터 수집 |
| ㈜에스에스엘 | 품질관리체계 마련 및 품질검증 수행, TTA 품질검증 대응 |
| ㈜크라우드웍스 | 인공호흡기 및 유관데이터 관리 도구 개발 및 라벨링 툴 개발 |
| ㈜버드온 | 인공지능 학습용 데이터 활용 응용서비스‧제품 개발 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 장혁재 | 070-4105-5371 | HJCHANG@yuhs.ac |