공공 의료데이터 상세

썸네일

양육 스트레스 상황 바이오이미지 복합데이터

##헬스케어 의료
- 본 사업은 양육 스트레스 노출군의 스트레스 관련 정신-신체 질환 발생을 예방하고, 건강한 육아를 위하여, 양육 스트레스 노출군 300명에 대한 포괄적 뇌영상-신경생리·생체신호-혈액-인지·임상 바이오 복합 데이터를 구축하고 이를 인공지능 학습용 데이터로 확산하고자 함
분야
헬스케어
유형
텍스트,이미지
생성 방식
안심존(온라인)
  • 구축년도 : 2023
  • 버전 : 1.1
AI-HUB

데이터 변경이력

데이터 변경이력
버전 일자 변경내용 비고
1.1 2024-10-30 데이터 최종 개방
1.0 2024-06-28 데이터 개방 Beta Version

데이터 히스토리

데이터 히스토리
일자 변경내용 비고
2024-06-28 산출물 공개 Beta Version

소개

- 본 사업은 양육 스트레스 노출군의 스트레스 관련 정신-신체 질환 발생을 예방하고, 건강한 육아를 위하여, 양육 스트레스 노출군 300명에 대한 포괄적 뇌영상-신경생리·생체신호-혈액-인지·임상 바이오 복합 데이터를 구축하고 이를 인공지능 학습용 데이터로 확산하고자 함

구축목적

- 본 사업은 양육 스트레스 노출 여성을 대상으로 표준화된 프로토콜을 적용한 전향적 고정밀 복합 데이터 구축을 통해, 현재까지 과학적-객관적 정의가 확립되어 있지 않은 양육 스트레스의 뇌-신체-정신 건강 영향을 정량화하고 이를 예측할 수 있는 인공지능 모델을 개발하는 것을 목적으로 함

- 데이터 구축 규모

데이터 구축 규모
데이터명 최종 업로드 데이터
[데이터명 1]
스트레스 상황
뇌영상 데이터
[종류] [형식] [수량] [부(보조)라벨링 1]
뇌구조/혈관 이상 판정
[형식] CSV
[수량] 300명 
T1 강조 영상 nii.gz 300명
T2 강조 영상데이터 nii.gz 300명
동맥스핀표지 관류 영상 nii.gz 300명
자기공명분광 영상 SDAT 300명
SPAR 300명 
TOF MRA 영상 nii.gz 300명
[데이터명 2]
스트레스 상황
신경생리·생체신호
데이터
[종류] [형식] [수량] [부(보조)라벨링 2]
생리학적 스트레스 지표 심각도
[형식] CSV
[수량] 300명
피부전도도 CSV 300명
심박변이도 CSV 300명
심전도 CSV 300명
폐기능검사 CSV 300명
체성분검사 CSV 300명
[데이터명 3]
스트레스 상황
혈액 데이터 
[종류] [형식] [수량] [부(보조)라벨링 3]
신체건강 위험도
[형식] CSV
[수량] 300명
신체-장기계 CSV 300명
신경호르몬계 CSV 300명
면역계 CSV 300명
[데이터명 4]
스트레스 상황
임상 데이터
[종류] [형식] [수량] [주(주요)라벨링 1]
정신건강 위험도
[형식] CSV
[수량] 300명
일반정보 영역
(인구학적-사회/환경 정보)
CSV 300명
양육 스트레스 정보 영역 CSV 300명
표준화된 정신과적 진단 영역 CSV 300명
정신건강 위험도 영역
(인지-감정-행동-성격-COVID19 영향 영역 포함)
CSV 300명 [주(주요)라벨링 2]
양육스트레스 심각도
[형식] CSV
[수량] 300명
자녀 행동-정서- 정신병리 평가 영역 CSV 100명


- 데이터 분포

데이터 분포
항목 구분 비율(%) 수량(건)
연령대 분포 20대 3.33 10
30대 50.67 152
40대 44 132
50대 이상 2 6
자녀수 분포 1명 46.33 139
2명 46.67 140
3명 이상 7 21

- 인공지능 모델 1

인공지능 모델 1
달성 목표 AI모델 알고리즘 AI 모델 Task
(임무 유형)
세부 수행방안
양육 스트레스 노출에 따른
“정신건강 위험도” 예측 
CNN 예측
(Prediction)
양육 스트레스 노출군의 “정신건강 위험도”를 3D 뇌영상 데이터로 예측하는 인공지능 모델 구성

 

- 인공지능 모델 2

인공지능 모델 2
달성 목표 AI모델 알고리즘 AI 모델 Task
(임무 유형)
세부 수행방안
“양육스트레스 심각도” 예측 CNN 예측
(Prediction)
양육 스트레스 노출군의 “양육스트레스 심각도”를 3D 뇌영상 데이터로 예측하는 인공지능 모델 구성

- 데이터 구성
○ 원천데이터

[1] 스트레스 상황 뇌영상 데이터

데이터 구성 [1] 스트레스 상황 뇌영상 데이터
  데이터명 포맷 내용 수량 개수
1 T1 강조 영상 데이터 nii.gz 이미지 300명 300개
2 T2 강조 영상 데이터 nii.gz 이미지 300명 300개
3 동맥스핀표지 관류 영상데이터  nii.gz 이미지 300명 300개
4 자기공명분광영상 데이터 SDAT, SPAR 이미지 300명 1200개
5 TOF 자기공명 혈관조영술 영상 데이터 nii.gz 이미지 300명 300개

 

[2] 스트레스 상황 신경생리-생체신호 데이터

데이터 구성 [2] 스트레스 상황 신경생리-생체신호 데이터
  데이터명 포맷 내용 수량 개수
1-1 피부전도도 CSV 텍스트 300명 1개
1-2 심박변이도 CSV 텍스트 300명 1개
2 심전도 CSV 텍스트 300명 1개
3 폐기능검사 CSV 텍스트 300명 1개
4 체성분검사  CSV 텍스트 300명 1개

 

[3] 스트레스 상황 혈액 데이터

데이터 구성 [3] 스트레스 상황 혈액 데이터
  데이터명 포맷 내용 수량 개수
1 신체-장기 기능계 CSV 텍스트 300명 1개
2 신경호르몬계 CSV 텍스트 300명 1개
3 면역계 CSV 텍스트 300명 1개

 

[4] 스트레스 상황 임상 데이터

데이터 구성 [4] 스트레스 상황 임상 데이터
  데이터명 포맷 내용 수량 개수
1 일반정보영역
- 반구조화된 면담
- Edinburgh Handedness Inventory (EHI)
- Duke Religious Index (DUREL)
CSV 텍스트 300명 1개
2 양육스트레스 정보 영역
- Parenting Stress Index (PSI)
- Perceived Stress Scale (PSS-10)
- Parenting Sense of Competence Scale (PSOC)
- Medical Outcomes Study 36-item Short Form Version 2 (MOS-SF2)
- Brief COPE Inventory (BCI)
- Connor-Davidson Resilience Scale (CD-RISC)
- Korean Occupational Stress Scale (KOSS)
- Life Event Checklist (LEC)
- Family Environment Scale (FES)
- Multidimensional Scale of Perceived Social Support (MSPSS)
CSV 텍스트 300명 1개
3 정신과적 진단 영역
- The Structured Clinical Interview for DSM-5 (SCID)
CSV 텍스트 300명 1개
4 정신건강위험도 영역
- Hamilton Depression Rating Scale (HDRS)
- ​Hamilton Rating Scale for Depression (HARS)
- Beck Scale for Suicide Ideation (K-BSI)
- Pittsburgh Sleep Quality Index (PSQI)
- Fatigue Severity Scale (FSS)
- Fagerstrom Test for Nicotine Dependence (FTND)
- Alcohol Use Disorders Identification Test (AUDIT)
- Behavioral Inhibition, Behavioral Activation, and Affective Responses (BIS/BAS)
- Barratt Impulsiveness Scale (BIS11)
- State Trait Anger Expression Inventory (STAXI)
- Temperament and Character Inventory (TCI)
- Cambridge Neuropsychological Test Automated Battery (CANTAB)
- COVID-19 기능 설문지
CSV 텍스트 300명 1개
5 자녀 행동-감정-정신병리 평가 영역
- Child Behavior Checklist (CBCL)
CSV 텍스트 100명 1개

 

○ 라벨링 데이터

라벨링 데이터
  데이터명 포맷 내용 수량 개수
주라벨링1 정신건강위험도 CSV 텍스트 300명 1개
주라벨링2 양육스트레스 심각도 CSV 텍스트 300명 1개
부라벨링1 뇌구조-혈관 이상 판정 CSV 텍스트 300명 1개
부라벨링2 생리학적 스트레스 지표 심각도 CSV 텍스트 300명 1개
부라벨링3 신체건강 위험도 CSV 텍스트 300명 1개


- 어노테이션 포맷

어노테이션 포맷
구분 속성명 타입 필수
여부
설명 범위 비고
[주라벨링 1]
정신건강위험도
1-1 hdrs_severity number Y HDRS 심각도 0, 1, 2, 3  
1-2 hars_severity number Y HARS 심각도 0, 1, 2, 3  
1-3 scid_currdx_bin number Y 현재 정신장애
진단여부
0, 1  
1-4 label1_mh_final number Y 주라벨링1 -
정신건강위험도
0, 1  
[주라벨링 2]
양육스트레스 심각도
2-1 psi_severity number Y PSI 심각도 0, 1, 2, 3  
2-2 pss_severity number Y PSS 심각도 0, 1, 2, 3  
2-3 label2_ps_final number Y 주라벨링2 -
양육스트레스심각도
0, 1  
[부라벨링 1]
뇌구조-혈관 이상판정
3-1 mri_abnormal number Y MRI 판독결과 0, 1, 2  
3-2 mra_abnormal number Y MRA 판독결과 0, 1, 2  
3-3 label3_mri_final number Y 부라벨링1 -
뇌구조-혈관이상 판정
0, 1, 2  
[부라벨링 2]
생리학적 스트레스
심각도
4-1 Stress_BL2_5min double Y 생리학적 스트레스 지표 0 이상  
4-2 physiol_stress number Y 생리학적 스트레스 지표 0, 1  
4-3 label4_physiol_final number Y 부라벨링2 -
생리학적 스트레스 심각도
0, 1  
[부라벨링 3]
신체건강위험도
5-1 anemia boolean Y 혈색소 검사 결과 0, 1  
5-2 liver_func boolean Y 간 기능 검사 결과 0, 1  
5-3 kidney_func boolean Y 신 기능 검사 결과 0, 1  
5-4 diabetes boolean Y 당 조절기능 검사 결과 0, 1  
5-5 thyroid_func boolean Y 갑상선 기능 검사 결과 0, 1  
5-6 label5_lab_final boolean Y 부라벨링3 -
신체건강위험도
0, 1  


- 어노테이션 유형
■ 주 라벨링 1: 정신건강위험도
  - 정신건강위험도 라벨링은 다음의 3가지 원천데이터를 각 데이터 별 임상적으로 정해진 기준 범위에 근거하여 Grade 0-1로 라벨링 진행함. 

어노테이션 유형 주 라벨링 1: 정신건강위험도
  데이터명 데이터 설명
1 Structured Clinical Interview for the DSM (SCID) 주요 정신장애 진단 여부
2 Hamilton Depression Rating Scale (HDRS) 우울 증상 심각도
3 Hamilton Anxiety Rating Scale (HARS) 불안 증상 심각도

 

어노테이션 유형 주 라벨링 1: 정신건강위험도 2
정신건강위험도 라벨링
Grade 0 정신과적 질환이 진단되지 않고 정신건강위험도 등 특이 사항 없는 수준
Grade 1 정신건강 영역의 위험도가 있어 정신건강의학과 혹은 관련 전문가의 집중 관찰 및 전문적인 평가가 필요한 수준

 

■ 주 라벨링 2: 양육스트레스 심각도

  - 양육 스트레스 심각도 라벨링은 다음의 2가지 원천데이터를 각 데이터 별 임상적으로 정해진 기준 범위에 근거하여 Grade 0-1로 라벨링 진행함. 

어노테이션 유형 주 라벨링 2: 양육스트레스 심각도 1
  데이터명 데이터 설명
1 Parenting Stress Index (PSI)  부모의 양육 스트레스 심각도 
2 Perceived Stress Scale (PSS) 일상 생활 스트레스 심각도 

 

어노테이션 유형 주 라벨링 2: 양육스트레스 심각도 2
양육 스트레스 심각도 라벨링
Grade 0 양육 스트레스 심각도가 낮은, 특이 사항이 없는 수준
Grade 1 양육 스트레스 심각도가 중증도 이상으로 정신건강의학과 혹은 관련 전문가의 집중 관찰 및 전문적인 평가가 필요한 수준

 

■ 부(보조) 라벨링 1: 뇌구조-혈관 이상 판정
  - 뇌영상 MRI, 뇌혈관 MRA의 판독소견의 원천데이터를 뇌구조 및 뇌혈관 이상 여부에 따라 Grade 0-2으로 라벨링을 진행함.

어노테이션 유형 부(보조) 라벨링 1: 뇌구조-혈관 이상 판정
뇌구조-혈관 이상 판정 라벨링
Grade 0 뇌구조 및 뇌혈관 이상 소견 없는 수준 
Grade 1 뇌구조 및 뇌혈관 이상 소견이 발견되나 정기적인 추적 관찰이 필요한 수준 
Grade 2 뇌구조 및 뇌혈관 이상 소견이 있으며, 즉각적인 전문의 평가 및 치료가 필요한 수준 

 

■ 부(보조) 라벨링 2: 생리학적 스트레스 지표 심각도
  - 심박변이도에서 추출한 원천데이터 중, stress index 값의 임상적 기준 범위에 따라 Grade 0-1로 라벨링을 진행함.

어노테이션 유형 부(보조) 라벨링 2: 생리학적 스트레스 지표 심각도
생리학적 스트레스 지표 심각도 라벨링
Grade 0 생리학적 스트레스 지표 심각도가 낮은, 특이 사항이 없는 수준
Grade 1 생리학적 스트레스 지표 심각도가 높은 수준 

 

■ 부(보조) 라벨링 3: 신체건강 위험도
  - 간기능, 신기능, 갑상선기능, 당 조절기능 등에 대한 혈액검사 원천데이터를 각 항목 별 정상 범위에 근거하여 Grade 0-1로 라벨링을 진행함. 

어노테이션 유형 부(보조) 라벨링 3: 신체건강 위험도
신체건강 위험도 라벨링
Grade 0 혈액검사 원천 데이터에 기반한 신체 건강 위험도 평가에서 특이 소견 없는 수준 
Grade 1 혈액검사 원천 데이터에 기반한 신체 건강 위험도 평가에서 특이 소견 발견됨

데이터셋 구축 담당자

수행기관(주관) : 이화여자대학교 산학협력단
수행기관(주관)
책임자명 전화번호 대표이메일 담당업무
신경식 02-3277-3747 ksshin@ewha.ac.kr 과제 총괄, 데이터 획득, 정제, 가공, 검수, 인공지능 모델 개발, 응용서비스 개발
수행기관(참여)
수행기관(참여)
기관명 담당업무
삼성서울병원 삼성서울병원
차의과학대학교 산학협력단 데이터 정제, 데이터 가공/라벨링, 데이터 검수
참사랑병원 데이터 정제, 데이터 가공/라벨링, 데이터 검수
순천향대학교 산학협력단 데이터 검수
영남대병원 산학협력단 데이터 검수
㈜아이쿱 인공지능 모델 개발, 응용서비스 개발
한국기초과학지원연구원 데이터 품질 검증, 데이터 최종 검수
울시립대학교 산학협력단 데이터 활용 가이드라인 개발
여성정책연구원 데이터 활용 가이드라인 개발
데이터 관련 문의처
데이터 관련 문의처
담당자명 전화번호 이메일
홍혜진 02-3277-6558 ewha.ai.consortium@gmail.com
AI모델 관련 문의처
AI모델 관련 문의처
담당자명 전화번호 이메일
주윤지 02-3277-6554 ewha.ai.consortium@gmail.com