| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.1 | 2024-10-30 | 데이터 최종 개방 | |
| 1.0 | 2024-06-28 | 데이터 개방 | Beta Version |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2024-06-28 | 산출물 공개 | Beta Version |
- 본 사업은 양육 스트레스 노출군의 스트레스 관련 정신-신체 질환 발생을 예방하고, 건강한 육아를 위하여, 양육 스트레스 노출군 300명에 대한 포괄적 뇌영상-신경생리·생체신호-혈액-인지·임상 바이오 복합 데이터를 구축하고 이를 인공지능 학습용 데이터로 확산하고자 함
- 본 사업은 양육 스트레스 노출 여성을 대상으로 표준화된 프로토콜을 적용한 전향적 고정밀 복합 데이터 구축을 통해, 현재까지 과학적-객관적 정의가 확립되어 있지 않은 양육 스트레스의 뇌-신체-정신 건강 영향을 정량화하고 이를 예측할 수 있는 인공지능 모델을 개발하는 것을 목적으로 함
| 데이터 영역 | 영상이미지 | 데이터 유형 | 텍스트 , 이미지 |
|---|---|---|---|
| 데이터 형식 | nii.gz, SPAR/SDAT(뇌영상), CSV(신경생리-생체신호), CSV(혈액), CSV(임상) | 데이터 출처 | 직접 획득 |
| 라벨링 유형 | 직접 라벨링 | 라벨링 형식 | CSV |
| 데이터 활용 서비스 | 인공지능 학습용 데이터를 활용한 AI 모델 개발 수요 창출, 양육스트레스 관련 서비스 모델 구축 수요 창출 | 데이터 구축년도/ 데이터 구축량 |
2023년/300명 |
- 데이터 구축 규모
| 데이터명 | 최종 업로드 데이터 | |||
|---|---|---|---|---|
| [데이터명 1] 스트레스 상황 뇌영상 데이터 |
[종류] | [형식] | [수량] | [부(보조)라벨링 1] 뇌구조/혈관 이상 판정 [형식] CSV [수량] 300명 |
| T1 강조 영상 | nii.gz | 300명 | ||
| T2 강조 영상데이터 | nii.gz | 300명 | ||
| 동맥스핀표지 관류 영상 | nii.gz | 300명 | ||
| 자기공명분광 영상 | SDAT | 300명 | ||
| SPAR | 300명 | |||
| TOF MRA 영상 | nii.gz | 300명 | ||
| [데이터명 2] 스트레스 상황 신경생리·생체신호 데이터 |
[종류] | [형식] | [수량] | [부(보조)라벨링 2] 생리학적 스트레스 지표 심각도 [형식] CSV [수량] 300명 |
| 피부전도도 | CSV | 300명 | ||
| 심박변이도 | CSV | 300명 | ||
| 심전도 | CSV | 300명 | ||
| 폐기능검사 | CSV | 300명 | ||
| 체성분검사 | CSV | 300명 | ||
| [데이터명 3] 스트레스 상황 혈액 데이터 |
[종류] | [형식] | [수량] | [부(보조)라벨링 3] 신체건강 위험도 [형식] CSV [수량] 300명 |
| 신체-장기계 | CSV | 300명 | ||
| 신경호르몬계 | CSV | 300명 | ||
| 면역계 | CSV | 300명 | ||
| [데이터명 4] 스트레스 상황 임상 데이터 |
[종류] | [형식] | [수량] | [주(주요)라벨링 1] 정신건강 위험도 [형식] CSV [수량] 300명 |
| 일반정보 영역 (인구학적-사회/환경 정보) |
CSV | 300명 | ||
| 양육 스트레스 정보 영역 | CSV | 300명 | ||
| 표준화된 정신과적 진단 영역 | CSV | 300명 | ||
| 정신건강 위험도 영역 (인지-감정-행동-성격-COVID19 영향 영역 포함) |
CSV | 300명 | [주(주요)라벨링 2] 양육스트레스 심각도 [형식] CSV [수량] 300명 |
|
| 자녀 행동-정서- 정신병리 평가 영역 | CSV | 100명 | ||
- 데이터 분포
| 항목 | 구분 | 비율(%) | 수량(건) |
|---|---|---|---|
| 연령대 분포 | 20대 | 3.33 | 10 |
| 30대 | 50.67 | 152 | |
| 40대 | 44 | 132 | |
| 50대 이상 | 2 | 6 | |
| 자녀수 분포 | 1명 | 46.33 | 139 |
| 2명 | 46.67 | 140 | |
| 3명 이상 | 7 | 21 |
- 인공지능 모델 1
| 달성 목표 | AI모델 알고리즘 | AI 모델 Task (임무 유형) |
세부 수행방안 |
|---|---|---|---|
| 양육 스트레스 노출에 따른 “정신건강 위험도” 예측 |
CNN | 예측 (Prediction) |
양육 스트레스 노출군의 “정신건강 위험도”를 3D 뇌영상 데이터로 예측하는 인공지능 모델 구성 |
- 인공지능 모델 2
| 달성 목표 | AI모델 알고리즘 | AI 모델 Task (임무 유형) |
세부 수행방안 |
|---|---|---|---|
| “양육스트레스 심각도” 예측 | CNN | 예측 (Prediction) |
양육 스트레스 노출군의 “양육스트레스 심각도”를 3D 뇌영상 데이터로 예측하는 인공지능 모델 구성 |
- 데이터 구성
○ 원천데이터
[1] 스트레스 상황 뇌영상 데이터
| 데이터명 | 포맷 | 내용 | 수량 | 개수 | |
|---|---|---|---|---|---|
| 1 | T1 강조 영상 데이터 | nii.gz | 이미지 | 300명 | 300개 |
| 2 | T2 강조 영상 데이터 | nii.gz | 이미지 | 300명 | 300개 |
| 3 | 동맥스핀표지 관류 영상데이터 | nii.gz | 이미지 | 300명 | 300개 |
| 4 | 자기공명분광영상 데이터 | SDAT, SPAR | 이미지 | 300명 | 1200개 |
| 5 | TOF 자기공명 혈관조영술 영상 데이터 | nii.gz | 이미지 | 300명 | 300개 |
[2] 스트레스 상황 신경생리-생체신호 데이터
| 데이터명 | 포맷 | 내용 | 수량 | 개수 | |
|---|---|---|---|---|---|
| 1-1 | 피부전도도 | CSV | 텍스트 | 300명 | 1개 |
| 1-2 | 심박변이도 | CSV | 텍스트 | 300명 | 1개 |
| 2 | 심전도 | CSV | 텍스트 | 300명 | 1개 |
| 3 | 폐기능검사 | CSV | 텍스트 | 300명 | 1개 |
| 4 | 체성분검사 | CSV | 텍스트 | 300명 | 1개 |
[3] 스트레스 상황 혈액 데이터
| 데이터명 | 포맷 | 내용 | 수량 | 개수 | |
|---|---|---|---|---|---|
| 1 | 신체-장기 기능계 | CSV | 텍스트 | 300명 | 1개 |
| 2 | 신경호르몬계 | CSV | 텍스트 | 300명 | 1개 |
| 3 | 면역계 | CSV | 텍스트 | 300명 | 1개 |
[4] 스트레스 상황 임상 데이터
| 데이터명 | 포맷 | 내용 | 수량 | 개수 | |
|---|---|---|---|---|---|
| 1 | 일반정보영역 - 반구조화된 면담 - Edinburgh Handedness Inventory (EHI) - Duke Religious Index (DUREL) |
CSV | 텍스트 | 300명 | 1개 |
| 2 | 양육스트레스 정보 영역 - Parenting Stress Index (PSI) - Perceived Stress Scale (PSS-10) - Parenting Sense of Competence Scale (PSOC) - Medical Outcomes Study 36-item Short Form Version 2 (MOS-SF2) - Brief COPE Inventory (BCI) - Connor-Davidson Resilience Scale (CD-RISC) - Korean Occupational Stress Scale (KOSS) - Life Event Checklist (LEC) - Family Environment Scale (FES) - Multidimensional Scale of Perceived Social Support (MSPSS) |
CSV | 텍스트 | 300명 | 1개 |
| 3 | 정신과적 진단 영역 - The Structured Clinical Interview for DSM-5 (SCID) |
CSV | 텍스트 | 300명 | 1개 |
| 4 | 정신건강위험도 영역 - Hamilton Depression Rating Scale (HDRS) - Hamilton Rating Scale for Depression (HARS) - Beck Scale for Suicide Ideation (K-BSI) - Pittsburgh Sleep Quality Index (PSQI) - Fatigue Severity Scale (FSS) - Fagerstrom Test for Nicotine Dependence (FTND) - Alcohol Use Disorders Identification Test (AUDIT) - Behavioral Inhibition, Behavioral Activation, and Affective Responses (BIS/BAS) - Barratt Impulsiveness Scale (BIS11) - State Trait Anger Expression Inventory (STAXI) - Temperament and Character Inventory (TCI) - Cambridge Neuropsychological Test Automated Battery (CANTAB) - COVID-19 기능 설문지 |
CSV | 텍스트 | 300명 | 1개 |
| 5 | 자녀 행동-감정-정신병리 평가 영역 - Child Behavior Checklist (CBCL) |
CSV | 텍스트 | 100명 | 1개 |
○ 라벨링 데이터
| 데이터명 | 포맷 | 내용 | 수량 | 개수 | |
|---|---|---|---|---|---|
| 주라벨링1 | 정신건강위험도 | CSV | 텍스트 | 300명 | 1개 |
| 주라벨링2 | 양육스트레스 심각도 | CSV | 텍스트 | 300명 | 1개 |
| 부라벨링1 | 뇌구조-혈관 이상 판정 | CSV | 텍스트 | 300명 | 1개 |
| 부라벨링2 | 생리학적 스트레스 지표 심각도 | CSV | 텍스트 | 300명 | 1개 |
| 부라벨링3 | 신체건강 위험도 | CSV | 텍스트 | 300명 | 1개 |
- 어노테이션 포맷
| 구분 | 속성명 | 타입 | 필수 여부 |
설명 | 범위 | 비고 | |
|---|---|---|---|---|---|---|---|
| [주라벨링 1] 정신건강위험도 |
1-1 | hdrs_severity | number | Y | HDRS 심각도 | 0, 1, 2, 3 | |
| 1-2 | hars_severity | number | Y | HARS 심각도 | 0, 1, 2, 3 | ||
| 1-3 | scid_currdx_bin | number | Y | 현재 정신장애 진단여부 |
0, 1 | ||
| 1-4 | label1_mh_final | number | Y | 주라벨링1 - 정신건강위험도 |
0, 1 | ||
| [주라벨링 2] 양육스트레스 심각도 |
2-1 | psi_severity | number | Y | PSI 심각도 | 0, 1, 2, 3 | |
| 2-2 | pss_severity | number | Y | PSS 심각도 | 0, 1, 2, 3 | ||
| 2-3 | label2_ps_final | number | Y | 주라벨링2 - 양육스트레스심각도 |
0, 1 | ||
| [부라벨링 1] 뇌구조-혈관 이상판정 |
3-1 | mri_abnormal | number | Y | MRI 판독결과 | 0, 1, 2 | |
| 3-2 | mra_abnormal | number | Y | MRA 판독결과 | 0, 1, 2 | ||
| 3-3 | label3_mri_final | number | Y | 부라벨링1 - 뇌구조-혈관이상 판정 |
0, 1, 2 | ||
| [부라벨링 2] 생리학적 스트레스 심각도 |
4-1 | Stress_BL2_5min | double | Y | 생리학적 스트레스 지표 | 0 이상 | |
| 4-2 | physiol_stress | number | Y | 생리학적 스트레스 지표 | 0, 1 | ||
| 4-3 | label4_physiol_final | number | Y | 부라벨링2 - 생리학적 스트레스 심각도 |
0, 1 | ||
| [부라벨링 3] 신체건강위험도 |
5-1 | anemia | boolean | Y | 혈색소 검사 결과 | 0, 1 | |
| 5-2 | liver_func | boolean | Y | 간 기능 검사 결과 | 0, 1 | ||
| 5-3 | kidney_func | boolean | Y | 신 기능 검사 결과 | 0, 1 | ||
| 5-4 | diabetes | boolean | Y | 당 조절기능 검사 결과 | 0, 1 | ||
| 5-5 | thyroid_func | boolean | Y | 갑상선 기능 검사 결과 | 0, 1 | ||
| 5-6 | label5_lab_final | boolean | Y | 부라벨링3 - 신체건강위험도 |
0, 1 | ||
- 어노테이션 유형
■ 주 라벨링 1: 정신건강위험도
- 정신건강위험도 라벨링은 다음의 3가지 원천데이터를 각 데이터 별 임상적으로 정해진 기준 범위에 근거하여 Grade 0-1로 라벨링 진행함.
| 데이터명 | 데이터 설명 | |
|---|---|---|
| 1 | Structured Clinical Interview for the DSM (SCID) | 주요 정신장애 진단 여부 |
| 2 | Hamilton Depression Rating Scale (HDRS) | 우울 증상 심각도 |
| 3 | Hamilton Anxiety Rating Scale (HARS) | 불안 증상 심각도 |
| 정신건강위험도 라벨링 | |
|---|---|
| Grade 0 | 정신과적 질환이 진단되지 않고 정신건강위험도 등 특이 사항 없는 수준 |
| Grade 1 | 정신건강 영역의 위험도가 있어 정신건강의학과 혹은 관련 전문가의 집중 관찰 및 전문적인 평가가 필요한 수준 |
■ 주 라벨링 2: 양육스트레스 심각도
- 양육 스트레스 심각도 라벨링은 다음의 2가지 원천데이터를 각 데이터 별 임상적으로 정해진 기준 범위에 근거하여 Grade 0-1로 라벨링 진행함.
| 데이터명 | 데이터 설명 | |
|---|---|---|
| 1 | Parenting Stress Index (PSI) | 부모의 양육 스트레스 심각도 |
| 2 | Perceived Stress Scale (PSS) | 일상 생활 스트레스 심각도 |
| 양육 스트레스 심각도 라벨링 | |
|---|---|
| Grade 0 | 양육 스트레스 심각도가 낮은, 특이 사항이 없는 수준 |
| Grade 1 | 양육 스트레스 심각도가 중증도 이상으로 정신건강의학과 혹은 관련 전문가의 집중 관찰 및 전문적인 평가가 필요한 수준 |
■ 부(보조) 라벨링 1: 뇌구조-혈관 이상 판정
- 뇌영상 MRI, 뇌혈관 MRA의 판독소견의 원천데이터를 뇌구조 및 뇌혈관 이상 여부에 따라 Grade 0-2으로 라벨링을 진행함.
| 뇌구조-혈관 이상 판정 라벨링 | |
|---|---|
| Grade 0 | 뇌구조 및 뇌혈관 이상 소견 없는 수준 |
| Grade 1 | 뇌구조 및 뇌혈관 이상 소견이 발견되나 정기적인 추적 관찰이 필요한 수준 |
| Grade 2 | 뇌구조 및 뇌혈관 이상 소견이 있으며, 즉각적인 전문의 평가 및 치료가 필요한 수준 |
■ 부(보조) 라벨링 2: 생리학적 스트레스 지표 심각도
- 심박변이도에서 추출한 원천데이터 중, stress index 값의 임상적 기준 범위에 따라 Grade 0-1로 라벨링을 진행함.
| 생리학적 스트레스 지표 심각도 라벨링 | |
|---|---|
| Grade 0 | 생리학적 스트레스 지표 심각도가 낮은, 특이 사항이 없는 수준 |
| Grade 1 | 생리학적 스트레스 지표 심각도가 높은 수준 |
■ 부(보조) 라벨링 3: 신체건강 위험도
- 간기능, 신기능, 갑상선기능, 당 조절기능 등에 대한 혈액검사 원천데이터를 각 항목 별 정상 범위에 근거하여 Grade 0-1로 라벨링을 진행함.
| 신체건강 위험도 라벨링 | |
|---|---|
| Grade 0 | 혈액검사 원천 데이터에 기반한 신체 건강 위험도 평가에서 특이 소견 없는 수준 |
| Grade 1 | 혈액검사 원천 데이터에 기반한 신체 건강 위험도 평가에서 특이 소견 발견됨 |
| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 신경식 | 02-3277-3747 | ksshin@ewha.ac.kr | 과제 총괄, 데이터 획득, 정제, 가공, 검수, 인공지능 모델 개발, 응용서비스 개발 |
| 기관명 | 담당업무 |
|---|---|
| 삼성서울병원 | 삼성서울병원 |
| 차의과학대학교 산학협력단 | 데이터 정제, 데이터 가공/라벨링, 데이터 검수 |
| 참사랑병원 | 데이터 정제, 데이터 가공/라벨링, 데이터 검수 |
| 순천향대학교 산학협력단 | 데이터 검수 |
| 영남대병원 산학협력단 | 데이터 검수 |
| ㈜아이쿱 | 인공지능 모델 개발, 응용서비스 개발 |
| 한국기초과학지원연구원 | 데이터 품질 검증, 데이터 최종 검수 |
| 울시립대학교 산학협력단 | 데이터 활용 가이드라인 개발 |
| 여성정책연구원 | 데이터 활용 가이드라인 개발 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 홍혜진 | 02-3277-6558 | ewha.ai.consortium@gmail.com |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 주윤지 | 02-3277-6554 | ewha.ai.consortium@gmail.com |