| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.0 | 2021-06-30 | 데이터 개방 | 데이터 최초 개방 |
| 일자 | 변경내용 | 비고 |
|---|---|---|
| 2025-01-06 | 데이터셋 변경 | 메타데이터 데이터 구축량 정보 수정 |
유방암 진단 및 치료 과정에서 필요한 영상·이미지 데이터
- 데이터 영역 : 헬스케어
- 데이터 유형 : 비디오 , 이미지
- 구축년도 : 2020년
- 구축량 : 655,231
의료 진단에서 활용될 수 있는 의료 인공지능 개발이 세계적으로 소개되고 있지만 민감한 의료 정보를 담고 있기 때문에 접근할 수 있는 오픈소스 의료 데이터의 종류가 제한적임. 따라서 유방암 진단에 활용할 수 있는 3종류의 유방암 의료 영상 데이터셋을 구축하여 영상 진단 판독을 보조할 수 있는 의료 인공지능 개발을 도모하고 의료 산업의 발전을 기대함
구축 내용 및 제공 데이터량
| 유형 | 구축 건수(건) | ||
|---|---|---|---|
| 분류 | 환자수 | 영상 수 | |
| 유방 초음파 | 양성 | 600명 | 600명 |
| 악성 | 600명 | 600장 | |
| 유방 촬영술 | 잔존암이 없는 환자 | 150명 | 600장 |
| 잔존암이 있는 환자 | 150명 | 600명 | |
| 유방 MRI | 잔존암이 없는 환자 | 150명 | 326,425장 |
| 잔존암이 있는 환자 | 150명 | 326,413장 | |
데이터 변경이력
| 버전 | 일자 | 변경내용 | 비고 |
|---|---|---|---|
| 1.0 | 2021.06.30 | 데이터 최초 개방 |
구축 목적
활용 분야
소개
구축 내용 및 제공 데이터량
| 유형 | 구축 건수(건) | ||
|---|---|---|---|
| 분류 | 환자수 | 영상 수 | |
| 유방 초음파 | 양성 | 600명 | 600명 |
| 악성 | 600명 | 600장 | |
| 유방 촬영술 | 잔존암이 없는 환자 | 150명 | 600장 |
| 잔존암이 있는 환자 | 150명 | 600명 | |
| 유방 MRI | 잔존암이 없는 환자 | 150명 | 326,425장 |
| 잔존암이 있는 환자 | 150명 | 326,413장 | |
대표도면
| 모달리티 | 유방암 영상데이터 | 데이터 포맷 |
어노테이션 항목 |
메타데이터 JSON 형식 |
|---|---|---|---|---|
| 유방 초음파 |
|
DICOM | 병변 부위 Polygon 체크 |
● DICOM 파일(비식별화 후) ● - patient id => anonymized id ● - patient name => anonymized ● JSON 파일 - 환자:JSON = 1:1 ● Excel 파일 - 양성/악성정보 비식별 환자ID, 나이, 제조사, 모델명 |
| 유방촬영술 |
|
DICOM | 병변 부위 Polygon 체크 |
● DICOM 파일 (비식별화 후) ● - patient id => anonymized id ● - patient name => anonymized ● JSON 파일 - 환자:JSON = 1:n ● Excel 파일 - 잔존암 정보, 비식별 환자ID, 나이, 제조사, 모델명, 사이드, ER, PR, HER2, IDC, Compression force |
| 유방 MRI |
|
DICOM | 병변 부위 Polygon 체크 |
● DICOM 파일 ● - patient id => anonymized id ● - patient name => anonymized ● JSON 파일 - 환자:json = 1:n ● Excel 파일 - 잔존암정보, 비식별 환자ID, 나이, 제조사, 모델명, 사이드, ER, PR, HER2, IDC |
필요성
데이터 구조
| 컬럼명 | 상세내역 |
|---|---|
| recvid (type: number) |
환자 익명 ID (min: 1000000, max: 9999999) |
| annotation_type (type: string) |
어노테이션 유형 (polygon segmentation) |
| class (type: number) |
0: 양성, 1: 악성 |
| 컬럼명 | 상세내역 |
|---|---|
| recvid (type: number) |
환자 익명 ID (min: 1000000, max: 9999999) |
| mammo_view (type: string) |
유방촬영술 View 정보 (RCC, LCC, RMLO, LMLO) |
| annotation_type (type: string) |
어노테이션 유형 (polygon segmentation) |
| exist_binary (type: number) |
유방촬영술 View에 따른 세그멘테이션 파일 유무 0: 세그멘테이션 파일 없음 1: 세그멘테이션 파일 있음 |
| class (type: number) |
0: 잔존암 있음 (no pCR), |
| 컬럼명 | 상세내역 |
|---|---|
| recvid (type: number) |
환자 익명 ID (min: 1000000, max: 9999999) |
| serious_name (type: string) |
유방MRI Serious 정보 제공 (t1_post_1, t1_post_2, t1_post_3, t1_post_4, t1_post_5, t1_post_sub_1, t1_post_sub_2, t1_post_sub_3, t1_post_sub_4, t1_post_sub_5, t1_pre, t2) |
| annotation_type (type: string) |
어노테이션 유형 (polygon segmentation) |
| class (type: number) |
0: 잔존암 있음 (no pCR), 1: 잔존암 없음 (pCR) |
| 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
|---|---|---|---|
| 유진규 | 02-569-5507 | contact@aitrics.com | · 데이터구축 총괄 |
| 기관명 | 담당업무 |
|---|---|
| 경북대칠곡병원 | · 원본 데이터 제공 및 데이터 어노테이션 |
| 경북대학교 산학협력단-IT대학 컴퓨터학부 | · 데이터 익명화 작업 및 데이터 어노테이션 툴 개발 · 유방암 데이터셋을 활용한 AI모델 개발 |
| 담당자명 | 전화번호 | 이메일 |
|---|---|---|
| 백원중(에이아이트릭스) | 02-569-5507 | contact@aitrics.com |