콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#헬스케어 의료

BETA 피부종양 이미지 합성 데이터

피부종양 이미지 합성데이터 아이콘 이미지
  • 분야헬스케어
  • 유형 이미지
  • 생성 방식합성데이터
구축년도 : 2024 갱신년월 : 2025-04 조회수 : 18 다운로드 : 3 용량 :

※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2025-04-22 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2025-04-22 산출물 전체 공개

    소개

    피부종양 진단 및 중증도 평가를 위한 고해상도 피부종양 이미지 합성 데이터 및 진단 데이터

    구축목적

    - 흔한 양성 및 악성 피부종양 15종 진단을 보조
    - 인공지능 알고리즘 개발을 위한 합성데이터 1만 5천 건 구축
  • 데이터 구축 규모
    피부종양 이미지 합성데이터 총 1만 5천장

     

    ● 원천데이터(총 1만 5천장)

    데이터 구축 규모-원천데이터
    클래스 포맷 해상도 규모
    기저세포암 PNG 512 x 512 1천장
    편평세포암 PNG 512 x 512 1천장
    악성흑색종 PNG 512 x 512 1천장
    보웬병 PNG 512 x 512 1천장
    광선각화증 PNG 512 x 512 1천장
    지루각화증 PNG 512 x 512 1천장
    흑색점 PNG 512 x 512 1천장
    멜라닌세포모반 PNG 512 x 512 1천장
    표피낭종 PNG 512 x 512 1천장
    사마귀 PNG 512 x 512 1천장
    피지샘증식증 PNG 512 x 512 1천장
    피부섬유종 PNG 512 x 512 1천장
    혈관종 PNG 512 x 512 1천장
    화농육아종 PNG 512 x 512 1천장
    비립종 PNG 512 x 512 1천장

     

    ● 라벨링 데이터(임상정보 1만 5천건)

    데이터 구축 규모-라벨링데이터
    클래스 포맷 유형 규모
    기저세포암 JSON 임상정보 1천장
    편평세포암 JSON 임상정보 1천장
    악성흑색종 JSON 임상정보 1천장
    보웬병 JSON 임상정보 1천장
    광선각화증 JSON 임상정보 1천장
    지루각화증 JSON 임상정보 1천장
    흑색점 JSON 임상정보 1천장
    멜라닌세포모반 JSON 임상정보 1천장
    표피낭종 JSON 임상정보 1천장
    사마귀 JSON 임상정보 1천장
    피지샘증식증 JSON 임상정보 1천장
    피부섬유종 JSON 임상정보 1천장
    혈관종 JSON 임상정보 1천장
    화농육아종 JSON 임상정보 1천장
    비립종 JSON 임상정보 1천장

     

    데이터 분포

    데이터 분포
    클래스 규모 비율(%)
    기저세포암 1,000 6.7
    편평세포암 1,000 6.7
    악성흑색종 1,000 6.7
    보웬병 1,000 6.7
    광선각화증 1,000 6.7
    지루각화증 1,000 6.7
    흑색점 1,000 6.7
    멜라닌세포모반 1,000 6.7
    표피낭종 1,000 6.7
    사마귀 1,000 6.7
    피지샘증식증 1,000 6.7
    피부섬유종 1,000 6.7
    혈관종 1,000 6.7
    화농육아종 1,000 6.7
    비립종 1,000 6.7
    합계 15,000 100%
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    ● 이미지 분류 (15종 이미지 분류)

     

      활용 지표: 유효성 및 유용성

     

    * AI 모델 : ResNet

     

    - ResNet(Residual Network)은 2015년에 Microsoft Research에서 고안된 모델로, 딥러닝에서 발생하는 기울기 소실 문제를 해결하기 위해 설계된 네트워크 구조.
    - ImageNet 챌린지에서 우승했으며, 이후 컴퓨터 비전 분야의 다양한 과제(분류, 검출, 분할)에서 표준 백본 네트워크로 널리 사용됨.

    ResNet 활용AI모델

    - 개발언어 및 프레임워크 확인

    ResNet개발언어 및 프레임워크
    품질특성 TASK 명 모델명 개발언어 프레임워크
    유효성 피부질환 진단(분류) ResNet101 python Pytorch 2.3.1

     

    - 데이터 학습 모델 및 학습 조건 확인

    ResNet 데이터 학습모델 및 학습조건 확인
    품질특성 TASK 명 모델명 학습데이터 비율 학습조건
    유효성 피부질환 진단(분류) ResNet101 8:1:1 image_size = 256
    batch_size = 32
    learning_rate = 0.001
    dropout_rate = 0.5
    num_epochs = 10
    optimizer = ADAM

     

    서비스 활용 시나리오

     

    구축한 모델은 환자의 피부종양 진료 지원 및 데이터 기반 연구에 활용할 수 있음.


    피부종양 진료지원
    ● 진단 보조 도구로 활용: 병변 이미지를 분석해 종양 유형을 분류하고 악성 가능성을 신속히 평가.
    ● 원격 진료 서비스에 적용: 모바일로 업로드된 이미지를 분석해 위험도를 예측하고 전문의 상담 여부를 안내.
    ● 경과 모니터링 및 사전 예방: 병변 변화를 정기적으로 추적하며 이상이 감지되면 사용자와 의료진에게 알림.

     

    데이터 기반 연구
    ● 피부종양 통계 분석: 자동 분류된 데이터를 기반으로 종양 발생률 및 경향을 분석하여 공공 보건 정책에 활용.
    ●  모델의 학습 데이터 확장: 새 데이터를 활용해 모델 성능을 향상시키고 희귀 종양 분류 능력을 강화.
    ●  종양 치료 효과 연구: 치료 전후 병변 데이터를 비교해 치료 효과를 정량적으로 평가.

     

    ● 이미지 분류 (이진 분류)

     

      활용 지표: 유효성

     

    * AI 모델 : EfficientNet-B3
    - EfficientNet-B3는 2019년에 Google Brain 팀에서 고안된 EfficientNet 계열의 모델로, 신경망의 효율성과 성능을 동시에 개선한 모델.
    - EfficientNet-B0을 기본 구조로 하며, B3는 이를 확장한 버전으로, 더 많은 파라미터와 계산량을 활용해 높은 정확도를 제공.

    EfficientNetB3 활용AI모델


    - 개발언어 및 프레임워크 확인

    EfficientNet-B3 개발언어 및 프레임 워크
    품질특성 TASK 명 모델명 개발언어 프레임워크
    유효성 피부질환 진단(분류) EfficientNet-B3 python Pytorch 2.3.1

     

    - 데이터 학습 모델 및 학습 조건 확인

    EfficientNet-B3 데이터 학습 모델 및 학습 조건 확인
    품질특성 TASK 명 모델명 학습데이터 비율 학습조건
    유효성 피부질환 진단(분류) EfficientNet-B3 8:1:1 image_size = 256
    batch_size = 32
    learning_rate = 0.001
    dropout_rate = 0.3
    num_epochs = 16
    optimizer = ADAM

     

    서비스 활용 시나리오

     

      구축한 모델은 환자의 악성흑색종 진료 지원 및 데이터 기반 연구에 활용할 수 있음.

     

    악성흑색종 진료지원
    ● 진단 정확도 향상: 초기 진료 시 흑색종과 멜라닌세포모반의 구분을 자동화하여 진단의 객관성과 정확도를 높임.
    ● 조기 발견 강화: 악성 흑색종으로 발전할 가능성이 있는 병변을 조기에 식별해 빠른 치료와 생존율 향상을 지원.


    데이터 기반 연구
    ● 분류 결과와 환자 데이터(유전자, 환경적 요인)를 결합해 흑색종의 발생 메커니즘을 규명.
    ● 모델이 학습한 병변 패턴을 활용해 새로운 흑색종 아형 및 특성을 발견하고 데이터베이스에 반영.


    기타정보
    대표성

    ● 실제 데이터와 유사한 합성 데이터를 활용해 다양한 병변의 분류 성능을 극대화했으며, 병변의 형태, 크기, 색상 등 주요 특징을 반영하여 높은 정확도를 제공.

     

    차별점
    ● 합성 데이터를 기반으로 모델을 학습하여 실제 데이터가 부족한 환경에서도 안정적이고 일관된 성능을 발휘하며, 드문 병변 사례까지 포함하여 범용성을 강화.
     

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    피부종양 이미지 합성데이터셋은 종양의 특성을 잘 반영된 피부의 부분 이미지와 라벨링 데이터로 구성됨
    ● 데이터 구성

    데이터 구성
    구분 Key Description Type Child Type
    1 annotations 어노테이션 배열 JsonArray JsonObject
    1-1 identifier 식별자 string  
    1-2 diagnosis_info 피부질환정보 JsonObject  
    1-2-1 diagnosis_name 피부질환명 string  
    1-2-2 onset 발병시기 string  
    1-2-3 distribution 병변분포 string  
    1-2-4 bodypart 신체부위 string  
    1-2-5 symptom 증상 string  
    1-2-6 desc 피부질환 설명 string  
    1-3 generated_parameters 합성관련 변수 정보 JsonObject  
    1-3-1 gender 성별 string  
    1-3-2 bodypart 신체부위 string  
    1-3-3 age_rance 연령대 string  
    1-3-4 race 인종 string  
    1-4 photograph 사진정보 JsonObject  
    1-4-1 file_path 이미지 파일경로 string  
    1-4-2 width 이미지 가로크기 int  
    1-4-3 height 이미지 세로크기 int  
    1-5 bbox 라벨링 정보 JsonObject  
    1-5-1 xpos x 좌표 int  
    1-5-2 ypos y 좌표 int  
    1-5-3 file_path 이미지 파일경로 string  
    1-5-4 width 이미지 가로크기 int  
    1-5-5 height 이미지 세로크기 int  

     

    ● 어노테이션 포맷

    어노테이션 포맷
    구분 항목명 Type Required 비고
    한글명 영문명
    1 어노테이션 배열 annotations JsonArray Yes  
    1-1 식별자 identifier string Yes  
    1-2 피부질환정보 diagnosis_info JsonObject Yes  
    1-2-1 피부질환명 diagnosis_name string Yes  
    1-2-2 발병시기 onset string No  
    1-2-3 병변분포 distribution string No  
    1-2-4 신체부위 bodypart string No  
    1-2-5 증상 symptom string No  
    1-2-6 피부질환 설명 desc string Yes  
    1-3 합성관련 변수 정보 generated_parameters JsonObject Yes  
    1-3-1 성별 gender string Yes  
    1-3-2 신체부위 bodypart string Yes  
    1-3-3 연령대 age_rance string Yes  
    1-3-4 인종 race string No  
    1-4 사진정보 photograph JsonObject No  
    1-4-1 이미지 파일경로 file_path string No  
    1-4-2 이미지 가로크기 width int No  
    1-4-3 이미지 세로크기 height int Yes  
    1-5 라벨링 정보 bbox JsonObject Yes  
    1-5-1 x 좌표 xpos int Yes  
    1-5-2 y 좌표 ypos int Yes  
    1-5-3 이미지 파일경로 file_path string Yes  
    1-5-4 이미지 가로크기 width int Yes  
    1-5-5 이미지 세로크기 height int Yes  

     

    ● 이미지 데이터 예시

    이미지 데이터 예시
      이미지 포맷 : PNG
    보웬병 보웬병
    악성흑색종 악성흑색종
    흑색점 흑색점

     

    어노테이션
      어노테이션
    포맷 JSON
    예시 {
        "annotations": [
            {
                "identifier": "Z4_14001_P0_L0",
                "diagnosis_info": {
                    "diagnosis_name": "보웬병",
                    "onset": "N/A",
                    "distribution": "N/A",
                    "bodypart": "N/A",
                    "symptom": "N/A",
                    "desc": "피부에 발생하는 상피내암의 일종으로 진단을 위해 조직검사가 필요함"
                },
                "generated_parameters": {
                    "gender": "N/A",
                    "age_range": "N/A",
                    "bodypart": "N/A",
                    "race": "황인"
                },
                "photograph": {
                    "file_path": "보웬병/Z4_14001_P0_L0.png",
                    "width": 512,
                    "height": 512
                },
                "bbox": {
                    "xpos": 0,
                    "ypos": 0,
                    "file_path": "보웬병/Z4_14001_P0_L0.png",
                    "width": 512,
                    "height": 512
                }
            }
        ]
    }
  • 데이터셋 구축 담당자

    수행기관(주관) : 서울대학교 산학협력단
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    나정임 031-787-7314 jina1@snu.ac.kr 주관업무 총괄, 데이터 수집/정제/가공/검수, 모델개발
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    에스큐아이소프트(주) 저작/검수 도구 개발/운영 및 품질관리
    충남대학교 산학협력단 합성데이터 생성
    한림대학교 산학협력단 데이터 수집, 정제, 검수
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    나정임 031-787-7314 jina1@snu.ac.kr
    조민우 02-2072-4291 windsblues@snu.ac.kr
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    나정임 031-787-7314 jina1@snu.ac.kr
    조민우 02-2072-4291 windsblues@snu.ac.kr
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    임광섭 02-2284-3341 wthlord@sqisoft.com
    류승근 02-2284-3341 harushogo@sqisoft.com
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.

국방데이터 이용신청 탭 이미지

국방데이터 개방 안내

본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.