※ 26년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2026-05-19 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2026-05-19 산출물 최종 공개 소개
중앙전파관리소가 제공한 적합성평가가 완료된 원천데이터를 평가유형, 법적 판단 근거에 따른 질의응답 데이터로 가공하여 10만건 이상의 학습데이터를 구축 및 공개/개방
구축목적
10만건 이상의 적합성평가 학습데이터를 기반으로 질의응답 모델 설계 및 구현하여 신뢰할 수 있는 고품질의 데이터 제공을 통해 불법 방송통신기자재 근절에 이바지
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 텍스트 데이터 형식 json 데이터 출처 국립전파연구원이 보유하고 있는방송통신기자재등 적합성평가 완료 데이터를 중앙전파관리소로부터 제공 받음 라벨링 유형 질의응답(자연어) 라벨링 형식 json 데이터 활용 서비스 AI 챗봇 상담, 셀프 적합성 진단 시뮬레이션, 직원용 답변 저작 보조 등 데이터 구축년도/
데이터 구축량2025년/텍스트 데이터 100,659건 -
방송통신기자재등 적합성평가 데이터는 원천데이터와 라벨링데이터 동일하게 총 100,659건을 구축함
대분류는 적합성평가 기준 적용분야인 EMC, 무선, 유선으로 분류하였으며, 중분류는 적합성평가 대상기자재 고시 각호에 해당하는 분류로 구분함○ 클래스별 데이터 구축 수량
클래스별 데이터 구축 수량 1차 경로 2차 경로 방송통신기자재등 적합성평가 데이터 원천데이터 라벨링데이터 구성비 무선 무선설비의 기기 1,106 1,106 1% 기타 무선설비의 기기 16,136 16,136 16% 유선 단말장치 및 유선방송국 설비의 기기 3,093 3,093 3% 방송 공동수신설비의 기기 122 122 0% EMC 생활가전기기류 28,756 28,756 29% 조명기기류 4,569 4,569 5% 멀티미디어기기류 28,847 28,847 29% 디지털기기류 6,457 6,457 6% 전파응용설비류 등 2,550 2,550 3% 이동수단용 전동기기류 등 9,023 9,023 9% 총 수량 100,659 100,659 100% ○ 기기 유형 분포
기기 유형 분포 클래스 분포 무선기기 17.13% 유선기기 3.19% EMC기기 79.68% 합계 100% ○ 적합성평가 유형 분포
적합성평가 유형 분포 클래스 분포 적합인증 3.15% 적합등록 94.57% 자기적합확인 2.28% 합계 100% ○ 질문 유형 분포
질문 유형 분포 클래스 분포 기본형 25.01% 명령형 25.29% 설명요구형 24.83% 선택요구형 24.87% 합계 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드적합성평가유형, 법적 판단 근거에 따른 질의응답 학습데이터를 기반으로 방송통신기자재등 적합성평가 질의응답 모델 설계 및 구현
○ 임무 정의
- 방송통신기자재등 적합성평가 질의응답 생성○ 임무 선정 사유
- 적합성평가유형, 법적 판단 근거에 따른 질의응답 학습데이터를 기반으로 방송통신기자재등 적합성평가 질의에 대한 답변을 생성하는 학습모델 구축
- 방송통신기자재등 적합성평가에 대한 질의에 대해 1차로 분류(category/re_class 등) 결과를 생성하고, 2차로 법령/제도(전파법 및 방송통신기자재 적합성평가) 안내 답변이 올바르게 생성되는지를 확인하여 구축 데이터에 대한 유효성을 검증○ 학습 모델 개발 환경
- 학습 환경: UbuntuOS, Python, Pytorch, GPU
- 모델리소스 및 자원 활용: H100 스펙 이상의 GPU 서버를 사용하여 모델 학습을 진행
- 모델 개발: 1-Cycle 자가 점검 계획에 맞춰 모델 개발
- 성능 지표 결과를 통해 가장 성능이 우수한 모델로 최종 선정○ 최종 선정 모델
- Qwen2.5 7B모델과 Llama 3.2 8B모델의 성능을 비교하여 최종 Qwen2.5 7B을 선정함
* 최종데이터 100,659건으로 성능검증결과 Llama 3.2 8B모델의 Accuracy는 57.8%이고, Qwen2.5 7B모델은 Accuracy 88%를 나타냄
* 최종품질검증 결과 Qwen2.5 7B모델은 Accuracy 88.25%를 달성함○ 모델 태스크 정의
▶ 1단계: 분류(Category/Key) 생성
- 입력: 사용자 질문(question)
- 출력: `pred` (지식 조회에 사용할 분류/키)
▶ 2단계: 규제/법령 안내 답변 생성
- 입력: 사용자 질문(question) + 지식(knowledge_dictionary[pred])
- 출력: 최종 답변(answer) -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드방송통신기자재등 적합성평가 데이터로 라벨링데이터 어노테이션에는 원천데이터의 어노테이션 포함
○ 라벨링데이터 포맷라벨링데이터 포맷 구분 속성명 타입 필수여부 설명 범위 예시 object Y 메타데이터 1 License string Y 유클리드소프트 유클리드소프트 2 annotation object Y 원천,라벨데이터 전체 2-1 meta_data_info object Y 원천데이터 2-1-1 id number Y 작업 ID 195220 2-1-2 doc_file_name string Y 원천데이터 명 방송통신기자재등 적합성평가 데이터 2-1-3 product_id number Y 수집 기자재의 관리번호 62 2-1-4 kc_id string Y 적합성평가 인증/등록 번호 R-R-QRU-CleanerV1-A 2-1-5 kc_date number Y 적합성평가 인증 및 등록 날짜 20200324 2-1-6 e_name string Y 기자재 명칭 Ultrasonic Cleaner 2-1-7 be_class string N 개정 전 대상기자재 분류 - 2-1-8 re_class string Y 개정 된 대상기자재 분류 나.생활가전 기기류 < 19) 전기 세척기류 < o (정의) 발열체나 초음파를 이용하여 주방용 기구나 생활용품, 신체를 세척하는 기기 2-1-9 add_class string N 추가 대상기자재 null 2-1-10 use string N 기자재 설명 Ultrasonic Cleaner 2-1-11 product_country string N 기기 제조국가 한국 2-1-12 group_name string Y 각 호에 대한 분류명 11. 전자파장해를 주거나 전자파로부터 영향을 받는 기기 2-1-13 field string Y 적합성평가 기준 적용분야 무선, 유선, EMC, SAR, 전자파강도 EMC 2-1-14 kc_type string Y 인증 유형 적합인증, 적합등록, 자기적합확인 적합등록 2-1-15 test string Y 적합성평가 표준 시험방법 KS C 9814-1, KS C 9814-2 2-1-16 description string N 해당 기기부호가 비고에 해당되는 경우 2-1-17 notice string Y 공통 안내사항 ※ 기자재별로 상세한 적합성평가 표준시험 방법은 지정시험기관에 문의 바랍니다.\n지정시험기관 리스트(https://www.rra.go.kr/ko/license/A_e_testorgan.do) 2-2 source_data_info object Y 라벨링데이터 2-2-1 question string Y 질문 5어절 이상 한국에서 제작한 Ultrasonic Cleaner는 어떤 적합성 평가를 받아야 해 2-2-2 answer string Y 답변 5어절 이상 Ultrasonic Cleaner는 KS C 9814-1, KS C 9814-2의 시험방법을 적용하며 전파법 제58조의2제3항, 전파법 시행령 제77조의3, 방송통신기자재등의 적합성 평가에 관한 고시 제8조~제10조에 따라 적합성 평가 유형 중 적합등록 평가를 받아야 합니다 2-2-3 category string Y 질의 유형 기본형, 명령형, 설명요구형, 선택요구형 기본형 2-2-4 Statutory provisions string Y 근거 법령 조항 전파법 제58조의2제3항 \n전파법 시행령 제77조의3 \n방송통신기자재등의 적합성평가에 \n관한 고시 제8조~제10조
○ json 예시
{ "liscense": "유클리드소프트",
"annotation": {
"meta_data_info": {
"id": 195220,
"doc_file_name": "방송통신기자재등 적합성평가 데이터",
"product_id": 62,
"kc_id": "R-R-QRU-CleanerV1-A",
"kc_date": 20200324,
"e_name": "Ultrasonic Cleaner",
"be_class": "",
"re_class": "나.생활가전 기기류 < 19) 전기 세척기류 < o (정의) 발열체나 초음파를 이용하여 주방용 기구나 생활용품, 신체를 세척하는 기기",
"add_class": null,
"use": "Ultrasonic Cleaner",
"product_country": "한국",
"group_name": "11. 전자파장해를 주거나 전자파로부터 영향을 받는 기기",
"field": "EMC",
"kc_type": "적합등록",
"test": "KS C 9814-1\n KS C 9814-2",
"description": "",
"notice": "※ 기자재별로 상세한 적합성평가 표준시험 방법은 지정시험기관에 문의 바랍니다.\n지정시험기관 리스트(https://www.rra.go.kr/ko/license/A_e_testorgan.do)"
},
"source_data_info": {
"question": "한국에서 제작한 Ultrasonic Cleaner는 어떤 적합성 평가를 받아야 해?\n",
"answer": "Ultrasonic Cleaner는 KS C 9814-1, KS C 9814-2의 시험방법을 적용하며 전파법 제58조의2제3항, 전파법 시행령 제77조의3, 방송통신기자재등의 적합성 평가에 관한 고시 제8조~제10조에 따라 적합성 평가 유형 중 적합등록 평가를 받아야 합니다.\n",
"category": "기본형",
"Statutory provisions": "전파법 제58조의2제3항 \n전파법 시행령 제77조의3 \n방송통신기자재등의 적합성평가에 \n관한 고시 제8조~제10조"
}
}
}
-
데이터셋 구축 담당자
수행기관(주관) : ㈜와이즈넛
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 윤세진 02-3404-6100 sjyun@wisenut.co.kr 사업관리, AI모델 개발, 구문정확성 검수 수행기관(참여)
수행기관(참여) 기관명 담당업무 한국전파진흥협회 데이터 수집, 전문가 검수 ㈜유클리드소프트 데이터 정제, 데이터 가공, 의미정확성 검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 오소연 책임 042-488-6589 syo@euclidsoft.co.kr 정재연 선임 042-488-6589 jyjeong@euclidsoft.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김봉수 과장 02-3404-6100 usgnob@wisenut.co.kr 이하은 대리 02-3404-6100 haolee@wisenut.co.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 오소연 책임 042-488-6589 syo@euclidsoft.co.kr 정재연 선임 042-488-6589 jyjeong@euclidsoft.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.

국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.