콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#인공지능 # 초거대 AI # 경제적수명 # 할인율 # 로열티율 # 기술가치평가 # Chain of Thought 데이터

BETA CoT-Fabric 기반 기술 가치평가 데이터

CoT-Fabric 기반 기술 가치평가 데이터 아이콘 이미지
  • 분야지식재산
  • 유형 텍스트
  • 생성 방식LLM
구축년도 : 2025 갱신년월 : 2026-06 조회수 : 799 다운로드 : 7 용량 :
샘플(경량) 데이터 ?

※ 26년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2026-06-05 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2026-06-05 산출물 최종 공개

    소개

    기술가치평가 결과를 정확하게 도출하고, 그 결과의 근거 과정을 CoT로 구축한 Instruction Tuning 데이터셋

    구축목적

    본 데이터는 기술가치평가 실무에서 수행되는 판단 논리와 산출 과정을 단계별 추론(CoT) 구조로 데이터화하여, AI가 평가 결과와 판단 근거를 함께 학습할 수 있도록 구축됨.
  • ○ 클래스별 데이터 구축 수량

    ○ 클래스별 데이터 구축 수량
    구분 원천데이터 가공데이터 구성비
    반도체·디스플레이 8,300 8,300 13.83%
    사이버 보안 4,800 4,800 8.00%
    수소 4,800 4,800 8.00%
    양자 700 700 1.17%
    우주항공·해양 4,800 4,800 8.00%
    이차전지 6,500 6,500 10.83%
    인공지능 6,000 6,000 10.00%
    차세대 원자력 3,000 3,000 5.00%
    차세대 통신 3,300 3,300 5.50%
    첨단 모빌리티 6,000 6,000 10.00%
    첨단 바이오 6,500 6,500 10.83%
    첨단로봇·제조 5,300 5,300 8.83%
    합계 60,000 60,000 100.00%

     

    ○ 특허 출원년도 분포

    ○ 특허 출원년도 분포
    특허 출원년도 비율
    2012 0.01%
    2013 2.39%
    2014 3.97%
    2015 6.53%
    2016 6.78%
    2017 8.67%
    2018 12.48%
    2019 12.96%
    2020 15.66%
    2021 15.95%
    2022 9.28%
    2023 5.09%
    2024 0.26%
    합계 100%

     

    ○ 문장별 어절 수 분포 확인

    ○ 문장별 어절 수 분포 확인
    문장 어절 수 구간 비율
    abstract 0 ~ 49 20.11%
    50 ~ 68 20.77%
    69 ~ 86 19.14%
    87 ~ 113 20.16%
    114 이상 19.83%
    합계 100%
    A_claims 0 ~ 247 20.10%
    248 ~ 370 20.00%
    371 ~ 525 19.96%
    526 ~ 786 19.97%
    787 이상 19.98%
    합계 100%
    B_claims 0 ~ 255 20.04%
    256 ~ 376 20.07%
    377 ~ 527 19.93%
    528 ~ 785 20.00%
    786 이상 19.98%
    합계 100%
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    ○ 임무 정의
      - 특허, 기업·재무, 가치평가 파라미터를 입력으로 받아 기술가치평가 결과와 그 판단 근거를 단계별 추론(CoT) 형태로 생성

     

    ○ 임무 선정 사유
      - CoT(Chain-of-Thought) 기반 질의응답 방식의 대표적인 초거대 언어모델 학습 방식으로, 기술가치평가 판단 논리를 포함한 텍스트 기반 CoT-Fabric 데이터를 활용하여 학습모델을 구축함.
      - 구축한 CoT-Fabric 기반 기술가치평가 데이터(JSON)를 LLM 기반 질의응답 모델에 적용하여 학습하고, 특허·기업·가치평가 정보를 입력으로 기술가치평가 결과와 단계별 추론 과정이 올바르게 생성되는지를 확인함으로써 구축 데이터의 학습 유효성을 검증함.

     

    ○ 학습 모델 개발 환경
     - 학습 환경: Ubuntu, Python, Transformers, GPU
     - 모델리소스 및 자원 활용: 고성능 GPU 서버를 사용하여 모델 학습을 진행
     - 모델 개발: 1-Cycle 자가 점검 계획에 맞춰 모델 개발
     - 성능 지표 결과를 통해 가장 성능이 우수한 모델로 최종 선정

     

    ○ 최종 선정 모델
     □ google/gemma-3-1b-it
      - 텍스트와 이미지를 동시에 입력받아 처리할 수 있는 멀티모달(Multimodal) 아키텍처를 적용한 10억 파라미터 규모의 모델
      - Google의 Gemma Terms of Use를 따르는 오픈 가중치 모델로서, 사용자의 지시를 따르도록 미세 조정(Instruction Tuned)된 다국어 모델로서 한국어 처리를 위해 적합한 모델
      - Hugging Face 사이트로부터 다운로드 가능

     

    ○ 학습 데이터 생성
      - 학습 데이터 전처리
        * 특허 기본정보, 회사/산업 정보, 요약문, 가치평가 관련 파라미터 등의 컨텍스트 추출

        * 특허의 가치 평가를 위한 예제, 목표 프롬프트 추가

      - 학습 데이터 포맷 변경 및 분할 (8:1:1로 분할)
        * train - 프롬프트, 답변 (카테고리 별 80%)
        * val - 프롬프트, 답변 (카테고리 별 10%)    

        * test - 프롬프트, 답변 (카테고리 별 10%)

    학습데이터 생성 예시 이미지

    [ 학습데이터 생성 예시 ]

     

    ○ 학습 알고리즘
      - LoRA(Low-Rank Adaptation) 파인튜닝 적용
      - LoRA는 모델 전체를 업데이트하지 않고, 일부 파라미터에 대해 저차원 행렬을 추가적으로 학습시켜 빠르고 효율적인 파인튜닝 수행
      - 기존 모델의 원래 가중치는 고정되고, 저차원 행렬만 학습하여 학습할 파라미터 수가 줄어들어 효율적인 학습이 가능
      - 기존의 전체 모델 파라미터를 업데이트하는 방식보다 메모리와 계산 비용이 크게 감소

    LoRA(Low-Rank Adaptation) 파인튜닝 이미지

    [ LoRA(Low-Rank Adaptation) 파인튜닝 ]

    (출처 : https://huggingface.co/docs/peft/main/conceptual_guides/lora)

     

    ○ AI 모델 성능

    ○ AI 모델 성능
    AI Task 알고리즘 데이터 수량 성능지표 목표치 평가결과
    총 구축량 학습(80%) 평가(20%)
    CoT 기반
    기술가치평가 
    gemma-3 60,000 건 48,000건 12,000건 MAPE 30%
    이내
    5.94%
  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    ○ 라벨링데이터 포맷 및 구성 

    ○ 라벨링데이터 포맷 및 구성 
    설명 분류 형식 수량 단위
    CoT-Fabric 기반
    기술가치평가
    데이터
    반도체·디스플레이 .json 8,300
    사이버 보안 .json 4,800
    수소 .json 4,800
    양자 .json 700
    우주항공·해양 .json 4,800
    이차전지 .json 6,500
    인공지능 .json 6,000
    차세대 원자력 .json 3,000
    차세대 통신 .json 3,300
    첨단 모빌리티 .json 6,000
    첨단 바이오 .json 6,500
    첨단로봇·제조 .json 5,300

     

    ○ 라벨링데이터 규칙

    ○ 라벨링데이터 규칙
    구분 속성명 타입 필수여부 설명 범위 예시
    1 patent_info Object   특허정보    
      1-1 open_year String Y 공개년도   2022
    1-2 open_date String Y 공개일자   20220222
    1-3 open_number String Y 공개번호   2022-0021626
    1-4 application_year String Y 출원년도   2020
    1-5 application_date String Y 출원일자   20200814
    1-6 application_number String Y 출원번호   2020-0102410
    1-7 register_year String Y 등록년도   2023
    1-8 register_date String Y 등록일자   20230403
    1-9 register_number String Y 등록번호   2518859
    1-10 invention_title String Y 발명의 명칭   인공지능 기반 고객 불만 관리 방법 및 장치
    1-11 abstract String Y 요약   본 명세서는 고객 불만 관리 방법 및 장치에 관한 것이다.
    1-12 ipc_section String Y IPC section   G
    1-13 ipc_class String Y IPC class   G06
    1-14 ipc_subclass String Y IPC subclass   G06Q
    1-15 ipc_main String Y IPC main   G06Q-030/02
    1-16 ipc_all String Y IPC all   G06Q-030/02
    1-17 applicant_name String Y 출원인명   OOOO
    1-18 B_claims array Y 공개 청구항   ["고객과의 상담 내용이 포함된 음성 상담 데이터를 수신하는 단계; …"]
    1-19 A_claims array Y 등록 청구항   ["데이터 수신부가 고객과의 상담 내용이 포함된 음성 상담 데이터를 수신하는 단계; …"]
    1-20 documentId String Y 특허 문헌번호   kr20200102410b1
    1-21 classdata String Y 12대 국가전략기술 클래스   인공지능
    1-22 patent_sentence_count Number Y 특허 활용 문장 수   42
    2 Company_info Object   기업 정보    
      2-1 company_name String Y 기업명   OOOO
    2-2 industry String Y 산업분야   은행 및 저축기관
    2-3 ksic String Y ksic분류   K641
    2-4 sales Number Y 매출액   71761095700
    2-5 equity Number Y 타인자본비율 [0~1] 1
    2-6 leverage Number Y 자기자본비율 [0~1] 0
    2-7 cost_of_goods_sold Number Y 매출원가   2.88884E+12
    2-8 net_income Number Y 당기순이익   2.42882E+11
    2-9 asset Number Y 자산   4.30193E+13
    2-10 net_asset_value Number Y 자본   4.73227E+12
    2-11 liabilities Number Y 부채   3.73347E+13
    3 valuation_id Object   가치평가 정보    
      3-1 patent_info String Y 특허번호   kr20200102410b1
    3-2 royalty_rate Number Y 로열티율   5.382
    3-3 useful_life_years Number Y 경제적 수명   7.332
    3-4 wacc Number Y 할인율   12.313
    3-5 business_risk Number Y 위험 프리미엄   3.299
    4 instruction_id Object   지시 ID    
      4-1 patent_no String Y 특허 번호   KR10-2518859
    4-2 ipc String Y 기술분류   G06Q-030/02
    4-3 title_ko String Y 발명의 명칭   인공지능 기반 고객 불만 관리 방법 및 장치
    4-4 abstract_ko String Y 요약   본 명세서는 고객 불만 관리 방법 및 장치에 관한 것이다.
    4-5 keywords array Y 핵심 키워드   ["인공지능","음성 상담 데이터","불만 등급"]
    4-6 total_revenue Number Y 매출액   71761095700
    4-7 royalty_rate Number Y 로열티율   5.382
    4-8 useful_life_years Number Y 경제적 수명   7.332
    4-9 wacc Number Y 할인율   12.313
    4-10 business_risk Number Y 위험 프리미엄   3.299
    4-11 input String Y 질의   "OOOO의 '인공지능 기반 고객 불만 관리 방법 및 장치' 특허 가치 평가를 요청합니다."
    4-12 output array Y 가치평가 추론 판단 결과   ["① 시장 매출 투영 – …", "② 로열티 베이스 결정 – …"]
    4-13 answer Number Y 가치평가 최종 산출물   179000000

     

    ○ json 예시

    {
      "patent_info": {
        "open_year": "2022",
        "open_date": "20220222",
        "open_number": "2022-0021626",
        "application_year": "2020",
        "application_date": "20200814",
        "application_number": "2020-0102410",
        "register_year": "2023",
        "register_date": "20230403",
        "register_number": "2518859",
        "invention_title": "인공지능 기반 고객 불만 관리 방법 및 장치",
        "abstract": "본 명세서는 고객 불만 관리 방법 및 장치에 관한 것이다. 본 명세서의 일 실시예에 따른 고객 불만 관리 방법은, 고객과의 상담 내용이 포함된 음성 상담 데이터를 수신하는 단계, 수신한 음성 상담 데이터로부터 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 추출하는 단계, 추출된 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 고객 불만 텍스트 데이터 및 고객 응대 텍스트 데이터를 포함하는 텍스트 상담 데이터로 전환하는 단계, 상기 고객 불만 텍스트 데이터로부터 불만 등급을 산정하고 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터로부터 상담 유형을 결정하는 단계 및 불만 등급, 상담 유형 및 텍스트 상담 데이터에 기초하여 불만 확률 테이블을 생성하는 단계를 포함한다.",
        "ipc_section": "G",
        "ipc_class": "G06",
        "ipc_subclass": "G06Q",
        "ipc_main": "G06Q-030/02",
        "ipc_all": "G06Q-030/02",
        "applicant_name": "OOOO",
        "B_claims": [
          "고객과의 상담 내용이 포함된 음성 상담 데이터를 수신하는 단계;상기 수신한 음성 상담 데이터로부터 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 추출하는 단계; 상기 추출된 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 고객 불만 텍스트 데이터 및 고객 응대 텍스트 데이터를 포함하는 텍스트 상담 데이터로 전환하는 단계;상기 고객 불만 텍스트 데이터로부터 불만 등급을 산정하고 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터로부터 상담 유형을 결정하는 단계 및상기 불만 등급, 상기 상담 유형 및 상기 텍스트 상담 데이터에 기초한 불만 확률 테이블을 생성하는 단계를 포함하는 고객 불만 관리 방법.",
          "제1항에 있어서,상기 불만 확률 테이블 내의 상기 텍스트 상담 데이터를 대상으로 통계 대상 질문을 입력 받는 단계;상기 텍스트 상담 데이터에 기초하여 상기 통계 대상 질문에 대한 응답 및 최종 응답을 도출하는 단계 및상기 도출된 최종 응답 및 상기 응답에 대한 통계 결과 정보를 부서별 사용자 단말로 제공하는 단계를 더 포함하는 고객 불만 관리 방법",
          "제2항에 있어서,상기 통계 결과 정보는 상기 텍스트 상담 데이터 전체 또는 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터 각각에 대한 통계 결과 정보인 고객 불만 관리 방법.",
          "제2항에 있어서,상기 통계 대상 질문에 대한 응답 및 최종 응답을 도출하기 전 상기 통계 대상 질문과 유사도가 높은 텍스트 상담 데이터를 추출하여 선 분류하는 단계를 더 포함하고,상기 텍스트 상담 데이터에 기초하여 통계 대상 질문에 대한 응답 및 최종 응답을 도출하는 단계는,상기 선 분류된 텍스트 상담 데이터에 기초하여 상기 통계 대상 질문에 대한 응답 및 최종 응답을 도출하는 것인 고객 불만 관리 방법.",
          "제2항에 있어서,상기 불만 확률 테이블 내의 상기 텍스트 상담 데이터를 대상으로 통계 대상 질문을 입력 받는 단계는,상기 텍스트 상담 데이터에 대한 검색 조건 설정과 함께 상기 통계 대상 질문을 입력 받는 단계를 더 포함하는 고객 불만 관리 방법.",
          "제1항에 있어서,상기 전환된 텍스트 상담 데이터를 이용하여 데이터 전처리를 수행하는 단계를 더 포함하는 고객 불만 관리 방법.",
          "고객과의 상담 내용이 포함된 음성 상담 데이터를 수신하는 데이터 수신부;상기 수신한 음성 상담 데이터로부터 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 추출하는 데이터 추출부;상기 추출된 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 고객 불만 텍스트 데이터 및 고객 응대 텍스트 데이터를 포함하는 텍스트 상담 데이터로 전환하는 데이터 전환부;상기 고객 불만 데이터로부터 불만 등급을 산정하고 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터로부터 상담 유형을 결정하는 데이터 분류부 및상기 불만 등급, 상기 상담 유형 및 상기 텍스트 상담 데이터에 기초한 불만 확률 테이블을 생성하는 테이블 생성부를 포함하는 고객 불만 관리 장치.",
          "제7항에 있어서,상기 불만 확률 테이블 내의 상기 텍스트 상담 데이터를 대상으로 통계 대상 질문을 입력 받고, 상기 텍스트 상담 데이터에 기초하여 상기 통계 대상 질문에 대한 응답 및 최종 응답을 도출하여 상기 도출된 최종 응답 및 상기 응답에 대한 통계 결과 정보를 부서별 사용자 단말로 제공하는 데이터 통계부를 포함하는 고객 불만 관리 장치.",
          "제8항에 있어서,상기 통계 결과 정보는,상기 텍스트 상담 데이터 전체 또는 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터 각각에 대한 통계 결과 정보인 고객 불만 관리 장치.",
          "제8항에 있어서,상기 데이터 통계부는,상기 통계 대상 질문에 대한 응답을 도출하기 전 상기 텍스트 상담 데이터 중 상기 통계 대상 질문과 유사도가 높은 텍스트 상담 데이터를 추출하여 선분류하고, 상기 선 분류된 텍스트 상담 데이터에 기초하여 상기 통계 대상 질문에 대한 응답을 도출하는 고객 불만 관리 장치.",
          "제8항에 있어서,상기 데이터 통계부는,상기 텍스트 상담 데이터에 대한 검색 조건 설정과 함께 상기 통계 대상 질문을 입력 받는 고객 불만 관리 장치.",
          "제7항에 있어서,상기 전환된 텍스트 상담 데이터를 이용하여 데이터 전처리를 수행하는 사전학습부를 더 포함하는 고객 불만 관리 장치."
        ],
        "A_claims": [
          "데이터 수신부가 고객과의 상담 내용이 포함된 음성 상담 데이터를 수신하는 단계;데이터 추출부가 상기 수신한 음성 상담 데이터로부터 고객의 발화에 대한 데이터인 고객 불만 음성 데이터 및 상담원의 발화에 대한 데이터인 고객 응대 음성 데이터를 추출하는 단계; 데이터 전환부가 상기 추출된 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 고객 불만 텍스트 데이터 및 고객 응대 텍스트 데이터를 포함하는 텍스트 상담 데이터로 전환하는 단계;데이터 분류부가 상기 고객 불만 텍스트 데이터로부터 불만 등급을 산정하고 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터로부터 상담 유형을 결정하는 단계; 및테이블 생성부가 상기 불만 등급, 상기 상담 유형 및 상기 텍스트 상담 데이터에 기초한 불만 확률 테이블을 생성하는 단계를 포함하고,상기 불만 확률 테이블은 세로축이 불만 등급 또는 불만 등급에 따른 불만 확률로 설정되고 가로축이 상담 유형으로 설정된 오차 행렬(Confusion matrix)이고,데이터 통계부가 상기 불만 확률 테이블 내의 상기 텍스트 상담 데이터를 대상으로 통계 대상 질문을 입력 받는 단계;상기 데이터 통계부가 상기 텍스트 상담 데이터에 기초하여 상기 통계 대상 질문에 대한 응답 및 최종 응답을 도출하는 단계; 및상기 데이터 통계부가 상기 도출된 최종 응답 및 상기 응답에 대한 통계 결과 정보를 부서별 사용자 단말로 제공하는 단계를 더 포함하고,상기 최종 응답은 상기 통계 대상 질문에 대한 각각의 텍스트 상담 데이터의 응답 중 가장 높은 빈도를 갖는 응답인고객 불만 관리 방법.",
          "제1항에 있어서,상기 통계 결과 정보는 상기 텍스트 상담 데이터 전체 또는 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터 각각에 대한 통계 결과 정보인 고객 불만 관리 방법.",
          "제1항에 있어서,상기 데이터 통계부가 상기 통계 대상 질문에 대한 응답 및 최종 응답을 도출하기 전 텍스트 상담 데이터를 예상 통계 대상 질문과 비교하여 유사도 값을 산출하고, 상기 유사도 값이 미리 설정된 기준 유사도 값을 초과하는 텍스트 상담 데이터를 추출하여 선 분류하는 단계를 더 포함하고,상기 데이터 통계부가 상기 텍스트 상담 데이터에 기초하여 통계 대상 질문에 대한 응답 및 최종 응답을 도출하는 단계는,상기 데이터 통계부가 선 분류된 텍스트 상담 데이터에 기초하여 상기 통계 대상 질문에 대한 응답 및 최종 응답을 도출하는 것인 고객 불만 관리 방법.",
          "제1항에 있어서,상기 데이터 통계부가 상기 불만 확률 테이블 내의 상기 텍스트 상담 데이터를 대상으로 통계 대상 질문을 입력 받는 단계는,상기 데이터 통계부가 상기 텍스트 상담 데이터에 대한 검색 조건 설정과 함께 상기 통계 대상 질문을 입력 받는 단계를 더 포함하는 고객 불만 관리 방법.",
          "제1항에 있어서,사전학습부가 상기 텍스트 상담 데이터를 이용하여 사전 학습을 수행하는 단계를 더 포함하는 고객 불만 관리 방법.",
          "고객과의 상담 내용이 포함된 음성 상담 데이터를 수신하는 데이터 수신부;상기 수신한 음성 상담 데이터로부터 고객의 발화에 대한 데이터인 고객 불만 음성 데이터 및 상담원의 발화에 대한 데이터인 고객 응대 음성 데이터를 추출하는 데이터 추출부;상기 추출된 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 고객 불만 텍스트 데이터 및 고객 응대 텍스트 데이터를 포함하는 텍스트 상담 데이터로 전환하는 데이터 전환부;상기 고객 불만 데이터로부터 불만 등급을 산정하고 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터로부터 상담 유형을 결정하는 데이터 분류부;상기 불만 등급, 상기 상담 유형 및 상기 텍스트 상담 데이터에 기초한 불만 확률 테이블을 생성하는 테이블 생성부; 및상기 불만 확률 테이블 내의 상기 텍스트 상담 데이터를 대상으로 통계 대상 질문을 입력 받고, 상기 텍스트 상담 데이터에 기초하여 상기 통계 대상 질문에 대한 응답 및 최종 응답을 도출하여 상기 도출된 최종 응답 및 상기 응답에 대한 통계 결과 정보를 부서별 사용자 단말로 제공하는 데이터 통계부를 포함하고,상기 불만 확률 테이블은 세로축이 불만 등급 또는 불만 등급에 따른 불만 확률로 설정되고 가로축이 상담 유형으로 설정된 오차 행렬(Confusion matrix)이고,상기 최종 응답은 상기 통계 대상 질문에 대한 각각의 텍스트 상담 데이터의 응답 중 가장 높은 빈도를 갖는 응답인고객 불만 관리 장치.",
          "제7항에 있어서,상기 통계 결과 정보는,상기 텍스트 상담 데이터 전체 또는 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터 각각에 대한 통계 결과 정보인 고객 불만 관리 장치.",
          "제7항에 있어서,상기 데이터 통계부는,상기 통계 대상 질문에 대한 응답을 도출하기 전 텍스트 상담 데이터를 예상 통계 대상 질문과 비교하여 유사도 값을 산출하고, 상기 유사도 값이 미리 설정된 기준 유사도 값을 초과하는 텍스트 상담 데이터를 추출하여 선 분류하고, 선 분류된 텍스트 상담 데이터에 기초하여 상기 통계 대상 질문에 대한 응답을 도출하는 고객 불만 관리 장치.",
          "제7항에 있어서,상기 데이터 통계부는,상기 텍스트 상담 데이터에 대한 검색 조건 설정과 함께 상기 통계 대상 질문을 입력 받는 고객 불만 관리 장치.",
          "제7항에 있어서,상기 텍스트 상담 데이터를 이용하여 사전 학습을 수행하는 사전학습부를 더 포함하는 고객 불만 관리 장치."
        ],
        "documentId": "kr20200102410b1",
        "classdata": "인공지능",
        "patent_sentence_count": 42
      },
      "Company_info": {
        "company_name": "OOOO",
        "industry": "은행 및 저축기관",
        "ksic": "K641",
        "sales": 71761095699.999,
        "equity": 1.0,
        "leverage": 0.0,
        "cost_of_goods_sold": 2888835257349.998,
        "net_income": 242881858199.999,
        "asset": 43019260299999.99,
        "net_asset_value": 4732274565299.998,
        "liabilities": 37334696099999.99
      },
      "valuation_id": {
        "patent_info": "kr20200102410b1",
        "royalty_rate": 5.382,
        "useful_life_years": 7.332,
        "wacc": 12.313,
        "business_risk": 3.299
      },
      "instruction_id": {
        "patent_no": "KR10-2518859",
        "ipc": "G06Q-030/02",
        "title_ko": "인공지능 기반 고객 불만 관리 방법 및 장치",
        "abstract_ko": "본 명세서는 고객 불만 관리 방법 및 장치에 관한 것이다. 본 명세서의 일 실시예에 따른 고객 불만 관리 방법은, 고객과의 상담 내용이 포함된 음성 상담 데이터를 수신하는 단계, 수신한 음성 상담 데이터로부터 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 추출하는 단계, 추출된 고객 불만 음성 데이터 및 고객 응대 음성 데이터를 고객 불만 텍스트 데이터 및 고객 응대 텍스트 데이터를 포함하는 텍스트 상담 데이터로 전환하는 단계, 상기 고객 불만 텍스트 데이터로부터 불만 등급을 산정하고 상기 고객 불만 텍스트 데이터 및 상기 고객 응대 텍스트 데이터로부터 상담 유형을 결정하는 단계 및 불만 등급, 상담 유형 및 텍스트 상담 데이터에 기초하여 불만 확률 테이블을 생성하는 단계를 포함한다.",
        "keywords": [
          "인공지능",
          "음성 상담 데이터",
          "불만 등급"
        ],
        "total_revenue": 71761095699.999,
        "royalty_rate": 5.382,
        "useful_life_years": 7.332,
        "wacc": 12.313,
        "business_risk": 3.299,
        "input": "OOOO의 '인공지능 기반 고객 불만 관리 방법 및 장치' (출원번호 2020-0102410, 은행 및 저축기관 산업 분야)의 특허 가치 평가를 기준 매출 717.6억원, 연 성장률 4.5%, 비교 로열티율 5.9%, 4.81%, 5.53%, 법인세율 24%, WACC 12.3%, IP 기여도 1.91, 경제적 수명 7년, 사업 준비기간 4년을 반영하여 '로열티 공제법'으로 단계별 계산 과정과 함께 상세히 평가해 주시길 요청합니다.",
        "output": [
          "① 시장 매출 투영 – OOO는 2020년에 출원한 인공지능 기반 고객 불만 관리 방법 및 장치를 바탕으로 은행 및 저축기관 산업에서 사업을 준비해왔다. 출원 이후 4년간은 사업화 준비 기간으로 매출이 발생하지 않았으며, 2024년부터 본격적인 사업화가 시작된다. 기준 매출은 717.6억원이며, 연평균 성장률 4.5%를 적용하여 2027년에는 매출이 818.9억원, 2030년에는 934.5억원에 이를 것으로 예상된다. 이와 같은 매출 성장 전망과 출원인을 고려했을 때 IP 기여도 1.91를 반영하는 것이 적정하다고 판단된다.",
          "② 로열티 베이스 결정 – 비교 대상 로열티율로는 5.9%, 4.81%, 5.53%가 제시되었으며, 이들은 모두 은행 및 저축기관 분야에서 산출된 수치이다. 이들 각각의 로열티율은 개별 사례별 차이가 있으나, 객관적이고 균형 잡힌 평가를 위해 산술평균인 5.41%를 사용하는 것이 합리적이다. 평균값을 적용함으로써 특정 사례에 편중되지 않고 전체 시장 상황을 반영하는 로열티 베이스를 확립할 수 있다.",
          "③ 로열티율 결정 – 비교 로열티율 평균 5.41%는 법인세율 24%를 고려하여 세후 로열티율로 조정할 필요가 있다. 법인세는 로열티 수익에 직접적인 영향을 미치므로, 세전 로열티율을 그대로 적용하면 실제 현금흐름을 과대평가할 위험이 크다. 이에 따라 세후 로열티율은 4.11%로 산출되어, 평가 시 실제 수익 창출 가능성을 보다 정확히 반영한다.",
          "④ 세후 조정 – 기준 매출 717.6억원에 세후 로열티율 4.11%를 적용하면 로열티 수익의 기본 틀이 마련된다. 여기에 IP 기여도 1.91를 곱하여 특허의 기여 정도를 반영함으로써, 실제 특허가 창출하는 경제적 가치가 구체적으로 산출된다. 이 세 요소가 결합되어 현금흐름 계산의 근간을 이루며, 사업화 과정에서 발생할 수익의 실질적 규모를 예측하는 데 중요한 역할을 한다.",
          "⑤ 현금흐름 계산 – 연도별 현금흐름은 매출에 IP 기여도 1.91과 세후 로열티율 4.11%를 곱하는 공식으로 산출된다. 즉, 매출 × IP 기여도 1.91 × 세후 로열티율 4.11%가 현금흐름의 기본 산정식이다. 준비기간 4년 동안은 사업화가 이루어지지 않아 현금흐름이 발생하지 않으며, 2024년부터 경제적 수명 7년 동안 이 공식에 따라 현금흐름이 발생한다. 이를 통해 연도별 현금유입 규모를 구체적으로 예측할 수 있다.",
          "⑥ 할인(NPV) – 할인율로는 가중평균자본비용(WACC) 12.3%가 적용되어 미래 현금흐름을 현재가치로 환산한다. 4년간의 준비기간을 반영하여 사업화 시점부터 발생하는 현금흐름을 할인하는 과정에서 NPV는 1.79억원으로 산출되었다. 이 값은 백만원 단위로 절사된 수치이며, 이를 통해 특허의 경제적 가치를 현재 시점에서 명확히 평가할 수 있다.",
          "⑦ 결론 – OOO의 출원번호 2020-0102410, 인공지능 기반 고객 불만 관리 방법 및 장치는 은행 및 저축기관 분야에서 기준 매출 717.6억원과 성장률 4.5%를 바탕으로 사업화가 이루어지고 있다. 비교 로열티율과 세후 조정, IP 기여도 1.91를 반영한 결과, NPV는 1.79억원으로 산출되었다. 이와 같은 종합적인 평가 과정을 통해 해당 특허는 경제적 가치가 충분히 있다고 평가된다."
        ],
        "answer": 179000000
      }
    }

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜워트인텔리전스
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    이상범 02-521-0110 sbmlee@wert.co.kr 실무책임자
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    특허법인 도담 데이터 수집/정제/가공/검수
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    송완감 02-521-0110 wgsong@wert.co.kr
    이상범 02-521-0110 sbmlee@wert.co.kr
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    송완감 02-521-0110 wgsong@wert.co.kr
    이상범 02-521-0110 sbmlee@wert.co.kr
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    송완감 02-521-0110 wgsong@wert.co.kr
    이상범 02-521-0110 sbmlee@wert.co.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.

국방데이터 이용신청 탭 이미지

국방데이터 개방 안내

본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.

방송영상 데이터 개방 안내

방송영상 데이터는 열람서비스를 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의