콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#인공지능 # 리걸테크 # 판결문 # 학습용 데이터 # 판례분석

법률/규정 (판결서, 약관 등) 텍스트 분석 데이터

법률/규정 (판결서, 약관 등) 텍스트 분석 아이콘
  • 분야한국어
  • 유형 텍스트
구축년도 : 2021 갱신년월 : 2023-05 조회수 : 15,872 다운로드 : 1,582 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-05-10 원천데이터, 라벨링데이터, 샘플데이터 수정
    1.0 2022-07-29 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-12-20 AI 모델 파일 등록
    2022-07-29 콘텐츠 최초 등록

    소개

    1만 건 이상의 판결문을 대상으로 기초사실, 주장 등을 가공한 데이터와 판례 내용을 기반으로 판결문 분석 데이터 구축, 1만 건 이상의 약관의 유·불리 조항 판단. 위법성과 유리 판단 이유 태깅 및 라벨링을 통해 소비자 입장에서의 유·불리 확인을 위한 법률 텍스트 분석 데이터셋 구축

    구축목적

    법률 판례 및 약관 분야는 전문성이 높은 분야로 이용자들의 접근을 용이하게 하고자 데이터셋 구축
  • 판결문/약관 분야 분포

    구분
    구분 세부 구분 건수 비율
    판결문 민사 4,747 47%
    형사 2,916 30%
    행정 2,337 23%
    약관 가맹계약 510 5%
    공급계약 453 5%
    분양계약 461 5%
    신탁계약 101 1%
    임대차계약 666 7%
    입소, 입주, 입점계약 272 3%
    신용카드 162 2%
    은행여신 190 2%
    은행전자금융서비스 196 2%
    전자결제수단 100 1%
    전자금융거래 381 4%
    상해보험 120 1%
    손해보험 161 2%
    질병보험 214 2%
    연금보험 156 2%
    자동차보험 201 2%
    책임보험 197 2%
    화재보험 184 2%
    증권사1 199 2%
    증권사2 230 2%
    증권사3 108 1%
    여객운송 150 2%
    화물운송 170 2%
    개인정보취금방침 98 1%
    게임 323 3%
    국내·외여행 237 2%
    결혼정보서비스 238 2%
    렌트(자동차 이외) 141 1%
    마일리지/포인트 74 1%
    보증 245 2%
    사이버몰 346 3%
    산후조리원 510 5%
    상조서비스 348 3%
    상품권 117 1%
    생명보험 122 1%
    예식업 268 3%
    온라인서비스 100 1%
    자동차 리스 및 렌트 147 1%
    체육시설 346 3%
    택배 202 2%
    통신, 방송서비스 110 1%
    교육 141 1%
    매매계약 305 3%

     

    법률/규정 (판결서, 약관 등) 텍스트 분석-판결문/약관 분야 분포_1_판결문 분포 그래프

     

    법률/규정 (판결서, 약관 등) 텍스트 분석-판결문/약관 분야 분포_2_약관 분포 그래프

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 데이터셋 구성

    구분
    구분 설명
    Original Dataset 전체 학습데이터
    Training Dataset(80%) 본 과제에서 구현될 모델 학습에 활용하고자 하는 실제 데이터셋
    Validation Dataset(10%) 전체 데이터셋 중에서 구현될 모델의 평가를 위해 사용되는 데이터셋
    Test Dataset(10%) 최종적으로 구현될 모델의 평가를 위해 사용되는 샘플 데이터셋

    <표> 데이터셋 구성 

     

    2. 모델 목적

    구분 목적
    판결문 판결문 주장/사실/판단/결론 분석 정확도 검사
    약관 약관 조항별 소비자 유·불리 판단 정확성 검사

     

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 판결문 주장/사실/판단/결과분석 모델 Estimation GPT-2, BERT F1-Score 0.84 0.88
    2 유·불리 판단 모델 Estimation GPT-2, BERT F1-Score 0.84 0.91

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 대표 도면(판결문)

    제목
    제목
    건축물표시변경신청불가취소
    매체유형 판결문
    판결유형 행정
    판결문 원문
    법률/규정 (판결서, 약관 등) 텍스트 분석-대표 도면(판결문)_1_판결문 원문

     

    2. 라벨링 데이터 구성(판결문)

    구분 항목명 타입 필수 설명 라벨 자동 추출 가능 여부 비고
    여부
    1 info Object Y 기초정보    
      1.1 caseField String Y 사건유형 가능 1. 민사
    2. 형사
    3. 행정
    1.2 detailField String Y 세부유형 가능 1. 민사
    2. 신청
    3. 가사
    4. 특허
    5. 행정
    6. 형사
    1.3 trailField String Y 심급유형 가능 1. 1심
    2. 2심
    1.4 caseNm String Y 사건명 가능  
    1.5 courtNm String Y 법원명 가능  
    1.6 judmnAdjuDe String Y 판결선고일 가능  
    1.7 caseNo String Y 사건번호 가능  
    1.8 relateLaword Array   관련법령 가능  
    /참조조문
    1.9 qotatPrcdnt Array   인용된판례 가능  
    /참조판례
    2 concerned Object Y 사건관계자    
      2.1 acusr String Y 원고 가능 1. 자연인, 
    2. 법인, 
    3. 국가, 
    4. 검사, 
    5. 기타
    2.2 dedat String Y 피고 가능 1. 자연인, 
    2. 법인, 
    3. 국가,
    4. 검사, 
    5. 기타
    3 org Object   원심판결    
      3.1 orgJdgmnCourtNm String   원심법원명 가능  
    3.2 orgJdgmnAdjuDe String   원심선고일 가능  
    3.3 orgJdgmnCaseNo String   원심사건번호 가능  
    4 disposal Object Y 처분    
      4.1 disposalform String Y 처분종류 가능 1. 손해배상금, 
    2. 손실보상금, 
    3. 재산분할액,
    4. 위자료, 
    5. 양육비, 
    6. 징역,
    7. 금고, 
    8. 집행유예, 
    9. 벌금, 
    10. 취소
    4.2 disposalcontent Array Y 처분내용 불가  
    5 mentionedItems Object Y 취지    
      5.1 rqestObjet Array Y 청구취지 가능  
    및 항소취지
    6 assrs Object   주장   항목명은 ‘주장’이지만 형사사건일 경우에는 주장, 민사사건일 때는 청구의 개념
      6.1 acusrAssrs Array   원고의 주장 불가 원고(민사, 행정)와 검사(형사)의 주장
    한 문장에 최대 245자로 태깅
    최대 20문장
      6.2 dedatAssrs Array   피고의 주장 불가 피고(민사, 행정)와 피고인(형사)의 주장
    한 문장에 최대 245자로 태깅
    최대 20문장
    7 facts Object Y 사실    
      7.1 bsisFacts Array Y 기초사실 불가 한 문장에 최대 245자로 태깅
    최대 20문장
    8 dcss Object Y 판단    
      8.1 courtDcss Array Y 재판부의 판단 불가 한 문장에 최대 245자로 태깅
    최대 30문장
    9 close Object Y 결론    
      9.1 cnclsns Array Y 재판의 결론 불가 한 문장에 최대 245자로 태깅
    최대 5문장

     

    3. 라벨링 데이터 실제 예시(판결문)

    {   
        “info”: {
            “caseNm”: “건축물표시변경신청불가취소”,
            “courtNm”: “광주지방법원”,
            “judmnAdjuDe”: “2010.04.29.”,
            “caseNo”: “2009구합3286”,
            “relateLaword”: [
            “주차장법 제19조의 4”,
            “주차장법 시행령 제12조”
        ],
            “qotatPrcdnt”: “”
        },
        “concerned”: {
            “acusr”: “2”,
            “dedat”: “3”
        },
        “org”: {
            “orgJdgmnCourtNm”: “”,
            “orgJdgmnAdjuDe”: “”,
            “orgJdgmnCaseNo”: “”
        },
        “disposal”: {
            “disposalform”: “10”,
            “disposalcontent”: “피고가 2009. 3. 12. 원고에 대하여 한 건축허가신청 불허가처분을 취소한다.”
        },
       
        “mentionedItems”: {
            “rqestObjet”: 
            “피고가 2009. 3. 12. 원고에 대하여 한 건축허가신청 불허가처분을 취소한다.”
        },
        “assrs”: {
            “acusrAssrs”: “”,
            “dedatAssrs”: “”
        },
        “facts”: {
            “bsisFacts”: [
            “원고는 순천시 덕암동 (지번 생략) 외 4필지 지상 이마트 순천점의 부설주차장(이하 이 사건 주차장이라 한다)에 대지면적 5,541㎡, 건축면적 341.25㎡의 주유소(이하 이 사건 주유소라 한다)를 신축하기 위하여 2009. 2. 12. 피고에게 주유소 건축허가신청을 하였고, 피고의 보완요구에 따라 같은 해 3. 5. 피고에게 부설주차장 용도변경신청을 하였다.”,
            “피고는 2009. 3. 12. 주변 교통정체 심화 및 부설주차장 타용도 변경불가를 사유로 다음과 같이 원고의 이 사건 주유소 건축허가신청에 대하여 불허가처분(이하 이 사건 처분이라 한다)을 하였다.”,
            “건축허가 신청지 부근은 지리적으로 교통유발시설이 밀집(순천역, 역전시장, 대형마트 3개소 등)되어 있고, 순천시 남측관문 및 원도심과 신도심을 연결하는 도로에 접하여 있는 곳으로 평상시에도 극심한 교통정체가 자주 발생하며, 각종 용역보고서에도 순천시에서 교통이 가장 혼잡한 곳으로 평가되고 있는 지역이다.”,
       “이러한 지역에 기존의 주유소와는 개념이 다른 주유소가 추가로 신축될 경우 주유를 하기 위한 차량으로 인하여 주변 교통정체가 더욱 심화되어 시민들의 불편이 가중될 것으로 판단된다.”
        ],
            },
        “dcss”: {
            “courtDcss”: [
            “지방자치단체는 그 고유사무인 자치사무와 개별법령에 의하여 지방자치단체에 위임된 단체위임사무에 관하여 자치조례를 제정할 수 있지만 그 경우라도 주민의 권리제한 또는 의무부과에 관한 사항이나 벌칙은 법률의 위임이 있어야 하고, 기관위임사무에 관하여 제정되는 이른바 위임조례는 개별법령에서 일정한 사항을 조례로 정하도록 위임하고 있는 경우에 한하여 제정할 수 있으므로, 주민의 권리제한 또는 의무부과에 관한 사항이나 벌칙에 해당하는 조례를 제정할 경우에는 그 조례의 성질을 묻지 아니하고 법률의 위임이 있어야 하고 그러한 위임 없이 제정된 조례는 효력이 없다 할 것이다( 대법원 2007. 12. 13. 선고 2006추52 판결 참조).”,
            “이 사건 조례 제13조 제2항은 ‘제1항에 의하여 설치된 부설주차장의 용도변경 제한’에 관하여 규정하고 있고, 이는 주차장법 제19조 제4항 및 같은 법 시행령 제7조 제2항에서 위임한 ‘시설물의 부지 인근의 범위’와는 무관한 사항이라 할 것이며, 한편 부설주차장의 용도변경 제한에 관하여는 주차장법 제19조의4 제1항 및 같은 법 시행령 제12조 제1항에서 지방자치단체의 조례에 대한 위임 없이 명확히 규정하고 있다. 따라서, 이 사건 조례 제13조 제2항은 법률의 위임 없이 주민의 권리제한에 관한 사항을 규정한 것으로서 법률유보의 원칙에 반하여 그 효력이 없다 할 것이다.”,
            “이마트 순천점의 판매시설 면적은 19,655㎡이고, 이 사건 주차장의 주차대수는 옥내 510대, 옥외 190대, 합계 700대이며, 이 사건 주유소의 면적은 주차대수 37대에 해당하는 사실이 인정되고, 이마트 순천점의 부설주차장은 132대가 주차가능한 경우 주차장법 시행령 제6조 및 별표 1에서 정한 설치기준을 충족시킨다고 할 수 있으므로, 위 인정사실에 의하면 이 사건 주차장은 주차장법 시행령 제12조 제1항 제3호의 ‘당해 시설물의 부설주차장의 설치기준 또는 설치제한기준을 초과하는 주차장’에 해당한다 할 것이고, 그 초과부분에 대하여 피고의 확인을 받은 경우에는 부설주차장의 용도를 변경할 수 있다 할 것이다.”,
            “피고는 위 초과부분을 확인하고 주차장법 시행령 제12조 제1항 제3호에 따라 이 사건 주차장의 용도변경을 허가하였어야 하는바, 부설주차장 타용도 변경불가는 이 사건 처분에 대한 적법한 처분사유가 될 수 없다.”,
            “이 사건 주유소 건축으로 인하여 주변 교통정체가 심화되는 등 교통상의 문제점이 발생할 가능성이 있다는 점을 인정할 아무런 증거가 없고, 위 인정사실에 의하여 인정되는 다음과 같은 사정 즉, 전라남도 교통영향평가위원회는 이 사건 주유소 건축에 따라 주변 교통정체 심화의 문제가 발생하지 않는다고 판단한 점, 원고는 이 사건 주유소를 건축하는 것을 조건으로 교통영향평가를 마쳤고, 위 교통영향평가의 내용이 객관적으로 명백히 부당한 것으로 볼 아무런 증거가 없는 점 등을 종합하여 보면, 주변 교통정체 심화가 이 사건 주유소 건축에 관한 관계 법규에서 정하는 제한에 해당한다거나 주변 교통정체 심화로 인해 건축 불허가를 할 만한 중대한 공익상의 필요가 있는 경우에 해당한다고 할 수 없으므로, 주변 교통정체 심화를 사유로 이 사건 주유소 건축을 불허가한 이 사건 처분은 위법하다 할 것이다.”
        ],
        },
        "close": [
            "cnclsns": “피고가 2009. 3. 12. 원고에 대하여 한 건축허가신청 불허가처분을 취소한다.”,
                       “소송비용은 피고가 부담한다.”,
        ],
            },

     

     

    1. 대표 도면(약관)

    제목
    00산후조리원 이용약관
    매체유형 약관
    약관유형 산후조리원
    약관 원문

    법률/규정 (판결서, 약관 등) 텍스트 분석-대표 도면(약관)_1_약관 원문

     

    2. 라벨링 데이터 구성(약관)

    구분 항목명 타입 필수 설명 라벨 자동 추출 가능 여부 비고
    여부
    1 clauseField String Y 약관분야 불가 1. 가맹계약 -510(5%)
    2. 공급계약 -453(5%)
    3. 분양계약 -461(5%)
    4. 신탁계약 -101(1%)
    5. 임대차계약 -666(7%)
    6. 입소, 입주, 입점계약 -272(3%)
    7. 신용카드 -162(2%)
    8. 은행여신 -190(2%)
    9. 은행전자금융서비스 -196(2%)
    10. 전자결제수단 -100(1%)
    11. 전자금융거래 -381(4%)
    12. 상해보험 –120(1%)
    13. 손해보험 -161(2%)
    14. 질병보험 -214(2%)
    15. 연금보험 -156(2%)
    16. 자동차보험 -201(2%)
    17. 책임보험 -197(2%)
    18. 화재보험 –184(2%)
    19. 증권사1 -199(2%)
    20. 증권사2 -230(2%)
    21. 증권사3 -108(1%)
    22. 여객운송 -150(2%)
    23. 화물운송 -170(2%)
    24. 개인정보취급방침 -98(1%)
    25. 게임 -323(3%)
    26. 국내·외 여행 -237(2%)
    27. 결혼정보서비스 -238(2%)
    28. 렌트(자동차 이외) -141(1%)
    29. 마일리지/포인트 -74(1%)
    30. 보증 -245(2%)
    31. 사이버몰 –346(3%)
    32. 산후조리원 -510(5%)
    33. 상조서비스 -348(3%)
    34. 상품권 -117(1%)
    35. 생명보험 -122(1%)
    36. 예식업 -268(3%)
    37. 온라인서비스 -100(1%)
    38. 자동차 리스 및 렌트 -147(1%)
    39. 체육시설 -346(3%)
    40. 택배 -202(2%)
    41. 통신, 방송서비스 -110(1%)
    42. 교육 -141(1%)
    43. 매매계약 –305(3%)
    2 ftcCnclsns String Y 공정위 심결례 불가 해당, 2. 비해당
    3 clauseArticle Array Y 약관조항 불가  
    4 dvAntageous String Y 유불리판단 불가 유리, 2. 불리
    5 comProvision string   비교근거 불가 공정위 심결례를 받지 않은 유·불리 조항의 판단근거 기입란 : 표준약관 비교조항, 공개 심결례 시정전후 약관 참고 확인 작성
    6 illdcssBasiss Array   위법성  불가  
    판단 근거
    7 relateLaword Array   관련 법령 불가  
    8 unfavorableProvision String   불리한  불가 신의성실의 원칙 위반
    조항 유형 개별금지 조항의 위반

     

    3. 라벨링 데이터 실제 예시(약관)

    {    "clauseField": "32",
        "ftcCnclsns": "1",
       "clauseArticle": [
                    "제9조 제2항 산모 본인의 개인적인 사정으로 인하여 퇴원할 시, 잔여기간의 입원금은 환불되지 않습니다."
                ],
                "dvAntageous": "2",
                "illdcssBasiss": [
                    "산모 개인에게 귀책사유가 있어 퇴원하는 경우라 할지라도 잔여기간 입원금의 환불을 일절금지하는 것은 계약의 해지로 인한 사업자의 원상회복의무를 부당하게 경감하는 조항이다."
                ],
                "relateLaword": [
                    "약관법 제9조제4호 계약의 해제 또는 해지로 인한 원상회복의무를 상당한 이유 없이 고객에게 과중하게 부담시키거나 고객의 원상회복 청구권을 부당하게 포기하도록 하는 조항"
                ],
                "unfavorableProvision": "2"
        
    }
  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜알엠소프트
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    이기원 02-859-0884 8325@rmsoft.kr 데이터 구축
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜심소프트 저작도구, AI 모델
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    이기원 02-859-0884 8325@rmsoft.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.