미니게이트 - 한국어-다국어 번역 말뭉치 (인문학)

인문학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 인문학 분야 다국어(영어, 중국어, 일본어) 번역 말뭉치 데이터

리소스

항목
CKAN dataset id ee3046a2-346c-457c-b96a-617dd0f2a750
상태 active
url https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=71498
버전 2023-12-22
라이선스 cc-zero
pricing 무료
담당자 2
담당자 연락처 인공신경망 기반 번역모델의 문장 번역 성능 (한-중)
업데이트일 2,023-12-22
유/무료 무료
이용방법 다운로드
제공 기관 수행기관(주관) : 미니게이트
최초 제공일 2,023-06-26
파일 크기 73,508,949
최초 수집 일시 2023-08-05T01:23:55…
최근 수집 일시 2024-02-28T10:58:20…

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기