-
㈜와이즈넛 - SNS 데이터 고도화 AI 허브
2020년 한국어 SNS데이터와 2021년 주제별 텍스트 일상 대화 데이터의 유형을 최소 1개에서 최대 3개로 멀티라벨링 하여 한국어 일상대화 AI 모델의 품질 향상을 위한 학습용 데이터 셋 제공 -
㈜엔에이치엔다이퀘스트 - OCR 데이터(고서한자) AI 허브
현존 고문헌의 대부분을 차지하고 있는 조선시대 고서의 원문 한자를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 고서 원문 내의 각 낱자 한자들에 대한 바운딩박스와 라벨링(유니코드 한자) 정보로 구성된 JSON 파일과 해당 고서 원문이미지 파일의 쌍으로 구성된 한자 글자수 기준 1천만 자 규모의 고서 한자... -
한국과학기술원 - 동영상 콘텐츠 하이라이트 편집 및 설명(요약) 데이터 AI 허브
뉴스, 유튜브 콘텐츠 등 영상을 수집하고 주요 장면의 위치를 레이블링 및 카테고리 항목에 대해 태깅하여 동영상 요약 학습용 데이터셋을 구축. 해당 데이터를 통해 인공지능 영상 요약 모델을 개발하고 자동화된 영상 편집 시스템을 제시.