-
㈜씨유박스 - 마스크 착용 한국인 안면 이미지 데이터
마스크 착용이 일반화된 상황에서 마스크 착용 시에도 활용 가능한 얼굴 인식 시스템 개발을 위해서 외국인 마스크 착용 안면 이미지 데이터보다 상대적으로 수가 부족한 한국인 마스크 착용 안면 데이터 구축 마스크에 가려진 안면 모습의 추정, 안면 생체 인식 시스템 등 얼굴 인식과 관련된 다양한 분야에서 활용을 목표 -
에스프레소미디어 - 초해상화(Super Resolution) 이미지
저해상도 영상에서 고해상도 영상을 추론하는 자동화 기술 개발을 위한 다양한 일상생활에서의 고해상도, 저해상도 이미지데이터 -
커뮤니케이션북스(주) - 문학작품 낭송․낭독 음성 데이터(시, 소설, 희곡, 시나리오)
인간의 감정이 가장 풍부하게 드러난 문학 작품을 성우, 배우와 같은 감정 표현 전문가들이 낭독한 AI 합성용 음성 데이터이다. 시 장르가 131.5시간, 희곡/시나리오 166시간, 소설 159시간으로 총 456.6시간을 구축하였다. -
한국외국어대학교 - 한-영 및 한-중 음성발화 데이터
다국어 음성 합성을 위한 같은 의미의 한국어-영어/ 한국어-중국어 AI 학습용 데이터 구축 -
한국외국어대학교 - 한영 혼합 인식 데이터
대화 중 자연스럽게 구사되는 영문 단어(외래어 및 외국어) 및 관용적 표현이 포함된 문장과 스크립트를 통해 AI 학습용 데이터 구축 -
심심이㈜ - 공감형 대화
인간과 같이 공감할 수 있는 능력을 갖고 자연스러운 공감 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 화자(감정화자)에게는 주어진 ‘감정과 상황에 처해진 것처럼 대화’하라는 임무를, 다른 화자(공감화자)에게는 ‘상대방에게 적절하게 공감’하라는 임무를 부여한 후 생성한 대화 데이터 HTML 미리보기 -
심심이㈜ - 지식검색 대화
인간과 자연스럽게 전문적인 지식과 관련된 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 화자(질문자)에게는 특정 주제에 대해 ‘궁금한 것처럼 자연스럽게 대화하라’는 임무를, 다른 화자(전문가)에게는 ‘전문가인 것처럼 자연스럽게 대화하라’는 임무를 부여한 후 전문가가 인터넷 검색을 통해 답변한 대화 데이터... -
심심이㈜ - 페르소나 대화
실제 인간과 같이 자연스럽고, 본인의 일관된 페르소나에 기반하여 발화하는 연속 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 사람의 성별, 연령, 직업, 성격, 취향 등을 표현하는 짧은 문장 5개로 구성된 페르소나를 구축한 후 임의의 페르소나를 각 화자(생성자)에게 부여해 ‘이 사람인 것처럼 자연스럽게... -
㈜엔에이치엔다이퀘스트 - OCR 데이터(공공)
일반 국민 생활과 밀접한 관련성이 높은 지방자치단체 (창원특례시, 김해시)와 외교 용어가 다수 포함되어있는 외교사료관 공공문서를 수집, 가공하여, 문서에 포함되어있는 다양한 문자 유형(인쇄체, 타자체, 수기 등)의 OCR 문자 인식 기술개발을 위한 인공지능 학습용 데이터셋 HTML 미리보기 -
㈜마크클라우드 - IP산업의 상표권 보호를 위한 오프라인 상표 이미지 데이터
◾ 오프라인에서 수집한 간판, 의류잡화, 종이인쇄물에 있는 상표 이미지 데이터를 비엔나 코드 분류 기준으로 가공, 정제하여 구축한 인공지능 학습용 데이터셋 구축 HTML 미리보기 -
-
㈜마크클라우드 - 해외상표 이미지 AI 데이터
전문가(변리사)가 관여된 해외 상표 및 비엔나 코드(Vienna code) 라벨링을 통한 인공지능 학습데이터 HTML 미리보기 -
㈜컴버스테크 - 특수환경 자율주행 3D 데이터 고도화
다양한 환경에서 객체를 인식하기 위한 3D 데이터를 고도화하여 재정제 및 3D 세그멘테이션으로 전방위 가공하여 구축한 학습데이터 HTML 미리보기 -
셀파이엔씨(주) - 3D 지표투과레이더 탐사 데이터
2015~2022년까지 서울 주요 도로에서 획득한 공동데이터와 공동탐사 전문업체의 데이터를 활용한 데이터 구축 HTML 미리보기 -
㈜딥로딩 - 연령대별 특징적 발화(은어·속어 등) 음성 데이터
문맥 이해 및 인식 성능개선을 위해 다양한 연령대별 특징적 발화(은어·속어 등) 음성 데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 이때 학습 데이터셋은 녹음한 음성 파일이며, 전사데이터는 txt 기반의 데이터 셋 목록 및 메타 정보로 구성됨. -
(주)에스엠시스템즈 - 개인 특정을 위한 자필과 모사 필기체 데이터
본 데이터는 수능과 모의평가에서 사용된 최근 5년 내의 문구 30개를 선정하여 디지털펜에서 수집된 필압, 필기속도 등의 필기속성 24종으로 필적감정을 통한 개인의 필체와 그 필체를 모사하여 개인 특정의 지표가 될 수 있는 데이터 HTML 미리보기 -
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터 HTML 미리보기 -
경상북도 - 상수원-취수원 통합 수질 및 녹조 데이터
상수원-취수원 통합 수질 및 녹조 데이터 HTML 미리보기 -
㈜새한지앤아이 - 태양광 발전 현황 및 적지 분석 데이터
태양광 발전 패널 분포, 시설 현황 분석, 신규 설치 최적지 선정을 위한 태양광 패널 및 옥상 이미지 데이터 HTML 미리보기 -
㈜아이렘기술개발 - 해양침적쓰레기 이미지 데이터 고도화
해양침적쓰레기 9종(어망, 통발, 유리, 금속, 플라스틱, 나무, 로프, 타이어, 고무)에 대해 총 7만장 이상의 이미지 데이터를 구축 HTML 미리보기 -
㈜카이로스랩 - 실험기반 재료 물성 데이터
인공지능 기반의 금속 물성 예측 모델에 활용 될, 금속 재료의 방대한 조성 영역에 대해 전기물성, 기계물성, 구조물성 및 표면/단면 주사현미경 이미지를 데이터베이스화 함. HTML 미리보기 -