-
미디어젠㈜ - 한국어 아동 음성 데이터 AI 허브
고품질 한국어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
㈜ 트위그팜 - 전문분야 영-한·중-한 번역 말뭉치 (식품) AI 허브
• 신경망 기반 기계 번역기 학습 데이터로 활용하기 위한 영한, 중한 말뭉치 • 식품 전문 분야 번역기의 성능 향상을 위한 학습용 데이터 -
㈜포티투마루 - 행정 문서 대상 기계독해 데이터 AI 허브
행정문서를 활용하여 기계독해 모델 생성을 위한 지문-질문-답변으로 구성된 인공지능 학습 데이터 -
주식회사 케이티알파 - 숫자가 포함된 패턴 발화 데이터 AI 허브
본 데이터는 한자어, 고유어, 외래어 등의 숫자 읽기 다양성을 반영하여 84개의 카테고리로 구성된 10,000시간 이상의 음성데이터로 구성하였음. (스크립트 데이터 포함) -
미디어젠㈜ - 학습용 아동 영어 음성 데이터 AI 허브
고품질 영어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
㈜ 트위그팜 - 방송 콘텐츠 한-중, 한-일 번역 병렬 말뭉치 데이터 AI 허브
• 신경망 기반 기계 번역기 학습 데이터로 활용하기 위한 한중, 한일 말뭉치 • 방송 콘텐츠 분야 번역기의 성능 향상을 위한 학습용 데이터 -
㈜ 트위그팜 - 일상생활 및 구어체 한-영 번역 병렬 말뭉치 데이터 AI 허브
• 신경망 기반 기계 번역기 학습 데이터로 활용하기 위한 한영, 영한 말뭉치 • 일상생활 및 구어체 번역기의 성능 향상을 위한 학습용 데이터 -
한국과학기술원 - 언어 기반 이미지 편집 데이터 AI 허브
컬러 변환, 편집 대상, 모양 변환의 다양한 편집 기능을 고려한 원본 이미지 파일을 수집하고 편집 명령어에 따른 편집 이미지를 획득하여 언어(텍스트) 명령어를 통한 사진 편집 기술에 활용될 수 있는 학습 데이터셋 구축. 해당 데이터를 통해 인공지능 이미지 편집모델을 구현하고 실제 서비스를 개발하여 활용될 수 있도록 함. -
㈜ 트위그팜 - 기술과학 분야 한-영 번역 병렬 말뭉치 데이터 AI 허브
• 신경망 기반 기계 번역기 학습 데이터로 활용하기 위한 한영, 영한 말뭉치 • 기술과학 번역기의 성능 향상을 위한 학습용 데이터 -
서울대학교 - 안내 로봇 인터랙션 멀티모달 AI 허브
안내 서비스를 수행하는 로봇시점 영상 및 음성 데이터 -
㈜와이즈넛 - 요약문 및 레포트 생성 데이터 AI 허브
다양한 한국어 원문 데이터로부터 정제된 추출 및 생성 요약문을 도출하고 검증한 한국어 문서요약 AI 데이터셋으로, 추출요약을 포함하여 본문에서 중요한 문장을 하나의 새로운 요약문으로 창조하는 생성요약(Abstractive Summarization)을 위한 데이터 세트를 구축하고 이를 실제 모델에 학습 -
㈜와이즈넛 - 방송 콘텐츠 대본 요약 데이터 AI 허브
정제가 완료된 다양한 방송 콘텐츠 대본 데이터로부터 생성 요약문을 도출한 방송 콘텐츠 대본 요약 AI 데이터셋으로, 방송 데이터의 분류는 물론, 대사의 요약, 상황 묘사, 상황 추론의 데이터를 구축함으로써 방송콘텐츠의 보존과 더불어 재활용의 가치를 부여하여 방송콘텐츠의 재생산, 유통을 활성화 -
포티투마루 - 도서자료 기계독해 AI 허브
기존 AI 질의응답 서비스의 기반이 되어온 지식베이스(Knowledge Base)가 가진 한계 및 비효율성 등을 극복하기 위해 자연어 형태의 질의를 받아 지식 정보를 제공하는 서비스에 활용할 수 있는 딥러닝 기반 기계 독해 학습데이터셋 구축 -
(주)티맥스에이아이 - 에세이 글 평가 데이터 AI 허브
다양한 학년군의 에세이 및 에세이 평가 점수로 구성된 데이터 • 에세이는 전문가의 자문을 통해 구성된 50가지 주제로 구성되어 있음 • 에세이에 대한 평가는 3인의 전문가 평가를 통해 이뤄졌으며, 최대 11가지 평가항목으로 이뤄진 루브릭을 통해 데이터의 신뢰성을 높임 -
미디어젠㈜ - 화자 인식용 음성 데이터 AI 허브
화자의 여러 발화 패턴으로부터 발화자를 구분할 수 있는 화자인식 인공지능을 훈련하기 위한 데이터셋 -
솔트룩스파트너스 - 일상생활 및 구어체 한-중, 한-일 번역 병렬 말뭉치 데이터 AI 허브
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공 -
㈜데이터드리븐 - 학생 청소년 핵심역량분석 교육 데이터 AI 허브
실제 교육 현장에서 학생을 관찰한 텍스트데이터를 정규화하여, 정규화된 결과를 교육적 역량으로 치환하고 이를 기준으로 수업기록을 교육 전문가를 통한 어노테이션을 진행하여, 교육 텍스트에서 정량적 역량 점수를 예측할 수 있는 인공지능 학습용 데이터셋 -
미디어젠㈜ - 다화자 가창 데이터 AI 허브
저작권 포함 미디/가사파일 구매하여 발라드/R&B, 락/팝, 트로트 장르를 대상으로 1,500곡을 18명의 가수에게 분배되어 총 4,500개의 음성 데이터를 구축. -
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터 AI 허브
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공