㈜솔트룩스 - 방송 콘텐츠 대화체 음성인식 데이터
리소스
-
PDF
★데이터구축가이드라인_세부1(최종).pdf
PDF
★데이터구축가이드라인_세부1(최종).pdf
-
PDF
★데이터설명서_1-1주제별음성_방송_20220128.pdf
PDF
★데이터설명서_1-1주제별음성_방송_20220128.pdf
항목 | 값 |
---|---|
CKAN dataset id | f447d219-9ed6-4c97-bce4-ed58f5c7feff |
상태 | active |
url | https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=463 |
버전 | 2023-12-12 |
라이선스 | cc-zero |
pricing | 무료 |
담당자 | 2 |
담당자 연락처 | 음성인식 |
업데이트일 | 2,023-12-12 |
유/무료 | 무료 |
이용방법 | 다운로드 |
제공 기관 | 수행기관(주관) : ㈜솔트룩스 |
최초 제공일 | 2,022-05-27 |
파일 크기 | 900,767,567,847 |
최초 수집 일시 | 2022-09-18T08:18:38… |
최근 수집 일시 | 2024-02-28T10:58:29… |
-
㈜솔트룩스 - 방송콘텐츠 대화체 음성인식 데이터 AI 허브
방송콘텐츠 상에서 한국인 대화체의 음성인식(STT) 기술 및 문맥을 이해하는 언어처리 기술 개발을 위한 인공지능 학습용 데이터로서 8개 카테고리, 대화체 음성인식, 문장별 의도 인공지능 학습용으로 정제된 7,000시간의 음성 데이터 -
㈜솔트룩스 - 주요 영역별 회의 음성인식 데이터 AI 허브
실제 환경, 시사토론, 독서모임, 온라인회의, 방송에서의 자연스러운 환경과 잡음이 결합된 회의 형태의 발성, 발음을 확보하기 위해 실제 환경에서 대화하는 TV, 라디오의 고품질 방송 콘텐츠, 의회 녹취록, UCC 음성 및 주제를 정한 직접 녹음 음성데이터를 wav 파일 형식으로 수집, 정제하여 발화자 말바뀜과 억양구 단위 경제정보를...