국립국어원 - 서울말 낭독체 발화 말뭉치
리소스
-
PDF
NIKL_SEOUL_v2.0.pdf
PDF
NIKL_SEOUL_v2.0.pdf
항목 | 값 |
---|---|
CKAN dataset id | 1c5686b8-389c-4fdd-a12c-862af5d800b0 |
상태 | active |
url | https://kli.korean.go.kr/main/requestMain.do?tabType=thumb&lang=ko&keyword=서울말 낭독체 발화 말뭉치 |
버전 | 1900-01-01 |
라이선스 | cc-zero |
pricing | 무료 |
유/무료 | 무료 |
최초 수집 일시 | 2023-12-05T21:05:48… |
최근 수집 일시 | 2024-04-21T16:12:37… |
-
문화체육관광부 국립국어원 국회 회의록 말뭉치 2021 공공데이터포털
2021년 국립국어원 국회 회의록 말뭉치 구축 사업을 통해 구축된 말뭉치입니다. 2003년부터 2020년까지 국회 소위원회 회의록을 대상으로 구축한 말뭉치로 발화 내 한자로 기록된 용어나 이름을 한글로 변환하였고, 행동이나 상황 묘사와 원어 삽입구를 정제하였습니다. LINK 미리보기 -
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터 AI 허브
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공 -
솔트룩스파트너스 - 일상생활 및 구어체 한-중, 한-일 번역 병렬 말뭉치 데이터 AI 허브
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공 -
인사이트베슬 - 대화/구어체 한영 말뭉치 코퍼스 데이터 15만 건 [데이터셋1호] 디지털 산업혁신 빅데이터 유료
실제 대화, 발화, 영상을 번역하면서 파생된 한영 말뭉치. 한영/영한 번역 AI에 필수적인 데이터이며 추가로 코퍼스 연구나 언어 교육 자료 제작에도 사용될 수 있는 데이터. 1차 MTPE로 생성되었고, 2차, 3차 전문가 교정, 4차 데이터 검수 완료