-
데이터리(Data.ly) - 민원 업무 자동화 인공지능 언어 데이터 AI 허브
창원시로부터 제공받은 콜센터 및 민원게시판(국민신문고) 원시 데이터에 학습에 필요한 정보(개체명, 의도분류, 부서정보, 키워드 등)를 부착하고 유사문장생성을 통해 표현의 다양성과 언어이해 능력을 향상한 인공지능 데이터셋 -
솔트룩스 - 온라인 구어체 말뭉치 데이터 AI 허브
온라인 플랫폼(게시판, 댓글 등)에서 구어체 위주의 텍스트 데이터를 수집 후 전사 도구를 활용하여 구축된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋 -
솔트룩스 - 대규모 웹데이터 기반 한국어 말뭉치 데이터 AI 허브
웹사이트 기반 (메가뉴스) 대용량의 텍스트 데이터를 수집 후 전사 도구를 활용하여 타이틀, 단락 제목, 본문 텍스트가 구조화된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋