-
주식회사 인피닉 - 스포츠 영상 데이터 (배구) AI 허브
협회 경기 영상과 다각도에서 직접 촬영한 경기 및 동작 영상을 이미지로 변환하여 구축한 데이터로 배구의 주요 객체 및 행동에 대한 정보가 포함되어 있음 -
솔트룩스파트너스 - 일상생활 및 구어체 한-중, 한-일 번역 병렬 말뭉치 데이터 AI 허브
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공 -
미니게이트 - 한국어-다국어(영어 제외) 번역 말뭉치(기술과학) AI 허브
기술과학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 기술과학 분야 다국어(중국어, 일본어) 번역 말뭉치 데이터 -
동양시스템즈 - 고서 한자 인식 OCR 데이터 AI 허브
현존 고문헌의 대부분을 차지하고 있는 조선시대 고서의 원문 한자를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 고서 원문 내의 각 낱자 한자들에 대한 바운딩박스와 라벨링(유니코드 한자) 정보로 구성된 JSON 파일과 해당 고서 원문이미지 파일의 쌍으로 구성된 한자 글자수 기준 1천만 자 규모의 고서 한자... -
한국지식재산연구원 - 산업정보 연계 주요국 특허 영-한 데이터 AI 허브
해외 주요국 영문 특허명세서를 전문가(변리사)가 관여한 한국어 번역, KSIC(표준산업분류) 라벨링 및 기술용어를 태깅한 데이터셋으로, 기술적 관점의 국제특허분류(IPC, International Patent Classification)가 아닌 통계청에 고시하고 있는 표준산업분류를 연계한 데이터를 통해 기술, 경제, 산업 간 유기적... -
㈜나라지식정보 - 문화, 게임 콘텐츠 분야 용어 말뭉치 AI 허브
인터넷 커뮤니티에서 발생하는 문화/게임 분야의 제품명, 서비스명, 특정 축약어, 특정 용어 등의 신조어 및 각종 용어를 수집, 라벨링 하여 기계가 빠르게 인식할 수 있도록 학습용 데이터를 구축함 -
㈜미디어그룹사람과숲 - 고소작업 현장 실시간 영상 데이터 AI 허브
고소작업 및 건설 근로자의 안전 실천의 기본인 안전장구류 검출 데이터 확보 및 안전고리 체결 유무, 과적 적재량, 난간에 기대는 행위, 신호수 위험인지 데이터 확보 및 cctv, lte 기반 안전모에 부착된 카메라, 액션캠을 활용하여 사각지대 없는 고소작업 현장 모니터링 AI응용 서비스를 통한 지능형 고소 작업현장 안전관리 구현 -
서울대학교병원 - 수면장애 진단을 위한 적외선 수면 동영상 데이터 AI 허브
수면다원검사(Polysomnography, PSG)중 촬영된 적외선 수면 동영상 및 해당 검사에 대한 판독 정보(검사 결과)가 담긴 어노테이션 파일 -
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터 AI 허브
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공 -
㈜스마트레이더시스템 - 4D 이미징 레이다 센서 기반의 동적 객체 인지 데이터 AI 허브
자율주행차에 설치된 4D 이미징 레이다 센서를 이용하여 고속도로와 도심 주행환경에서 수집된 동적객체 인식을 위한 데이터셋 구축 - 동적객체: 승용차, 버스, 트럭, 오토바이, 보행자, 특수목적차량, 자전거 -
㈜포티투마루 - 뉴스 기사 기계독해 데이터 AI 허브
국내 종합일간지 및 지역신문의 뉴스기사를 지문으로 활용, 자연어 질의 응답으로 이루어진 인공지능 학습 데이터 -
㈜미디어그룹사람과숲 - 서울시 노후 주택 균열 데이터 AI 허브
서울시 내 25개구 20년 이상 된 단독주택, 다세대주택, 연립주택, 아파트, 비주거용주택 총 5가지의 주택 유형에 대하여 총 7가지의 노후화 현상(균열, 박리, 철근 노출 등)을 일반 및 열화상 촬영을 동시 취득하여 외부 노후화 현상에 따른 내부(열화상) 현상을 비교 데이터로 데이터셋을 구성하여 노후 현상을 수치화 하여 건축물에... -
㈜엔에이치엔다이퀘스트 - OCR 데이터(교육) AI 허브
교육활동 과정에서 작성된 초중고 학생 손글씨 데이터를 이용하여 초중고 학생들의 교육활동을 지원하기 위한 에듀테크 산업에서 손글씨 문자 OCR 인식하는 AI 모델을 개발하기 위한 학습용 데이터