-
피씨앤 - 랜드마크 이미지 AI 허브
인공지능 기반의 컴퓨터 비전 기술 및 서비스 개발에 활용하기 위해 국내 특성(지리 공간적, 기능적)이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터 구축 -
동양시스템즈 - 대용량 손글씨 OCR 데이터 AI 허브
산업 및 실생활에서 사용되는 각종 신청서등에 포함된 다양한 한글 손글씨를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 다양한 손글씨 원문을 수집하고 작성된 손글씨에 대한 바운딩박스와 라벨링 정보로 구성된 JSON 파일과 해당 손글씨 원문이미지 파일의 쌍으로 구성된 OCR AI 학습용 데이터셋 -
㈜아이엠알 - 도시 소리 데이터 AI 허브
도시 소리/소음에 대한 대분류 3종, 중분류 10종, 소분류 24종의 73,864건의 인공지능 학습용 데이터 -
미래아이티(주) - 부품 품질 검사 영상 데이터(자동차) AI 허브
자동차 부품의 품질 검사 이미지를 수집한 데이터셋으로, 도어, 프레임, 라디에이터 그릴, 루프사이드, 배선, 범퍼, 카울커버, 커넥터, 테일/헤드 램프, 휀더 데이터를 포함하며, 재사용에 제한이 없도록 저작권 문제를 완전히 해결한 원천 데이터를 확보 -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 번역 말뭉치 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용... -
㈜디아이솔루션 - 유동 인구 분석을 위한 CCTV 영상 데이터 AI 허브
총 7곳의 상권으로부터 CCTV 화각을 고려하여 수집된 데이터셋으로, 촬영 시간 및 촬영 장소의 다양성을 추구하며 비식별화를 통해 개인정보 문제를 해결한 학습용 데이터셋 -
데이터리(Data.ly) - 민원 업무 자동화 인공지능 언어 데이터 AI 허브
창원시로부터 제공받은 콜센터 및 민원게시판(국민신문고) 원시 데이터에 학습에 필요한 정보(개체명, 의도분류, 부서정보, 키워드 등)를 부착하고 유사문장생성을 통해 표현의 다양성과 언어이해 능력을 향상한 인공지능 데이터셋 -
누리IDT - 고서 한자 인식 (OCR) AI 허브
고서 한자 이미지를 인식하기 위한 이미지 데이터 -
미니게이트 - 한국어-다국어 번역 말뭉치(기초과학) AI 허브
기초과학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 기초과학 분야 다국어(영어, 중국어, 일본어) 번역 말뭉치 데이터 -
서울대학교 산학협력단 - 화상 이미지 및 임상 데이터 AI 허브
화상 진단을 보조하고 화상 단계를 판정하는 인공지능 기술 개발을 위한 데이터로 본 데이터를 통해 화상 치료의 표준화를 이루고 의료비 상승을 촤소화 하고자 함 -
㈜아와소프트 - 교통법규 위반 상황 데이터 AI 허브
스마트 국민 제보를 통하여 촬영된 교통법규 위반 상황중 신호위반, 안전모미착용, 중앙선침범, 진로변경위반에 해당하는 영상 데이터를 경찰청으로부터 제공받아 AI 학습시 교통법규 위반 상황별 분류 가능한 형태의 AI 데이터로 가공함. -
고려대학교산학협력단 - 의료, 법률 전문 서적 말뭉치 AI 허브
저작재산권 이용허락을 확보한 의료 및 법률 분야 핵심 전문 도서와 분야 전문성과 최신성을 갖춘 특허(의료), 판결문(법률)을 기반으로 1억 어절의 데이터셋을 구축 -
서울대병원 - 고해상도 분자조직학 이미지 데이터 AI 허브
4532명 환자의 신장 및 소아 장 전자현미경 이미지와 다양한 질환(1차성 사구체 질환, 소아 장 운동장애 질환 등) 영역 라벨링 및 관련 임상 정보를 포함한 신장 및 소아 장 병리 진단을 위한 AI 학습용 데이터셋 -
(주)에버트란 - 방송콘텐츠 한국어-영어 번역 말뭉치 AI 허브
인공지능 학습용 다국어 방송콘텐츠 번역 말뭉치 구축 방송 콘텐츠 분야의 영어, 스페인어, 러시아어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 통·번역 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural... -
서울대학교 산학협력단 - 소아청소년 피부질환 이미지 데이터 AI 허브
40가지 소아청소년 피부질환 진단을 보조하고 아토피피부염의 중증도를 판정하는 인공지능 알고리즘 개발을 위한 데이터셋 58,186건 -
㈜마크클라우드 - 해외상표 이미지 AI 데이터 AI 허브
전문가(변리사)가 관여된 해외 상표 및 비엔나 코드(Vienna code) 라벨링을 통한 인공지능 학습데이터 -
㈜마크클라우드 - IP산업의 상표권 보호를 위한 오프라인 상표 이미지 데이터 AI 허브
◾ 오프라인에서 수집한 간판, 의류잡화, 종이인쇄물에 있는 상표 이미지 데이터를 비엔나 코드 분류 기준으로 가공, 정제하여 구축한 인공지능 학습용 데이터셋 구축 -
㈜우경정보기술 - 실내외 군중 특성 데이터 AI 허브
군중의 규모 및 이동방향 예측을 활용하여 군중의 상황을 분석 유추할 수 있는 기반 마련을 위하여 군중특성데이터를 인공지능 모델을 학습시켜 상황인지, 예측 및 다양한 군중특성에 대한 마케팅, 고객분석, 정책 제안 등에 활용 -
미래아이티(주) - 부품 품질 검사 영상 데이터(선박·해양플랜트) AI 허브
다양한 선박 및 해양플랜트 부품의 품질 검사 이미지를 수집한 데이터셋으로, FPSO 배관, 버트/파이프/필렛 조인트, 모재, 선체, 케이블, 보온재, 덕트 데이터를 포함하며, 재사용에 제한이 없도록 저작권 문제를 완전히 해결한 원천 데이터를 확보 -
㈜미디어그룹사람과숲 - 물류창고 내 작업 안전 데이터 AI 허브
물류창고 내 사고 및 위험 발생 가능성을 사전 파악할 수 있도록 작업환경 안의 각 객체에 대한 정보를 기반으로 하는 AI 학습용 데이터를 구축하고 대형화 및 고밀도화되는 분야로서 현장 작업자들의 안전과 효율적인 작업을 책임질 수 있는 AI 서비스 제공