-
㈜넥스인테크놀로지 - 금융, 법률 문서 기계독해 데이터 AI 허브
● 금융, 법률(ODT, HWP, PDF, 등) 포함, 다양한 영역의 복합데이터(텍스트, 테이블)를 대상으로 한 MRC QA학습 데이터 구축 ● 정답경계 추출형, Yes/No 단문형, Table 정답 추출형, 다지선다형 등의 다양한 융형의 학습 데이터 구축 및 기계독해 모델 개발 -
테스트웍스 - 수어 영상 AI 허브
지숫자, 지문자의 데이터 영상 생성을 통해 길찾기, 교통, 주소 등과 관련된 한국수어 인식 인공지능 기술 및 서비스 개발에 활용 가능한 총 536,000개의 영상 데이터 제공 -
파나시아 - 아산시 하천부지 점유현황 데이터 AI 허브
아산시 하천부지 점유현황 구축 데이터를 기반으로 국가전반의 국.공유지의 변화를 감지하여 무단점유 의심지역을 추출하는 AI 모델을 개발하기 위한 학습용 데이터 -
㈜알엠소프트 - 법률/규정 (판결서, 약관 등) 텍스트 분석 데이터 AI 허브
1만 건 이상의 판결문을 대상으로 기초사실, 주장 등을 가공한 데이터와 판례 내용을 기반으로 판결문 분석 데이터 구축, 1만 건 이상의 약관의 유·불리 조항 판단. 위법성과 유리 판단 이유 태깅 및 라벨링을 통해 소비자 입장에서의 유·불리 확인을 위한 법률 텍스트 분석 데이터셋 구축 -
고려대학교 산학협력단 - 소아 흉부 이미지 데이터 AI 허브
신생아에서 15세 청소년에 이르기까지 연령별 흉부 주요발병 질환별로 소아흉부 X-ray 영상과 폐 영역 및 병변 부위를 마스킹한 인공지능 학습용 영상 데이터 -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 통·번역 음성 데이터 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용... -
서울대학교 산학협력단 - 단계별 욕창 환부 이미지 데이터 AI 허브
욕창 환부 이미지 라벨링은 욕창 4단계 및 기타 감별 궤양, 정상 부위로 진행됨 욕창의 경우 1~4단계로 라벨링 기타 감별 궤양은 6종으로 미분류 욕창, 당뇨병성 궤양, 습윤 궤양, 의료기기 기반 조직 손상, 장시간 압력 노출 조직 손상, 심주조직 손상으로 라벨링 원천데이터는 .jpg, 라벨링데이터는 .json -
㈜엔에이치엔다이퀘스트 - OCR 데이터(금융 및 물류) AI 허브
금융과 물류 산업에서 많이 활용되는 서식 기반의 문서들을 인공지능이 자동으로 판독하는 모델 개발에 필요한 다양한 금융권 손필기 데이터와 선적 서류 인쇄물 OCR 데이터. 페이지 단위의 문서 이미지와 해당 이미지내 단어 또는 어절 영역을 4-포인트 폴리곤 박스로 그리고 해당 영역 내 라벨링 정보로 구성된 JSON 파일을 쌍으로 구성하여... -
㈜모토브 - 교통수단 판별 데이터 AI 허브
모바일 센서 데이터, 대중교통 카드 원시데이터 등 5종의 교통수단별 데이터와 교통수단, 환승형태 등의 교통수단 판별과 동선 예측을 위한 경로 학습용 데이터 구축 -
커뮤니케이션북스(주) - 문학작품 낭송․낭독 음성 데이터(시, 소설, 희곡, 시나리오) AI 허브
인간의 감정이 가장 풍부하게 드러난 문학 작품을 성우, 배우와 같은 감정 표현 전문가들이 낭독한 AI 합성용 음성 데이터이다. 시 장르가 131.5시간, 희곡/시나리오 166시간, 소설 159시간으로 총 456.6시간을 구축하였다. -
오피니언라이브 - K-Fashion 이미지 AI 허브
패션 영역과 속성, 스타일 정보를 인식 및 도출할 수 있도록 학습용 이미지 데이터셋을 구축하고, 한국형 패션 인지 및 트렌드 파악과 AI기반 시각지능 기술 및 서비스 개발에 활용 -
(사)캠틱종합기술원 - 진안홍삼 품질 데이터 AI 허브
비파괴 방식을 통해 진안홍삼의 내부품질(내공/내백) 데이터를 확보하기 위한 목적으로, 진안 내에 소재한 홍삼 가공업체 저장고에 비축된 진안홍삼의 X-ray 학습데이터 구축. 데이터 구축량은 360,000장이며, 홍삼 1개당 top, bottom, side 중 홍삼 형태에 따라 2개 단면에서 촬영(총 18만개 이상 홍삼 객체 사용) -
㈜피씨엔 - 안구 움직임 영상 데이터 AI 허브
자연스러운 눈의 움직임과 시선 관련 기술 성숙도를 올리기 위해 거리에 따른 안구 움직임 영상과 VR헤드셋 내부에서의 안구 움직임 영상 데이터 -
㈜미디어그룹사람과숲 - 자연 및 인공적 발생 非언어적 소리 데이터 AI 허브
– 자연적, 인공적으로 발생하는 각종 비언어적인 소리 데이터 – 대분류 10개, 중분류 28개, 소분류125개의 데이터셋 구축 -
제주특별자치도 - 제주 주요작물 자동탐지 데이터 AI 허브
제주특별자치도 농업정책의 주요작물 15종(식량작물 5종, 월동작물 10종)에 대한 재배지역 학습데이터 구축 및 재배현황 파악 후 다양한 농업정책 활용성 제공 -
서경대학교 산학협력단 - 주요 화훼류 품질 데이터 AI 허브
주요 화훼류 품목 9종(장미, 국화, 백합, 거베라, 접목선인장, 심비디움, 호접란, 스킨답서스, 고무나무)에 대해 유통환경별(농가/유통센터/도소매점) 정상 및 중결점 이미지데이터와 유통환경모니터링데이터 수집을 통해 학습용 데이터 120만장 이상 구축 -
㈜엔에이치엔다이퀘스트 - OCR 데이터(옛한글) AI 허브
옛한글을 자동으로 인식 및 판독하는, 인공지능 모델 개발에 필요한 대규모 OCR 데이터. 고문헌 및 고문서의 옛한글 이미지와 해당 이미지 내 개별 글자들을 바운딩 박스로 그리고 해당 영역 내 라벨링 정보로 구성된 JSON 파일을 쌍으로 구성하여 글자 수 기준 1천만 자 이상의 규모로 구축. -
흥일기업 - 로봇 관점 주행 영상 AI 허브
실내 자율주행 로봇 관점의 주행 환경 영상기반 학습용 데이터 -
㈜마크클라우드 - 유사 상표 이미지 검색 서비스의 사용자 입력 이미지 데이터 AI 허브
유사 상표 검색 서비스의 사용자가 서비스를 이용하며 입력한 상표 이미지를 수집 및 정제하고 상표 도형분류코드인 ‘비엔나코드’ 중분류 기준으로 가공하여 구축한 인공지능 학습용 데이터 셋 -
㈜엔에이치엔다이퀘스트 - OCR 데이터(공공) AI 허브
일반 국민 생활과 밀접한 관련성이 높은 지방자치단체 (창원특례시, 김해시)와 외교 용어가 다수 포함되어있는 외교사료관 공공문서를 수집, 가공하여, 문서에 포함되어있는 다양한 문자 유형(인쇄체, 타자체, 수기 등)의 OCR 문자 인식 기술개발을 위한 인공지능 학습용 데이터셋