-
누리IDT - 고서 한자 인식 (OCR) AI 허브
고서 한자 이미지를 인식하기 위한 이미지 데이터 -
동양시스템즈 - 고서 한자 인식 OCR 데이터 AI 허브
현존 고문헌의 대부분을 차지하고 있는 조선시대 고서의 원문 한자를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 고서 원문 내의 각 낱자 한자들에 대한 바운딩박스와 라벨링(유니코드 한자) 정보로 구성된 JSON 파일과 해당 고서 원문이미지 파일의 쌍으로 구성된 한자 글자수 기준 1천만 자 규모의 고서 한자...