sample_c99a3f60-5a1e-11eb-ab1e-c10ff631dc21.csv

샘플 데이터

테이블 미리보기 준비 중...

전체 화면 보기

컬럼 정보 준비 중...

전체 화면 보기

항목
파일명 sample_c99a3f60-5a1e-11eb-ab1e-c10ff631dc21.csv
파일 포맷 CSV
설명 샘플 데이터
데이터셋 설명

※ 본 데이터는 매 월 단위로 작성 및 배포됩니다.

■ 데이터 개요 ※ 음식 블로그 데이터 POS 데이터 중 큰 비중을 차지하고 있는 요식업 POS 가맹점에 대해 이용객의 소비 패턴을 파악하기 위해 맛집 블로그 내용에 대한 수집을 시행하였습니다. ※ 메뉴 트렌드 데이터 음식 블로그 데이터 내에서 표준 품목(메뉴)에 대한 언급 횟수를 수치화한 데이터입니다. 한 게시글 내에서 언급되는 횟수를 모두 고려할 경우 짧은 글에 비해 긴 글에 대한 편향이 존재할 수 있기 때문에 언급 횟수는 한 게시글 당 한 번으로 제한하였습니다.

■ 데이터 형태 ※ 음식 블로그 데이터 블로그에 대한 주소와 게시일, 제목, 본문 내용 등이 제공됩니다. 개인정보 유출에 대한 우려가 존재할 수 있기 때문에 숫자 및 영문 텍스트 데이터는 모두 제거하였습니다. ※ 메뉴 트렌드 데이터 메뉴 트렌드를 보고자 하는 기준년월과 메뉴 코드, 메뉴명, 총 게시글 수, 게시글 당 평균 언급 수 등이 제공됩니다.

■ 데이터 산출 과정 1. 블로그 데이터 수집을 위한 크롤러 작성 2. 맛집 블로그 내용 수집 3. 텍스트 데이터 전처리 및 개인정보 제거 4. 블로그 데이터에 대한 게시글 언급 수 계산

■ 데이터 컬럼 설명 BLOG_URL(블로그URL) : 블로그 URL SRCH_WRD_NM(검색단어명) : 블로그 게시글을 찾기 위한 검색어 PSTG_YMD(게시일자) : 블로그 게시물이 게시된 날짜 SRCH_CN(검색내용) : 검색 결과에 출력되는 짧은 문장 NTT_TTL(게시물제목) : 블로그 게시글 제목 BLOG_CN(블로그내용) : 블로그 게시글 본문

url 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요)
원본 페이지 https://kadx.co.kr/opmk/frn/pmumkproductDetail/c99a3f60-5a1e-11eb-ab1e-c10ff631dc21/5
버전 2023-01-19
파일 크기5 KB
행 수 1 100건 이하의 작은 데이터
컬럼 수6
텍스트 인코딩utf-8
컬럼 구분자 , 콤마 (COMMA)

import pandas as pd

df = pd.read_csv('sample_c99a3f60-5a1e-11eb-ab1e-c10ff631dc21.csv', on_bad_lines='skip', delimiter=',', encoding='utf-8', encoding_errors='ignore')

컬럼 타입 샘플
BLOG_URL string None
SRCH_WRD_NM string None
PSTG_YMD int64 None
SRCH_CN string None
NTT_TTL string None
BLOG_CN string None

항목
column_info_url https://kadx.co.kr/cmm/fms/frnFileDown.do?atchFileId=kadxDataDetail474&fileSn=0
생성일시 2022-09-14T13:35:07.739812
아이디 995e8296-1dea-4827-9a73-ccf45182c14f
key https://kadx.co.kr/cmm/fms/frnFileDown.do?atchFileId=FILE_000000000001211&fileSn=0
메타데이터 수정일시 2023-10-08T16:33:37.136821
데이터셋 아이디 8682ab17-6307-4bcc-933b-29df904e550b
상태 active
url https://kadx.co.kr/cmm/fms/frnFileDown.do?atchFileId=FILE_000000000001211&fileSn=0