KNTBLOG2019100000001.csv

Sample

테이블 미리보기 준비 중...

전체 화면 보기

컬럼 정보 준비 중...

전체 화면 보기

항목
파일명 KNTBLOG2019100000001.csv
파일 포맷 CSV
설명 Sample
데이터셋 설명

유명 블로그 내의 공개 포스트를 월별로 제공. 블로그 포스트의 원문 URL, 작성일시, 제목, 본문 내용을 포하고 있으며, 분석을 위한 제목, 본문 텍스트의 형태소 분석 결과를 제공.

url 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요)
원본 페이지 https://www.bigdata-telecom.kr/invoke/SOKBP2603/?goodsCode=KNTBLOG2019100000001
버전 2022-10-12
파일 크기754 KB
행 수 200
컬럼 수7
텍스트 인코딩utf-8
컬럼 구분자 , 콤마 (COMMA)

import pandas as pd

df = pd.read_csv('KNTBLOG2019100000001.csv', on_bad_lines='skip', delimiter=',', encoding='utf-8', encoding_errors='ignore')

컬럼 타입 샘플
IDX int64 None
SITENAME string None
WRITE_DATE string None
URL string None
TITLE string None
BODY string None
MORPHEME float64 None

항목
column_info_url https://www.bigdata-telecom.kr/invoke/SOKBP2603/get_datasetDescExcel/KNTBLOG2019100000001
생성일시 2023-09-28T16:23:38.267368
curl curl 'https://www.bigdata-telecom.kr/invoke/SOKBP2603/getSample' -H 'Accept: application/json, text/javascript, */*; q=0.01' -H 'Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7,de;q=0.6' -H 'Cache-Control: no-cache' -H 'Connection: keep-alive' -H 'Content-Type: application/json' -H 'Origin: https://www.bigdata-telecom.kr' -H 'Pragma: no-cache' -H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36' -H 'X-Requested-With: XMLHttpRequest' --data-raw '{"goods_code":"KNTBLOG2019100000001"}' --compressed
아이디 55de9827-b3e3-4292-aeee-27ff58205b14
메타데이터 수정일시 2023-09-28T16:23:38.198502
데이터셋 아이디 01d881ba-d81e-42ba-bcf0-3a8f344afa60
상태 active
url https://www.bigdata-telecom.kr/invoke/SOKBP8601/getBdpSampleFile/KNTBLOG2019100000001/csv