KNTTWIT2019100000001.csv
Sample
테이블 미리보기 준비 중...
컬럼 정보 준비 중...
항목 | 값 |
---|---|
파일명 | KNTTWIT2019100000001.csv |
파일 포맷 | CSV |
설명 | Sample |
데이터셋 설명 | 트위터 내의 사용자 포스트를 월별로 제공. 트위터 포스트의 원문 URL, 작성일시, 본문 등의 내용을 포하고 있으며, 분석을 위한 제목, 본문 텍스트의 형태소 분석 결과를 제공. |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://www.bigdata-telecom.kr/invoke/SOKBP2603/?goodsCode=KNTTWIT2019100000001 |
버전 | 2022-10-12 |
파일 크기 | 52 KB |
행 수 | 200 큼 |
컬럼 수 | 7 |
텍스트 인코딩 | utf-8 |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('KNTTWIT2019100000001.csv', on_bad_lines='skip', delimiter=',', encoding='utf-8', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
IDX | int64 | None |
SITENAME | string | None |
WRITE_DATE | string | None |
URL | string | None |
TITLE | float64 | None |
BODY | string | None |
MORPHEME | float64 | None |
항목 | 값 |
---|---|
column_info_url | https://www.bigdata-telecom.kr/invoke/SOKBP2603/get_datasetDescExcel/KNTTWIT2019100000001 |
생성일시 | 2023-09-28T16:23:36.584784 |
curl | curl 'https://www.bigdata-telecom.kr/invoke/SOKBP2603/getSample' -H 'Accept: application/json, text/javascript, */*; q=0.01' -H 'Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7,de;q=0.6' -H 'Cache-Control: no-cache' -H 'Connection: keep-alive' -H 'Content-Type: application/json' -H 'Origin: https://www.bigdata-telecom.kr' -H 'Pragma: no-cache' -H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36' -H 'X-Requested-With: XMLHttpRequest' --data-raw '{"goods_code":"KNTTWIT2019100000001"}' --compressed |
아이디 | cd02f758-e92a-4e67-a39d-76983f7cf5f6 |
메타데이터 수정일시 | 2023-09-28T16:23:36.560407 |
데이터셋 아이디 | 4da4139e-de5e-423b-b9c1-f17a7b192c82 |
상태 | active |
url | https://www.bigdata-telecom.kr/invoke/SOKBP8601/getBdpSampleFile/KNTTWIT2019100000001/csv |