SSN000040_202109.csv
샘플 데이터
테이블 미리보기 준비 중...
항목 | 값 |
---|---|
파일명 | SSN000040_202109.csv |
파일 포맷 | CSV |
설명 | 샘플 데이터 |
데이터셋 설명 | 포털 사이트에서 식품명을 검색했을 때 표출되는 컨텐츠의 순위를 보여주는 데이터입니다. 소고기, 곱창, 마라탕, 국수 등 세상에는 맛있는 음식이 참 많습니다. 사람들은 요리를 위해 레시피를 검색하거나, 필요한 재료를 주문하기 위해 식품명을 검색해보곤 하는데요. 해당 데이터는 사람들이 주로 검색하는 식품명 키워드를 리스트업 한 후, 키워드를 포털 사이트에 검색했을 때 표출되는 검색결과 중 5개 음식 관련 서비스의 콘텐츠 제목과 내용을 담았습니다. 해당 식품 키워드와 관련하여 어떤 컨텐츠들이 노출되고 있는지, 전날과 비교했을 때 콘텐츠 순위가 어떻게 변동됐는지 등을 볼 수 있어 식품 관련 컨텐츠의 트렌드 변화를 확인할 수 있습니다. [데이터 상세 정보] 1) 추출 일자: 2021년 9월 30일 2) 포함 컬럼: 기준일자, 채널명, 식품검색키워드명, 포털컨텐츠제목, 포털컨텐츠내용, URL주소, 순위, 순위전일대비변동 |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://kdx.kr/data/view/30741 |
버전 | 2021-10-28 |
파일 크기 | 39 MB |
행 수 | 13 100건 이하의 작은 데이터 |
컬럼 수 | 9 |
텍스트 인코딩 | utf-8 |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('SSN000040_202109.csv', on_bad_lines='skip', delimiter=',', encoding='utf-8', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
STD_DATE | float64 | 20210930.0 |
PORTAL_NM | string | N |
SRCH_KWRD_NM | string | 鴻 |
CONTS_SJ | string | 戚耕 陥 猿獄鍵 鴻! 嬢胸惟 左淫拝猿!? 苑鴻左淫狛 - 推軒研 荘位惟~ 幻鯵税.... |
CONTS_CN | string | 照苑鴻精 嬢卓 左淫背醤走 忽掘亜 照持奄澗走推 硝呪 赤聖猿推神献楕 傾獣杷 腰硲研 左檎 照苑鴻 左淫狛戚 赤岩艦陥. 姶紫杯艦陥. |
URL_ADDR | string | https://www.10000recipe.com/recipe/6876903 |
RANK | float64 | 99.0 |
RANK_CHG | float64 | 0.0 |
Unnamed: 8 | float64 | nan |
항목 | 값 |
---|---|
생성일시 | 2023-09-09T20:05:03.560987 |
curl | curl 'https://kdx.kr/product/getCsvSampleDataList' -H 'Accept: application/json, text/javascript, */*; q=0.01' -H 'Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7,de;q=0.6' -H 'Cache-Control: no-cache' -H 'Connection: keep-alive' -H 'Content-Type: application/x-www-form-urlencoded; charset=UTF-8' -H 'Pragma: no-cache' -H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36' -H 'X-Requested-With: XMLHttpRequest' --data-raw 'product_id=30741' --compressed |
아이디 | 4d203616-2e85-4a5e-aaa0-761a179a6a61 |
key | SSN000040_202109.csv |
메타데이터 수정일시 | 2023-09-09T20:05:03.536863 |
데이터셋 아이디 | 5e28fc7f-8754-448c-b6da-8fe0ed7ca07d |
상태 | active |