웹 크롤링 기초 2, 네이버에서 KPI200지수 얻어내기

네이버에서 KPI200지수 데이터 긁어오기를 해봅시다.

# -*- coding: utf-8 -*-
"""
Spyder Editor

This is a temporary script file.
"""

index_code = "KPI200" # KPI200 지수 코드입니다.
page_number = 1

# 긁어올 naver 금융 중에 KPI200지수 시세입니다.
naver_url = 'http://finance.naver.com/sise/sise_index_day.nhn?code=' + index_code + '&page=' + str(page_number)


from urllib.request import urlopen
source = urlopen(naver_url).read() # 긁어 와보리기
#print(source)


# 이제 긁어왔으니 beautifulSoup로 분석할 차례
import bs4
source = bs4.BeautifulSoup(source, 'lxml')
#print(source.prettify())

# html코드중에 테이블 속성에 td태그를 불러올것임!
td = source.find_all('td')
# print(len(td)) # 54개나있네

# 날짜 부분 1개 추출
d = source.find_all('table')[0].find_all('tr')[2].find_all('td')[0]
print(d)

그러니까 순서는 url따고,

python으로 url불러오고

beautifulsoup으로 조작하는 것이다.

본 글은 "파이썬으로 배우는 금융공학 레시피"를 기준으로 작성되었습니다.

저작자표시 (새창열림)

'개발 > Financial Programming' 카테고리의 다른 글

웹크롤링 기초3. 네이버 KPI200 지수 일별 체결가 추출 (html) (0)	2019.04.28
웹 크롤링 기초 1 (0)	2019.04.21

'개발 > Financial Programming' 카테고리의 다른 글

검색 태그

티스토리툴바