본문 바로가기
웹 프로그래밍(풀스택-->python)

32. Quiz_웹스크래핑(크롤링) 연습

by 백엔드개발자0107 2021. 4. 20.

 

이런식으로 웹스크래핑을 해보자!

 

import requests
from bs4 import BeautifulSoup

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(
    'https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303', headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

trs = soup.select(
    "#old_content > table > tbody > tr")

for tr in trs:
    a_tag = tr.select_one("td.title > div > a")
    if a_tag is not None:
        title = a_tag.text
        rank = tr.select_one("td:nth-child(1) > img")["alt"]
        star = tr.select_one("td.point").text

        print(rank, title, star)

 

이런식으로 코딩하면 된다.

 

단, 속성에 있는 값을 구하고자 할때는 rank["alt"]이런식으로 구하면 된다!

'웹 프로그래밍(풀스택-->python)' 카테고리의 다른 글

34. DB 개괄  (0) 2021.04.23
33. DB 설치 확인  (0) 2021.04.23
31. 웹스크래핑(크롤링) 기초  (0) 2021.04.20
30. 패키지 사용해보기  (0) 2021.04.19
29. 파이썬 패키지 설치하기  (0) 2021.04.17