python/배운 내용 정리

파이썬 웹스크래핑으로 이미지 파일불러오기!

직장인코딩 2022. 10. 4. 22:10
반응형

 

import requests #requets 모듈 설치
from bs4 import BeautifulSoup # beautifulsoup 모듈 설치
import re
for i in range(5, 10): # 이것은 url 변수에 page 부분을 반복하기위해서 설정해놓았음
    url = "https://search.daum.net/search?w=tot&q=201{}%EB%85%84%EC%98%81%ED%99%94%EC%88%9C%EC%9C%84&DA=MOR&rtmaxcoll=MOR".format(i)
    res = requests.get(url) # requests의 get 함수로 url 정보를 받아주고
    res.raise_for_status() # 제대로 실행되는지 확인해주고
    soup = BeautifulSoup(res.text, 'lxml') # beautifulsoup 에 정보를 받아준다.

    images = soup.find_all("img", attrs={'class':'thumb_img'}) #image 파일을 find_all 함수로 찾아준다
    for idx, image in enumerate(images): #imgaes에 저장된 하나의 dic image에 정보를 하나 씩 저장
        print(image['src']) # 보니깐 dic 안에 src 부분이 이미지 url 이더라

        image_url = image['src']
        image_res = requests.get(image_url)
        image_soup = BeautifulSoup(image_res.text, 'lxml')

        with open('movie{}{}.jpg'.format(i, idx+1), 'wb') as f:
            f.write(image_res.content) # with open 함수로 파일로 바꿔주고 content라고 적어야 안에
             # 파일로 바뀐다.
        
        if idx >= 4:
            break
 
 

 

 

반응형