반응형
import requests #requets 모듈 설치
from bs4 import BeautifulSoup # beautifulsoup 모듈 설치
import re
for i in range(5, 10): # 이것은 url 변수에 page 부분을 반복하기위해서 설정해놓았음
url = "https://search.daum.net/search?w=tot&q=201{}%EB%85%84%EC%98%81%ED%99%94%EC%88%9C%EC%9C%84&DA=MOR&rtmaxcoll=MOR".format(i)
res = requests.get(url) # requests의 get 함수로 url 정보를 받아주고
res.raise_for_status() # 제대로 실행되는지 확인해주고
soup = BeautifulSoup(res.text, 'lxml') # beautifulsoup 에 정보를 받아준다.
images = soup.find_all("img", attrs={'class':'thumb_img'}) #image 파일을 find_all 함수로 찾아준다
for idx, image in enumerate(images): #imgaes에 저장된 하나의 dic image에 정보를 하나 씩 저장
print(image['src']) # 보니깐 dic 안에 src 부분이 이미지 url 이더라
image_url = image['src']
image_res = requests.get(image_url)
image_soup = BeautifulSoup(image_res.text, 'lxml')
with open('movie{}{}.jpg'.format(i, idx+1), 'wb') as f:
f.write(image_res.content) # with open 함수로 파일로 바꿔주고 content라고 적어야 안에
# 파일로 바뀐다.
if idx >= 4:
break
반응형