언어&프레임워크

[웹개발종합반]url만 넣으면 자동으로 나오는 이미지, 제목, 디스크립션(og)

밍풀 2023. 2. 19. 15:03

위와 같이 라이브러리 한번에 다깔기 가능

확실한건 뒤에, 어떻게 하는지 잘 모르는건 앞에서 작업하기

 

url만 넣으면 이미지, 제목, 디스크립션이 어떻게 해서 자동으로 나오는 건지 알아보기

 

예를들어 위와 같이 카카오톡으로 url만 보냈는데 이미지와 제목 내용이 딸려 오는경우가 있음 

이때의 이미지, 제목, 내용을 og image , og title, og description 이라고 함

 

head는 우리눈에 안보이지만 필요한 정보를 담는데 그곳에 og 가 존재함

 

보스베이비 영화페이지의 검사내용을 살펴 보면 og가 meta태그 에 있는 것을 확인 할 수 있음 

 

meta 태그의 property가 og 인것을 크롤링 해 가져오면 됨(하나만 가져오기에 select_one 사용)

ogtitle은 <meta content="보스 베이비 2" property="og:title"/>이 됨
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import requests
from bs4 import BeautifulSoup
 
url = 'https://movie.naver.com/movie/bi/mi/basic.naver?code=191597'
 
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(url,headers=headers)
 
soup = BeautifulSoup(data.text, 'html.parser')
 
ogtitle=soup.select_one('meta[property="og:title"]')['content'#property가 og:title인거 meta태크가져와,그중 content
ogdesc=soup.select_one('meta[property="og:description"]')['content']
ogimage=soup.select_one('meta[property="og:image"]')['content']
 
cs

위와 같이 보스베이비 영화페이지에서 og들을 크롤링 할 수 있음