selenium 3

[python] selenium 활용한 웹페이지 PDF 파일로 저장하기

들어가며 여러 웹사이트를 돌아다니며 크롤링하다 보면 가끔은 내PC에 저장하고 싶은 정보들이 있을 수 있다. 나 같은 경우 필요성을 느낀 포인트가 한가지 있는데, 포털사이트에서 신문기사를 보면 너무 불필요하게 광고가 덕지덕지 있어 늘 불편했다. 인쇄버튼을 누르면 광고 없이 깔끔하게 볼 수 있잖아! 파이썬과 셀레니움에는 언제나 정답이 있다!! 웹페이지 PDF 파일로 저장하기 아래 예시로 사용할 웹페이지가 있다. 기사 시작하기 전부터 영상이 딸린 커다란 광고가 붙어 있다. URL : https://www.mk.co.kr/news/world/10584572 그리고 기사 헤드라인 아래쪽으로 보면 프린터 모양 '인쇄' 버튼이 있는데 이걸 눌러 보면 URL은 아래와 같다. URL : https://www.mk.co...

SW개발/python 2022.12.28

[python] selenium 활용한 웹사이트 동작제어 실행

selenium 활용한 웹사이트 동작제어 실행 서론 지난 포스팅에서는 셀레니움을 활용하여 세종도서관 자동로그인을 구현했습니다. 이번에는 로그인 이후 사용자가 직접 클릭을 하는 것과 같이 웹사이트 동작 제어를 해 보겠습니다. 바로 사전로그인 동작을 말이죠! 본론 우선, 지난 포스팅 복습으로 코드를 다시 올려드립니다. 오늘 진행할 부분은 "2. 사전예약 자동제어" 부분에 코드를 추가할 꺼에요. import getpass from selenium import webdriver ''' 국립세종도서관 자동로그인 ''' options = webdriver.ChromeOptions() # headless 옵션 설정 : 개발환경이 리눅스라면 아래 두가지는 포함 options.add_argument('headless')..

SW개발/python 2021.06.21

[python] selenium 활용한 웹사이트 자동 로그인

셀레니움 활용한 웹사이트 자동 로그인 서 론 이번 글에서는 python selenium 라이브러리를 활용해 웹사이트 자동 로그인을 구현해 보겠습니다. selenium 모듈은 많은 기능이 있으며, 잘 활용한다면 웹사이트 조작에 여러가지를 자동화 할 수 있어요 제가 시도해 볼 대상 사이트는 세종시에 있는 "국립세종도서관" 홈페이지 입니다. 왜 도서관 홈페이지냐구요? 현재 코로나-19로 인해 사전 방문 예약으로 운영되고 있으며, 하루 400명 제한된 인원만 받고 있어요. 도서관 가서 빌리고 싶은 책이 있는데 사전 방문 예약에 실패해 갈 수가 없다면 너무 속상하지 않나요? 저는 지난번에 사전예약방문이 된 줄 알고 도서관까지 열심히 갔는데... 예약이 안되어 있었더라고요... 할 수 없이 도서관 앞에서 20여분 ..

SW개발/python 2021.05.27