0. Selenium
Selenium은 파싱 또는 크롤링을 막기 위한 수단이 적용된 사이트에서 간단하게 스크래핑 할 수 있도록 도와주는 도구 입니다. 사용자가 정의한 행위를 WebDriver API를 사용자 대신 수행하는 일종의 웹 브라우저라고 이해하면 좋을 것 같습니다.
1. Chrome 브라우저 버전 확인
Selenium이 사용 할 브라우저의 드라이버를 다운받아야 하는데요. 이를 위해 현재 내 PC에 설치된 Chrome의 버전을 확인하고 이에 맞는 드라이버를 설치해야 합니다.
이를 위해 Chrome을 실행한 후 오른쪽 상단 점 3개 → 도움말 → Chrome 정보에서 아래와 같은 형식의 빌드 버전을 확인합니다.
- 111.0.*
- 112.0.*
- 113.0.*
2. Chrome 드라이버 다운로드
해당 버전에 맞는 Chrome 드라이버를 다운로드 한 후에 실행할 파이썬 스크립트와 같은 경로에 저장합니다. Selenium과 드라이버의 정상 동작을 확인하기 위해 아래와 같은 예시 코드를 실행하여 작동 여부를 테스트 합니다.
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_experimental_option("detach", True)
driver = webdriver.Chrome(options=chrome_options)
driver.get("https://mr-zero.tistory.com/")
3. Selenium 파이썬 라이브러리 설치
마지막으로 cmd 또는 powershell에서 pip를 통해 파이썬에서 사용할 Selenium 라이브러리를 설치합니다.
pip install selenium
'etc' 카테고리의 다른 글
C-TAS에서 위협 IP를 자동으로 수집해 슬랙으로 전송하기 - (3) 크롤링 분석 (0) | 2023.04.22 |
---|---|
C-TAS에서 위협 IP를 자동으로 수집해 슬랙으로 전송하기 - (2) Slack bot 생성 및 권한 부여 (0) | 2023.04.21 |
C-TAS에서 위협 IP를 자동으로 수집해 슬랙으로 전송하기 - (0) 계기 (0) | 2023.04.21 |
Windows10 WSL2 환경에 minikube 구축하기 (0) | 2023.03.16 |
AWS에 ELK 스택 구축(7.x) (0) | 2023.03.16 |
0. Selenium
Selenium은 파싱 또는 크롤링을 막기 위한 수단이 적용된 사이트에서 간단하게 스크래핑 할 수 있도록 도와주는 도구 입니다. 사용자가 정의한 행위를 WebDriver API를 사용자 대신 수행하는 일종의 웹 브라우저라고 이해하면 좋을 것 같습니다.
1. Chrome 브라우저 버전 확인
Selenium이 사용 할 브라우저의 드라이버를 다운받아야 하는데요. 이를 위해 현재 내 PC에 설치된 Chrome의 버전을 확인하고 이에 맞는 드라이버를 설치해야 합니다.
이를 위해 Chrome을 실행한 후 오른쪽 상단 점 3개 → 도움말 → Chrome 정보에서 아래와 같은 형식의 빌드 버전을 확인합니다.
- 111.0.*
- 112.0.*
- 113.0.*
2. Chrome 드라이버 다운로드
해당 버전에 맞는 Chrome 드라이버를 다운로드 한 후에 실행할 파이썬 스크립트와 같은 경로에 저장합니다. Selenium과 드라이버의 정상 동작을 확인하기 위해 아래와 같은 예시 코드를 실행하여 작동 여부를 테스트 합니다.
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_experimental_option("detach", True)
driver = webdriver.Chrome(options=chrome_options)
driver.get("https://mr-zero.tistory.com/")
3. Selenium 파이썬 라이브러리 설치
마지막으로 cmd 또는 powershell에서 pip를 통해 파이썬에서 사용할 Selenium 라이브러리를 설치합니다.
pip install selenium
'etc' 카테고리의 다른 글
C-TAS에서 위협 IP를 자동으로 수집해 슬랙으로 전송하기 - (3) 크롤링 분석 (0) | 2023.04.22 |
---|---|
C-TAS에서 위협 IP를 자동으로 수집해 슬랙으로 전송하기 - (2) Slack bot 생성 및 권한 부여 (0) | 2023.04.21 |
C-TAS에서 위협 IP를 자동으로 수집해 슬랙으로 전송하기 - (0) 계기 (0) | 2023.04.21 |
Windows10 WSL2 환경에 minikube 구축하기 (0) | 2023.03.16 |
AWS에 ELK 스택 구축(7.x) (0) | 2023.03.16 |