웹크롤링을 위한 대표적인 라이브러리 셀러니움
셀레니움은 IE, 크롬, FF, 엣지를 지원한다.
대부분 크롬을 쓰겠지만, 인터넷 익스플로러를 써야만 하는 곳도 있다.
따라서 셀레니움을 이용한 인터넷 익스플로러 크롤링 사전 준비 방법을 소개한다.
셀레니움 IE 드라이버 다운로드
아래에서 셀레니움 익스플로러 드라이버를 다운 받는다.
[https://selenium-release.storage.googleapis.com/index.html]
- IE는 32,64비트 관계없이 32비트를 권장한다.
- 드라이버 버전을 잘 보고 맞춰서 다운 받아야 한다.
보호모드 사용 끄기
인터넷옵션 - 보안 - 인터넷, 로컬인트라넷, 신뢰할수있는 사이트, 제한한 사이트 모두 ‘보호모드사용(IE를 다시 시작해야함)’ 체크해제
인터넷옵션 - 고급 - 보안에서 ‘향상된 보호모드 사용*’ 해제
ZOOM LEVEL
브라우저에서 about:blank 들어간뒤에 [보기]-[확대/축소]에 들어가서 100%인지 확인
디스플레이설정에 가서 배율 및 레이아웃이 100%인지도 확인(윈도우10에서는 확인란이 있음)
레지스트리 설정
window+R 누르고 regedit 검색 (64비트라면 두번 작업해주어야함)
- 32비트 윈도우
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Internet Explorer\Main\FeatureControl\FEATURE_BFCACHE - 64비트 윈도우
HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Internet Explorer\Main\FeatureControl\FEATURE_BFCACHE
Feature Control에 들어가면 FEATURE_BFCACHE가 없을텐데 새 키 생성
FEATURE_BFCACHE를 만들면 디폴트로 기본값이 뜰텐데 오른쪽에 새로운 값 추가
(타입읍 DWORD로, 이름 iexplore.exe, 값 0)
출처 https://soraji.github.io/java/2019/04/19/seleniumIEDriver/ 에서 발췌
'Python' 카테고리의 다른 글
코드 실행 시간 측정 (0) | 2021.02.09 |
---|---|
데이터프레임 중간 생략없이 보는 방법 (1) | 2021.02.04 |
파이썬 오프라인 환경에서 패키지 관리하기 (0) | 2021.01.11 |