欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 教育 > 锐评 > Selenium越过网页验证的几种方式

Selenium越过网页验证的几种方式

2025/2/24 16:46:52 来源:https://blog.csdn.net/qq_36532060/article/details/144851962  浏览:    关键词:Selenium越过网页验证的几种方式

前言

selenium模拟浏览器作为自动化测试工具,有很多人会用它来爬一些数据,这种方式通常都可以绕开网页自带的接口加密之类的东西直接获取数据。但是最近禁用selenium的网站越来越多了(直接浏览器可以打开,但是用selenium打开的浏览器访问这些网页就一片空白)。于是整理几个selenium绕过这些反爬措施的方法。

简单取消标识

这个比较基础,就是把chrome上的那个自动化测试标识去了,可以绕过一些简单的反selenium措施(估计可以绕过10%-20%的)

from selenium import webdriver
from selenium.webdriver.chrome.options import Optionsoptions = Options()
options.add_experimental_option('excludeSwitches', ['enable-automation'])driver = webdriver.Chrome(options=options)

复杂取消标识

如果更复杂一点的话就需要知道为什么这些网站可以判断一个浏览器是不是selenium操作的,绝大部分使用的是一行js代码“window.navigator.webdriver”,在正常的浏览器下执行的结果是undefined
在这里插入图片描述
但是如果在selenium操作的浏览器下运行的结果就会是true
在这里插入图片描述
所以需要做的操作就很简单了,运行js代码强制令这个变量=undefined就可以了
在这里插入图片描述
加几行这些个代码就可以搞定基本80%以上的防selenium网站了

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词