您的位置: 网站首页> selenium爬虫> 当前文章
selenium清除残留chromedriver进程(网上帖子是错的)
老董-我爱我家房产SEO2020-09-14152围观,149赞
selenium如果频繁通过chromedriver来启动和关闭谷歌浏览器,那么内存会残留一些chromedriver进程,因为chromedriver并不会随着程序的退出而立刻在内存消失。所以在频繁使用的时候可能感觉到卡顿,此时查下系统的进程会发现很多chromedriver驻留在内存!
解决这个问题,也是有思路可寻的,网上也有相关文章,但是千篇一律,而且是错的!!!目测全部都是复制粘贴,真是流毒甚深。你看度娘显示相同的文章的:
这个文章被N个人转载,流传甚广,可惜他说的在python中的操作是错的。他的错误做法如下:
c_service = Service('chromedriver路径') c_service.command_line_args() c_service.start() driver = webdriver.Chrome() driver.get("http://www.baidu.com") driver.quit(); c_service.stop()
经过验证,以上做法在启动之初就会产生2个chromedriver,一个是WebDriver类创建的,一个是Service类创建的,而且这两个chromedriver各自为政毫无关系,退出也是各自退出各自的。不相信的话,我们看WebDriver的源码,他的quit方法内部就是靠service.stop()。而且本人实际在cmd下查看过chromedriver进程确实有2个,所以上面那篇帖子的做法纯属意淫,画蛇添足,毫无根据!
def quit(self): """ Closes the browser and shuts down the ChromeDriver executable that is started when starting the ChromeDriver """ try: RemoteWebDriver.quit(self) except Exception: # We don't care about the message because something probably has gone wrong pass finally: self.service.stop()
正确的做法应该是这么来实现:
from selenium.webdriver.chrome.service import Service service = Service('xxx') # 参数是chromedriver路径 service.command_line_args() service.start() option = Options() No_Image_loading = {"profile.managed_default_content_settings.images": 2} option.add_experimental_option("prefs", No_Image_loading) driver = webdriver.Remote(service.service_url,options=option) driver.get('http://mail.sina.net'); service.stop()
以上做法可行是因为WebDriver类本身就是继承了RemoteWebDriver类,不过要注意上面的方法创建的driver实例不具备execute_cdp_cmd方法,因为execute_cdp_cmd方法是WebDriver类定义的,没有这个方法可能无法屏蔽一些反爬特征。
如果想彻底的话,还是在结尾直接调用cmd命令来干掉chromedriver进程【 os.system('taskkill /im chromedriver.exe /F')】记得加个异常处理免得chromedriver不存在了你还在杀死他。,当然这是通杀,如果想精准杀死进程也是可以的,利用driver.service.process.pid属性可实现。
很赞哦!
python编程网提示:转载请注明来源www.python66.com。
有宝贵意见可添加站长微信(底部),获取技术资料请到公众号(底部)。同行交流请加群
相关文章
文章评论
-
selenium清除残留chromedriver进程(网上帖子是错的)文章写得不错,值得赞赏