佳木斯湛栽影视文化发展公司

主頁(yè) > 知識(shí)庫(kù) > python爬蟲selenium模塊詳解

python爬蟲selenium模塊詳解

熱門標(biāo)簽:企業(yè)做大做強(qiáng) 電話運(yùn)營(yíng)中心 硅谷的囚徒呼叫中心 客戶服務(wù) 百度AI接口 Win7旗艦版 語(yǔ)音系統(tǒng) 呼叫中心市場(chǎng)需求

selenium模塊

selenium基本概念

selenium優(yōu)勢(shì)

  • 便捷的獲取網(wǎng)站中動(dòng)態(tài)加載的數(shù)據(jù)
  • 便捷實(shí)現(xiàn)模擬登陸

selenium使用流程:

1.環(huán)境安裝:pip install selenium

2.下載一個(gè)瀏覽器的驅(qū)動(dòng)程序(谷歌瀏覽器)

3.實(shí)例化一個(gè)瀏覽器對(duì)象

基本使用

代碼

from selenium import webdriver
from lxml import etree
from time import sleep

if __name__ == '__main__':

 bro = webdriver.Chrome(r"E:\google\Chrome\Application\chromedriver.exe")
 bro.get(url='http://scxk.nmpa.gov.cn:81/xk/')

 page_text = bro.page_source
 tree = etree.HTML(page_text)
 li_list = tree.xpath('//*[@id="gzlist"]/li')
 for li in li_list:
  name = li.xpath('./dl/@title')[0]
  print(name)
 sleep(5)
 bro.quit()

基于瀏覽器自動(dòng)化的操作

代碼

#編寫基于瀏覽器自動(dòng)化的操作代碼

- 發(fā)起請(qǐng)求: get(url)

- 標(biāo)簽定位: find系列的方法

- 標(biāo)簽交互: send_ keys( 'xxx' )

- 執(zhí)行js程序: excute_script('jsCod')

- 前進(jìn),后退: back(),forward( )

- 關(guān)閉瀏覽器: quit()

代碼

https://www.taobao.com/

from selenium import webdriver
from time import sleep

bro = webdriver.Chrome(executable_path=r"E:\google\Chrome\Application\chromedriver.exe")

bro.get(url='https://www.taobao.com/')

#標(biāo)簽定位
search_input = bro.find_element_by_id('q')
sleep(2)
#執(zhí)行一組js代碼,使得滾輪向下滑動(dòng)
bro.execute_script('window.scrollTo(0,document.body.scrollHeight)')
sleep(2)
#標(biāo)簽交互
search_input.send_keys('女裝')
button = bro.find_element_by_class_name('btn-search')
button.click()

bro.get('https://www.baidu.com')
sleep(2)
bro.back()
sleep(2)
bro.forward()
sleep(5)
bro.quit()

selenium處理iframe:

- 如果定位的標(biāo)簽存在于iframe標(biāo)簽之中,則必須使用switch_to.frame(id)

- 動(dòng)作鏈(拖動(dòng)) : from selenium. webdriver import ActionChains
	- 實(shí)例化一個(gè)動(dòng)作鏈對(duì)象: action = ActionChains (bro)
	- click_and_hold(div) :長(zhǎng)按且點(diǎn)擊操作
	- move_by_offset(x,y)
	- perform( )讓動(dòng)作鏈立即執(zhí)行
	- action.release( )釋放動(dòng)作鏈對(duì)象

代碼

https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable

from selenium import webdriver
from time import sleep
from selenium.webdriver import ActionChains
bro = webdriver.Chrome(executable_path=r"E:\google\Chrome\Application\chromedriver.exe")

bro.get('https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable')

bro.switch_to.frame('iframeResult')

div = bro.find_element_by_id('draggable')

#動(dòng)作鏈
action = ActionChains(bro)
action.click_and_hold(div)

for i in range(5):
 action.move_by_offset(17,0).perform()
 sleep(0.3)

#釋放動(dòng)作鏈
action.release()

bro.quit()

selenium模擬登陸QQ空間

代碼

https://qzone.qq.com/

from selenium import webdriver
from time import sleep


bro = webdriver.Chrome(executable_path=r"E:\google\Chrome\Application\chromedriver.exe")
bro.get('https://qzone.qq.com/')
bro.switch_to.frame("login_frame")

switcher = bro.find_element_by_id('switcher_plogin')
switcher.click()

user_tag = bro.find_element_by_id('u')
password_tag = bro.find_element_by_id('p')
user_tag.send_keys('1234455')
password_tag.send_keys('qwer123')
sleep(1)

but = bro.find_element_by_id('login_button')
but.click()

無(wú)頭瀏覽器和規(guī)避檢測(cè)

代碼

from selenium import webdriver
from time import sleep
#實(shí)現(xiàn)無(wú)可視化界面
from selenium.webdriver.chrome.options import Options
#實(shí)現(xiàn)規(guī)避檢測(cè)
from selenium.webdriver import ChromeOptions

#實(shí)現(xiàn)無(wú)可視化界面
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
#實(shí)現(xiàn)規(guī)避檢測(cè)
option = ChromeOptions()
option.add_experimental_option('excludeSwitches',['enable-automation'])

bro = webdriver.Chrome(executable_path=r"E:\google\Chrome\Application\chromedriver.exe",chrome_options=chrome_options,options=option)

bro.get('https://www.baidu.com')
print(bro.page_source)
sleep(2)
bro.quit()

到此這篇關(guān)于python爬蟲selenium模塊詳解的文章就介紹到這了,更多相關(guān)python爬蟲selenium模塊內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python selenium模擬網(wǎng)頁(yè)點(diǎn)擊爬蟲交管12123違章數(shù)據(jù)
  • python爬蟲之利用Selenium+Requests爬取拉勾網(wǎng)
  • python實(shí)現(xiàn)selenium網(wǎng)絡(luò)爬蟲的方法小結(jié)
  • python爬蟲利用selenium實(shí)現(xiàn)自動(dòng)翻頁(yè)爬取某魚數(shù)據(jù)的思路詳解
  • Python爬蟲之Selenium實(shí)現(xiàn)關(guān)閉瀏覽器
  • Python爬蟲中Selenium實(shí)現(xiàn)文件上傳
  • Python爬蟲之Selenium下拉框處理的實(shí)現(xiàn)
  • 教你如何使用Python selenium

標(biāo)簽:山西 濟(jì)南 安康 山西 崇左 長(zhǎng)沙 喀什 海南

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python爬蟲selenium模塊詳解》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    凭祥市| 共和县| 云霄县| 晋宁县| 腾冲县| 扎囊县| 英山县| 株洲市| 东港市| 成都市| 梧州市| 安新县| 南部县| 东乌| 宝应县| 石屏县| 大港区| 米脂县| 宜城市| 加查县| 平山县| 娄烦县| 卢龙县| 故城县| 榆社县| 玉龙| 大同县| 休宁县| 顺平县| 贵南县| 琼海市| 双鸭山市| 中阳县| 油尖旺区| 息烽县| 台中市| 忻城县| 新和县| 满洲里市| 承德市| 新巴尔虎左旗|