佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > selenium+chromedriver在服務(wù)器運行的詳細(xì)教程

selenium+chromedriver在服務(wù)器運行的詳細(xì)教程

熱門標(biāo)簽:網(wǎng)站建設(shè) 美圖手機 使用U盤裝系統(tǒng) 智能手機 硅谷的囚徒呼叫中心 百度競價點擊價格的計算公式 檢查注冊表項 阿里云

1.前言

想使用selenium從網(wǎng)站上抓數(shù)據(jù),但有時候使用phantomjs會出錯。chrome現(xiàn)在也有無界面運行模式了,以后就可以不用phantomjs了。

但在服務(wù)器安裝chrome時出現(xiàn)了一些錯誤,這里總結(jié)一下整個安裝過程

2.ubuntu上安裝chrome

# Install Google Chrome
# https://askubuntu.com/questions/79280/how-to-install-chrome-browser-properly-via-command-line
sudo apt-get install libxss1 libappindicator1 libindicator7
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome*.deb # Might show "errors", fixed by next line
sudo apt-get install -f

這時應(yīng)該已經(jīng)安裝好了,用下邊的命行運行測試一下:

google-chrome --headless --remote-debugging-port=9222 https://chromium.org --disable-gpu

這里是使用headless模式進(jìn)行遠(yuǎn)程調(diào)試,ubuntu上大多沒有g(shù)pu,所以–disable-gpu以免報錯。
之后可以再打開一個ssh連接到服務(wù)器,使用命令行訪問服務(wù)器的本地的9222端口:

curl http://localhost:9222

如果安裝好了,會看到調(diào)試信息。但我這里會報一個錯誤,下邊是錯誤的解決辦法。

1)可能的錯誤解決方法

運行完上邊的命令可能會報一個不能在root下運行chrome的錯誤。這個時候使用下邊方設(shè)置一下chrome

1.找到google-chrome文件

我的位置位于/opt/google/chrome/

2.用vi打開google-chrome文件

vi /opt/google/chrome/google-chrome

在文件中找到

exec -a "$0" "$HERE/chrome" "$@"

3.在后面添加 –user-data-dir –no-sandbox即可,整條shell命令就是

exec -a "$0" "$HERE/chrome" "$@" --user-data-dir --no-sandbox

4.再重新打開google-chrome即可正常訪問!

3.安裝chrome驅(qū)動chromedriver

下載chromedriver

chromedriver提供了操作chrome的api,是selenium控制chrome的橋梁。

chromedriver最好安裝最新版的,記的我一開始安裝的不是最新版的,會報一個錯。用最新版的chromedriver就沒有問題,最新版的可以在下邊地址找到
https://sites.google.com/a/chromium.org/chromedriver/downloads

我寫這個文章時最新版是2.37

wget https://chromedriver.storage.googleapis.com/2.37/chromedriver_linux64.zip
unzip chromedriver_linux64.zip

到這里服務(wù)器端的無界面版chrome就安裝好了。

4.無界面版chrome使用方法

from selenium import webdriver
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument("user-agent='Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'")
wd = webdriver.Chrome(chrome_options=chrome_options,executable_path='/home/chrome/chromedriver')

wd.get("https://www.163.com")

content = wd.page_source.encode('utf-8')
print content

wd.quit()

這里chrome_options中的第三項設(shè)置參數(shù),使用這個設(shè)置可以避免網(wǎng)站檢測到你使用的是無界模式進(jìn)行反抓取。

下邊另外的兩項設(shè)置,不進(jìn)行設(shè)置時在桌面版linux系統(tǒng),或者mac系統(tǒng)上會打開有界面的chrome.調(diào)試時可以注釋掉下邊兩行使用有界面版chrome來調(diào)試程序。

chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')

5.參考

https://jiayi.space/post/zai-ubuntufu-wu-qi-shang-shi-yong-chrome-headless
https://blog.csdn.net/u013703963/article/details/71083802

總結(jié)

到此這篇關(guān)于selenium+chromedriver在服務(wù)器運行的文章就介紹到這了,更多相關(guān)selenium+chromedriver在服務(wù)器運行內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

標(biāo)簽:懷化 煙臺 通遼 湘潭 黃山 湖北 山南 賀州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《selenium+chromedriver在服務(wù)器運行的詳細(xì)教程》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    松滋市| 屏山县| 金溪县| 辰溪县| 临漳县| 股票| 贡嘎县| 微博| 三穗县| 长宁县| 江口县| 南丹县| 恩施市| 贡嘎县| 长治县| 扶绥县| 射阳县| 浦县| 青田县| 冕宁县| 交口县| 垦利县| 阿鲁科尔沁旗| 金溪县| 元谋县| 高淳县| 南木林县| 娄底市| 山丹县| 石屏县| 遂平县| 馆陶县| 林甸县| 长乐市| 灵宝市| 寿光市| 彰化县| 星子县| 杭锦后旗| 万荣县| 当雄县|