佳木斯湛栽影视文化发展公司

主頁 > 知識(shí)庫 > python簡單爬蟲--get方式詳解

python簡單爬蟲--get方式詳解

熱門標(biāo)簽:服務(wù)器配置 智能手機(jī) 鐵路電話系統(tǒng) 美圖手機(jī) 網(wǎng)站文章發(fā)布 銀行業(yè)務(wù) 檢查注冊(cè)表項(xiàng) 呼叫中心市場需求

簡單爬蟲可以劃分為get、post格式。其中,get是單方面的獲取資源,而post存在交互,如翻譯中需要文字輸入。本文主要描述簡單的get爬蟲。

環(huán)境準(zhǔn)備

安裝第三方庫

pip install requests
pip install bs4
pip install lxml

進(jìn)行爬蟲

1.獲取網(wǎng)頁數(shù)據(jù)。

import requests
from bs4 import BeautifulSoup
url = "https://cn.bing.com/search?q=爬蟲CSDNqs=nform=QBREsp=-1pq=爬蟲csdnsc=5-6sk=cvid=0B13B88D8F444A0182A4A6C36E463179/"
response = requests.get(self.url)

2.解析網(wǎng)頁數(shù)據(jù)

soup = BeautifulSoup(response.text, 'lxml')

3.選取目標(biāo)數(shù)據(jù)。此處key 依據(jù)源代碼目標(biāo)標(biāo)題的位置確定。首先進(jìn)入開發(fā)者模式,后查看目標(biāo)在html中的位置,右擊選擇“復(fù)制selector”,見下圖。

key = "#b_results > li > div.b_title > h2 > a"
soup.select(key)

4.清洗數(shù)據(jù)

result = {}
for i, item in enumerate(data):
     result.update({
         f'title_{i}': item.get_text(),
         f'url_{i}': item.get('href')
     })
 print(result)

參考

鏈接:https://www.jb51.net/article/152560.htm

總結(jié)

本篇文章就到這里了,希望能夠給你帶來幫助,也希望您能夠多多關(guān)注腳本之家的更多內(nèi)容!

您可能感興趣的文章:
  • Python大數(shù)據(jù)之網(wǎng)絡(luò)爬蟲的post請(qǐng)求、get請(qǐng)求區(qū)別實(shí)例分析
  • python2與python3爬蟲中g(shù)et與post對(duì)比解析
  • python爬蟲 基于requests模塊的get請(qǐng)求實(shí)現(xiàn)詳解
  • python爬蟲 基于requests模塊發(fā)起ajax的get請(qǐng)求實(shí)現(xiàn)解析
  • python爬蟲中g(shù)et和post方法介紹以及cookie作用

標(biāo)簽:樂山 長治 上海 紅河 沈陽 新疆 滄州 河南

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python簡單爬蟲--get方式詳解》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    进贤县| 城步| 革吉县| 松江区| 奉新县| 进贤县| 绥芬河市| 阿瓦提县| 南开区| 香港| 达孜县| 卢龙县| 扎囊县| 偃师市| 佛教| 庆云县| 秭归县| 福鼎市| 什邡市| 阿克苏市| 兴和县| 汝州市| 玉溪市| 鲜城| 涟水县| 即墨市| 若尔盖县| 蒙自县| 安顺市| 澜沧| 榆中县| 平谷区| 张家川| 常德市| 崇义县| 闻喜县| 乐都县| 怀宁县| 资中县| 吐鲁番市| 油尖旺区|