佳木斯湛栽影视文化发展公司

主頁(yè) > 知識(shí)庫(kù) > XMLHTTP批量抓取遠(yuǎn)程資料

XMLHTTP批量抓取遠(yuǎn)程資料

熱門標(biāo)簽:科大訊飛語(yǔ)音識(shí)別系統(tǒng) 團(tuán)購(gòu)網(wǎng)站 電子圍欄 服務(wù)器配置 Linux服務(wù)器 Mysql連接數(shù)設(shè)置 阿里云 銀行業(yè)務(wù)
可以在此基礎(chǔ)上結(jié)合正則表達(dá)式做成更好的效果,希望大家能分享一下Xmlhttp的session共享技術(shù) 

html> 
head> 
title>AUTOGET/title> 
meta http-equiv="Content-Type" content="text/html; charset=gb2312"> 
/head> 
body bgcolor="#FFFFFF" style="font-family:Arial;font-size:12px"> 

'================================================= 
'FileName: Getit.Asp 
'Intro : Auto Get Data From Remote WebSite 
'Author: Babyt(阿泰) 
'URL: http://blog.csdn.net/babyt 
'createAt: 2002-02 Lastupdate:2004-09 
'DB Table : data 
'Table Field: 
' UID -> Long -> Keep ID Of the pages 
' UContent -> Text -> Keep Content Of the Pages(HTML) 
'================================================= 

Server.ScriptTimeout=5000 

'on error resume next 
Set conn = Server.createObject("ADODB.Connection") 
conn.open "Provider=Microsoft.Jet.OLEDB.4.0;Data Source="  Server.MapPath("getit.mdb") 
Set rs = Server.createObject("ADODB.Recordset") 
sql="select * from data" 
rs.open sql,conn,1,3 

Dim comeFrom,myErr,myCount 

'======================================================== 
comeFrom="http://www.xxx.com/U.asp?ID=" 
myErr1="該資料不存在" 
myErr2="該資料已隱藏" 
'======================================================== 

'*************************************************************** 
' 只需要更改這里 i 的始點(diǎn)intMin和終點(diǎn)intMax,設(shè)定步長(zhǎng)intStep 
' 每次區(qū)間設(shè)置成5萬(wàn)左右。估計(jì)要兩個(gè)多小時(shí)。期間不需要人工干預(yù) 
'**************************************************************** 
intMin=0 
intMax=10000 
'設(shè)定步長(zhǎng) 
intStep=100 

'========================================================== 
'以下代碼不要更改 
'========================================================== 
Call GetPart (intMin) 
Response.write "已經(jīng)轉(zhuǎn)換完成"  intMin  "~~"  intMax  "之間的數(shù)據(jù)" 
rs.close 
Set rs=Nothing 
conn.Close 
set conn=nothing 
%> 
/body> 
/html> 

'使用XMLHTTP抓取地址并進(jìn)次內(nèi)容處理 
Function GetBody(Url) 
Dim objXML 
On Error Resume Next 
Set objXML = createObject("Microsoft.XMLHTTP") 
With objXML 
.Open "Get", Url, False, "", "" 
.Send 
GetBody = .ResponseBody 
End With 
GetBody=BytesToBstr(GetBody,"GB2312") 
Set objXML = Nothing 
End Function 
'使用Adodb.Stream處理二進(jìn)制數(shù)據(jù) 
Function BytesToBstr(strBody,CodeBase) 
dim objStream 
set objStream = Server.createObject("Adodb.Stream") 
objStream.Type = 1 
objStream.Mode =3 
objStream.Open 
objStream.Write strBody 
objStream.Position = 0 
objStream.Type = 2 
objStream.Charset = CodeBase 
BytesToBstr = objStream.ReadText 
objStream.Close 
set objStream = nothing 
End Function 
'主函數(shù) 
Function GetPart(iStart) 
Dim iGo 
time1=timer() 
myCount=0 
For iGo=iStart To iStart+intStep 
If iGo=intMax Then 
Response.Execute comeFrom  iGo 
'進(jìn)行簡(jiǎn)單的數(shù)據(jù)處理 
content = GetBody(comeFrom  iGo ) 
content = Replace(content,chr(34),""") 
If instr(content,myErr1) OR instr(content,myErr2) Then 
'跳過(guò)錯(cuò)誤信息 
Else 
'寫入數(shù)據(jù)庫(kù) 
rs.AddNew 
rs("UID")=iGo 
'******************************** 
rs("UContent")=Replace(content,""",chr(34)) 
'********************************* 
rs.update 
myCount=myCount+1 
Response.Write iGo  "BR>" 
Response.Flush 
End If 
Else 
Response.write "font color=red>成功抓取"myCount"條記錄," 
time2=timer() 
Response.write "耗時(shí):"  Int(FormatNumber((time2-time1)*1000000,3))  " 秒/font>BR>" 
Response.Flush 
Exit Function 
End If 
Next 
Response.write "font color=red>成功抓取"myCount"條記錄," 
time2=timer() 
Response.write "耗時(shí):"  CInt(FormatNumber((time2-time1),3))  " 秒/font>BR>" 
Response.Flush 
'遞歸 
GetPart(iGo+1) 
End Function%> 
您可能感興趣的文章:
  • asp xmlhttp下載一句話
  • 用ASP VBS xmlhttp adodbstream下載和保存圖片的代碼
  • 用asp+xmlhttp編寫web采集程序
  • ASP小偷程序如何利用XMLHTTP實(shí)現(xiàn)表單的提交
  • asp中利用xmlhttp抓取網(wǎng)頁(yè)內(nèi)容的代碼

標(biāo)簽:衢州 廣元 大理 棗莊 蚌埠 萍鄉(xiāng) 江蘇 衡水

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《XMLHTTP批量抓取遠(yuǎn)程資料》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    淮南市| 乌苏市| 滨州市| 泾川县| 酉阳| 清水县| 静海县| 黄大仙区| 左权县| 潞西市| 广东省| 合肥市| 建平县| 阿勒泰市| 颍上县| 澜沧| 改则县| 商都县| 南丰县| 兴山县| 盐池县| 杨浦区| 文昌市| 南江县| 大兴区| 伊吾县| 本溪| 略阳县| 大方县| 泰宁县| 容城县| 肇州县| 微博| 印江| 三明市| 威信县| 临颍县| 芮城县| 永顺县| 苍梧县| 井研县|