佳木斯湛栽影视文化发展公司

主頁(yè) > 知識(shí)庫(kù) > 用asp自動(dòng)解析網(wǎng)頁(yè)中的圖片地址

用asp自動(dòng)解析網(wǎng)頁(yè)中的圖片地址

熱門標(biāo)簽:團(tuán)購(gòu)網(wǎng)站 服務(wù)器配置 科大訊飛語(yǔ)音識(shí)別系統(tǒng) 銀行業(yè)務(wù) 電子圍欄 阿里云 Linux服務(wù)器 Mysql連接數(shù)設(shè)置
一,取得原頁(yè)中的圖片的地址。
%
function PicStr(str)
 Set objRegExp = New Regexp '設(shè)置配置對(duì)象
 objRegExp.IgnoreCase = True '忽略大小寫
 objRegExp.Global = True '設(shè)置為全文搜索
 objRegExp.Pattern = "IMG.+?>" '為了確保能準(zhǔn)確地取出圖片地址所以分為兩層配置:首先找到里面的IMG>標(biāo)簽,然后再取出里面的圖片地址后面的getimgs函數(shù)就是實(shí)現(xiàn)后一個(gè)功能的。
 strs=trim(str)
 Set Matches =objRegExp.Execute(strs) '開(kāi)始執(zhí)行配置
 For Each Match in Matches
 PicStr = PicStr getimgs( Match.Value ) '執(zhí)行第二輪的匹配
 Next
 '所有的圖片在里面都是這樣的src="http://圖片的地址",所以可以這樣來(lái)取得確切的圖片地址
end function

function getimgs(str)
 getimgs=""
 Set objRegExp1 = New Regexp
 objRegExp1.IgnoreCase = True
 objRegExp1.Global = True
 objRegExp1.Pattern = "http://.+?""" '取出里面的地址
 set mm=objRegExp1.Execute(str)
 For Each Match1 in mm
 getimgs=getimgs"||"left(Match1.Value,len(Match1.Value)-1) '把里面的地址串起來(lái)備用
 next
end function
%>

二,下載圖片并保存在服務(wù)器上。
%
function getHTTPPage(url)
  on error resume next
  dim http
  set http=server.createobject("MSXML2.XMLHTTP") '使用xmlhttp的方法來(lái)獲得圖片的內(nèi)容
  Http.open "GET",url,false
  Http.send()
  if Http.readystate>4 then
  exit function
  end if
  getHTTPPage=Http.responseBody
  set http=nothing
  if err.number>0 then err.Clear
end function
'取得了圖片的內(nèi)容要保存,給人一種感覺(jué)是用FSO來(lái)作就可以了,但實(shí)際上不行,這樣保存程序就會(huì)出錯(cuò),因?yàn)镕SO不支持流式的文件,所以我們要調(diào)用另一個(gè)對(duì)象:ADO.STREM。具體的過(guò)程如下:
function saveimage(from,tofile)
  dim geturl,objStream,imgs
  geturl=trim(from)
  imgs=gethttppage(geturl)'取得圖片的具休內(nèi)容的過(guò)程
  Set objStream = Server.CreateObject("ADODB.Stream")'建立ADODB.Stream對(duì)象,必須要ADO 2.5以上版本
  objStream.Type =1'以二進(jìn)制模式打開(kāi)
  objStream.Open
  objstream.write imgs'將字符串內(nèi)容寫入緩沖
  objstream.SaveToFile server.mappath(tofile),2'-將緩沖的內(nèi)容寫入文件
  objstream.Close()'關(guān)閉對(duì)象
  set objstream=nothing
end function

'所以只要用一個(gè)循環(huán)來(lái)把剛才取得的地址中的圖片全部保存下來(lái),具體過(guò)程如下:
arrimg=split(PicStr(str),"||") '分割字串,取得里面地址列表
allimg=""
newimg=""
for i=1 to ubound(arrimg)
if arrimg(i)>"" and instr(allimg,arrimg(i))1 then '看這個(gè)圖片是否已經(jīng)下載過(guò)
fname=baseurlcstr(imid(arrimg(i),instrrev(arrimg(i),".")))
saveimage(arrimg(i),fname)‘保存地址的函數(shù),過(guò)程見(jiàn)上面
allimg=allimg"||"arrimg(i) '把保存下來(lái)的圖片的地址串回起來(lái),以確定要替換的地址
newimg=newimg"||"fname '把本地的地址串回起來(lái)
end if
next
'第三步就是替換原來(lái)的地址了。具體的過(guò)程就是下面了:
arrnew=split(newimg,"||") '取得原來(lái)的圖片地址列表
arrall=split(allimg,"||") '取得已經(jīng)保存下來(lái)的圖片的地址列表
for i=1 to ubound(arrnew) '執(zhí)行循環(huán)替換原來(lái)的地址
  strs=replace(strs,arrall(i),arrnew(i))
next
%>

標(biāo)簽:蚌埠 大理 萍鄉(xiāng) 江蘇 棗莊 衢州 廣元 衡水

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《用asp自動(dòng)解析網(wǎng)頁(yè)中的圖片地址》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    南宁市| 星子县| 涟水县| 南川市| 定日县| 德江县| 平顶山市| 铅山县| 江城| 安徽省| 格尔木市| 鄯善县| 平罗县| 淮安市| 娄底市| 朝阳县| 永城市| 施秉县| 九江县| 聊城市| 临猗县| 长春市| 垦利县| 遂溪县| 利川市| 连城县| 老河口市| 利津县| 阳西县| 宣城市| 扎鲁特旗| 敦化市| 黄陵县| 漯河市| 徐水县| 高雄县| 富顺县| 乌兰察布市| 甘谷县| 安远县| 兴山县|