佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > .net 解決spider多次和重復抓取的方案

.net 解決spider多次和重復抓取的方案

熱門標簽:網(wǎng)站排名優(yōu)化 客戶服務 百度AI接口 科大訊飛語音識別系統(tǒng) 人工智能 國美全國運營中心 電銷業(yè)務 電商新玩法

原因:

早期由于搜索引擎蜘蛛的不完善,蜘蛛在爬行動態(tài)的url的時候很容易由于網(wǎng)站程序的不合理等原因造成蜘蛛迷路死循環(huán)。

所以蜘蛛為了避免之前現(xiàn)象就不讀取動態(tài)的url,特別是帶?的url

解決方案:

1):配置路由

復制代碼 代碼如下:

routes.MapRoute("RentofficeList",
               "rentofficelist/{AredId}-{PriceId}-{AcreageId}-{SortId}-{SortNum}.html",
               new { controller = "Home", action = "RentOfficeList" },
               new[] { "Mobile.Controllers" });

第一個參數(shù)是路由名稱
第二個參數(shù)是路由的Url模式,參數(shù)之間用{}-{}方式分隔
第三個參數(shù)是一個包含默認路由的對象
第四個參數(shù)是應用程序的一組命名空間

2):設置連接

a href="@Url.Action("RentofficeList",new RouteValueDictionary { { "AredId",0},{"PriceId",0},{"AcreageId",0},{"SortId",0},{"SortNum",0}})">默認排序/a>

對照上面的Url模式,依次寫入?yún)?shù)賦值
3):獲取參數(shù)

復制代碼 代碼如下:

int areaId = GetRouteInt("AredId");//獲取參數(shù)
/// summary>
/// 獲得路由中的值
/// /summary>
/// param name="key">鍵/param>
/// param name="defaultValue">默認值/param>
/// returns>/returns>
protected int GetRouteInt(string key, int defaultValue)
{
return Convert.ToInt32(RouteData.Values[key], defaultValue);
}
/// summary>
/// 獲得路由中的值
/// /summary>
/// param name="key">鍵/param>
/// returns>/returns>
protected int GetRouteInt(string key)
{
return GetRouteInt(key, 0);
}

根據(jù)上面3個步驟操作,顯示的url地址為:

http://localhost:3841/rentofficelist/3-0-0-0-0.html
這樣就可以避免靜態(tài)頁面上使用動態(tài)參數(shù),顯示的頁面都為靜態(tài)頁面

您可能感興趣的文章:
  • javascript SpiderMonkey中的函數(shù)序列化如何進行

標簽:POS機 咸寧 廈門 益陽 南平 拉薩 棗莊 攀枝花

巨人網(wǎng)絡通訊聲明:本文標題《.net 解決spider多次和重復抓取的方案》,本文關鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    米泉市| 罗定市| 门源| 抚远县| 浠水县| 陵川县| 河间市| 紫云| 榕江县| 夏邑县| 栾城县| 清涧县| 新民市| 登封市| 望都县| 马山县| 乌苏市| 长岛县| 来凤县| 轮台县| 琼中| 翼城县| 吐鲁番市| 潮安县| 麻城市| 光泽县| 岳西县| 西乌珠穆沁旗| 威海市| 平阳县| 偏关县| 阳曲县| 屯门区| 公安县| 和静县| 临高县| 武宁县| 彭水| 曲沃县| 友谊县| 灌云县|