站長資訊網(wǎng)
        最全最豐富的資訊網(wǎng)站

        php 正則表達式提取網(wǎng)頁超級鏈接url的函數(shù)

        復制代碼 代碼如下:
        function match_links($document) {
        preg_match_all(“‘<s*as.*?hrefs*=s*([“‘])?(?(1)(.*?)\1|([^s>]+))[^>]*>?(.*?)</a>’isx”,$document,$links);
        while(list($key,$val) = each($links[2])) {
        if(!empty($val))
        $match[‘link’][] = $val;
        }
        while(list($key,$val) = each($links[3])) {
        if(!empty($val))
        $match[‘link’][] = $val;
        }
        while(list($key,$val) = each($links[4])) {
        if(!empty($val))
        $match[‘content’][] = $val;
        }
        while(list($key,$val) = each($links[0])) {
        if(!empty($val))
        $match[‘all’][] = $val;
        }
        return $match;
        }

        主要是正則的問題,下面給出個asp.net下的,多測試正則
        獲取頁面的鏈接正則

        復制代碼 代碼如下:
        public string GetHref(string HtmlCode)
        {
        string MatchVale = “”;
        string Reg = @”(h|H)(r|R)(e|E)(f|F) *= *(‘|””)?((w|\|/|.|:|-|_)+)(‘|””| *|>)?”;
        foreach (Match m in Regex.Matches(HtmlCode, Reg))
        {
        MatchVale += (m.Value).ToLower().Replace(“href=”, “”).Trim() + “||”;
        }
        return MatchVale;
        }
        贊(0)
        分享到: 更多 (0)
        網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號
        主站蜘蛛池模板: 四虎精品影院永久在线播放| 国产精品高清免费网站| 久久国产精品成人免费| 亚洲精品国产精品乱码在线观看| 91po国产在线精品免费观看| 精品无码人妻一区二区免费蜜桃| 久久免费国产精品| 四虎国产精品免费久久5151| 色欲国产麻豆一精品一AV一免费| 久久久精品国产Sm最大网站| 欧美精品黑人巨大在线播放| 精品久久久久久无码中文字幕一区| 久久精品这里只有精99品| mm1313亚洲国产精品无码试看| 国产精品久久久久影院嫩草 | 久久精品国产一区二区三区| 日韩精品在线免费观看| 99精品视频在线观看re| 国产乱码精品一区二区三区中文| 无码精品久久久天天影视| 亚洲一区二区三区国产精品| 乱人伦人妻精品一区二区| 国产精品99| 98香蕉草草视频在线精品看| 久久精品国产秦先生| 97久久久久人妻精品专区| 国内精品久久久久久99蜜桃 | 九九热这里只有在线精品视 | 亚洲精品永久在线观看| 日韩亚洲精品福利| 亚洲精品97久久中文字幕无码| 久久九九久精品国产| 精品视频久久久久| 国内精品国语自产拍在线观看| 国产成人综合久久精品尤物| 国产精品极品| 国内精品久久久久影院网站| 国产亚洲精品影视在线产品| 久久久久无码精品国产app| 久久成人国产精品一区二区| 全国精品一区二区在线观看|