站長資訊網
        最全最豐富的資訊網站

        php 正則表達式提取網頁超級鏈接url的函數

        復制代碼 代碼如下:
        function match_links($document) {
        preg_match_all(“‘<s*as.*?hrefs*=s*([“‘])?(?(1)(.*?)\1|([^s>]+))[^>]*>?(.*?)</a>’isx”,$document,$links);
        while(list($key,$val) = each($links[2])) {
        if(!empty($val))
        $match[‘link’][] = $val;
        }
        while(list($key,$val) = each($links[3])) {
        if(!empty($val))
        $match[‘link’][] = $val;
        }
        while(list($key,$val) = each($links[4])) {
        if(!empty($val))
        $match[‘content’][] = $val;
        }
        while(list($key,$val) = each($links[0])) {
        if(!empty($val))
        $match[‘all’][] = $val;
        }
        return $match;
        }

        主要是正則的問題,下面給出個asp.net下的,多測試正則
        獲取頁面的鏈接正則

        復制代碼 代碼如下:
        public string GetHref(string HtmlCode)
        {
        string MatchVale = “”;
        string Reg = @”(h|H)(r|R)(e|E)(f|F) *= *(‘|””)?((w|\|/|.|:|-|_)+)(‘|””| *|>)?”;
        foreach (Match m in Regex.Matches(HtmlCode, Reg))
        {
        MatchVale += (m.Value).ToLower().Replace(“href=”, “”).Trim() + “||”;
        }
        return MatchVale;
        }
        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 久久精品二区| 精品人妻中文字幕有码在线| 最新精品亚洲成a人在线观看| 国产精品无码AV一区二区三区| 久久99精品九九九久久婷婷| 国产精品一区二区久久| 亚洲欧美日韩久久精品第一区| 国产高清在线精品一本大道国产| 国产精品久久久亚洲| 中文成人无字幕乱码精品区| 国产精品一区二区av不卡| 精品国产一区二区三区无码| 无码乱码观看精品久久| 国产精品五月天强力打造| 精品亚洲综合在线第一区| 国产午夜无码精品免费看动漫| 日韩精品一二三区| 国产亚洲精品拍拍拍拍拍| 亚洲精品欧美综合在线| 97久久精品国产精品青草| 日韩精品乱码AV一区二区| 亚洲精品欧美二区三区中文字幕| 精品无人区无码乱码毛片国产 | 日本午夜精品一区二区三区电影| 久久精品国产精品亚洲艾草网美妙| 国产成人精品一区在线| 亚洲国产精品一区二区久久| 国产一精品一av一免费爽爽| heyzo高无码国产精品| 国产午夜精品一区二区三区漫画| 久久精品黄AA片一区二区三区| 中文精品久久久久人妻不卡| 亚洲综合精品网站| 亚洲欧洲美洲无码精品VA| 亚洲一区精品无码| 三上悠亚久久精品| 久久丫精品国产亚洲av| 亚洲AV无码成人精品区天堂 | 亚洲精品二三区| 亚洲精品岛国片在线观看| 亚洲午夜精品第一区二区8050|