站長資訊網
        最全最豐富的資訊網站

        用Python獲取Amazon亞馬遜的商品信息

        引言

        亞馬遜網站相較于國內的購物網站,可以直接使用python的最基本的requests進行請求。訪問不是過于頻繁,在未觸發保護機制的情況下,可以獲取我們想要的數據。本次通過以下三部分簡單介紹下基本爬取流程:

        • 使用requests的get請求,獲取亞馬遜列表和詳情頁的頁面內容

        • 使用css/xpath對獲取的內容進行解析,取得關鍵數據

        • 動態IP的作用及其使用方法

        一、獲取亞馬遜列表頁的信息

        以游戲區為例:

        用Python獲取Amazon亞馬遜的商品信息

        程序員必備接口測試調試工具:立即使用
        Apipost = Postman + Swagger + Mock + Jmeter
        Api設計、調試、文檔、自動化測試工具
        后端、前端、測試,同時在線協作,內容實時同步

        獲取列表內能獲取到的商品信息,如商品名,詳情鏈接,進一步獲取其他內容。

        用requests.get()獲取網頁內容,設置好header,利用xpath選擇器選取相關標簽的內容:

        import requests   from parsel import Selector   from urllib.parse import urljoin       spiderurl = 'https://www.amazon.com/s?i=videogames-intl-ship'   headers = {       "authority": "www.amazon.com",       "user-agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 10_3_3 like Mac OS X) AppleWebKit/603.3.8 (KHTML, like Gecko) Mobile/14G60 MicroMessenger/6.5.19 NetType/4G Language/zh_TW",   }   resp = requests.get(spiderurl, headers=headers)   content = resp.content.decode('utf-8')   select = Selector(text=content)   nodes = select.xpath("http://a[@title='product-detail']")   for node in nodes:       itemUrl = node.xpath("./@href").extract_first()       itemName = node.xpath("./div/h2/span/text()").extract_first()       if itemUrl and itemName:           itemUrl = urljoin(spiderurl,itemUrl)#用urljoin方法湊完整鏈接           print(itemUrl,itemName)
        登錄后復制

        此時已經獲取的當前列表頁目前能獲得的信息:

        用Python獲取Amazon亞馬遜的商品信息

        二、獲取詳情頁信息

        進入詳情頁:

        用Python獲取Amazon亞馬遜的商品信息

        進入詳情頁之后,能獲得

        贊(1)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 久久99国产精品久久99果冻传媒| 久久精品国产亚洲av瑜伽| 91久久福利国产成人精品| 久久夜色精品国产欧美乱| 国产精品亚洲高清一区二区| 久久久久99精品成人片直播| 欧美国产精品va在线观看| 青青青国产依人精品视频| 久久久国产乱子伦精品作者| 欧美在线精品永久免费播放| 丝袜美腿国产精品视频一区| 国产精品成人A区在线观看| 亚洲AV日韩精品一区二区三区| 国产精品丝袜久久久久久不卡| 国产精品一国产精品| 久久99精品久久久久久久久久| 亚洲欧美日韩国产一区二区三区精品| 国产午夜精品理论片| 99久re热视频这里只有精品6| 国产精品久久久久jk制服| 四虎国产精品永久在线观看| 香港aa三级久久三级老师2021国产三级精品三级在 | 久久精品中文字幕有码| 国产精品1024视频| 嫩草影院久久国产精品| 99热精品在线观看| 国产成人精品午夜福利| 久久99精品久久久久久久不卡 | 久久r热这里有精品视频| 国产精品日韩欧美一区二区三区| 亚洲精品国产精品乱码不卡√| 无码国模国产在线无码精品国产自在久国产 | 久久精品国产欧美日韩| 国产亚洲精品成人a v小说| 国产高清日韩精品欧美激情| 国产成人精品曰本亚洲79ren | 久久国产精品一区二区| 国产精品亚洲专区在线观看 | 日韩精品系列产品| 亚洲精品高清国产一线久久| 亚洲精品国产品国语在线|