當前位置:妙知谷 >

遊戲數碼 >互聯網 >

阿里媽媽淘寶聯盟寶貝採集方法

阿里媽媽淘寶聯盟寶貝採集方法

本文介紹使用採集器採集阿里媽媽淘寶聯盟(以衣服為例)的方法
本文僅以阿里媽媽淘寶聯盟衣服搜索結果頁面舉例説明,大家如果有其他採集淘寶聯盟商品的需求,可以更換搜索關鍵詞進行採集。
採集內容為:
商品圖片地址,商品標題,店鋪名,銷量,商品價格,佣金,比率,商品鏈接

阿里媽媽淘寶聯盟寶貝採集方法

操作方法

(01)步驟1:創建採集任務1)進入主界面,選擇“自定義採集”

阿里媽媽淘寶聯盟寶貝採集方法 第2張

(02)2)將要採集的網站URL複製粘貼到輸入框中,點擊“保存網址”

阿里媽媽淘寶聯盟寶貝採集方法 第3張

(03)3)保存網址後,鼠標點擊輸入框,在右側操作提示框中,選擇“輸入文字”

阿里媽媽淘寶聯盟寶貝採集方法 第4張

(04)4)然後輸入採集的商品,點擊確定

阿里媽媽淘寶聯盟寶貝採集方法 第5張

(05)5)  網絡加載速度比較慢,所以需要設置執行前等待,為防止輸入框沒加載完畢操作失效還需要設置出現元素

阿里媽媽淘寶聯盟寶貝採集方法 第6張

(06)然後點擊搜索,並選擇“點擊該按鈕”

阿里媽媽淘寶聯盟寶貝採集方法 第7張

(07)由於網頁涉及Ajax技術。所以需要選中點擊元素,打開“高級選項”,勾選“Ajax加載數據”,設置時間為“5秒”。 因為頁面打開後需要向下滑動才可以出現更多內容,所以還需要設置頁面滾動,滾動次數選擇30次,每次間隔2秒,選擇向下滾動一屏完成後,點擊“確定”。

阿里媽媽淘寶聯盟寶貝採集方法 第8張

(08)步驟2:創建翻頁循環1)將頁面下拉到底部,找到下一頁按鈕,鼠標點擊,在右側操作提示框中,選擇“循環點擊單個鏈接”

阿里媽媽淘寶聯盟寶貝採集方法 第9張

(09)2)同上,此步驟也需要設置高級選項,打開“高級選項”,勾選“Ajax加載數據”,設置時間為“3秒”。 因為頁面打開後需要向下滑動才可以出現更多內容,所以還需要設置頁面滾動,滾動次數選擇30次,每次間隔1秒,選擇向下滾動一屏完成後,點擊“確定”

阿里媽媽淘寶聯盟寶貝採集方法 第10張

(10)步驟3:採集阿里媽媽淘寶聯盟商品信息1)移動鼠標,選中第一個商品圖片,標題,店鋪名,系統會自動識別出相似的元素,在提示框中選擇“選中全部”,隨後點擊採集圖片地址或者採集以下元素文本。

阿里媽媽淘寶聯盟寶貝採集方法 第11張

(11)2)如果要採集商品鏈接,價格,佣金,比率,銷量的話,則要寫xpath才能實現採集。以採集價格字段舉例:首先選擇添加特殊字段

阿里媽媽淘寶聯盟寶貝採集方法 第12張

(12)然後選中該字段,選擇自定義數據字段(下圖紅色框中的)

阿里媽媽淘寶聯盟寶貝採集方法 第13張

(13)隨後選擇自定義定位元素方式,並按下圖填入XPah。價格的元素匹配的XPath為//div[1]//div[@class="content-line clearfix mt5"]/span[1]相對Xpath勾上,並填入//div[@class="content-line clearfix mt5"]/span[1]需要注意的事,Xpath會隨着網站結構的改變而改變,所以上面xpath不能確保一直有效。如果要採集這些數據,建議學習一下Xpath:

阿里媽媽淘寶聯盟寶貝採集方法 第14張

(14)填好xpath之後,隨後在自定義數據字段->自定義抓取方式中選擇抓取文本即可。

阿里媽媽淘寶聯盟寶貝採集方法 第15張

(15)同理,如果要採集佣金,比率,商品鏈接分別設置為:佣金:元素匹配的XPath為//div[1]//div[@class="content-line clearfix"]/span[2]相對Xpath勾上,並填入//div[@class="content-line clearfix"]/span[2]自定義數據字段->自定義抓取方式中選擇抓取文本商品鏈接:元素匹配的XPath為//div/a[@class="search-box-img img-loaded"]相對Xpath勾上,並填入//div/a[@class="search-box-img img-loaded"]自定義數據字段->自定義抓取方式中選擇抓取超鏈接(a標籤的href)比率:元素匹配的XPath為//div[1]//div[@class="content-line clearfix"]/span[1]相對Xpath勾上,並填入//div[@class="content-line clearfix"]/span[1]自定義數據字段->自定義抓取方式中選擇抓取文本銷量:元素匹配的XPath為//div[1]//div[@class="content-line clearfix mt5"]/span[2]相對Xpath勾上,並填入//div[1]//div[@class="content-line clearfix mt5"]/span[2]自定義數據字段->自定義抓取方式中選擇抓取文本設置完成以後,可以看到數據都在字段中了:

阿里媽媽淘寶聯盟寶貝採集方法 第16張

(16)3)然後再選擇‘’啟動本地採集”

阿里媽媽淘寶聯盟寶貝採集方法 第17張

(17)步驟4:數據採集及導出1)採集完成後,會跳出提示,選擇“導出數據”選擇“合適的導出方式”,將採集好的數據導出這裏我們選擇excel作為導出為格式,一份完好的阿里媽媽淘寶聯盟商品信息就導入出來了,數據導出後如下圖

阿里媽媽淘寶聯盟寶貝採集方法 第18張
  • 文章版權屬於文章作者所有,轉載請註明 https://miaozhigu.com/sm/hulianwang/ev1v1j.html