亚洲欧洲日产国码无码久久99|精品亚洲a∨无码专区毛片|国产99视频精品免视看7|久久夜色精品国产欧美|日韩A∨无码成人精品国产

一：前言

嘀嘀嘀，上車請刷卡。昨天看到了不錯的圖片分享網——花瓣，里面的圖片質量還不錯，所以利用selenium+xpath我把它的妹子的欄目下爬取了下來，以圖片欄目名稱給文件夾命名分類保存到電腦中。這個妹子主頁http://huaban.com/boards/favorite/beauty是動態加載的，如果想獲取更多內容可以模擬下拉，這樣就可以更多的圖片資源。這種之前爬蟲中也做過，但是因為網速不夠快所以我就抓了19個欄目，一共500多張美圖，也已經很滿意了。

先看看效果：

Paste_Image.png

Python抓取網絡高清美圖

Paste_Image.png

二：運行環境

IDE：Pycharm

Python3.6

lxml 3.7.2

Selenium 3.4.0

requests 2.12.4

三：實例分析

1.這次爬蟲我開始做的思路是：進入這個網頁http://huaban.com/boards/favorite/beauty然后來獲取所有的圖片欄目對應網址，然后進入每一個網頁中去獲取全部圖片。（如下圖所示）

Paste_Image.png

2.但是爬取獲取的圖片分辨率是236x354，圖片質量不夠高，但是那個時候已經是晚上1點30之后了，所以第二天做了另一個版本：在這個基礎上再進入每個縮略圖對應的網頁，再抓取像下面這樣高清的圖片。

Python抓取網絡高清美圖

Paste_Image.png

四：實戰代碼

1.第一步導入本次爬蟲需要的模塊

Python抓取網絡高清美圖

2.下面是設置webdriver的種類，就是使用什么瀏覽器進行模擬，可以使用火狐來看它模擬的過程，也可以是無頭瀏覽器PhantomJS來快速獲取資源，['--load-images=false', '--disk-cache=true']這個意思是模擬瀏覽的時候不加載圖片和緩存，這樣運行速度會加快一些。WebDriverWait標明最大等待瀏覽器加載為10秒，set_window_size可以設置一下模擬瀏覽網頁的大小。有些網站如果大小不到位，那么一些資源就不加載出來。

Python抓取網絡高清美圖

3.parser(url, param)這個函數用來解析網頁，后面有幾次都用用到這些代碼，所以直接寫一個函數會讓代碼看起來更整潔有序。函數有兩個參數：一個是網址，另一個是顯性等待代表的部分，這個可以是網頁中的某些板塊，按鈕，圖片等等...

Python抓取網絡高清美圖

4.下面的代碼就是解析本次主頁面http://huaban.com/boards/favorite/beauty/然后獲取到每個欄目的網址和欄目的名稱，使用xpath來獲取欄目的網頁時，進入網頁開發者模式后，如圖所示進行操作。之后需要用欄目名稱在電腦中建立文件夾，所以在這個網頁中要獲取到欄目的名稱，這里遇到一個問題，一些名稱不符合文件命名規則要剔除，我這里就是一個 * 影響了。

Python抓取網絡高清美圖

Paste_Image.png

5.前面已經獲取到欄目的網頁和欄目的名稱，這里就需要對欄目的網頁分析，進入欄目網頁后，只是一些縮略圖，我們不想要這些低分辨率的圖片，所以要再進入每個縮略圖中，解析網頁獲取到真正的高清圖片網址。這里也有一個地方比較坑人，就是一個欄目中，不同的圖片存放dom格式不一樣，所以我這樣做

Python抓取網絡高清美圖

這就把兩種dom格式中的圖片地址都獲取了，然后把兩個地址list合并一下。img_url +=img_url2在本地創建文件夾使用filename = 'image{}'.format(fileName) + str(i) + '.jpg'表示文件保存在與這個爬蟲代碼同級目錄image下，然后獲取的圖片保存在image中按照之前獲取的欄目名稱的文件夾中。

Python抓取網絡高清美圖

五：總結

這次爬蟲繼續練習了Selenium和xpath的使用，在網頁分析的時候也遇到很多問題，只有不斷練習才能把自己不會部分減少，當然這次爬取了500多張妹紙還是挺養眼的。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

python

python

+關注

關注
56

文章
4782

瀏覽量
84453

原文標題：小白請上車 | Python抓取花瓣網高清美圖

文章出處：【微信號：magedu-Linux，微信公眾號：馬哥Linux運維】歡迎添加關注！文章轉載請注明出處。

美圖秀秀（美圖大師）

`<font face="Verdana"><strong>美圖秀秀（美圖大師）<

發表于 09-02 10:53

如何使用高清網絡機頂盒

隨著3g互聯網絡的發展，其覆蓋率不斷的擴大使互聯網絡電視的使用也越來越普遍。那么在如何使用高清網絡機頂盒時，我們怎么去選購機頂盒呢?　　選高清

發表于 06-17 17:26

小米聯姻美圖最大的敵人還是蘋果！

`有網友調侃，心目中國產手機的拍照水平是：美圖＞vivo＞華為＞OPPO＞小米。想不到這一頭一尾的兩個品牌，居然結盟了！2018年11月19日，小米集團發布Q3公告，并高調宣布與美圖公司簽訂戰略合作

發表于 11-21 13:50

python網絡爬蟲概述

網絡爬蟲(Web Spider)又稱網絡蜘蛛、網絡機器人，是一種按照一定的規則，自動地抓取萬維網信息的程序或者腳本。網絡爬蟲按照系統結構和實

發表于 03-21 16:51

美圖M6s發布：Angelababy自曝高清自拍簡直美炸了

昨天美圖正式發布了新一代的美圖的手機M6s，美圖的首席代言人Angelababy隨即在微博曬出了由美圖M6s拍攝的自拍美照，并附文稱一張高清

發表于 12-06 18:22 ?2493次閱讀

美圖V4高清圖賞

要說手機圈最為養眼的發布會，當然要數美圖了。作為行業內“顏值”最高的新品發布會，美圖手機似乎一直在堅持把手機發布會當成時尚秀來辦。美女帥哥紅毯已成標配，明星網紅更是紛來捧場，熱鬧非凡。

發表于 12-14 10:34 ?3760次閱讀

python3.3抓取網頁數據的程序資料免費下載

本文檔的主要內容詳細介紹的是python3.3抓取網頁數據的程序資料免費下載。

發表于 01-29 15:19 ?21次下載

美圖V7高清圖賞

1月8日下午，美圖手機正式發布美圖V7標準版，搭載驍龍845處理器，全球首創的前置三攝配置，支持“前置AI夜拍美顏”“3D凝時相機”“閉眼修復”等攝影功能。

發表于 01-30 09:25 ?3609次閱讀

美圖皮膚檢測儀高清圖賞

近日，美圖手機官方微博發布告別信，宣布將在年中關閉手機業務，將旗下美圖手機的品牌獨家授權給小米集團。

發表于 05-29 09:01 ?5145次閱讀

用Python寫網絡爬蟲的PDF電子書免費下載

本書講解了如何使用Python 來編寫網絡爬蟲程序，內容包括網絡爬蟲簡介，從頁面中抓取數據的三種方法，提取緩存中的數據，使用多個線程和進程來進行

發表于 07-08 08:00 ?9次下載

小米CC9美圖定制版高清圖賞

去年底，小米宣布收購美圖手機，未來美圖手機將由小米運營。在7月2日晚的發布會上，小米正式發布了小米CC9美圖定制版，也就是之前的“小仙女”手機，小米負責硬件的生產研發，但相機部分則是100%由

發表于 07-08 09:56 ?3307次閱讀

Python爬蟲：使用哪種協議的代理IP最佳？

網絡大數據要抓取信息，大多需要經過python爬蟲工作，爬蟲能夠幫助我們將頁面的信息抓取下來。

發表于 06-28 16:25 ?1936次閱讀

Python網絡設備巡檢(異常自動報警)

python抓取交換機的信息。

發表于 12-29 09:09 ?3042次閱讀

使用Python對網絡設備進行運維的思路分析

用python代碼抓取交換機的上面的信息，例如客戶端的MAC地址，交換機端口，并把抓取的信息篩選，存入sqlserver數據庫。

發表于 01-26 16:38 ?549次閱讀

Python庫解析：通過庫實現代理請求與數據抓取

在Python中，有多個庫可以幫助你實現代理請求和數據抓取。這些庫提供了豐富的功能和靈活的API，使得你可以輕松地發送HTTP請求、處理響應、解析HTML/XML/JSON數據，以及進行復雜的網絡操作。

發表于 10-24 07:54 ?138次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

Python抓取網絡高清美圖

評論

美圖秀秀（美圖大師）

如何使用高清網絡機頂盒

小米聯姻美圖最大的敵人還是蘋果！

python網絡爬蟲概述

美圖M6s發布：Angelababy自曝高清自拍簡直美炸了

美圖V4高清圖賞

python3.3抓取網頁數據的程序資料免費下載

美圖V7高清圖賞

美圖皮膚檢測儀高清圖賞

用Python寫網絡爬蟲的PDF電子書免費下載

小米CC9美圖定制版高清圖賞

Python爬蟲：使用哪種協議的代理IP最佳？

Python網絡設備巡檢(異常自動報警)

使用Python對網絡設備進行運維的思路分析

Python庫解析：通過庫實現代理請求與數據抓取