三個Python爬蟲版本，帶你以各種方式爬取校花網，輕鬆入門爬蟲

2018-12-29 尋夢園科技 820 Views

三個Python爬蟲版本，帶你以各種方式爬取校花網，輕松入門爬蟲

爬蟲是什麼？

如果我們把互聯網比作一張大的蜘蛛網，數據便是存放於蜘蛛網的各個節點，而爬蟲就是一只小蜘蛛，

沿著網路抓取自己的獵物（數據）爬蟲指的是：向網站發起請求，獲取資源後分析並提取有用數據的程序；

從技術層面來說就是通過程序模擬瀏覽器請求站點的行為，把站點返回的HTML代碼/JSON數據/二進制數據（圖片、視頻）爬到本地，進而提取自己需要的數據，存放起來使用；

Python學習資料或者需要代碼、視頻加Python學習群：960410445

版本：Python3

系統：Windows

IDE： Pycharm

請求庫：requests,selenium（可以驅動瀏覽器解析渲染CSS和JS，但有性能劣勢（有用沒用的網頁都會加載）；）

解析庫：正則，beautifulsoup，pyquery

存儲庫：文件，MySQL，Mongodb，Redis

三個Python爬蟲版本，帶你以各種方式爬取校花網，輕松入門爬蟲

三個Python爬蟲版本，帶你以各種方式爬取校花網，輕松入門爬蟲

三個Python爬蟲版本，帶你以各種方式爬取校花網，輕松入門爬蟲

三個Python爬蟲版本，帶你以各種方式爬取校花網，輕松入門爬蟲

（如果一共需要爬30個視頻，開30個線程去做，花的時間就是其中最慢那份的耗時時間）

三個Python爬蟲版本，帶你以各種方式爬取校花網，輕松入門爬蟲

明白了Python爬蟲的基本流程，然後對照代碼是不是覺得爬蟲特別的簡單呢？

About 尋夢園

尋夢園是台灣最大的聊天室及交友社群網站。致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。擁有數百間不同的聊天室，讓您隨時隨地都能找到志同道合的好友！