作者liwei290341 (darling341)
看板Python
標題[問題] 關於Dcard的爬蟲批量下載圖檔
時間Wed Dec 26 14:29:32 2018
各位大家好,搭給後,台尬侯!
小弟近期在學習python的爬蟲,由於接觸不久,所以上來詢問
近期魯宅我想努力變帥,所以在爬D卡上的穿搭版,想試著把每張照片下載下來
當作是造型型錄逐一改造自己,但發現網路上關於D卡爬蟲的相關文章好少
不知道是否能有大神幫幫忙,提供點方向或是提供個線索給魯宅我
感激不盡!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.50.131.36
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1545805774.A.C50.html
→ jiyu520: ...你有嘗試過的話,會發現根本不難啊 12/26 14:40
→ virginbear: 我猜你其實想爬的是另外一個版吧 12/26 14:44
→ CMJ0121: 等到你的爬蟲被他們 ban 再來討論吧 XD 12/26 14:54
推 woogee: 我的爬蟲抓了半年左右被ban了,換成headless再戰一波 12/26 16:27
→ woogee: 關鍵字:Dcard API 12/26 16:27
→ woogee: 還用CNN寫了個辨識"男生穿搭"還是"女生穿搭"的程式 12/26 16:28
推 tses89214: 想爬什麼版啊~~~XD 12/26 18:53
推 yushes920179: 太明顯了 你才不是要爬穿搭 少騙 12/26 19:08
推 damnbear: 我不相信你 12/26 19:29
推 nini200: 大家都老司機..... 12/26 20:32
推 Vere: 我連抓4天IP被ban,不過還好hinet換IP很快 12/27 01:08
推 mizumutsuki: 為什麼會被ban啊,是抓的速度太快嗎 12/27 06:57
推 CMJ0121: 原因不知道 我只知道 header 帶我的 ID 就居居了 ker 12/27 15:53
→ liwei290341: 另外一個版是順便拉~~不是主要拉 哈哈哈 12/30 00:12
→ liwei290341: 我有試著自己嘗試過了 但是因為還太菜 所以很多部分 12/30 00:13
→ liwei290341: 不知道從哪下手 才上來求助 12/30 00:13
→ liwei290341: 謝關鍵字 會再試試看的! 12/30 00:14
→ liwei290341: 我嘗試了幾天發現,是不是現在DCA在防爬蟲啊?API的 01/02 11:46
→ liwei290341: 部分似乎不是json格式,用soup抓下來也是一堆!![]+!! 01/02 11:47
→ liwei290341: 似乎完全看不到內文,請問還有大大願意試試看嗎? 01/02 11:48
推 HenryLiKing: 給一下API我試試看嗎? 01/24 12:08