[爆卦]網 路 爬蟲 PTT是什麼?優點缺點精華區懶人包

為什麼這篇網 路 爬蟲 PTT鄉民發文收入到精華區:因為在網 路 爬蟲 PTT這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者jamesxxx1997 (黃~)看板Python標題[問題] 想請教學網路爬蟲前的預備知識有哪...

網 路 爬蟲 PTT 在 矽谷輕鬆談 Just Kidding Tech Instagram 的精選貼文

2021-08-18 20:58:44

EP48 Facebook 槓上新聞議價法全面下架澳洲新聞 Facebook 和 Google 為何反應截然不同? #Facebook一波未平一波又起 幾天前 Facebook 宣布封鎖澳洲新聞,全面下架澳洲媒體,限制澳洲媒體的貼文和連結,所有使用者們無法在 Facebook 上找到任何澳洲新聞...


各位大大好,新手想在此請教一下,若想學習網路爬蟲,有哪些先備知識要先會呢?
也想知道,應該學多深
(像是我知道好像要先學HTML和CSS,不過不清楚應該學到哪個程度,javascript亦然)


謝謝各位大大~

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.83.22.152
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1507307029.A.F35.html
neil987: 學會看youtube跟google查東西 10/07 12:04
lizkarina: 首先網路連線要懂一點,tcp/ip, udp. 怎麼用socket. 10/07 13:10
lizkarina: tls/ssl. http protocol(get,post...)/headers/cookies 10/07 13:13
lizkarina: http status code. https(http over tls). 如果要取的 10/07 13:14
lizkarina: 資料用javascript生成,你就需要web driver. 10/07 13:15
lizkarina: #webdriver. 再來看你取的資料是html,json,圖片,影像 10/07 13:17
lizkarina: 或是音樂,再學相對應的知識。 10/07 13:18
jamesxxx1997: 謝謝neil大的解答,收穫良多~ 10/07 18:09
jamesxxx1997: 好的,謝謝l大,你的意思是說其實這是一個很廣泛 10/07 18:09
jamesxxx1997: 的東西對吧,那我就先照你說的,學西一些網路連線 10/07 18:10
jamesxxx1997: 的概念,感謝~ 10/07 18:11
sean50301: 稍微了解一下css跟xpath就可以爬簡單的網頁了 10/07 18:35
areyo: 大數學堂 10/07 19:16
f496328mm: https://goo.gl/V41YL2 10/08 06:37
f496328mm: 學爬蟲 推薦這串影片 講得蠻好的 10/08 06:38
goldflower: 大數學堂無敵 真的 10/08 16:07
goldflower: 應該不會看到比這邊還詳細的影片了 10/08 16:08
vi000246: 正規表達式也可以學一下 會方便很多 10/08 16:24
f496328mm: 正規可以說是必備 10/09 00:34
jamesxxx1997: 恩恩,現在正在學正規表達式(re模組) 10/09 13:17
jamesxxx1997: 謝謝各位的指導XDD 10/09 13:17
mantour: 先找一個你想爬的網站,然後用到什麼學什麼 10/20 20:27
jamesxxx1997: 想要爬CDC網站的圖片及文章 11/14 16:14

你可能也想看看

搜尋相關網站