[爆卦]python requests登入是什麼?優點缺點精華區懶人包

為什麼這篇python requests登入鄉民發文收入到精華區:因為在python requests登入這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者liquidbox (樹枝擺擺)看板Python標題[問題] 以requests登入網站時間Mo...


我遇到一個網站,一進入就會prompt,提醒需要輸入帳密,

我可以用selenium連上 https://username:[email protected]
並取得我想要爬取的資料

但selenium實在太慢了,所以我想回歸原本使用requests+lxml,
卻無法使用 https://username:[email protected] 的方式登入,
會一直引發ConnectionError(err, request=request)

我想試著用requests.get(url,auth=(username,password))
也一樣會引發ConnectionError

想請問像這類的網站是否可直接利用requests登入?
謝謝

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.111.96 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1561973826.A.9F5.html
TakiDog: 當然可以 07/01 20:09
s860134: 因為沒有具體範例 無法給建議 07/01 23:46
liquidbox: 瞭解,謝謝 07/02 06:54
coeric: 一個網站.....到底哪一個網站 這是請鬼拿藥單嗎? 07/02 10:22
TakiDog: 這大概basic auth才會出現的連線方式,我也回當然可以, 07/02 16:21
TakiDog: 也不算資訊不足啦 07/02 16:21
謝謝分享,我單純認為,
也許requests針對https://username:password@host會有通用的處理方法
加上網站不便提供,所以沒辦法進一步清楚
結果跟爬蟲怎麼爬一樣,這件事得見招拆招,證實這件事比我原先想的更複雜

先前試了網路上幾種方法都沒能成功,只好等日後技能點齊一點再來想辦法
但我還是學到了requests有解,但我功力不夠這件事,
至少方向出來了,謝謝分享
※ 編輯: liquidbox (61.230.111.96 臺灣), 07/02/2019 17:51:48
ssivart: 用 selenium 發的請求是會帶瀏覽器 header 跟 cookie 或 07/04 00:36
ssivart: 有些表單需要的 csrf token等等 所以可以成功 建議你可 07/04 00:36
ssivart: 以觀察登入時帶了哪些參數 以及開f12看登入方式是走 pos 07/04 00:36
ssivart: t back 還是 jwt或其他 都了解清楚後再想辦法用 request 07/04 00:36
ssivart: 模擬 07/04 00:36
ssivart: 另外登入通常是用 HTTP POST 不是 GET 07/04 00:37
原來如此,謝謝詳細說明,
我從這個方向去試試看,謝謝
※ 編輯: liquidbox (36.224.143.114 臺灣), 07/04/2019 18:49:27

你可能也想看看

搜尋相關網站