[爆卦]Python 下載 網頁 所有 檔案是什麼?優點缺點精華區懶人包

為什麼這篇Python 下載 網頁 所有 檔案鄉民發文收入到精華區:因為在Python 下載 網頁 所有 檔案這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者jerryskin (小光)看板Python標題[問題] 請問如何大量下載某網頁上的圖片時間We...

2/1
感謝板友的回覆與來信
全部的照片已手動備份完畢
現階段還是很多人
因無法一次性備份照片而苦惱
被這款流氓app綁架中...
1/24
處於放棄狀態…一天一天備份中
感謝板友
1/23
瀏覽器使用chrome,網頁完整儲存檔案
https://tinyurl.com/wr4sera
請板友幫忙看網頁結構,謝謝


因為從小孩2015年出生到現在
都使用(時光小屋)這個APP

從2018年8月開始
APP製造商不再提供照片批次備份程式
網頁也沒有備份照片的按鈕可以按

只能透過手機APP,一天一天的去備份照片
備份下來再想辦法傳送到電腦

我有3個小孩,分別使用4年2年1年
我有3個小孩,分別使用4年2年1年
我有3個小孩,分別使用4年2年1年
全部7年,一共2100天,等於要備份2100次



google許多方法都無效
(可以google"時光小屋備份"就知道了)

後來發現有python
研究了一兩天還是沒有辦法成功一次性的下載

目前自行摸索狀況如下
import requests
from bs4 import BeautifulSoup
res = requests.get('https://www.peekaboomoments.com/zh-CN/home/537104626')
soup = BeautifulSoup(res.text)
for img in soup.select('???????'):
print ???????
卡關了.....不知該如何繼續下去

來此版尋求幫助,謝謝各位


--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.175.13.86 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1579706454.A.5E1.html
dododavid006: 如果要知道如何下載需要知道網頁的結構,但你給出的01/22 23:34
dododavid006: 如果要知道如何下載需要知道網頁的結構,但你給出的01/22 23:34
dododavid006: 網址似乎需要登入才能看到內容,所以如果你無法給出01/22 23:34
dododavid006: 網址似乎需要登入才能看到內容,所以如果你無法給出01/22 23:34
dododavid006: 一個範例來我覺得版上的大大們也是會愛莫能助01/22 23:35
dododavid006: 你可以把網頁存下來,存的時候選完整內容,然後會拿01/22 23:36
dododavid006: 到一個 html 檔與一個資料夾,資料夾中你可以把你的01/22 23:36
dododavid006: 小孩的照片刪掉,再把檔案跟資料夾一起壓縮傳到雲端01/22 23:37
dododavid006: 這樣網頁中照片的部份就會處於遺失圖片的狀態,但這01/22 23:37
dododavid006: 不會影響到檢查網頁結構的部份01/22 23:38
dododavid006: 另外我個人的意見是,雖然 python 也是能做這種事,01/22 23:38
dododavid006: 但因為還要處理登入的問題,所以可能使用瀏覽器的01/22 23:39
dododavid006: userscript 會比較方便01/22 23:39
感謝d大,我再下載整個網頁給板友們幫忙看網頁結構
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 00:28:26
vi000246: 你要不要直接發案給別人接比較快01/23 01:49
感謝v大
沒有這樣子的經驗,請問如果依此案的需求可能會需要多少費用呢?
沒有這樣子的經驗,請問如果依此案的需求可能會需要多少費用呢?
如果不方便透漏也可以站內信,謝謝
fiorentino: 可以用Python的selenium來做01/23 04:46
fiorentino: 可以用Python的selenium來做01/23 04:46
感謝f大
我再朝selenium的方向前進看看
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 07:40:17
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 07:50:43
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 07:50:43
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 07:51:25
shala: 從提供的網頁結構仍無法確定大圖網址,幫不上忙01/24 16:59
shala: 從提供的網頁結構仍無法確定大圖網址,幫不上忙01/24 16:59
感謝s大
目前處於放棄狀態 以天備份中
不過如果有方法的話 應該可以幫到很多人
※ 編輯: jerryskin (223.139.250.36 臺灣), 01/24/2020 17:13:22
※ 編輯: jerryskin (223.139.250.36 臺灣), 01/24/2020 17:15:16
s860134: 我嘗試註冊 看起來沒有提供網頁板?01/24 22:25
回s大
我沒有單純使用網頁註冊,一開始用app註冊
後來開網頁登入,一樣可以上傳照片
※ 編輯: jerryskin (223.139.250.36 臺灣), 01/24/2020 22:39:52
windclara: 建議去CodeJob發案吧。用爬蟲是有很大機會能做到。但01/25 10:33
windclara: 建議去CodeJob發案吧。用爬蟲是有很大機會能做到。但01/25 10:33
windclara: 卡在需要登入,你無法隨意公開自己的帳密。再來您對Py01/25 10:33
windclara: thon也不算熟悉。所花的時間成本更巨大。但發案頂多101/25 10:33
windclara: 個人知道,且還可以改掉密碼,避免洩漏自己常用密碼。01/25 10:34
nyitalumnus: 好像有個軟體叫做: offline enterprise.可以把整個02/01 23:49
nyitalumnus: 網站都下載下來。02/01 23:49
※ 編輯: jerryskin (1.175.4.84 臺灣), 02/02/2020 08:44:14
※ 編輯: jerryskin (1.175.4.84 臺灣), 02/02/2020 17:29:22

你可能也想看看

搜尋相關網站