[爆卦]網頁擷取是什麼?優點缺點精華區懶人包

為什麼這篇網頁擷取鄉民發文收入到精華區:因為在網頁擷取這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者kimari ()看板Web_Design標題[問題] 如何從其他網頁擷取特定內容時間Tue O...

網頁擷取 在 JobUs職場小旅行 Instagram 的最佳貼文

2021-07-06 07:11:20

我們在找尋資料或要做報告時,總會從網路上下手,複製一些線上的文獻資料與圖片,但有時候在未來要翻找的時候便找不到網頁了😅!而就算只是隨意瀏覽,有時候看到自己想要保存的內容,使用書籤一下子就被淹沒了一點也不好找到😢,這樣該怎麼辦呢?  因此我們今天就是要推薦給大家6款一鍵擷取網頁資訊的插件,教大家除...


各位板友好,我是自學 html, css 的初學者。

目前我手邊有2個網頁檔如下:


A網頁部分原始碼:
<div>連絡資訊: 1234</div>

B網頁部分原始碼:
<table><tr><td>9876</td></tr></table>


A網頁我可以自由編輯原始碼,但沒有 php 或 asp 的權限 (我也不會)
B網頁網址未公開,但沒設權限,故有網址的人都能看到,
但一來我沒有權限改裡面內容,二來作者僅同意我擷取9876的內容,
不希望我直接公開網址,因為網頁中可能包含 ABCD 等其他內容。
故不能直接用 iframe 連到B網頁

曾試過用 Google Sheet 的 IMPORTXML 函數功能,來顯示9876的內容。
該功能可順利擷取到B網頁我要的內容,但 Google Sheet 畢竟不能取代網頁。
https://support.google.com/docs/answer/3093342

想請問如果在只有單純修改A網頁的權限限制下,
是否能運用類似 Google Sheet IMPORTXML 功能,
來讓看A網頁的瀏覽者,自動去抓取B網頁的9876內容,並取代原本的1234,
以達到A網頁可以即時顯示B網頁部份內容功能。
因為B網頁的9876內容每天都會變,可能隔天就變5566…

謝謝各位板友讀完問題,並懇請解惑,萬分感謝。

--
※ 文章網址: https://www.ptt.cc/bbs/Web_Design/M.1603810317.A.E70.html
ssccg: 你可以編輯原始碼但是沒後台的權限? 那你編的原始碼是在哪 10/27 23:21
ssccg: 如果是有後台的網頁,要能改到後台的原始碼才叫能改原始碼 10/27 23:21
ssccg: 如果你真能改原始碼好了,那就是寫程式去抓B的內容放進去 10/27 23:23
ssccg: 沒有別條路,你改在前端(html)放網址的話瀏覽者一定看的到 10/27 23:24
抱歉沒說明清楚,我有後台管理介面,可以刪、增伺服器檔案也可以修改網頁。
但一些 php 留言板或論壇的功能,我就只有管理介面附的陽春選項可改,
而不能增加 php 的功能 (我也不會 orz)

至於您說的 "寫程式去抓B的內容放進去" 是指利用 javascript 之類的功能嗎?
我知道只要前端的話瀏覽者就一定看得到,但如果可以用比較迂迴的方式,
讓瀏覽者不會直接從A網頁看到B網頁的網址,就達到目的了。
(意即瀏覽者從原始碼挖B網頁的網址就不管了)
※ 編輯: kimari (111.252.39.242 臺灣), 10/27/2020 23:40:13
pm2001: 如果沒辦法用伺服器端完成這個事情 那根本無法隱藏B網頁 10/28 07:56
Rplus: Google App script function: UrlFetchApp 10/28 08:42
not5not6not7: 我個人會用先php curl去抓網頁內容 10/29 11:57
laechan: 或者寫支小python去抓 10/29 22:16

你可能也想看看

搜尋相關網站