網站上線,只能全站被收錄嗎? 若是希望有部分頁面拒絕被索引,亦或者若我的網站有些東西不想被搜尋到或"暫時"不想被搜尋到,可以使用下述方式: 是網頁內作法,使用所謂的meta標籤阻擋,但壞處是必須每一個網頁都需獨立設置使用。 而第二種方式,則是可以針對整個網站做規範的限制,這就是本次要講的主題:Robots.txt。 為何有網頁不想被收錄的可能? 比較可能出現的情境與受眾比較常見的可能有這些 尚未完成的網站但需上線實測的網站:有些網站可能上線是為了協作測試,亦或者用工具做壓力測試,但測試階段又不想被搜尋引擎檢索內容,這時就可以用到Robots.txt做排除了。(但在這建議搭配noindex使用,效果最佳) 網站管理者後台:有許多CMS(內容管理系統,如:Wordpress)與自行架設的網站會提供管理者後台登入的入口,這些通常是為了網站維護與管理而設置的入口,沒有被檢索的必要。 特定資料夾內檔案:網站希望搜尋引擎檢索的,往往是有內容的資訊,許多後台使用的檔案,就會以資料夾形式或正規字元方式(正規字元使用方式可見此篇後續的進階使用說明)做排除檢索的動作。
確定! 回上一頁