我們做的每一個(gè)方面都使搜索引擎捕獲和輸入,但事實(shí)上,在許多情況下我們也需要防止搜索引擎捕獲和輸入,例如,公司的內(nèi)部測試網(wǎng)站,也許內(nèi)部網(wǎng),也許后臺登錄頁面,一定不能指望被外部人員發(fā)現(xiàn),所以我們需要停止搜索引擎捕獲。
給咱們發(fā)一張制止查找引擎抓取網(wǎng)站的查找成果截圖:咱們能夠看到,描繪沒有被抓取到,而是有一句提示:因?yàn)樵摼W(wǎng)站的robotstxt文件存在約束指令(約束查找引擎抓取),體系無法供給該頁面的內(nèi)容描繪。Robots是站點(diǎn)與spider交流的重要途徑,站點(diǎn)經(jīng)過robots文件聲明本網(wǎng)站中不想被查找引擎錄入的部分或許指定查找引擎只錄入特定的部分。
百度查找robots全新晉級晉級后robots將對網(wǎng)站視頻URL錄入抓取狀況僅當(dāng)您的網(wǎng)站包括不期望被視頻查找引擎錄入的內(nèi)容時(shí),才需求運(yùn)用robotstxt文件如果您期望查找引擎錄入網(wǎng)站上一切內(nèi)容,請勿樹立robotstxt文件。
如您的網(wǎng)站未設(shè)置robots協(xié)議,百度查找對網(wǎng)站視頻URL的錄入將包括視頻播放頁URL,及頁面中的視頻文件視頻周邊文本等信息,查找對已錄入的短視頻資源將對用戶呈現(xiàn)為視頻極速體會(huì)頁此外,綜藝影視類長視頻,查找引擎僅錄入頁面URL.