首页 > 运营 > 建站经验 > 正文

如何预防robots.txt文件泄露网站后台目录

2020-07-03 12:52:17
字体:
来源:转载
供稿:网友
这篇文章主要为大家详细介绍了如何预防robots.txt文件泄露网站后台目录,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴。

关于如何预防robots.txt文件泄露网站后台目录的问题,我们首先需要了解robots.txt文件的用途和作用。

Robots使用说明

  1. robots.txt可以告诉搜素引擎你网站的哪些页面可以被抓取,哪些页面不可以被抓取。

  2. 屏蔽无价值的页面。

  3. 屏蔽重复路径。

  4. 屏蔽死链等。

了解了robots.txt的功能后,我们会发现这样的一个问题:

问题描述:

在robots.txt文件中设置搜索引擎不允许访问“后台目录”,但是别人就会下载到robots.txt然后找出后台目录的地址,路径泄漏导致不安全隐患,有什么解决方法吗?当然有,下面361模板给出一般的解决方法。

解决方法:

首先,robots.txt是必须保证任何人、包括搜索引擎能访问的,否则就没有意义了,不能起到应有的作用。也可以这样说,只要搜索引擎能访问robots.txt,那任何人肯定也能访问。

由于robots.txt不支持通配符和表达式等各种条件的判断,所有只能通过变通的方法来实现尽可能的安全。

如果需要设置搜索引擎不允许访问“后台目录”、又不想让其他人看到后台目录(这是必须考虑到的!),假设后台目录是 /admin123/,那么我们可以在设置的时候这样写:

    User-agent: *    Disallow: /adm*/

关键在第二句,这样写就会阻止搜索引擎访问任何以“adm”开头的文件和目录。为了防止别人猜出你的后台目录,这里截取的越短越好,比如:

    User-agent: *    Disallow: /a*/

这样,同样起到作用,但留的字母更少,更难猜了,这时会阻止搜索引擎访问所有以“a”开头的文件和目录。

这里需要注意一个问题,就是要避免影响其它的目录和文件,可以通过修改后台目录来实现,不要把别的需要收录的文件或目录一块给屏蔽了。

如果后台目录以某个字母或几个字母开头,那就避免其它需要被收录的文件或目录以这几个字母开头,这样就可以了。

你学会了吗?这就是如何预防robots.txt文件泄露网站后台目录的全部内容。


以上就是如何预防robots.txt文件泄露网站后台目录的全部内容,希望对大家的学习和解决疑问有所帮助,也希望大家多多支持错新网。
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表