郭兵个人网站

自古人无死,人无信不立

« MIME设置功能后缀名设置 配置 IIS 在 64 位 Windows 上运行 32 位 ASP.NET 应用程序 »

如何设置网页被百度收录页面的权重性?我该收录的他没收录,比较次要的页反而

问题:敬辞怎样配备布置网页被百度收录页面的权重性?我该收录的他充公录,比力非主要的页反倒收录了,需要怎么措置惩罚?

我的站是:www.ywbhw.com


最佳回答:Robots.txt 把该文件放在网页根目次

robots.txt是搜刮引擎中拜候网站的时辰要查看的第1个文件。Robots.txt文件告诉蛛蛛步伐在办事器上啥子文件是可以被查看的。

当1个搜刮蛛蛛拜候1个站点时,它会头先查抄该站点根目次下是不是存在robots.txt,如果存在,搜刮呆板人就会根据该文件中的内容来确定拜候的规模;如果该文件不存在,所有的搜刮蛛蛛将可以容或拜候网站上所有无被口令保护的页面。

robots.txt必需放置在1个站点的根目次下,并且文件名必需全数小写。

语法:最简略的 robots.txt 文件施用两条规则:
• User-Agent: 合用下面所开列规则的周游器
• Disallow: 要中途阻挡的网页


1. 每一当用户试图拜候某个不存在的URL时,办事器都会在日志中记录404错误(没有办法找到文件)。每一当搜刮蛛蛛来寻觅其实不存在的robots.txt文件时,办事器也将在日志中记录一条404错误,以是你应该在网站中新增1个robots.txt。

2. 网站管理员必需使蛛蛛步伐阔别某些办事器上的目次——包管办事器机能。比如:大大都网站办事器都有步伐储存在“cgi-bin”目次下,是以在robots.txt文件中加入“Disallow: /cgi-bin”是个好主张,这样可以容或制止将所有步伐文件被蛛蛛引患上,可以节流办事器资源。一般网站中不需要蛛蛛抓取的文件有:后台管理文件、步伐剧本、附件、数值库文件、编码文件、范式表文件、模型板文件、导航图片以及配景图片等等。

下面是VeryCMS里的robots.txt文件:
User-agent: *
Disallow: /admin/ 后台管理文件
Disallow: /require/ 步伐文件
Disallow: /attachment/ 附件
Disallow: /images/ 图片
Disallow: /data/ 数值库文件
Disallow: /template/ 模型板文件
Disallow: /css/ 范式表文件
Disallow: /lang/ 编码文件
Disallow: /script/ 剧本文件

3. 如果你的网站是动态网页,并且你为这些个动态网页始于了静态副本,以供搜刮蛛蛛更容易抓取。那末你需要在robots.txt文件里配备布置制止动态网页被蛛蛛引患上,以包管这些个网页不会被视为含重复内容。

4. robots.txt文件里还可以直接包孕在sitemap文件的链接。就像这样:
Sitemap: sitemap.xml

今朝对于此暗示支持的搜刮引擎公司有Google, Yahoo, Ask and MSN。而中文搜刮引擎公司,显然不在这个圈子内。这样做的利益就是,站长不用到每个搜刮引擎的站长东西或者相似的站长部门,去提交处理自己的sitemap文件,搜刮引擎的蛛蛛自己就会抓取robots.txt文件,读取此中的sitemap路径,接着抓取此中相链接的网页。

5. 合理施用robots.txt文件还能制止拜候时堕落。比如,不克不及让搜刮者直接步入购物车页面。由于没有理由使购物车被收录,以是你可以在robots.txt文件里配备布置来遏止搜刮者直接步入购物车页面。


其他回应1: 你觉患上好 百度却不附以及
多点原创 时常更新 信赖会好的
 

  • 相关文章:

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

最新评论及回复

最近发表

Powered By Z-Blog 1.8 Devo Build 80201  Theme By Bokezhuti.cn

Copyright www.guobing.com Your WebSite. Rights Reserved.
冀ICP备06002790号