立即注册 找回密码

QQ登录

只需一步,快速开始

【SEO教程】第二十课 robots协议之偷梁换柱-懒人模式 道勤网录制

2015-1-26 02:21| 发布者: quanshiyinian| 查看: 835| 评论: 0|原作者: quanshiyinian|来自: 原创

摘要: 这节课视频较长,加载稍慢,请大家耐心等待10-20秒中后观看!主讲内容:robots协议之偷梁换柱-懒人模式 (无法观看请刷新页面等待10-20秒,单击播放器右下角可全屏观看)什么是Robots协议?Robots协议也称为爬虫 ...
这节课视频较长,加载稍慢,请大家耐心等待10-20秒中后观看!主讲内容:robots协议之偷梁换柱-懒人模式

(无法观看请刷新页面等待10-20秒,单击播放器右下角可全屏观看)
什么是Robots协议?

Robots协议也称为爬虫协议、机器人协议,网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。

Robots协议一般是一个文本文件,命名为robots.txt并且存放在网站根目录。

Robots协议的作用:

1、告诉搜索引擎网站上面的页面哪些可以抓取,不该抓取的就不要抓取。

2、告诉搜索引擎可以重点或者首先抓取哪个页面,配合网站地图效果更佳。

如何设置Robots协议?

工具:http://tool.chinaz.com/robots/

Robots协议一般命名为robots.txt,存放在网站根目录。

备注:如果网站根目录没有robots.txt,那么说明该网站允许所有搜索引擎抓取。

高清视频下载地址:seo课程下载地址.txt下面是robots协议常用的发给大家,一起学习交流:
【SEO教程】第二十课 robots协议之偷梁换柱-懒人模式 道勤网录制
下面把相关的课程资料也发给大家,
  1. 最常用的 robots文件使用两条规则:User-Agent: (后面跟着允许的搜索引擎蜘蛛)
  2. Disallow: (后面跟着要拦截的网页)
  3. 具体详细写法有:
  4. User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符
  5. Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录
  6. Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录
  7. Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录   
  8. Disallow: /ABC 这里定义是禁止爬寻ABC整个目录 
  9. Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。
  10. Disallow: /*?* 禁止访问网站中所有的动态页面
  11. Disallow: .jpg$ 禁止抓取网页所有的.jpg格式的图片
  12. Disallow:/ab/adc.html 禁止爬寻ab文件夹下面的adc.html所有文件
  13. -------------------------------------------------------------------------





  14. Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录
  15. Allow: /tmp 这里定义是允许爬寻tmp的整个目录
  16. Allow: .htm$ 仅允许访问以".htm"为后缀的URL。
  17. Allow: .gif$ 允许抓取网页和gif格式图片例1.
  18. User-agent: * Disallow: /禁止所有搜索引擎访问网站的任何部分


  19. Allow: /tag.html
复制代码
  1. #
  2. # robots.txt for discuz! X3
  3. #

  4. User-agent: *
  5. Disallow: /api/
  6. Disallow: /data/
  7. Disallow: /source/
  8. Disallow: /install/
  9. Disallow: /template/
  10. Disallow: /config/
  11. Disallow: /uc_client/
  12. Disallow: /uc_server/
  13. Disallow: /static/
  14. Disallow: /admin.php
  15. Disallow: /search.php
  16. Disallow: /member.php
  17. Disallow: /api.php
  18. Disallow: /misc.php
  19. Disallow: /connect.php
  20. Disallow: /forum.php?mod=redirect*  论坛的一些跳转页面
  21. Disallow: /forum.php?mod=post*   论坛发帖页面
  22. Disallow: /home.php?mod=spacecp*   用户的个人资料页面
  23. Disallow: /userapp.php?mod=app&*   用户应用的页面(就是那个很多游戏的云平台)
  24. Disallow: /*?mod=misc*   提示的跳转页面
  25. Disallow: /*?mod=attachment*    附件的页面
  26. Disallow: /*mobile=yes*   手机浏览器的页面
  27. Disallow: /*?*   禁止访问网站中所有的动态页面
复制代码




鲜花

握手

雷人

路过

鸡蛋
相关推荐
!jz_fbzt! !jz_lxwm! !jz_gfqqq!

关于我们|手机版|小黑屋|地图|【道勤网】-www.daoqin.net 软件视频自学教程|免费教程|自学电脑|3D教程|平面教程|影视动画教程|办公教程|机械设计教程|网站设计教程【道勤网】 ( 皖ICP备15000319号-1 )

GMT+8, 2024-5-5 19:37

Powered by DaoQin! X3.4 © 2016-2063 Dao Qin & 道勤科技

返回顶部