0514-86177077
9:00-17:00(工作日)
看了下日志,发现有几条类似这样的:2010-07-27 16:03:33 W3SVC1129513256 221.192.135.26 GET /a/view/18691.html - 80 - 203.208.60.251 Mediapartners-Google 200 0 0Mediapartners-Google是什么,搜索一下,原来是Google Adsense的漫游器。
以下内容来自 网站管理员支持中心 我希望网站的某些网页不被编入索引,但要在这些页上显示 AdSense 广告。能否满足我的这一要求? 可以。您可以在这些网页上禁用 (Disallow) 除 Mediapartners-Google 之外的所有漫游器。这样可确保不将网页编入索引,但可让 Googlebot-MediaPartners 漫游器分析这些网页,以确定是否显示广告。Googlebot-MediaPartners 漫游器不与其他 Google 用户代理共享网页。例如,您可以使用下列条目:User-Agent:*Disallow:/folder1/User-Agent:MediaPartners-GoogleAllow:/folder1/如何拦截 Googlebot? 拦截 GooglebotGoogle 使用多个 user-agent。您可以在条目的 User-Agent 行中包含漫游器名称来拦截对网页的访问。拦截 Googlebot 将会拦截所有以"Googlebot"开头的漫游器。Googlebot:从我们的网站索引和新闻索引中抓取网页 Googlebot-Mobile:针对我们的移动索引抓取网页 Googlebot-Image:针对我们的图片索引抓取网页 Mediapartners-Google:抓取网页确定 AdSense 的内容。只有在您的网站上展示 AdSense 广告的情况下,我们才会使用此漫游器来抓取您的网站。 Adsbot-Google:抓取网页来衡量 AdWords 目标网页的质量。只有在您使用 AdWords 为您的网站做广告的情况下,我们才会使用此漫游器。参阅关于此漫游器的更多信息以及如何在您的网站上执行部分拦截。 例如,要完全拦截 Googlebot,您可以使用下列语法:User-agent:Googlebot Disallow:/允许 Googlebot如果您要拦截除 Googlebot 以外的所有漫游器访问您的网页,可以使用下列语法:User-agent:Disallow:/User-agent:GooglebotDisallow:Googlebot 跟随指向它自己的行,而不是指向所有漫游器的行。"Allow"扩展名Googlebot 可识别称为"Allow"的 robots.txt 标准扩展名。其他搜索引擎的漫游器可能无法识别此扩展名,因此请使用您感兴趣的其他搜索引擎进行查找。"Allow"行的作用原理完全与"Disallow"行一样。只需列出您要允许的目录或页面即可。您也可以同时使用"Disallow"和"Allow"。例如,要拦截子目录中某个页面之外的其他所有页面,可以使用下列条目:User-Agent:GooglebotDisallow:/folder1/Allow:/folder1/myfile.html这些条目将拦截 folder1 目录内除 myfile.html 之外的所有页面。如果您要拦截 Googlebot 并允许 Google 的另一个漫游器(如 Googlebot-Mobile),可使用"Allow"规则允许该漫游器的访问。例如:User-agent:GooglebotDisallow:/User-agent:Googlebot-MobileAllow:
标签:黔南 柳州 六安 广东 鄂州 晋中 保健品群呼 日照
上一篇:广东地税热线呼叫中心业务量全国第一
下一篇:电话邦:200人深耕6年只为1个小号码