主页 > 知识库 > 网站优化必看 蜘蛛陷阱 不利于蜘蛛爬取的网页

网站优化必看 蜘蛛陷阱 不利于蜘蛛爬取的网页

热门标签:苹果 Win7旗舰版 Linux服务器 解决方案 科大讯飞语音识别系统 铁路电话系统 阿里云 电销机器人

  1、搜索引擎能不能找到网页。

  1)要让搜搜引擎发现网站首页,网站推广就必须有良好的外部链接链接到首页,就找到了首页,然后蜘蛛会沿着链接爬的更深。

  让蜘蛛通过简单的html页面的链接到达,javascript链接,flash链接都是蜘蛛的陷阱。这点要注意。

  2)找到网页后能不能抓去内容。

  被发现的蜘蛛是可以被爬取的,数据库动态生成,带过很多的参数url、sessionID、整个页面都是flash、框架结构、大量的转向,和大量的复制内容都可能把蜘蛛拦截在门外。这也也是要注意的

  2、flash

  1)在网页某一个部分使用flash来增强视觉效果很正常网络推广,比如现在很多的flash广告、图标等。但是这是一个html页面的一部分。不会有太大的影响

  2)但是有的网站就是一个很大的flash文件,这就构成了蜘蛛的陷阱,这时候蜘蛛爬取的只有一个flash链接,没有其他的内容,所以这点尽量要避免。

  3、sessionID

  1)有些网站使用sessionID(会话ID)跟踪用户的访问,用户的没一次访问都会生成一个独立的ID,然后加在url里,这是蜘蛛每一次抓取网站都会把蜘蛛当作一个新的用户网络营销,造成蜘蛛不能正常爬取,这也是蜘蛛的一大陷阱。

  2)通常建议跟踪用户访问应该使用cookies而不要生存sessionID 。

  4、各种的跳转

  1)除了大家熟悉的301转向之外,其他的转向对搜索蜘蛛都比较敏感的,比如302暂时转向,javascript转向,flash转向,meta refresh跳转,所以建议大家不要做其他不利于网页的转向,301也包括,不到万不得已的时候也不要用301转向。这是个建议。谢谢阅读,希望能帮到大家,请继续关注脚本之家,我们会努力分享更多优秀的文章。

标签:湖州 湘西 安阳 辛集 邵阳 呼伦贝尔 三门峡 毕节

巨人网络通讯声明:本文标题《网站优化必看 蜘蛛陷阱 不利于蜘蛛爬取的网页》,本文关键词  ;如发现本文内容存在版权问题,烦请提供相关信息告之我们,我们将及时沟通与处理。本站内容系统采集于网络,涉及言论、版权与本站无关。
  • 相关文章
  • 收缩
    • 微信客服
    • 微信二维码
    • 电话咨询

    • 400-1100-266