网站目录结构是百度蜘蛛爬行的重要路径,其对于企业网站的重要程度不言而喻,那么企业网站建设怎么做目录结构的优化呢?网总管小编对此进行了简单的总结,希望大家有所收获。
目录结构最好用一级到二级,不要超过三级。目录的组织方式尽量采用:首页-》栏目页-》内容页。目录名采用拼音或者英文。避免使用多层嵌套的子目录。
robots.txt
robots.txt是一种存放于网站根目录下的文本文件,用于告诉搜索引擎的爬虫(spider),此网站中的哪些内容是不应被搜索引擎的索引,哪些是可以被索引。robots.txt协议并不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个文件,但也有一些特殊情况。
当我们不希望网站中的某些页面被搜索引擎抓取,也许这些网页在搜索结果中出现对于用户来说并没多大用处,就可以把这些页面放在robots.txt里,这可以保证网站的某些内容不出现在搜索结果中。
Sitemaps
Sitemaps可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,搜索引擎就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动“通知”搜索引擎,方便搜索引擎进行索引。
Sitemaps文件通常是XML格式的,格式比较简单,Sitemaps协议以<urlset>开始标记开始,以</urlset>结束标记结束。每个网址包含一个作为父标记的<url>条目。每一个<url>父标记包括一个<loc>子标记条目。<loc>是网页文件的网址。此网址应以http开始并少于2048个字符。<lastmod>表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD。
以上就是网总管小编对于企业网站建设怎么做目录结构优化的一些建议,如果大家有其他疑问,欢迎随时咨询。
标签:盐城
林芝
东营
乌鲁木齐
九江