Ruby的XML格式数据解析库Nokogiri的使用进阶-巨人网络通讯

主页 > 知识库 > Ruby的XML格式数据解析库Nokogiri的使用进阶

Ruby的XML格式数据解析库Nokogiri的使用进阶

一、基础语法
1.直接以字符串形式获取nokogiri对象:

html_doc = Nokogiri::HTML("html>body>h1>Mr. Belvedere Fan Club/h1>/body>/html>")
xml_doc = Nokogiri::XML("root>aliens>alien>name>Alf/name>/alien>/aliens>/root>")

这里的html_doc和xml_doc就是nokogiri文件

2.也可以通过文件句柄获取nokogiri对象:

f = File.open("blossom.xml")
doc = Nokogiri::XML(f)
f.close

3.还可以直接从网站获取:

require 'open-uri'
doc = Nokogiri::HTML(open("http://www.xxx.com/"))

二、XML文件解析实例
从XML/HTML文件里抓取字段的常用方法:

现在有一个名为shows.xml的文件,内容如下:

root>
 sitcoms>
  sitcom>
   name>Married with Children/name>
   characters>
    character>Al Bundy/character>
    character>Bud Bundy/character>
    character>Marcy Darcy/character>
   /characters>
  /sitcom>
  sitcom>
   name>Perfect Strangers/name>
   characters>
    character>Larry Appleton/character>
    character>Balki Bartokomous/character>
   /characters>
  /sitcom>
 /sitcoms>
 dramas>
  drama>
   name>The A-Team/name>
   characters>
    character>John "Hannibal" Smith/character>
    character>Templeton "Face" Peck/character>
    character>"B.A." Baracus/character>
    character>"Howling Mad" Murdock/character>
   /characters>
  /drama>
 /dramas>
/root>

如果想把所有character标签的内容查找出来,可以这样处理:

@doc = Nokogiri::XML(File.open("shows.xml"))
@doc.xpath("//character")

xpath和css方法,返回的是一个结点列表,类似于一个数组,它的内容就是从文件中查找出来的符合匹配规则的结点.

把dramas结点里的character结点列表查出来:

@doc.xpath("//dramas//character")

更有可读性的css方法:

characters = @doc.css("sitcoms name")
# => ["name>Married with Children/name>", "name>Perfect Strangers/name>"]

当已知查询结果唯一时,如果想直接返回这个结果,而不是列表,可以直接使用at_xpath或at_css:

@doc.css("dramas name").first # => "name>The A-Team/name>"
@doc.at_css("dramas name")  # => "name>The A-Team/name>"

三、Namespaces
对于有多个标签的情况,命名空间就起到非常大的作用了.
例如有这样一个parts.xml文件:

parts>
 !-- Alice's Auto Parts Store -->
 inventory xmlns="http://alicesautoparts.com/">
  tire>all weather/tire>
  tire>studded/tire>
  tire>extra wide/tire>
 /inventory>

 !-- Bob's Bike Shop -->
 inventory xmlns="http://bobsbikes.com/">
  tire>street/tire>
  tire>mountain/tire>
 /inventory>
/parts>

可以使用唯一的URL作为namespaces,以区分不同的tires标签:

@doc = Nokogiri::XML(File.read("parts.xml"))
car_tires = @doc.xpath('//car:tire', 'car' => 'http://alicesautoparts.com/')
bike_tires = @doc.xpath('//bike:tire', 'bike' => 'http://bobsbikes.com/')

为了让namespace的使用更方便,nokogiri会自动绑定在根结点上找到的合适的任何namespace.
nokogiri会自动关联提供的URL,这个惯例可以减少代码量.
例如有这样一个atom.xml文件:

feed xmlns="http://www.w3.org/2005/Atom">

 title>Example Feed/title>
 link href="http://example.org/"/>
 updated>2003-12-13T18:30:02Z/updated>
 author>
  name>John Doe/name>
 /author>
 id>urn:uuid:60a76c80-d399-11d9-b93C-0003939e0af6/id>

 entry>
  title>Atom-Powered Robots Run Amok/title>
  link href="http://example.org/2003/12/13/atom03"/>
  id>urn:uuid:1225c695-cfb8-4ebb-aaaa-80da344efa6a/id>
  updated>2003-12-13T18:30:02Z/updated>
  summary>Some text./summary>
 /entry>
/feed>

遵循上面提到的惯例,xmlns已被自动绑定,不用再手动为xmlns赋值:

@doc.xpath('//xmlns:title')
# => ["title>Example Feed/title>", "title>Atom-Powered Robots Run Amok/title>"]

同样情况,css的用法:

@doc.css('xmlns|title')

并且在使用css方式时,如果namespaces名字是xmlns,那么连这个词本身都可以忽略掉:

@doc.css('title')

您可能感兴趣的文章:

Ruby中使用Nokogiri包来操作XML格式数据的教程
Ruby中XML格式数据处理库REXML的使用方法指南
实例解析Ruby程序中调用REXML来解析XML格式数据的用法
Ruby使用REXML库来解析xml格式数据的方法
Ruby程序中创建和解析XML文件的方法
在Ruby中处理XML和XSLT以及XPath的简单教程

标签：石嘴山六安宜春淄博河北松原鄂州自贡

巨人网络通讯声明：本文标题《Ruby的XML格式数据解析库Nokogiri的使用进阶》，本文关键词 Ruby,的,XML,格式,数据,解析,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《Ruby的XML格式数据解析库Nokogiri的使用进阶》相关的同类信息！

Ruby的XML格式数据解析库Nokogiri的使用进阶

一、基础语法 1.直接以字符串形式获取nokogiri对象: html_doc = Nokogiri::HTML("htmlbodyh1Mr. Belvedere Fan Club/h1/body/html")xml_doc = Nokogiri::XML("rootaliensaliennameAlf/name/alien/aliens/root") 这里的html_doc和xml_do...

10-18

网页到底要不要分页 SEO分页指南：内容分页的优点和缺点

很多站长和编辑有时候就会纠结在要不要进行分页这件事情上。分页的优缺点大家心里都模模糊糊的有些感受，可是究竟都有...

10-19

红岗区四举措促服务外包产业提速

今年，红岗区通过采取引育并举、重点抓好骨干企业，强化载体、重点抓好园区建设，健全机制，重点抓好人才队伍，落实政...

10-22

海口市好用不限频电话卡靠谱

2020年中国通信网络运维服务高级研讨会在京召开。本次大会由中国通信企业协会通信网络运营专业委员会主办，以“5G智慧物...

03-02

深圳培训专用AI语音机器人好用吗-关于

深圳培训专用AI语音机器人好用吗操作简单，容易上手，可度掌握客户的情况，企业在使用电销系统后，透明绩效考核员工，...

05-17

广州百应电话机器人（百应智能机器人）

本文目录一览： 1、谁知道深圳数心科技推出的百应电话机器人，它怎么样？2、百应AI电销机器人体系的最大效果是什么？...

11-28

“第六届(2013)全球外包大会”花落无锡

4月11日下午，第六届（2013）全球外包大会媒体推介会在北京召开，无锡市委常委、常务副市长黄钦，商务部研究院党委书记...

10-22

Win8系统怎么把固定在开始屏幕上的图标重命名?

对于刚使用win8操作系统的朋友来说，还有很多功能等着我们去熟悉，而在Win8中已经有不少人习惯将常用的软件、游戏等固定...

10-20

400电话办理的费用是多少呢福州400电话代理、办理、价格

400电话处理过程非常简单，企业需要选择正式代理处理相对较快，北京企业可以选择巨人技术处理，北京是巨人技术总部，广...

01-13

网络侵犯商标权犯罪的新态势

近年来，互联网发展迅速，网络带宽的增大及上网成本的降低使人们越来越依赖网络，特别是移动网络的普及使各种移动应用...

10-23

电话销售心得电话机器人

销售很难找到，周转率仍然很高【电话销售心得】工作的单调对情绪的影响很大，人们无法长时间保持工作热情，遇到不好...

10-24

中国的新商标法将发生哪些变化以保护知识产权所有人

恶意注册商标（“恶意”）是指通过不正当手段企图注册商标，在此期间，申请人通过不当地使用先前注册的商标违反了法律...

10-23

优质的400电话套餐打400电话算国内语音套餐吗

优质的400电话套餐打400电话算国内语音套餐吗以下内容由巨人小编整理发布。您好，400电话是双向收费，客户按市话收费，...

05-16

海南智能外呼系统商家（电话智能外呼）

本文目次一览： 1、外呼零碎哪家公司做的好？ 2、ai智能呆板人外呼零碎哪家的好？ 3、什么是智能外呼营销零碎？求细致解...

11-25

高频电销卡服务商-广州电销卡哪里买

高频电销卡服务商-广州电销卡哪里买电销卡在线网（运营主体：巨人网络通讯）主营电销卡、不封号电话卡、不封卡电话卡...

04-12

南通电脑外呼系统（南京电话外呼系统）

本篇文章给大家谈谈南通电脑外呼系统，以及南京电话外呼系统对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。...

11-06

如何借力物联网卡智能化监控融入安防

根据有关数据显示，我国应用监控摄像头数目与其他国家相比，一直都是处于前列的，平均以每千人计算，拥有的安防监控设...

10-13

湖州防封号电话营销线路办理,电话软件-你知道吗?

湖州防封号电话营销线路办理,电话软件提升企业经济效益。电销效率提升的同时，企业无需再像以前一样雇佣太多电销人员...

12-17

现场讲解机器人

1、什么是智能语音电话机器人？【现场讲解机器人】汇港通AI Call智能语音机器人基于深度学习的算法应用(ASR、TTS、NLP)，可...

10-24

秦皇岛移动群呼线路办理公司,外呼系统批发-有效!

秦皇岛移动群呼线路办理公司,外呼系统批发载与客户的沟经进程，完毕沟通现场回访，AI自主学习功能，沟通话术不断自我完...

12-17

电话机器人真人对话（电话机器人打电话）

本文目录一览：1、电话机器人是什么?2、中科嘉智人工智能电销机器人具有基本的语言交流才能吗?3、电话接通后有是机器人...

08-28

Win7 64位系统XP模式失效的原因及解决方法

XP模式现状： Win7系统中的XP虚拟模式是其一大创新，可以为用户提供XP和Win7两种操作体验。既解决了旧版软件的兼容性问题，...

10-20

烟台电销电话机器人一般多少钱（烟台机器人）

本文目录一览： 1、电话机器人多少钱？ 2、智能电话销售机器人多少钱 3、电销机器人一年多少钱啊？ 4、电销机器人多少钱...

11-25

国家电力监管委员会电监办呼叫中心采购项目结果

项目名称：国家电力监管委员会电监办呼叫中心系统硬件采购项目相关供应商对成交结果有异议的，可自本公告发布之日起...

10-19

Android版本微信6.5.10发布可单独设置伴侣圈互动通知

【TechWeb报道】比来Android系统的微信v6.5.10版本发布上线了，新的版本加入了可以设置某条伴侣圈的互动不再通知。没错,这次...

10-16

400电话申请需要多少钱？根据企业业务量决定

现在已经全面进入智能化时代，很多以前需要人工去操作的事情，现在只要通过智能软件就可以轻松搞定。从市场调查情况来...

04-05

昆明市稳定不封号电话卡办理

作为“新基建”的重要组成部分，5G网络将为智慧城市、车联网、智慧农业和智慧的发展提供新机遇。截至今年2月，三大移动...

03-26

微信管理软件哪个最好

以往客户的跟进流程是这样的：先拿到客户联系方式（客户的名片或来自市场部门的销售线索等），之后销售与客户通过电话...

10-26

如何成为400电话代理商400电话最大的代理商

很多企业在申请400电话时都会有一个误解，那就是他们认为400电话的代理人只会在数字资源上有所不同，所以他们选择哪个代...

01-13

内容+产品+营销，阿里全面助力海尔电视逆势增长

9 月 6 日，就在海尔电视迎来创业 20 周年庆典的同时，一份亮眼的成绩单也被大家所关注：数据显示，正傍边国乃至全球彩电...

10-16

南京电商电销卡办理要多少钱,外呼系统报价-仔细了解

一企嗨电话营销系统 1．当前的电销场景有哪些困扰？ 1）手机.卡频繁被封，电销业务难以启动； 2）销售人员号码被标注，...

12-17

智能电话机器人高清版（智能电话机器人高清版下载）

本文目录一览：1、如何选择智能电话机器人?2、电话机器人怎么选?有什么推荐的吗?3、智能电话机器人哪个好?4、智能电话机...

08-28

ai智能销售机器人的优势

Ai智能销售机器人工作量大，可实现24小时工作，全年无休止。即使是正常的工作时间，也可以不停的工作。每天拨打3000+通话...

02-23

郑州400电话申请有用吗？（申请400的电话得需要多少钱）

郑州想要申请400电话，必须了解申请的意义所在，为什么企业都要加入400队伍？其实不难分析，企业经营最终目的无非就是为...

11-07

南阳外呼营销系统联系方式的简单介绍

本文目次一览： 1、外呼线路供给(德律风发卖公用) 2、外呼零碎怎样操持？ 3、外呼零碎外呼线路供给(德律风发卖公用) 呼唤...

11-26

全面屏时代如期而至，易快来凭技术来搞事。

大势所趋，未来属于全面屏陪同着iphone8 的发布趋近，各大知名手机品牌纷纷发布了以全面屏设计为主要概念的旗舰产品，...

10-16

HTML5对比HTML4的主要改变和改进总结

这段时间一直在帮老师做项目比较忙，经常课都没去上，就泡在实验室里，也没什么时间看其他东西了。我在项目中分配到了...

10-16

武威市ai电销机器人（智能ai电销机器人）

今天给各位分享武威市ai电销机器人的知识，其中也会对智能ai电销机器人进行解释，如果能碰巧解决你现在面临的问题，别...

11-06

企业徽标通过商标和版权保护

在这种竞争激烈的环境中，企业只有极短的时间（几秒钟）才能使潜在客户印象深刻，他们的产品比市场上竞争对手的产品更...

10-23

打电话软件外呼平台（打电话软件外呼平台怎么收费）

今天给各位分享打电话软件外呼平台的知识，其中也会对打电话软件外呼平台怎么收费进行解释，如果能碰巧解决你现在面临...

08-27

汕头商标转让

汕头是全国都知名的主要的港口城市之一，更是中国经济特区的重要组成部分，更是中国投资环境百佳城市之一，由于这些大...

10-22

Win10 20H2 Build 19042.662版补丁KB4586853推送更新内容汇总

面向 Beta 和 Release Preview 频道的 Windows Insider 成员，今天微软发布了适用于 Windows 10 October 2020（20H2）的累积更新 KB4586853 ，...

10-19

oracle scott 解锁步骤

运行cmd sqlplus/nolog 回车 SQLconn/as sysdba 回车 SQLalter user scott account unlock; 回车 SQLdisconnect 回车 SQLconn scott/tiger@orcl;回车然后输入...

10-18

姜堰外呼系统（姜堰外呼系统招聘信息）

本文目次一览： 1、外呼软件有哪些？ 2、电销零碎的外呼形式有哪些？ 3、能够复杂说一下外呼零碎是什么吗？ 4、外呼零碎...

11-26

电话机器人一天的电话（电话通知机器人）

本篇文章给大家谈谈电话机器人一天的电话，以及电话通知机器人对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

05-16

大型的电话机器人（专业电话机器人）

今天给各位分享大型的电话机器人的知识，其中也会对专业电话机器人进行解释，如果能碰巧解决你现在面临的问题，别忘了...

03-28

电销信用卡办理（电话推销办理信用卡）

本文目录一览：1、打电话推销信用卡违法吗2、广发银行信用卡电话营销是不是骗人的?打电话推销信用卡违法吗最近几天，...

07-10

菏泽外呼系统排名（菏泽呼叫中心招聘）

今天给各位分享菏泽外呼系统排名的知识，其中也会对菏泽呼叫中心招聘进行解释，如果能碰巧解决你现在面临的问题，别忘...

08-28

电销卡天津（天津办电话卡优惠）

本文目录一览：1、电销卡和普卡的差别?2、专门打电话的手机卡是什么手机卡去手机店怎么说3、电销卡在哪里办理多少钱4、...

07-10

辽宁电销卡外呼系统哪家好（电销外呼系统哪个

本文目录一览：1、电销外呼体系品牌排名，哪家好2、电销外呼体系哪个好了？市面上的太多了！有能够引荐的吗3、电销外呼...

11-29

无锡外呼系统怎么样（外呼系统安全吗）

今日给各位同享无锡外呼体系怎么样的常识，其间也会对外呼体系安全吗进行解说，假如能可巧处理你现在面对的问题，别忘...

05-17

Ruby的XML格式数据解析库Nokogiri的使用进阶

10-18

本页收集关于Ruby的XML格式数据解析库Nokogiri的使用进阶的相关信息资讯供网民参考！

四合一精品企业网站建设

多一个网站就为企业多增加一条营销渠道

¥888元限时抢购

立即咨询 快速购买

企业400电话

智能AI客服机器人
￥15000

在线订购

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

推荐文章

上一篇：Ruby中使用Nokogiri包来操作XML格式数据的教程

下一篇：Ruby和Ruby on Rails中解析JSON格式数据的实例教程

一起分享吧

Ruby的XML格式数据解析库Nokogiri的使用进阶

四合一精品企业网站建设

¥888元限时抢购

立即咨询快速购买

企业400电话

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

在线咨询