[31]XPath-白红宇

[31]XPath

阅读量：7117 次

发布时间：2019-06-28

本文共 5613 字，大约阅读时间需要 18 分钟。

XPath 是一种节点查找手段，对比之前使用标准 DOM 去查找 XML 中的节点方式，大大降低了查找难度，方便开发者使用。但是，DOM3 级以前的标准并没有就 XPath 做出规范；直到 DOM3 在首次推荐到标准规范行列。大部分浏览器实现了这个标准，IE 则以自己的方式实现了 XPath。

一． IE 中的 XPath

在 IE8及之前的浏览器，XPath 是采用内置基于 ActiveX 的 XML DOM 文档对象实现的。在每一个节点上提供了两个方法：selectSingleNode()和 selectNodes()。

selectSingleNode()方法接受一个 XPath 模式（也就是查找路径），找到匹配的第一个节点并将它返回，没有则返回 null。

var user = xmlDom.selectSingleNode('root/user'); //得到第一个 user节点alert(user.xml); //查看 xml 序列alert(user.tagName); //节点元素名alert(user.firstChild.nodeValue); //节点内的值

上下文节点：我们通过 xmlDom 这个对象实例调用方法，而 xmlDom 这个对象实例其实就是一个上下文节点，这个节点指针指向的是根，也就是 root 元素之前。那么如果我们把这个指针指向 user 元素之前，那么结果就会有所变化。

//通过 xmlDom，并且使用 root/user 的路径var user = xmlDom.selectSingleNode('root/user');alert(user.tagName); //user//通过 xmlDom.documentElement，并且使用 user 路径，省去了 rootvar user = xmlDom.documentElement.selectSingleNode('user');alert(user.tagName); //user//通过 xmlDom，并且使用 user 路径，省去了 rootvar user = xmlDom.selectSingleNode('user');alert(user.tagName); //找不到了，出错

PS：xmlDom 和 xmlDom.documentElement 都是上下文节点，主要就是定位当前路径查找的指针，而xmlDom 对象实例的指针就是在最根上。

XPath 常用语法

//通过 user[n]来获取第 n+1 条节点，PS：XPath 其实是按 1 为起始值的var user = xmlDom.selectSingleNode('root/user[1]');alert(user.xml);//通过 text()获取节点内的值var user = xmlDom.selectSingleNode('root/user/text()');alert(user.xml);alert(user.nodeValue);//通过//user 表示在整个 xml 获取到 user 节点，不关心任何层次var user = xmlDom.selectSingleNode('//user');alert(user.xml);//通过 root//user 表示在 root包含的层次下获取到 user 节点，在 root 内不关心任何层次var user = xmlDom.selectSingleNode('root//user');alert(user.tagName);//通过 root/user[@id=6]表示获取 user 中 id=6 的节点var user = xmlDom.selectSingleNode('root/user[@id=6]');alert(user.xml);

PS：更多的 XPath 语法，可以参考 XPath 手册或者 XML DOM 手册进行参考，这里只提供了最常用的语法。

selectSingleNode()方法是获取单一节点，而 selectNodes()方法则是获取一个节点集合。

var users = xmlDom.selectNodes('root/user'); //获取 user 节点集合alert(users.length);alert(users[1].xml);

二． W3C 下的 XPath

在 DOM3 级 XPath 规范定义的类型中，最重要的两个类型是 XPathEvaluator 和XPathResult。其中，XPathEvaluator 用于在特定上下文对 XPath 表达式求值。

XPathEvaluator 的方法

方法	说明
createExpression(e, n)	将 XPath 表达式及命名空间转化成 XPathExpression
createNSResolver(n)	根据 n 命名空间创建一个新的 XPathNSResolver 对象
evaluate(e, c, n ,t ,r)	结合上下文来获取 XPath 表达式的值

W3C 实现 XPath 查询节点比 IE 来的复杂，首先第一步就是需要得到 XPathResult 对象的实例。得到这个对象实例有两种方法，一种是通过创建 XPathEvaluator 对象执行 evaluate()方法，另一种是直接通过上下文节点对象(比如 xmlDom)来执行evaluate()方法。

//使用 XPathEvaluator 对象创建 XPathResultvar eva = new XPathEvaluator();var result= eva.evaluate('root/user', xmlDom, null,    XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);alert(result);//使用上下文节点对象(xmlDom)创建 XPathResultvar result= xmlDom.evaluate('root/user', xmlDom, null,    XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);alert(result);

相对而言，第二种简单方便一点，但 evaluate 方法有五个属性：1.XPath 路径、2.上下文节点对象、3.命名空间求解器(通常是 null)、4.返回结果类型、5 保存结果的 XPathResult对象(通常是 null)。

对于返回的结果类型，有 10 中不同的类型

常量	说明
XPathResult.ANY_TYPE	返回符合 XPath 表达式类型的数据
XPathResult.ANY_UNORDERED_NODE_TYPE	返回匹配节点的节点集合，但顺序可能与文档中的节点的顺序不匹配
XPathResult.BOOLEAN_TYPE	返回布尔值
XPathResult.FIRST_ORDERED_NODE_TYPE	返回只包含一个节点的节点集合，且这个节点是在文档中第一个匹配的节点
XPathResult.NUMBER_TYPE	返回数字值
XPathResult.ORDERED_NODE_ITERATOR_TYPE	返回匹配节点的节点集合，顺序为节点在文档中出现的顺序。这是最常用到的结果类型
XPathResult.ORDERED_NODE_SNAPSHOT_TYPE	返回节点集合快照，在文档外捕获节点，这样将来对文档的任何修改都不会影响这个节点列表
XPathResult.STRING_TYPE	返回字符串值
XPathResult.UNORDERED_NODE_ITERATOR_TYPE	返回匹配节点的节点集合，不过顺序可能不会按照节点在文档中出现的顺序排列
XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE	返回节点集合快照，在文档外捕获节点，这样将来对文档的任何修改都不会影响这个节点列表

PS：上面的常量过于繁重，对于我们只需要学习了解，其实也就需要两个：1.获取一个单一节、2.获取一个节点集合。

1.获取一个单一节点

var result= xmlDom.evaluate('root/user', xmlDom, null,XPathResult.FIRST_ORDERED_NODE_TYPE, null);if(result !== null) {    alert(result.singleNodeValue.tagName); //singleNodeValue属性得到节点对象}

2.获取节点集合

var result= xmlDom.evaluate('root/user', xmlDom, null,XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);var nodes = [];if(result !== null) {    while ((node = result.iterateNext()) !== null) {        nodes.push(node);    }}

PS：节点集合的获取方式，是通过迭代器遍历而来的，我们保存到数据中就模拟出 IE相似的风格。

三． XPath 跨浏览器兼容

如果要做 W3C 和 IE 的跨浏览器兼容，我们要思考几个问题：1.如果传递一个节点的下标，IE 是从 0 开始计算，W3C 从 1 开始计算，可以通过传递获取下标进行增 1 减 1 的操作来进行。2.独有的功能放弃，为了保证跨浏览器。3.只获取单一节点和节点列表即可，基本可以完成所有的操作。

//跨浏览器获取单一节点function selectSingleNode(xmlDom, xpath) {
         var node= null;    if(typeofxmlDom.evaluate != 'undefined') {        var patten = /\[(\d+)\]/g;        var flag = xpath.match(patten);        var num = 0;        if(flag !== null) {            num = parseInt(RegExp.$1) + 1;            xpath = xpath.replace(patten, '['+ num + ']');        }        var result= xmlDom.evaluate(xpath, xmlDom, null,        XPathResult.FIRST_ORDERED_NODE_TYPE, null);        if(result !== null) {            node = result.singleNodeValue;        }    } else if (typeof xmlDom.selectSingleNode != 'undefined') {        node = xmlDom.selectSingleNode(xpath);    }    return node;}

//跨浏览器获取节点集合function selectNodes(xmlDom, xpath) {
         var nodes = [];    if(typeofxmlDom.evaluate != 'undefined') {        var patten = /\[(\d+)\]/g;        var flag = xpath.match(patten);        var num = 0;        if(flag !== null) {            num = parseInt(RegExp.$1) + 1;            xpath = xpath.replace(patten, '['+ num + ']');        }        var node= null;        var result= xmlDom.evaluate('root/user', xmlDom, null,        XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);        if (result !== null) {            while ((node = result.iterateNext()) !== null) {                nodes.push(node);            }        }    } else if (typeof xmlDom.selectNodes !='undefined') {        nodes = xmlDom.selectNodes(xpath);    }    return nodes;}

PS：在传递 xpath 路径时，没有做验证判断是否合法，有兴趣的可以自行完成。XML 还有XSLT 和 EX4，由于在使用频率的缘故，暂且搁置。

转载于:https://www.cnblogs.com/pengtdy/p/8306222.html

你可能感兴趣的文章