最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

【已解决】C#中对于XmlNode,去用SelectNodes或SelectSingleNode查找,结果找不到(子节点)

C# crifan 7609浏览 0评论

【问题】

折腾:

【记录】C#中的HTML解析

过程中,对于内容为:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns:og="http://ogp.me/ns#" xmlns:fb="http://www.facebook.com/2008/fbml" xmlns="http://www.w3.org/1999/xhtml" lang="en" xml:lang="en" >
  <head>
  ...
</head>
<body>
    ...
    <div class="gig-wrapper " data-gig_id="103857" id="gig_id-103857">
        ...
    </div>
</body>
</html>

的html,转换为xml后,调用对应的SelectNodes或SelectSingleNode去查找gig-wrapper:

XmlNodeList gigDataList = xmlDoc.SelectNodes("//div[@data-gig_id]");

结果却找不到。

【解决过程】

1.后来参考了:

System.Xml.XmlDocument.SelectNodes() 查询不到节点问题?

使用写成:

XmlDocument xmlDoc = htmlToXmlDoc(searchResultHtml);

XmlNamespaceManager m = new XmlNamespaceManager(xmlDoc.NameTable);
m.AddNamespace("w3org", "http://www.w3.org/1999/xhtml");

//XmlNodeList nodes00 = xmlDoc.SelectNodes("//w3org:div", m);
//XmlNodeList nodes01 = xmlDoc.SelectNodes("//w3org:div[@class]", m);
//XmlNodeList nodes02 = xmlDoc.SelectNodes("//w3org:div[@class='gig-inner']", m);
//XmlNodeList nodes03 = xmlDoc.SelectNodes("//w3org:div[@class='gig-image gig-index constrained']", m);
XmlNodeList gigDataList = xmlDoc.SelectNodes("//w3org:div[@data-gig_id]", m);

就可以了。

2.后来也看到官网的解释了:

XmlNode.SelectNodes Method (String, XmlNamespaceManager)

 

【总结】

对于本身html带xmlns的,转换为xml后,使用SelectNodes或SelectSingleNode去查找其下节点,需要添加对应的XmlNamespaceManager参数,才可以的。

转载请注明:在路上 » 【已解决】C#中对于XmlNode,去用SelectNodes或SelectSingleNode查找,结果找不到(子节点)

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
82 queries in 0.260 seconds, using 22.11MB memory