XML文件解析器TXml
来源: 阅读:1025 次 日期:2015-08-26 15:25:18
温馨提示: 小编为您整理了“XML文件解析器TXml”,方便广大网友查阅!

前几天看了开源的XML文件解析器TinyXml,它是怎么实现解析的没怎么看懂,于是决定自己实现一个,反正最近不忙。先命名为TXml。现在完成了解析和查询功能,全部代码加起来不到1000行,将会继续完善它。源码必共享

先简单说一下我的思路:

1:读取XML文件信息,并存入一个字符数组中;

2:遍历数组,将数组解析成一棵树;

3:以路径的方式查询和按属性查询;

这个解析器最麻烦的地方就在怎么将字符数组解析成一颗树。我们先看一下一个简单XML文件,他包括文件头、节点、节点名称及节点值、属性名称及属性值,子节点、父节点、注释等。

<?xml version="1.0" encoding="utf-8" ?>

<!--注释-->

<Items>

<item name="chentaihan">89757</item>

</Items>

简单介绍一下解析的实现,不太好说清楚,看代码可能更容易理解一些。递归实现,每次都从一个节点开始解析,就是 从字符“<”开始,到字符“>”结束,字符<后面就是节点的名称,之后的就是节点属性,字符>后一个字符如果不是<,那就 是节点的值,如果是字符<,可能是子节点也可能是这个节点结束了。遇到字符<开始递归,空格和注释直接被PASS。

代码如下:

const char* TXmlParser::ParseContent(const char* p,XmlNode* baseNode)

{

if(p==NULL || !*p)

return NULL;

if(*p=='<')//开始一个节点

{

bool isNote;

p=SkipNote(p,isNote);//跳过注释

if(isNote) {//是注释

ParseContent(p,baseNode);

return NULL;

}

if(*p=='/')//结束节点

{

while(p!=NULL && *p && *p!='>')

{

p++;

}

++p=SkipWhiteSpace(p);

ParseContent(p,baseNode->parent);//新节点

}else{ //节点属性

string name;

while(p!=NULL && *p && *p!='>' && *p!=' ' && *p!='/')

{

name.push_back(*p++);

}

XmlNode* node=new XmlNode(name,baseNode);

baseNode->AppendNode(node);

if(*p=='>')

{

++p=SkipWhiteSpace(p);

ParseContent(p,node);//新节点

}else{

p=GetAttr(p,node);

if(*p=='/')

{

while(p!=NULL && *p && *p!='<')

p++;

ParseContent(p,baseNode);//新节点

}else{

++p=SkipWhiteSpace(p);

ParseContent(p,node);//新节点

}

}

}

}else{//节点的值

GetNodeValue(p,baseNode);

}

}

按路径的方式查询。利用两个数组实现,假设这两个数组分别为A,B;第一次查询将结果存入数组A,将A作为数据 源,将查询结果存入B,清除A中的数据,将B作为数据源,将查询结果存入A,反复进行,最后A,B中有一个就是查询结果。当然也可以用递归实现,我们都知 道递归太深容易爆线程栈,且性能低。

按属性查询。同样没有用递归实现,有个经常出现的面试题:按层序打印一个棵树。那么这里也是按层序查找,就是利用一个队列,按根节点、根节点的直接子节点进栈,一个个匹配,不匹配就出队列。

//根据属性查询--利用队列按层序查询

XmlNode* XmlNode::SelectSingleNodeByAttr(const string& attrName,const string& attrValue,XmlNode* node)

{

if(node==NULL)

return NULL;

if(node->attribute!=NULL && (*node->attribute)[attrName]==attrValue)

{

return node;

}

queue<XmlNode*> list;

for(int i=node->ChildCount()-1;i>=0;i--)

{

list.push((*node->childNodes)[i]);

}

while(list.size()>0)

{

XmlNode* tmpNode=list.front();

if(tmpNode->attribute!=NULL && (*tmpNode->attribute)[attrName]==attrValue)

{

return tmpNode;

}

for(int i=tmpNode->ChildCount()-1;i>=0;i--)

{

list.push((*tmpNode->childNodes)[i]);

}

list.pop();

}

return NULL;

}

看了按属性查找,我们就很容易知道,C#中ConfigurationManager读取配置文件的大致实现,因为配置文件很简单,就是一个节点下 面有多个节点,完全可以这样实现,根节点基本可以无视,直接就是一个字典,KEY存key的值,VALUE存value的值,查找的时间复杂度就是 O(1)。

简单测试:

更多信息请查看网络编程
手机网站地址:XML文件解析器TXml
由于各方面情况的不断调整与变化, 提供的所有考试信息和咨询回复仅供参考,敬请考生以权威部门公布的正式信息和咨询为准!

2025国考·省考课程试听报名

  • 报班类型
  • 姓名
  • 手机号
  • 验证码
关于我们 | 联系我们 | 人才招聘 | 网站声明 | 网站帮助 | 非正式的简要咨询 | 简要咨询须知 | 加入群交流 | 手机站点 | 投诉建议
工业和信息化部备案号:滇ICP备2023014141号-1 云南省教育厅备案号:云教ICP备0901021 滇公网安备53010202001879号 人力资源服务许可证:(云)人服证字(2023)第0102001523号
云南网警备案专用图标
联系电话:0871-65317125(9:00—18:00) 获取招聘考试信息及咨询关注公众号:
咨询QQ:526150442(9:00—18:00)版权所有:
云南网警报警专用图标
Baidu
map