Dom4j简介
dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的。dom4j是一个十分优秀的JavaXML API,具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom技术,同时它也是一个开放源代码的软件,可以在SourceForge上找到它。在IBM developerWorks上面还可以找到一篇文章,对主流的Java XML API进行的性能、功能和易用性的评测,所以可以知道dom4j无论在哪个方面都是非常出色的。如今可以看到越来越多的Java软件都在使用dom4j来读写XML,特别值得一提的是连Sun的JAXM也在用dom4j。这已经是必须使用的jar包, Hibernate也用它来读写配置文件。
dom4j配置
- 官网下载dom4j
- 在项目中新建一个Folder用来添加dom4j
- 在dom4j上点击鼠标右键找到Build Path加入到项目中
利用Dom4j读取XML文档
以我这篇博客【XML】XML基本结构以及XML-Schema约束的XML文档为例:
import java.util.List;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class HrReader {
public void readXml(){
String file = "E:/workspace/eclipse/HelloWorld/src/test2/hr.xml";
//SAXReader类是读取XML文件的核心类,用于将XML解析后以“树”的形式保存在内存中
SAXReader reader = new SAXReader();
try {
Document document = reader.read(file);
Element root = document.getRootElement();//获取XML文档的根节点,即hr标签
List<Element> employees = root.elements("employee");//elements方法用于获取指定的标签集合
for(Element employee : employees){
Element name = employee.element("name");//element方法用于获取唯一的子节点对象
String empName = name.getText();//getText()方法用于获取标签文本
System.out.println(empName);
System.out.println(employee.elementText("age"));
System.out.println(employee.elementText("salary"));
Element department = employee.element("department");
System.out.println(department.element("dname").getText());
System.out.println(department.elementText("address"));
Attribute att = employee.attribute("no");
System.out.println(att.getText());
System.out.println("------");
}
} catch (DocumentException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
HrReader reader = new HrReader();
reader.readXml();
}
}
利用Dom4j写入XML文档
import java.io.FileOutputStream;
import java.io.OutputStreamWriter;
import java.io.Writer;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class HrWriter {
public void writeXml(){
String file = "E:/workspace/eclipse/HelloWorld/src/test2/hr.xml";//XML文件地址
SAXReader reader = new SAXReader();//SAXReader类是读取XML文件的核心类
try {
Document document = reader.read(file);//将XML解析后以“树”的形式保存在内存中
Element root = document.getRootElement();//获取XML文档的根节点,即hr标签
Element employee = root.addElement("employee");//加入一个员工
employee.addAttribute("no", "009");//设置员工属性
Element name = employee.addElement("name");//加入一个员工名称
name.setText("李四");//设置员工名称
employee.addElement("age").setText("34");//加入并设置员工的年龄
employee.addElement("salary").setText("6000");//加入并设置员工的薪水
Element department = employee.addElement("department");//加入员工所属部门
department.addElement("dname").setText("人事部");//加入并设置员工所属部门的名字
department.addElement("address").setText("XX大厦-B105");//加入并设置员工所属部门的地址
Writer writer = new OutputStreamWriter(new FileOutputStream(file), "UTF-8");//将文件输出流转化成writer对象
document.write(writer);//将内存中构建的DOM模型写入XML文件中
writer.close();//关闭输出流
} catch (Exception e) {
e.printStackTrace();//如果有异常则打印堆栈信息
}
}
public static void main(String[] args){
HrWriter hrWriter = new HrWriter();//新建一个hrWriter对象
hrWriter.writeXml();//调用writeXml方法
}
}
写入之后的XML文档为:
<?xml version="1.0" encoding="UTF-8"?>
<!-- 人力资源管理系统 -->
<hr xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:noNamespaceSchemaLocation="hr.xsd">
<employee no="007">
<name>或无言</name>
<age>18</age>
<salary>20000</salary>
<department>
<dname>开发部</dname>
<address>XX大厦-B103</address>
</department>
</employee>
<employee no="008">
<name>张三</name>
<age>31</age>
<salary>30000</salary>
<department>
<dname>工程部</dname>
<address>XX大厦-B104</address>
</department>
</employee>
<employee no="009">
<name>李四</name>
<age>34</age>
<salary>6000</salary>
<department>
<dname>人事部</dname>
<address>XX大厦-B105</address>
</department>
</employee>
</hr>
总结
dom4j是一个很好的工具,当XML文档有大量数据需要处理时非常方便。
参考文献: